程序代码http://www.oschina.net/code/snippet_188162_22208
对如下两组数据进行测试,生成的树居然不是对称的。两组数据其实只是性别对换了。为啥生成的树的结果不是男女结点对换呢?如果我对列属性重新排序,生成的树结果是不是又不一样呢?难道我的算法有bug?没有理解透C4.5?
第一组:
年龄,性别,职业,兴趣,是否为朋友
青年,女,学生,足球,否
成年,男,律师,阅读,是
成年,女,律师,足球,否
成年,女,学生,阅读,是
青年,女,学生,篮球,否
青年,男,学生,篮球,是
青年,男,学生,阅读,是
青年,男,学生,足球,是
青年,男,学生,游泳,是
老年,女,律师,篮球,否
老年,女,医生,阅读,否
老年,男,教师,游泳,否
老年,女,律师,阅读,是
老年,女,教师,足球,否
老年,女,教师,阅读,是
老年,男,教师,阅读,是
成年,女,教师,篮球,是
老年,女,教师,足球,否
老年,女,农民,足球,否
成年,女,农民,阅读,是
生成的决策树:
第二组:
年龄,性别,职业,兴趣,能否为朋友
青年,男,学生,足球,否
成年,女,律师,阅读,是
成年,男,律师,足球,否
成年,男,学生,阅读,是
青年,男,学生,篮球,否
青年,女,学生,篮球,是
青年,女,学生,阅读,是
青年,女,学生,足球,是
青年,女,学生,游泳,是
老年,男,律师,篮球,否
老年,男,医生,阅读,否
老年,女,教师,游泳,否
老年,男,律师,阅读,是
老年,男,教师,足球,否
老年,男,教师,阅读,是
老年,女,教师,阅读,是
成年,男,教师,篮球,是
老年,男,教师,足球,否
老年,男,农民,足球,否
成年,男,农民,阅读,是
生成的决策树: