C4.5算法对数据的支持不是很稳定

刘学炜 发布于 2013/06/17 22:55
阅读 1K+
收藏 1

9 大论坛聚焦技术前沿、100+ 重磅嘉宾荟聚,GOTC 2024 年度开源盛典来袭!戳我立即报名

程序代码http://www.oschina.net/code/snippet_188162_22208

对如下两组数据进行测试,生成的树居然不是对称的。两组数据其实只是性别对换了。为啥生成的树的结果不是男女结点对换呢?如果我对列属性重新排序,生成的树结果是不是又不一样呢?难道我的算法有bug?没有理解透C4.5?

第一组:
年龄,性别,职业,兴趣,是否为朋友
青年,女,学生,足球,否
成年,男,律师,阅读,是
成年,女,律师,足球,否
成年,女,学生,阅读,是
青年,女,学生,篮球,否
青年,男,学生,篮球,是
青年,男,学生,阅读,是
青年,男,学生,足球,是
青年,男,学生,游泳,是
老年,女,律师,篮球,否
老年,女,医生,阅读,否
老年,男,教师,游泳,否
老年,女,律师,阅读,是
老年,女,教师,足球,否
老年,女,教师,阅读,是
老年,男,教师,阅读,是
成年,女,教师,篮球,是
老年,女,教师,足球,否
老年,女,农民,足球,否
成年,女,农民,阅读,是

生成的决策树:

第二组:
年龄,性别,职业,兴趣,能否为朋友
青年,男,学生,足球,否
成年,女,律师,阅读,是
成年,男,律师,足球,否
成年,男,学生,阅读,是
青年,男,学生,篮球,否
青年,女,学生,篮球,是
青年,女,学生,阅读,是
青年,女,学生,足球,是
青年,女,学生,游泳,是
老年,男,律师,篮球,否
老年,男,医生,阅读,否
老年,女,教师,游泳,否
老年,男,律师,阅读,是
老年,男,教师,足球,否
老年,男,教师,阅读,是
老年,女,教师,阅读,是
成年,男,教师,篮球,是
老年,男,教师,足球,否
老年,男,农民,足球,否
成年,男,农民,阅读,是

生成的决策树:

加载中
0
刘学炜
刘学炜
对数据结构、次序更换都会导致结果不同
当前问题已关闭评论
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部