- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于单因素方差分析的决策树算法
CN431258/ TP 计算机工程与科学 2007 年第 29 卷第 10 期
ISSN 1007130X COM PU T ER EN GIN EER IN G SCIEN CE Vol29 ,No 10 ,2007
( )
文章编号 :1007130X 2007
基于单因素方差分析的决策树算法
Deci sio n Tr ee Al go rit h m s Ba sed
o n a OneWay A naly si s of V ariance
丁顺利 ,洪允德 ,袁静波
D ING Shunli , HONG Yunde ,Y UAN Jingbo
( 东北大学秦皇岛分校计算机工程系 ,河北 秦皇岛 066004)
( Department of Computer Engineering , Northeastern University at Qinghuangdao , Qinghuangdao 066004 , China)
摘 要 :测试属性的选择是决策树构建的关键 。本文基于单因素方差分析原理 ,提出了决策树算法 AN OVA 1. 0 及
AN OVA2 . 0 。两种算法在测试属性的选择上分别采用最大组间平方和 、最大组内平方和增益率 ,而且都在平台 W E KA3
5 上实现 。与 ID3 、C45 进行效率 、精度等方面比较的大数据集实验结果表明 ,提出的两种算法是较好的分类算法 。
Abstract :Two new deci sion t ree algorit hm s , AN OVA 10 and AN OVA20 , are p resent ed in t hi s p ap er . The algo
rit hm s are based on oneway analy si s of variance . AN OVA 1. 0 select s t est ed at t ribut es according to t he biggest sum of
squares between group s. AN OVA2 . 0 select s t he t est ed att ribut es accor ding to t he biggest int ergroup gain ratio of sum of
squares . AN OVA 1. 0 and AN OVA2 . 0 are implement ed in t he Weka35 software . The t wo given algorit hms are comp ared to
ID3 and C4 . 5 in p erformance , p reci sion ,and so on . The exp eriment s wit h lar ger dat a set s are done and t he exp eriment al re
sult s show t hat AN OVA 1. 0 and AN OVA2 . 0 are bett er classification algorit hm s.
关键词 :决策树 ;组间平方和 ;组内平方和增益率
Key words :deci sion t ree ;int ergroup sum of squares ;int ragroup gain ratio of sum of squares
中图分类号 : TP3 11
文档评论(0)