决策树ID3算法的实例解析.pptxVIP

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
决策树ID3算法的实例解析

决策树ID3算法的实例解析;讲座主要内容;嘉兴——中国共产党的诞生地;上海港;上海经济圈: 中国经济的火车头。 ;沪杭高铁; 嘉兴是一座具有悠久历史和灿烂文化的城市;田园泽国 水都绿城 江南雄郡 源远流长 ; 茅盾    王国维   徐志摩   丰子恺 ;嘉兴学院简介;数据挖掘10大算法产生过程;1. 提名 (Nominations);数据挖掘10大算法产生过程;;;;数据挖掘10大算法产生过程;算法陈述;数据挖掘10大算法产生过程;排名;数据挖掘10大算法;数据挖掘10大算法产生过程;由算法的原作者和陈述人编写调查表 如何更好地使用这10大算法? 是否需要为这10大算法专门编写一本书? - 注:该书已出版,参见右图封面。书名为 ?The Top Ten Algorithms in Data Mining?, 编著者为吴信东和Vipin Kumar 针对这10大算法的任何问题展开讨论;讲座主要内容;信息的定量描述;信息量的定义;对信息量的 认识理解 ;抛一枚均匀硬币,出现正面与反面的信息量是多少? 解:出现正面与反面的概率均为0. 5,它们的信息量是 I(正)= -lbp(正)= -lb0.5=1b I(反)= -lbp(反)= -lb0.5=1b ;抛一枚畸形硬币,出现正面与反面的概率分别是1/4,3/4,出现正面与反面时的信息量是多少? 解:出现正面与反面的概率分别是1/4,3/4,它们的信息量是 I(正)= -lbp(正)= -lb1/4=2b I(反)= -lbp(反)= -lb3/4=0.415b ;信源含有的信息量是信源发出的所有可能消息的平均不确定性,香农把信源所含有的信息量称为信息熵,是指每个符号所含信息量的统计平均值。m种符号的平均信息量为;抛一枚均匀硬币的信息熵是多少? 解:出现正面与反面的概率均为0. 5,信息熵是 ;抛一枚畸形硬币,出现正面与反面的概率分别是1/4,3/4,出现正面与反面时的信息量是多少? 解:出现正面与反面的概率分别是1/4,3/4,信息熵是 ;例:气象预报;34;35;活 动;活动的熵;已知户外的天气情况下活动的条件熵;已知户外时活动的条件熵;平均互信息;是否适合打垒球的决策表;活动的熵;已知天气时活动的条件熵;天气 ;天气 ;天气 ;各互信息量;天气;ID3算法生成的决策树;ID3算法;不协调决策表;用互信息率取代互信息作为衡量一个属性重要性的指标 ???失值的处理 连续值的离散化 剪枝 生成决策规则;决策规则(产生式规则);分类器评价标准;准确度分析;召回率r(Recall)和精准率p(Precision);F1;构造分类器的主要步骤;训练数据和测试数据的划分方法;谢谢大家!

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档