weka算法参数整理.pdf

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
weka算法参数整理

1. 关联算法 1.1.Aprior算法 1.1.1. Apriori算法weka参数界面 概要 实现Apriori关联规则挖掘算法,挖掘出给定参数条件下的关联规则。此迭代的减少最小支持度直到发现设定最 置信度下的规则数目。 1.1.2. Apriori算法参数配置说明 英文名称 中文翻译 默认值 取值范围 参数说明 car 分类关联分析 False False 返回常规的关联分析规则 True 返回指定分类属性的关联规则 classIndex 分类属性索引 -1 {-1,[1,N]}int -1代表最后一列,设置的数字代表相应的列作为分类属性;Car为True时生效。 delta delta 0.05 (0,1) 每次迭代upperBoundMinSupport 减少的数值,直到最小支持度或设定规则数目。 lowerBoundMinSupport 最小支持度下限 0.1 (0,upperBoundMinSupport) 迭代过程中最小支持度的下限。 metricType 度量类型 confidence Confidence(置信度) 规则项集数目占规则前件数目比例;car为True,metricType 只能用confidence。 P(A,B)/P(A)P(B);规则前件和规则后件同时发生的概率除以分布单独发生的概率 Lift(提升度) 1 之积;Lift=1 时表示A和B独立,数值越大前后件关联性越强。 Leverage(杠杆率) P(A,B)-P(A)P(B);Leverage=0时A和B独立,数值越大A和B 的关联性越强。 P(A)P(!B)/P(A,!B) (!B表示B没有发生) Conviction也是用来衡量A和B 的 Conviction(确信度) 独立性。从它和lift 的关系(对B取反,代入Lift公式后求倒数)可以看出,这 个值越大,A、B越关联。 minMetric 最小度量值 0.9 根据metricType取值不同 Confidence(0,1);lift1;leverage0;conviction(0,1) numRules 规则数目 1 [1,+∞]int 关联算法产生规则的数目 outputItemSets 输出项集 False False 不输出频繁项集 True 输出频繁项集 removeAllMissingCols 移除空列 False False 不移除所有值都缺失的列 True 移除所有值都缺失的列 significanceLevel 显著性水平 -1? (0,1) χ检验

文档评论(0)

xxj1658888 + 关注
实名认证
内容提供者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年04月12日上传了教师资格证

1亿VIP精品文档

相关文档