- 1、本文档共31页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
weka算法参数整理
1. 关联算法
1.1.Aprior算法
1.1.1. Apriori算法weka参数界面
概要
实现Apriori关联规则挖掘算法,挖掘出给定参数条件下的关联规则。此迭代的减少最小支持度直到发现设定最
置信度下的规则数目。
1.1.2. Apriori算法参数配置说明
英文名称 中文翻译 默认值 取值范围 参数说明
car 分类关联分析 False False 返回常规的关联分析规则
True 返回指定分类属性的关联规则
classIndex 分类属性索引 -1 {-1,[1,N]}int -1代表最后一列,设置的数字代表相应的列作为分类属性;Car为True时生效。
delta delta 0.05 (0,1) 每次迭代upperBoundMinSupport 减少的数值,直到最小支持度或设定规则数目。
lowerBoundMinSupport 最小支持度下限 0.1 (0,upperBoundMinSupport) 迭代过程中最小支持度的下限。
metricType 度量类型 confidence Confidence(置信度) 规则项集数目占规则前件数目比例;car为True,metricType 只能用confidence。
P(A,B)/P(A)P(B);规则前件和规则后件同时发生的概率除以分布单独发生的概率
Lift(提升度) 1
之积;Lift=1 时表示A和B独立,数值越大前后件关联性越强。
Leverage(杠杆率) P(A,B)-P(A)P(B);Leverage=0时A和B独立,数值越大A和B 的关联性越强。
P(A)P(!B)/P(A,!B) (!B表示B没有发生) Conviction也是用来衡量A和B 的
Conviction(确信度) 独立性。从它和lift 的关系(对B取反,代入Lift公式后求倒数)可以看出,这
个值越大,A、B越关联。
minMetric 最小度量值 0.9 根据metricType取值不同 Confidence(0,1);lift1;leverage0;conviction(0,1)
numRules 规则数目 1 [1,+∞]int 关联算法产生规则的数目
outputItemSets 输出项集 False False 不输出频繁项集
True 输出频繁项集
removeAllMissingCols 移除空列 False False 不移除所有值都缺失的列
True 移除所有值都缺失的列
significanceLevel 显著性水平 -1? (0,1) χ检验
文档评论(0)