- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于前缀项集的Apriori算法改进-计算机应用与软件.PDF
第34卷第2期 计算机应用与软件 Vol34No.2
2017年2月 ComputerApplicationsandSoftware Feb.2017
基于前缀项集的Apriori算法改进
于守健 周羿阳
(东华大学计算机学院 上海201600)
摘 要 关联规则的挖掘是数据挖掘中一个重要内容,主要目的是找到事务数据库中的有趣的模式。Apriori
算法是关联规则挖掘的最经典算法之一,但是它本身存在着效率上的瓶颈。在深入了解Apriori算法前提下,提
出基于前缀项集的候选集存储结构,并利用哈希表在快速查找上的优势,大大提高了经典Apriori算法在连接步
骤和剪枝步骤中的效率。实验证明改进后的Apriori算法在一定支持度下比经典Apriori算法有着更大的效率优
势,并且支持度越小时提升效率越大。
关键词 数据挖掘 Apriori算法 前缀项集 关联规则 哈希表
中图分类号 TP3 文献标识码 A DOI:10.3969/j.issn.1000386x.2017.02.052
THEIMPROVEMENTOFAPRIORIALGORITHMBASEDONPREFIXEDITEMSET
YuShoujian ZhouYiyang
(CollegeofComputerScienceandTechnology,DonghuaUniversity,Shanghai201600,China)
Abstract Theminingofassociationruleisanimportantmethodfordiscoveringinterestingrelationsbetweenvariables
inlargedatabases.Apriorialgorithmisoneofthemostclassicalalgorithmsofassociationrules,butithasbottleneckin
efficiency.Thus,acandidateitemsetstoragestructurebasedonprefixeditemsetisproposedwiththehelpofthequick
searchofhashmap,andtheefficiencyofclassicalApriorialgorithminconnectingandpruningstephasbeenimproved
greatly.TheexperimentsshowthattheimprovedApriorialgorithmdoesbetterinefficiencythantheclassicalApriori
algorithmincertaindegreessupport,andthesmallersupport,thebetterefficiency.
Keywords Datamining Apriorialgorithm Prefixeditemset Associationrules Hashmap
近年来也出现了针对不同方面的的算法改进方式。
0 引 言 Zhang等[4]提出了基于分类的改进的Apriori算法,在
效率上有一定程度的提升。Jia等[5]从事务数据库划
随着计算机技术在各个行业的迅猛发展,各行业
分和动态项集统计的角度对经典 Apriori算法进行改
所产生的数据也越来越多,但是如何在这些海量数据 进。Liu等[6]在研究煤炭隐患数据时提出了数据库矩
中获取有价值的信息也成了一个新的问题。数据挖 阵化的方法来进一步提升算法效率。Wang等[7]提出
掘,即数据知识发现,正是在这个大背景下应运而生。 一种优化的方法来
您可能关注的文档
- 基于GIS的线性构造异常和裂缝综合分析-物探与化探.PDF
- 基于Grassmann流形的多聚类特征选择.PDF
- 基于L'a'b'彩色空间和局域动态阈值的药用植物叶片-计算机应用与软件.PDF
- 基于LabVIEW的婴儿培养箱温湿度检测系统-重庆理工大学学报.PDF
- 基于LBP的眼睛开闭检测方法-计算机应用研究.PDF
- 基于LDA的信息检索模型.doc
- 基于Mathematica的图像处理技术-徐州工程学院学报.PDF
- 基于MatlabGUI数控机床热误差补偿的仿真系统-重庆理工大学学报.PDF
- 基于MCX314控制器的数控机床运动控制系统-Read.PDF
- 基于MirrorDriver的屏幕图像捕捉技术.PDF
- 基于动态拓扑的空间演化博弈与群体行为分析-计算机工程与应用.PDF
- 基于区间数变权原理的教学质量评估模型.PDF
- 基于半点运算与多基表示的椭圆曲线标量乘法.PDF
- 基于双基ISAR的空间高速目标成像分析.PDF
- 基于双衬套理论求解地壳岩石应变传递系数的探讨-地球物理学进展.PDF
- 基于可变特征空间SVM的互联网流量分类-信息通信学术期刊网.PDF
- 基于可调节网格改进的跨区域GPSR路由算法-吉林大学学报.PDF
- 基于响应面方法的数控机床空间动态特性研究-四川大学学报(工程科学版).doc
- 基于四元数和增广矩阵束的!!#雷达角度估计算法-数据采集与处理.PDF
- 基于四元数和犅样条的机械手平滑态规划器-浙江大学学报.PDF
文档评论(0)