- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Hadoop物联网数据挖掘算法分析与应用
基于Hadoop物联网数据挖掘算法分析与应用
摘 要: 介绍了物联网数据处理的若干关键技术,如大数据采集、大数据存储、大数据的分析与挖掘等。以Hadoop为平台对物联网数据进行挖掘与分析,为了提高处理庞大数据的实效性,基于MapReduce架构采用了朴素贝叶斯分类算法、K-modes聚类算法以及ECLAT算法。分析认为,应用这三类算法,提高了数据分类效率,优化了类内对象之间的相似性以及类间对象之间的关联性,为更高效的数据挖掘提供了很好的思路。
关键词: 物联网; Hadoop; 朴素贝叶斯; K-modes; ECLAT
中图分类号:TP212.9;TP391.4 文献标志码:A 文章编号:1006-8228(2018)06-29-03
Analysis and application of data mining algorithm for Internet of Things based on Hadoop
Chen Juan
(Guangling College of YangZhou University, Yangzhou, Jiangsu 225127, China)
Abstract: Some key technologies of data processing for Internet of Things are introduced, such as big data acquisition, big data storage, big data analysis and mining. In this paper, the data of Internet of Things is excavated and analyzed on Hadoop platform, In order to improve the effectiveness of large data processing, Naive Bayesian classification algorithm, K-modes clustering algorithm and ECLAT algorithm are adopted in MapReduce framework. The analysis shows that the application of these three kinds of algorithms improves the efficiency of data classification, optimizes the similarity among the objects in the class and the correlation among the objects between classes, and provides a good idea for more efficient data mining.
Key words: Internet of things; Hadoop; Naive Bayesian; K-modes; ECLAT
0 引言
当前计算机技术发展迅速,物联网是在计算机、互联网之后信息产业发展的第三次浪潮,它必将成为社会发展的重要推力,它能够实现人与人、人与物和物与物之间的沟通与交流。物联网的兴起也必将再次引发数据的快速增长,对许多行业来说既是更严峻的挑战,也是更宝贵的机遇。物联网正在深刻改变着人们的生活习惯、工作方式。
本文主要采用Hadoop分布式系统架构处理物联网环境下的大数据,Hadoop是一个分布式计算平台,具有高可靠性、高扩展性、高效性以及高容错性等优点。其主要由三大部分构成,HDFS(Hadoop Distributed File System)分布式文件系统、Hadoop MapReduce分布式计算模型和 HBase 分布式数据库。
因此,如何更好地应用Hadoop计算平台处理好物联网大数据,将是一个待攻克的难题。本文主要分析如何运用Hadoop平台处理大数据的理论依据,以及物联网的应用前景。
1 物联网概述
物联网[1]底层网络通过RFID(Radio Frequency Identification)、WSNs(Wireless Sensor Networks)、?o线局域网等网络技术采集物物交换信息并传输到智能汇聚网关,通过智能汇聚网关接入到网络融合体系,最后利用包括广播电视网、互联网、电信网等网络途径使信息到达终端用户应用系统。作为底层的数据感知层次[2],在这个阶段主要感知各种各样的信息内容,例如二维标签、识别器、摄像头信息、传感网络等。然后,整理收集到的数据通过
文档评论(0)