- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据的环境下文本信息挖掘系统的设计
大数据的环境下文本信息挖掘系统的设计
摘 要: 传统文本信息挖掘技术系统能够对文本信息进行系统的信息挖掘,但是在大数据环境下容易产生系统的数据识别乱码以及数据干扰。针对上述问题,提出一种大数据环境下文本信息挖掘系统设计方案,在系统的硬件设备上增加数据简化器,通过数据简化器能够对数据进行一定的过滤筛选,保证数据进入识别阶段的准确率,同时促进了数据挖掘过程的效率,对文本信息挖掘的过程使用质数矩阵模型,通过建立的质数矩阵模型能够有效地对文本信息进行深层次的挖掘。同时优化了Aprioirt计算方法,保证了对文本信息的优先识别度,避免了传统方法中出现的数据混乱以及数据干扰问题。为了验证设计的大数据环境下文本信息挖掘系统的有效性,设计了对比仿真实验,通过实验数据的分析,有效地证明了设计的大数据环境下文本信息挖掘系统的有效性,避免了传统方法中出现的数据混乱以及数据干扰问题。
关键词: 大数据环境; 文本信息; 关联密度; Aprioirt?算方法; 挖掘系统
中图分类号: TN911.1?34; TP391 文献标识码: A 文章编号: 1004?373X(2018)01?0125?04
Abstract: The traditional text information mining technology system can carry out the systematic information mining for text information, but is easy to generate the data identification messy code of the system and data interference in the big data environment. Aiming at these problems, a design scheme of text information mining system in big data environment is put forward. The data reducer is added on the hardware device of the system, which can filter the data, ensure the accuracy of data entered into the recognition stage, and improve the efficiency of data mining. The prime number matrix model is used in the process of information mining to mine the text information deeply. The Aprioirt computing method is optimized to ensure the priority recognition of text information, avoid the data chaos and data interference of the traditional method. In order to verify the effectiveness of text information mining system in large data environment, the contrast simulation experiment was designed. The experimental data verifies that the text information mining system in large data environment is effective, and can avoid the data chaos and data interference of the traditional methods.
Keywords: big data environment; text information; correlation density; Aprioirt computing method; mining system
0 引 言
伴随互联网时代的快速崛起,互联网的数据信息已经用海量来比拟[1?2]。随着信息储量的不断增加,对信息进行系统挖掘能够发现数据信息中的隐藏数据和潜在有价值的数据[3?4]。这样可以最大程度上的使用数据信息[5?6]。互联网环境下的数据传输方式都是以压缩的形式进行传递,在大数据的环境下,文本信息是传输的主体,能够占据大数据信息的[13]以上[7
您可能关注的文档
- 大数据时代下金融机构竞争的策略的研究.doc
- 大数据时代下高新技术企业研发成本管理创新的研究.doc
- 大数据时代下高校辅导员预警能力的研究.doc
- 大数据时代下高校学生事务管理育人的研究.doc
- 大数据时代下高校信息化的规划的思考.doc
- 大数据时代个人信息保护的研究.doc
- 大数据时代下高职院校计算机教学的改革探究.doc
- 大数据时代个人数据保护相关的研究.doc
- 大数据时代中国政府统计的改革发展新的模式.doc
- 大数据时代中国移动互联网产品营销的策略分析.doc
- 2023-2024学年八年级数学上册单元速记·巧练(沪教版)第十六章 二次根式(单元重点综合测试)(解析版).docx
- 2023-2024学年八年级物理下册单元速记·巧练(教科版)第9章 压强【单元测试·真题提升卷】(原卷版).docx
- 2023-2024学年八年级物理下册单元速记·巧练(教科版)第10章 流体的力现象【单元测试·考点通关卷】(原卷版).docx
- 【起飞计划】2024年中考物理一轮单元复习(人教版)专题7 力(原卷版).docx
- 2023-2024学年八年级物理下册单元速记·巧练(教科版)第11章 机械与功【单元测试·真题提升卷】(原卷版).docx
- 2023-2024学年八年级数学上册单元速记·巧练(沪教版)第十九章 几何证明(单元重点综合测试)(原卷版).docx
- 2023-2024学年八年级物理下册单元速记·巧练(教科版)第11章 机械与功【速记清单】.docx
- 2023-2024学年八年级数学上册单元速记·巧练(沪教版)第十八章 正比例函数和反比例函数(45道压轴题专练)(解析版).docx
- 【起飞计划】2024年中考物理一轮单元复习(人教版)专题4 光现象(原卷版).docx
- 【中考冲刺】2024年中考数学二轮复习名校模拟题重要考点分类汇编(天津专用)专题10 几何动态与函数综合(共36道)(原卷版).docx
文档评论(0)