- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于分布式数据流的大数据分类模型和算法
第 卷 第 期 计 算 机 学 报
40 1
Vol.40 No.1
年 月
2017 1 CHINESEJOURNALOF COMPUTERS Jan.2017
基于分布式数据流的大数据分类模型和算法
毛国君 胡殿军 谢松燕
( )
中央财经大学信息学院 北京 100086
,
摘 要 大数据是需求驱动的概念 随着数据库系统的普及和因特网服务的扩张 企业或者个人可用的数据正在
.
, ,
膨胀 已有的技术很难满足大数据时代的数据分析需求 因此需要探索新的理论和方法来支撑大数据的应用 虽然
.
, ,
大数据的 属性已经被广泛讨论 但是它们大多描述的仍然是大数据的表象 所以很难从中抽象出统一的数据格
4V
,
式 因而进一步寻找可用于数据格式化的技术特征是必要的 面向于以分布式和流动性为主要技术特征的大数据
.
, ,
应用需求 文中以分布式数据流为数据表达载体 在此基础上设计对应的大数据分类模型和挖掘算子 同时针对大
.
数据的分类挖掘需要解决的关键问题来构建关键步骤对应的算法 理论上证明了文中给出的微簇合并技术和样本
.
:
数据重构方法的合理性 实验表明 文中提出的基于分布式数据流的大数据的分类模型及算法不仅能大幅度地减
.
, ( );
少网络节点间的通讯代价 而且可以获得平均 左右的全局挖掘精度的提升 对比已有的典型算法
10% DS means
-
, 、
虽然时间花费略高于DS means 但是两者在不同的数据容量测试下相差很小 且时间攀升趋势相当.
-
您可能关注的文档
- 培训-移液器的使用技术.pdf
- 城市道路交通标志和标线设置规范DB33_T 818-2010.pdf
- 基 于 多 目 标 规 划 和 模 糊 层 次 分 析 法 的 打 车 补 贴 模型.pdf
- 培训教材- 内部审核概述.pdf
- 培训师授课技能培训-郭宝成.pdf
- 基于 棒球最佳击点 的探究.pdf
- 垂钓区景观设计方案05.pdf
- 基于ABAQUS的钢管轴心受压非线性屈曲分析.pdf
- 基于AHP的土地整理综合效益评价研究及应用.pdf
- 基于51的智能LED照明控制系统设计.pdf
- 中国国家标准 GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- 《GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计》.pdf
- 中国国家标准 GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- 《GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置》.pdf
- 中国国家标准 GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- GB/T 17889.4-2024梯子 第4部分:铰链梯.pdf
- 《GB/T 17889.4-2024梯子 第4部分:铰链梯》.pdf
文档评论(0)