- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据融合研究-问题与挑战-孟小峰
大数据融合研究:问题与挑战
孟小峰 杜治娟
中国人民大学信息学院 北京 100872
(xfmeng@)
Research on the Big Data Fusion : Issues and Challenges
Meng Xiaofeng and Du Zhijuan
School of Information, Renmin University of China, Beijing 100872
Abstract Data characteristics and realistic demands have changed because the large-scale datas linked and crossover. The main features
of the data are large scale, multi-source heterogeneous, cross domain, cross media, cross language, dynamic evolution and generalization,
which is playing an important role. And the corresponding data storage, analysis and understanding are also facing a major challenge.
The immediate problem to be solved is how to use the data association, cross and integration to achieve the maximization of the value of
big data. Our paper believes that the key to solving this problem lies in the integration of data, so we put forward the concept of large
data fusion. We use Web data, scientific data and business data fusion as a case to analyze the demand and necessity of data fusion, and
proposed a new task of large data fusion, but also summarized and analyzed the existing fusion technology. Finally, we analyze the
challenges that may be faced in the process of large data fusion and problems caused by large data fusion.
Keywords big data, data integration, data fusion, knowledge fusion, data management
摘 要 随着大规模数据的关联和交叉,数据特征和现实需求都发生了变化。以大规模、多源异构、跨领域、
跨媒体、跨语言、动态演化、普适化为主要特征的数据发挥着更重要的作用,相应的数据存储、分析和理解
也面临着重大挑战。当下亟待解决的问题是如何利用数据的关联、交叉和融合实现大数据的价值最大化。本
文认为解决这一问题的关键在于数据的融合,所以提出了大数据融合的概念。本文首先以Web 数据、科学数
据和商业数据的融合作为案例分析了大数据融合的需求和必要性,并提出了大数据融合的新任务。然后,总
结分析了现有融合技术。最后针对大数据融合问题可能面临的挑战和大数据融合带来的问题进行了分析。
关键词 大数据;数据集成;数据融合;知识融合;数据管理
中图法分类号 TP391
近20 年里,数据产生的方式不断在扩展,数据之 或早期 “大数据”(量大)的最显著特征。
间的关系变得千丝万缕,呈现出大规模数据关联、交 (2 )演化性:是指数据随时间或解释的变化而变
[1,2]
叉和融合的局面 ,数据出现了如下新的特征: 化的特性,体现了数据的动态性和知识的演化性。比
(1)多元性:当下数据不仅是类型多样,更重要 如,实体的某些属性在不同时间点可能产生变化。这
的是数
您可能关注的文档
- 大学物理(甲) 第三章 刚体力学基础.pdf
- 大学物理02-守恒定律.pdf
- 大学摄影教程06摄影构图01.pdf
- 大学物理(上册—第三版—修订版)课后习题答案.pdf
- 大学物理4-2.pdf
- 大学基础物理学热力学第二定律(章6.2)11wang.pdf
- 大学物理1期末复习纲要.pdf
- 大学物理II练习题.pdf
- 大学物理A上期中习题课.pdf
- 大学物理——韩永胜——10第八章气体动理论.pdf
- 大学生职业规划大赛《新闻学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《应用统计学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《音乐学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《中医学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《信息管理与信息系统专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《汽车服务工程专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《水产养殖学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《市场营销专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《音乐表演专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《音乐学专业》生涯发展展示PPT.pptx
文档评论(0)