- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据存储研究文献综述
2023 年 2 月 6 日
目录
TOC \o 1-3 \h \z \u 1. 前言 1
2. 研究现状 2
2.1 国内研究现状 2
2.2 国际研究现状 2
3. 研究热点 3
4. 研究前沿 9
4.1 机器学习(MACHINE LEARNING) 10
4.2 光子晶体(PHOTONIC CRYSTALS) 11
4.3 集群计算(CLUSTER COMPUTING) 12
4.4 大数据分析(BIG DATA ANALYSIS) 12
4.5 数据仓库(DATA WAREHOUSE) 13
4.6 重复数据删除(DATA DEDUPLICATION) 13
4.7 负载均衡(LOAD BALANCING) 14
4.8 存储架构(STORAGE ARCHITECTURE) 14
4.9 远程数据审计(REMOTE DATA AUDITING) 14
4.10 数据占有(DATA POSSESSION) 15
5. 结论 15
参考文献 15
PAGE
PAGE 19
大数据存储研究文献综述
摘要:“大数据” 通常指的是那些数量巨大、难于收集、处理、分析的数据集,亦指那些在传统基础设施中长期保存的数据。大数据存储是将这些数据集持久化到计算机中。国内外对大数据存储的研究目前处于成熟期,发展中存在一些潜在问题,但是机器学习、光子晶体、集群计算的发展为大数据存储提供新的契机与研究方向。本文拟分析目前大数据存储的发展现状、研究热点与发展趋势,为大数据存储研究的开题指明方向。
关键词:大数据存储 文献综述
前言
“大数据” 通常指的是那些数量巨大、难于收集、处理、分析的数据集,亦指那些在传统基础设施中长期保存的数据。这里的“大”有几层含义,它可以形容组织的大小,而更重要的是,它界定了企业中IT基础设施的规模。业内对大数据应用寄予了无限的期望,商业信息积累的越多价值也越大。
从整体上看,在大数据存储领域有一定的研究成果,国内相关领域研究于本世纪10年代起步,本世纪10年代开始该领域研究热度升高,主要集中于分布式文件系统、技术与非结构化数据等研究方向;国际方面,针对大数据存储的研究源于二十一世纪初,兴起于本世纪10年代,重点研究方向包括机器学习、光子晶体与集群计算等。根据成熟度理论,大数据存储的发展期共经历四个时期:2006年-2015年是该领域的萌芽期,此时,全球对大数据存储的研究方兴未艾,无论是论文发表数量还是学者数量都普遍较少。2015年之后,大数据存储领域进入到了高速的发展期,相关研究数量呈指数级增长,研究内容也愈发丰富。一直到2018年,大数据存储的研究步入成熟期,论文发表数量保持增长,但增速逐渐放缓。从2023年开始,该领域的研究日趋减少,大数据存储的发展进入稳定期。
本文采用文献计量学、科学知识图谱、自然语言理解等研究方法,借助 猎研SciRadar一站式科技创新情报平台,利用大数据分析和文本挖掘技术,采用2006-2022年期间大数据存储领域的全球期刊和会议论文数据,综合梳理大数据存储领域内的国内外研究现状,分析大数据存储领域的研究热点和新兴研究领域,并通过相关统计预测模型估算判断其未来发展趋势。
研究现状
2.1 国内研究现状
国内研究现状分析数据主要来源于中文期刊。早期的研究有:Hubert Yoshida(2012)[1]重点探究了大数据存储平台必须具有弹性。学者(2012)[2]着重探究了大数据存储解决方案。后续的研究有:金培权等(2013)[3]主要分析了面向新型存储的大数据存储架构与核心算法综述。丁兆明等(2013)[4]集中剖析了大数据存储和分析技术应用及标准化。郭建波(2013)[5]重点发表了海量结构化大数据存储检索系统探讨。宫婧等(2014)[6]主要探索了大数据存储中的容错关键技术综述。冯汉超等(2014)[7]集中探索了分布式系统下大数据存储结构优化研究。安洋等(2014)[8]集中描述了基于行列混合存储的大数据存储方法研究与实现。宋亚奇等(2015)[9]主要研究了云平台下输变电设备状态监测大数据存储优化与并行处理。李婧等(2015)[10]集中阐述了地质大数据存储技术。史玉良等(2015)[11]着重发表了基于MongoDB的前置通信平台大数据存储机制。陈阳等(2016)[12]集中阐述了基于NOSQL的大数据存储安全性分析。杨静(2016)[13]着重探索了分布式系统下大数据存储结构优化策略初探。郭文惠(2016)[14]重点分析了数据湖——一种更好的大数据存储架构。朱永利等(2017)[15]主要描述了ODPS平台下的电力
您可能关注的文档
最近下载
猎研 SciRadar 一站式科技创新情报平台,全球学术期刊、会议论文有哪些信誉好的足球投注网站引擎,文献计量在线分析,极速辅助科研选题,智能文献综述,一键生成开题报告。
文档评论(0)