- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据时代基于云计算的数据监护研究
大数据时代基于云计算的数据监护研究
在大数据时代,为了更好地管理和利用科学数据,计算机图灵奖获得者Jim Gray于2002年提出了数据监护(Data Curation)的概念。十余年来,数据监护一直是国内外信息资源管理领域的热点议题,研究主题集中在数据监护的内容、发展策略、合作模式、职业教育、成功实践等领域。111鉴于云计算能够为数据监护提供强有力的技术支撑,如云计算快速提供资源的能力有助于辅助完成资源密集型数据监护任务,网络化云服务有利于实现数据监护的协同工作,基于云计算开展数据监护引起了国外信息资源管理学界和业界的广泛关注。本文对基于云计算的数据监护问题进行探讨,希望对我国的数据监护工作有所借鉴。
一、数据监护工作流程
数据监护是为了确保数据当前的使用目的,并能用于未来再发现及再利用,从数据产生伊始即对其进行管理和完善的活动。121为了有效指导数据监护实践,提高数据监护效率,一些数据监护机构和研究者对数据监护过程进行了概念化,提出了相应的数据监护生命周期模型。本文基于英国数据监护中心的DCC数据监护生命周期模型13与王芳和慎金花提出的细化的数据监护生命周期模型,梳理出了数据监护工作流程,见图1。数据监护工作流程由4个阶段、11个业务环节组成,涵盖了数据监护的所有必要阶段和核心工作。
数据收集阶段:数据采集。数据采集是数据监护活动的起点,指根据采集政策,从数据创建者、档案馆、知识库或数据中心等接收数据。元数据创建。为采集到的数据创建管理、描述、结构和技术元数据,以便进行数据管理和数据维护,以及实现数据共享。
数据处理阶段:数据评价和选择。评估数据并为长期监护和保存选择数据。数据评价和选择直接关系到科学数据库的质量,并且带有一定的主观性。数据剔除。根据成文的政策、指引或法律要求,处理未成为长期监护和保存对象的数据,将这些数据转移到其他档案馆、知识库、数据中心或其他保管机构。根据法律要求,有些数据会被安全销毁。数据导入。将经过选择的数据传送至档案馆、知识库、数据中心或其他数据监护机构。为保证数据的可用性,在导入数据之前,应进行去重、交叉注释、格式认证等。数据迁移。根据存储环境的需求,或者为了确保数据对硬件和软件退化的抗扰性,改换数据的格式、存储系统、存储类型。
数据保存阶段:数据长期保存。长期保存须确保数据的可信性、可靠性、可用性和完整性。长期保存包括数据清洗、数据验证、分配保存元数据、分配表征信息,保证数据具备可接受的数据结构和文件格式。数据存储。遵守相关标准,选择科学的组织方式和安全的存储介质组织并存储数据。数据存储既可以保证数据的安全性,又便于数据被随时使用和加工处理。
数据利用阶段:数据获取。采用适当的标准发布数据,并执行严格的访问控制和验证程序,保证用户安全、准确的访问和获取数据。数据复用。制订数据复用规则,在不违反知识产权的前提下,提供数据复制、链接、引用等服务。数据转换。根据原始数据创建新数据。例如,通过转换格式、建立子集等途径,创建新数据。
二、云计算为数据监护提供支撑
云计算作为分布式计算、网络存储、负载均衡、热备份冗余等计算机和网络技术融合的产物,具有超大规模、虚拟化、通用性、高可扩展性等诸多特点。云计算的特点与数据监护的需求非常契合,可以为数据监护提供强有力的技术支撑。
弹性服务:云计算服务的规模可快速伸缩,以自动适应业务负载的动态变化。用户使用的云计算资源与业务的实际需求相一致,避免了因为资源供需不匹配而导致的服务质量下降或资源浪费。161数据监护的数据剔除和数据迁移等任务不需要持续不断的执行,属偶发性活动。云计算的弹性服务能够很好地满足偶发性数据监护活动的资源调用需求。
按需服务:云计算以服务的形式为用户提供基础设施、存储空间、应用程序等,并能够根据用户的需求,自动分配各种资源。17用户也可以根据需要在云中部署所需的应用程序。云计算的按需服务为数据监护中需要依赖主观意识完成的任务,如元数据创建、数据评价和选择提供了极大的便利。
泛在接入:用户通过互联网可以随时随地利用云计算服务。数据用户越来越多的使用笔记本电脑、智能手机、平板电脑,将数据监护业务流程转移至云,能够极大地方便用户上传、访问和下载数据。数据监护的数据采集、数据获取和数据复用等业务环节,可以从云计算的这一特点中受益。
服务外包:用户进行数据处理所需的计算资源价格昂贵,将提供计算资源的业务委托给云服务商,既能够节省开支,又能够使用户专注于自己的核心工作。云服务商为了利益最大化,保持最优竞争力,都会迅速应对技术变革,以更低的价格提供更快的处理器和更大的存储空间。云计算服务外包的特点使数
您可能关注的文档
最近下载
- (完整版)电气设备安装标准规范.pdf
- GB∕T 13861-2022生产过程危险和有害因素分类、解读与示例说明清单【危险源识别工具】(雷泽佳-2024A0).doc
- 2021年中国光大银行校园招聘在线测试笔试题考试真题笔经.doc
- 新浪·按键精灵开发者1级认证参考解析.docx VIP
- 2023年福建省各地中考语文模拟卷【文学类文本阅读题解及答案解析】汇集.docx VIP
- 皮亚杰认知发展论.ppt VIP
- 2.1 几代中国人的美好夙愿 课件初中读本.ppt
- 流域化“厂网一体”运营模式的探索与实践.pdf
- 半导体制造技术离子注入工艺.pptx
- 全国普通话水平测试用普通话词语表(表一+表二).pdf
- 软件下载与安装、电脑疑难问题解决、office软件处理 + 关注
-
实名认证服务提供商
专注于电脑软件的下载与安装,各种疑难问题的解决,office办公软件的咨询,文档格式转换,音视频下载等等,欢迎各位咨询!
文档评论(0)