大数据背景下科学数据互操作实践进展研究.docx

大数据背景下科学数据互操作实践进展研究.docx

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

??

?

??

大数据背景下科学数据互操作实践进展研究

?

??

?

?

?

?

?

?

?

???

?

?

?

?

?

杨京王效岳白如江

(山东理工大学科技信息研究所山东淄博255049)

摘要:文章在梳理科学数据互操作的基本概念和必威体育精装版研究进展的基础上,重点介绍了欧盟科学数据基础设施建设项目GRDI2020、美国安全数据研究组织IJIS以及医学数据研究所WestHealth三个不同性质的国际机构对科学数据互操作的实践研究状况,进而指出目前科学数据互操作实践研究中面临的政策落实困难、难以制定共同的标准协议、缺乏定义互操作的共同框架、数据质量低等问题。

关键词:大数据;科学数据;互操作;GRDI2020;IJIS;WestHealth

中图分类号:G203文献标识码:ADOI:10.11968/tsygb.1003-6938.2015069

收稿日期:2015-03-26;责任编辑:刘全根

1引言

大数据时代的计算机和数字设备产生并积累了海量的科学数据,科学研究从独立、小型的学术行会形态转移到大规模、更加互联和开明的科学家群体中。科学研究范式相应发生了根本性转变,进入到基于数据密集型计算的“第四范式”。这一范式的特点是科学研究建立在掌握尽可能多的科学数据基础之上。因此,迫切需要将科学数据纳入正式的学术交流过程,使之成为一种跟文献一样可以公开获取的资源。正如吉姆格雷描述的科学研究第四范式愿景:“能够实现所有的科学数据和文献的统一,创建数据文献交互操作的世界,更好的实现学术交流。”[1]

科学数据的互操作正是实现上述愿景的一个先决性条件,它帮助实现跨学科、跨社区的学术信息交流。CODATA中国委员会将科学数据的互操作列为大数据时代支撑科学研究的共性技术之一[2]。因此,实现科学数据的互操作,构建基于科学数据的第四范式对学术信息交流和创新具有深远的意义。

2科学数据互操作概述

2.1科学数据互操作概念

大数据时代越来越需要跨学科进行科学研究,比如地理观测领域依赖于多学科的科学数据分析,包括水文学、地质学、农学、地理学、生物学、GIS等。但是由于不同学科的系统和软件平台不同,产生的科学数据在格式、结构、语义关联、准确度等方面都存在差异。比如水文学计量长度的单位是米,数据格式是MIF,而地质学用的是千米,数据格式是GML。因此需要对科学数据实行必要的转换,实现就这一过程是科学数据互操作。

科学数据互操作作为整个互操作问题的一方面,目前还没有一个统一的定义,许多学者立足各自的视角对其提出了不同的观点。例如ScottA.Renner教授将科学数据互操作定义为跨越不同组织机构和系统的界限以一种统一、有效的方式正确阐释和理解科学数据的能力[3];Maurice教授认为科学数据互操作是为有效的信息交流而进行的数据管理活动,包括科学数据的清洗、耦合、融合、迁移以及信息提取等[4];MarijnJanssen教授认为科学数据互操作是两个或更多的数据集相互连接、结合、处理的能力[5];NancyIde教授等人把科学数据互操作分为语法互操作和语义互操作两方面。其中,语法互操作是指系统依赖于特定的协议进行相同格式的结构化数据交换,通常是通过XML格式和Web服务技术;语义互操作确保信息以相同的方式进行解释,这要求对不同本体的共同理解[6]。

根据以上学者对科学数据互操作的不同定义,本文认为科学数据互操作强调把不同格式和结构的数据集成在一起操作,可以理解为两个或更多的学科系统之间交换彼此的数据集信息并且使用所交换信息的能力。

2.2科学数据互操作必威体育精装版研究进展

大数据时代科学研究范式的变革要求科学数据是开放和互操作的,它的实现会极大推动科学研究的步伐。因此,学者们对其研究表现出极大的热情。会议方面,“种质资源数据互操作国际电子商务大会”(2013年12月)[7]与“第八届加拿大公共安全科学数据互操作研讨会”(2014年11日)[8]相继召开,科学家们共同探讨了各自领域不同数据源和资源的当前互操作状态以及面对的问题;2014年4月“语义互操作大会”在雅典召开,旨在促进语义互操作技术的发展[9]。

理论研究方面,美国SAFECOM国土安全项目[10]以及R.Rezaei教授[11]分别提出了用来定义和衡量科学数据互操作体系成熟的五个阶段。实践探索方面,张晓林教授[12]、JFEthier教授[13]以及MADhuieb教授[14]等针对不同的应用场景构建了相应的科学数据互操作规范框架;何克清教授[15]、王芳教授[16]等对科学数据互操作标准协议的应用进行了深入研究。社会应用层面,爱尔兰EdwardCurry教授[17]以美国MarijnJanssen教授[5]等试图通过关联数据和数据组合的方法促进科学数

您可能关注的文档

文档评论(0)

136****6482 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档