- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
科学研究数据出版与获取
科学研究数据出版与获取
[摘 要] 分析数据出版遇到的挑战,介绍用知识螺旋模型出版数据的简单过程,并探讨数据存储库如何采集高质量数据。
[关键词] 科学研究数据 数据出版 数据获取
[中图分类号] G237 [文献标识码] A [文章编号] 1009-5853 (2013) 06-0086-04
[Abstract] Analyze the issues faced by data publication,introduce the simple data publication process based on the knowledge spiral model,and expound how data repositories collect and store high-quality scientific research data.
[Key words] Research data Data publication Data acquiring
不仅 “大科学”有所谓的海量数据现象,所有学科都有产生大量原生数据和派生数据的趋势。在科学技术飞速发展的今天,科学研究数据的作用越来越大,在数据发挥核心作用的所有研究中,对数据可验证性的期望不断增加[1],而且为了进行进一步的研究,对现有数据集进行重组或重新利用的需求也在不断增加[2]。世界范围内的科学数据共享势在必行,要实现共享就要做好科学数据的出版工作。国内对此也有研究,王萍等提出基于网格技术的科学数据存储与共享[3]。但是,目前数据出版还处于发展阶段,数据文献的状况在各研究领域和各个学科有着很大差别。
1 数据出版中的问题
和传统的文字出版物相比,数据出版更具有挑战性。每当人们谈及学期论文或毕业论文时,考虑的几乎都是文字出版物的类型,比如期刊论文、书籍等,很少会想到数据。而数据出版作为新生事物,在以下诸多方面都面临着亟待解决的问题。
1.1 文件格式
文字出版物的格式,如TXT、HTML、RTF、Word、OpenOffice、PDF、LaTeX等,已经被全世界所有学科的研究人员广泛使用。
科学研究数据也有几种格式,如XML、电子表格、二进制格式等,要根据某一领域的需要选择所需要的格式。个别格式用标准工具不能打开,需要安装专门的分析和可视化软件。
1.2 内容特征
科学研究数据比纯文字研究论文的目的性更强。研究论文具有主观性特征,因为写论文的目的就是传播知识。为此,作者建立了具有逻辑性和引导性的结构,突出重要方面,解释数据,使用表格、数字和图片来进行具体陈述。
而数??文件往往直接或间接由计算机或仪器产生。一般情况下,对文件有严格的标准要求,并由计算机输出和进行优化处理。因此,数据文件客观而清晰,一般情况下不需要人工检查。
1.3 科学质量保障
文字性出版物的科学质量保障,一般以同行评审方式来实现。对一篇论文来说,编辑主要审阅作者的主张、逻辑性及对其他出版物的引用。同行评审即审阅人,其往往是同一领域的专家,要对主题有深刻理解。此外,由于论文是为了让读者阅读,所以要对其进行优化,并且还对页码有限制。
比较而言,数据是庞大的,而且数据存储方式不可能优化到使读者都容易接受的程度。所以,多数情况下,数据的科学质量保障不能做到完全使人满意,而且一般都要依赖于计算机的帮助。怎样对数据进行科学质量保障还不是很明确。此外,数据的科学质量保障在很大程度上还要看数据类型及其所属的研究领域。而除了原始数据本身,还需要对元数据进行审核。总之,科学数据的审阅人员必须具有相应的能力和软件工具使用技能才可能进行质量控制。由于上述困难,对数据质量的控制往往不是靠同行评审,而是靠作者自己。
1.4 版式质量保障和技术质量保障
文字性出版物的版式质量保障主要集中在处理文字、排版和结构方面。一般来说,这个过程审阅人不需要对内容有更深的理解。它是科学出版物质量保障的一小部分内容。
对于数据文件,应该称为技术质量保障。这个过程要对数据进行验证,确保数据从源头到目标位置的无差错传输。在此过程中,评审员要检查数据是否完整,是否有异常。
1.5 浏览和检索
研究论文直接包含检索词,而且有明确的元数据,分类和索引过程相对简单。数据库支持所有前面提到的文本文件格式。
如果数据文件格式不能被有哪些信誉好的足球投注网站引擎识别,或者数据本身非常大,那么数据文件的索引就必须限制在给定的元数据中,因此,数据文件的元数据是浏览和检索的关键。
1.6 存储地址
纯文字文献,即使是综合出版物也可以保存为单个文献,并存储在仓储中。因此,仓储可作为长期存放地址,直接满足用户获取论文的需求。
数据文件处
您可能关注的文档
最近下载
- 5年(2019-2023)中考1年模拟英语真题分项汇编(全国)专题06 阅读理解之说明文(解析版).pdf VIP
- 《会计基础》教案 第2课 会计基本假设、会计基础、会计信息质量要求和会计准则体系.doc
- 4.《望海潮》《扬州慢》比较阅读教学设计2023-2024学年统编版高中语文选择性必修下册.docx
- 熔化焊接与热切割安全技术实际操作考试.docx
- 中图版地理七下期中复习提纲.pdf VIP
- 部编版语文二年级下册全册优秀ppt课件.pptx
- 马铃薯种传土传病害.ppt VIP
- 生猪屠宰兽医卫生检验人员考试题库5份(含答案).docx
- 四川省2021年10月自考03331公共事业管理试题.doc
- 常用玻璃量器检定培训课件.pptx
文档评论(0)