基于生命周期的生命科学数据质量控制体系研究.docx

基于生命周期的生命科学数据质量控制体系研究.docx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

基于生命周期的生命科学数据质量控制体系研究

?

?

夏义堃管茜

摘??要:数据是生命科学研究的基础性资源,研究生命科学数据管理的质量控制对推进科学数据管理和生命科学理论与研究方法创新具有重要的现实意义。基于生命周期理论,通过政策文本分析、案例比较和文献调研,系统梳理了不同主体在生命科学数据的管理计划、采集、组织、保存、共享利用不同阶段中的质量控制措施提出不同阶段生命科学数据质量控制的核心要求,构建了包括基础层、主体层、流程控制层三个层次的生命科学数据质量控制体系。

关键词:科学数据管理;数据质量;质量控制;数据生命周期;生命科学

AbstractDataisabasicresourceinlifescienceresearch.Theresearchoflifesciencedatamanagementofqualitycontrolcanadvancescientificdatamanagement,andlifescienceinnovationtheoryandresearchmethodhasimportantpracticalsignificance.Basedonthelifecycletheory,throughpolicytextanalysis,casecomparisonandliteratureresearch,thispapersystematicallysortsoutthequalitycontrolmeasuresofdifferentsubjectsindifferentstagesoflifesciencedatamanagementplanning,collection,organization,preservation,sharingandutilization.Inthispaper,thecorerequirementsoflifesciencedataqualitycontrolatdifferentstagesareputforward,andthelifesciencedataqualitycontrolsystematthreelevelsisconstructed,includingthebasiclayer,themainlayerandtheprocesscontrollayer.

Keywordsscientificdatamanagement;dataquality;qualitycontrol;datalifecycle;lifescience

生命科学在20世纪后期出现了飞跃式的发展,以基因测序、基因组学、蛋白质组学和生物信息学为代表的技术加快了生命科学领域数据的产生速度[1],数据的积累与利用已经成为推动生命科学研究不可缺少的组成部分。海量的生命科学数据不仅具有传统大数据的“4V特征”,还因研究对象、存储结构、参数标准、应用场景等多元性而格外复杂,同时,人体受试样本的隐私保护、动物样本实验的伦理约束等进一步增添了数据管理的难度。

如何对体量巨大、增长迅速、多源异构且隐私伦理属性突出的生命科学数据进行有效地质量控制与开发管理,既是当前科学数据管理工作亟待突破和解决的重要问题,也是生命科学研究创新的前期条件。本文基于数据生命周期理论,着重分析了生命科学数据质量控制的主体行为与基本做法,构建了質量控制的主体行为与基本做法,构建了包括基础层、主体层和流程控制层在内的生命科学数据质量控制体系,以期为我国生物科学数据质量控制提供借鉴参考。

1??研究回顾与问题的提出

1.1??生命科学数据质量研究综述

近年来,生命科学进入“大数据”时代,生命科学领域研究结论的可靠性常被质疑,数据的再利用性以及实验的可再现性接连出现问题,并引发国内外学者的关注,相关研究主要集中在以下几个方面:

(1)生命科学数据质量内涵及评估指标体系研究。生命科学数据质量是一个多维度概念,可理解为多个质量特征的集合,并受到学科、数据类型和应用目的等影响。除遵循国际通用的FAIR原则外,Flatley和Stead[2]从一致性、正确性和完整性角度讨论了临床记录数据质量的概念;Weiskopf和Weng[3]将合理性和通用性视为质量考察维度;Kahn等[4]构建了针对电子健康记录临床研究数据的质量评价模型,主要指标有准确性、可信性、客观性、及时性和数据量的合理性;Chen等[5]从数据本身、数据使用和数据收集3个角度描述

文档评论(0)

159****4253 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档