- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医学数字资源语义互联模式探究
医学数字资源语义互联模式探究[摘要]在充分复用丰富的医学知识组织体系基础上,构建以UMLS为主导的多本体融合的医学数字资源语义互联模式,即一种基于全局本体统控、多种本体融通的模式框架。以UMLS为主导的多本体融合模式由三个基本层和两个链接层构筑。从UMLS本体的全局统控、多本体融合的语义标引机制、多本体融合的语义检索模式、多本体融合的信息集成构架这4个方面详细阐述医学数字资源语义互联的机理。从自然语言处理、智能检索、本体学习、知识发现和专业知识聚类等方面分析医学数字资源语义互联的功能。
[关键词]语义互联 本体 全局本体 UMLS [分类号]G250.73 1 引言 语义提取、语义分析、语义检索、语义集成和语义互操作已经成为当前语言学、逻辑学、图书馆学情报学、计算机科学等领域的研究热点。各领域从不同角度进行理论探讨和技术挖掘,力图进一步推动数字资源的语义互联和语义互理解。随着本体理论的日趋深入和本体技术的渐臻发展,本体作为一种蕴含知识间语义关系且能在知识层提供知识共享和复用的工具已经得到共识,以本体为知识组织核心的语义检索成为主要研究方向,并已积累了一定的研究成果。在此基础上,专家学者开始探讨本体在知识管理、语义互操作、决策支持和推理中的应用,并探讨本体促进数字资源语义互联的模式、机制并构建实验性系统。在医学领域,由于美国国立医学图书馆长期的积累,已经形成世界范围公认的知识组织体系,包括科学的叙词表、各种本体、医学术语标准、国际分类标准等。这为医学领域的数字资源进行语义互操作奠定了基础,为整合分散的、异质的各类生物医学数据源提供了保障。本文整合各种领域本体,集成各领域本体中的概念、术语和概念之间的语义关系,提出了医学数字资源语义互联模式――以UMLS为主导的多本体融合模式。
本文的研究意义在于促进各种知识本体在医学信息领域中的有效共享,为建立智能化的医学临床科研融合系统提供基础性研究,为进行深层次的医学数据挖掘与服务提供理论支持。
2 医学数字资源语义互联模式 UMLS(the Unified Medical Language System)是美国国家医学图书馆(National Library of Medicine,NLM)设计和维护的一体化医学语言系统。UMLS词表已成为词典标准在生物医学知识中共享,并被应用于生物医学数据库的信息提取和集成、本体的语义集成等。鉴于此,在构建医学数字资源语义互联方面,充分利用专家对UMLS在描述概念方面已取得的研究成果不失为一个捷径。
医学数字资源语义互联模式是以UMLS为主导的多本体融合模式,其充分考虑了UMLS在描述概念和语义集成方面的优势地位,为生物医学用户提供了统一的语义空间。在该语义空间中,异构数字资源通过语义标引实现语义互理解,用户可以对生物医学文献、生物医学数据库、临床数据进行数据挖掘、数据集成、决策支持、自然语言处理和知识发现,实现对知识的智能服务和共享。该模式是一种基于全局本体统控、多种本体融通的数字资源语义互联模式框架,见图1。在该模式中,每一种本体发挥他们各自在数据挖掘、语义分析、语义检索方面的作用,充分体现出本体的复用以及对现有知识组织体系的再利用;另外,该模式将提供词典标准的UMLS作为全局本体,形成共享的词汇集,从而保证本体之间的语义互理解。
3 医学数字资源语义互联的结构 以UMLS为主导的多本体融合模式由三个基本层和两个链接层构筑。
3.1基本层 层是系统与用户的交互接口,用户通过应用接口层对异构数据源进行语义查询、数据挖掘等操作。
UMLS为主导的多本体融合数字资源互联模式的关键所在,该层以UMLS为全局本体,通过本体映射和本体集成方法与工具复用医学生物学领域本体。
(蛋白质)数据、文献数据和网页数据。
3.2链接层 引注释、检索和跨医学信息资源和本体的映射,反映数据资源层与语义层的交互。
策支持与推理层。该层位于用户层与语义层之间,在该层上,本体作为一种语义核心集支持对自然语言的处理、数据的集成、决策支持以及知识发现。
三个基本层是医学数字资源语义互联的根本和目的所在,两个链接层是数字资源语义互联功能和智能的体现。
4 医学数字资源语义互联的机理 4.1UMLS本体的全局统控 医学知识本体为用户、资源和服务提供了信息交互的理解平台,为信息共享提供了可能性。目前,国际上开源的生物医学领域本体大体分为4种:基于医学信息检索的本体类型(UMLS、MeSH),基于生物医学数据的本体类型(OBO系列本体、GO),基于临床医学的本体类型(OpenGALEN、转化医学本体TMO),基于医学调查的本体类型(OBI)。这些医学领域本体或者建立了临床术语,或者为关联、集成和转化以患
您可能关注的文档
- 前循环动脉瘤介入栓塞治疗.doc
- 剑桥商务英语口语考试介绍及应试技巧.doc
- 前沿实验课程在综合型药学人才培养中初探.doc
- 剖宫产后疤痕子宫人流手术风险分析及防范对策探析.doc
- 剖宫产术后再次妊娠阴道分娩成功影响因素及母婴结局分析.doc
- 剪纸动画守望者――吴云初.doc
- 剖析初中英语书面表达教学有效性.doc
- 剪纸艺术在幼儿园环境创设中应用.doc
- 副枪DIRC系统在型钢炼钢厂自动化应用.doc
- 力学在大型水坝发展中作用探析.doc
- 广东省韶关市乐昌市(2024年)七年级上学期生物期中试卷.docx
- 贵州省黔南布依族苗族自治州罗甸县(2024年)七年级下学期期中质量监测生物试题(含答案).docx
- 广东省汕头市澄海区(2024年)下学期期末七年级历史科试卷(word版含答案).docx
- 广东省江门市(2024年)七年级下学期生物7月期末试卷.docx
- 广东省清远市连州市(2024年)七年级下学期生物7月期末试卷.docx
- 冀教版七年级数学上册2.3 线段的长短 同步测试卷(2024年).docx
- 第一章 走进物理世界 单元卷(含解析) -2024年物理沪粤版八年级上册(2024年).docx
- 冀教版(2024)七年级上册英语期中测试卷(含解析+听力书面材料).docx
- 广东省广州市黄埔区(2024年)七年级上学期历史期末试卷(A卷).docx
- 福建省三明市尤溪县(2024年)七年级(上)第二次月考历史试卷(含解析).docx
文档评论(0)