中医古籍语言系统构建的关键问题与对策论文.docVIP

中医古籍语言系统构建的关键问题与对策论文.doc

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中医古籍语言系统构建的关键问题与对策论文.doc

  中医古籍语言系统构建的关键问题与对策论文 .freelLS)现代部分的构建已初具规模,但中医古籍部分的语言系统建设却一直缺如。中医古籍所含学术内容在整个中医药体系中具有根基性的重要地位,以古汉语为表述方式的中医古籍学术体系有别于现代中医药语言体系,两者决定了中医古籍语言系统是TCMLS的一个不可或缺的组成部分。笔者在此基础上进行尝试,并试图对实践过程中遇见之问题勉力探讨。 1 背景介绍 TCMLS是以UMLS(一体化医学语言系统)为参考,以本体论为指导,以中医药语言特点及学科体系为依据,以Vocabulary Builder软件为平台研制开发的,在UMLS原有语义类型和语义关系的基础上,.freelLS是古籍语言系统构建的基础,在其总目下增加古籍术语一类,暂作为古籍语言系统加工的平台。 2 存在问题及初步解决方案 2.1 中医古籍分类体系的构建问题 古籍分类就是按照古籍内容的学科性质分门别类,将之组织(构建)成一个知识体系。其作用在于不仅能够呈现古籍的基本内容、同一科目有些什么古籍,而且还可以揭示出各个科目所含古籍之间的相互关系。现有的《中国图书分类法》和《全国中医图书联合目录》分类法,均不能较好地解决构建中医古籍语言系统所需要的分类体系。因其或注重学术流派,或关注图书本身,而对文献的内容关注较少。语言系统整体框架内古籍部分的分类显然不能局限于文献图书本身,而必须立足于文献所包含的知识,方能更好地分析把握其含义及相关关系。 在现代中医药语言系统分类体系的基础上,根据古籍的特点进行分类的修订和完善,预先建立一个能够满足中医古籍语言系统整体架构需求的分类体系比较困难,而且自上而下建立的分类可能遗漏古籍中的部分信息。 有鉴于此,本研究采取先在《内经》、《伤寒论》的章节目录下进行现有词条加工的方法,在完成3本词典1万余词条的处理后,根据相应词条上位词的提取构建古籍的分类体系的初步轮廓,在此基础上进行修订。由下而上根据具体概念的上位词所反映出的上下位关系而最终建立起古籍分类体系,以期更切合实际,易于被最终用户理解和接受。 2.2 古籍概念定义问题 2.2.1 定义筛选问题 古籍中的概念定义纷繁复杂,如“下”在《内经词典》中有多达20个不同的定义,其中“在下”、“向下”、“低处”、“量词”等解释,与医学关系不甚密切,属于公共领域的含义,这样的概念定义加工进语言系统非但意义不大,而且会使整个系统变得冗余。所以,采取先筛选出与医学相关的定义,然后再加工的原则进行概念词的录入。 2.2.2 定义取舍问题 依据词典的解释相对比较确定,但却不是古籍语言系统加工的唯一路径。古代医学概念语义具有较大的复杂性、多义性,这是对其理解的难点,同时也影响、制约着TCMLS的构建,对概念语义失之辨析,会导致语义网络的失真、错误,影响语言系统的最终应用。如何给内涵和外延都很复杂的古籍概念进行比较明确的定义,是关系到古籍语言系统构建准确性的关键问题。参考和借鉴各领域的必威体育精装版研究成果是目前可行的途径。 如针灸概念部分可以以“针灸理论文献通考”项目组的必威体育精装版研究成果为依托,进行下一步的加工处理。如若没有现成的研究成果,可以在加工过程中及时咨询专家意见,以不断调整完善。 2.3 与原有系统概念的兼容问题 中医古籍语言系统的构建不但要尽力展现古籍中同一概念术语在不同语境、文本、历史时期中内涵的演变,建立概念之间的同义、近义以及相关关系,从而避免检索中可能出现的遗漏或错检,而且要最终实现古籍概念术语与现代中医药语言系统之间的互通甚至与UMLS的兼容。 古籍概念与现代部分的中医药概念完全同名,但是意义却完全不同。如“根”,在药用植物学里是植物体生长在土壤中的营养器官,而在古代针灸概念中却是“井穴”,二者全然不同的含义使我们在加工处理的时候,要进行进一步的区分,以便可以快速有哪些信誉好的足球投注网站到检索者想要查询的概念。如在“根”后面用括号的形式标注出所属学科,可以避免药用植物学中“根”这个作为类存在的概念与针灸学中的具体概念“根”发生混淆。这是具体加工过程中初步的解决方案。 2.4 古籍概念的加工来源问题 TCMLS的建立最初都是来源于教材、词典、工具书,因其有比较明确的定义,便于加工处理。这对于中医药学现代部分而言比较合适,但古籍的概念比较分散,不是几本工具书就能涵盖包容的。所以,古籍语言系统未来的加工范围要扩展到具体古籍,如《千金方》、《外台秘要》等,这就需要制定更为详尽的规则。 如何在古籍文本中获取领域概念?所谓领域概念,从某种意义上讲是领域知识在文本中的外在表现。领域概念的获取就是从领域文本集合中抽取最能代表该领域的概念集合,这个过程包括从领域文本中抽取术语集合、词性规范(同义词处理)以及领域概念的筛选和确定2。换言之,我们要加工的概念是否是语义的集合,

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档