网站大量收购闲置独家精品文档,联系QQ:2885784924

中药数据优化处理探讨.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中药数据优化处理探讨.pdf

19 第33卷第19期 中国中药杂志 V01.33,Issue 2008年lO月 China ofChineseMateriaMedica October,2008 Journal ·学术探讨· 中药数据优化处理探讨 林端宜h,徐筱杰2,杨淑静3,赖新梅1,乔学斌2 (1.福建中医学院信息所,福建福州350003; 2.北京大学中药中药现代化研究中心,北京1000871; 3.福建中医学院中医系,福建福州350003) [摘要】 要获得高信息含量的、有用的知识,理想情况就是原始数据是不含噪声的正确数据。中药数据库系 统是数据库技术在中药领域的运用,是在中药信息研究过程中,对大量不规范的原始数据进行分析、整理、补充、完 善建立起来的。本研究结合在建的中草药信息系统回顾中药数据处理加工中的若干关键问题。 [关键词】 中药;原始数据;数据处理;数据库 [中图分类号]R284.1[文献标识码】A[文章编号】1001-5302(2008)19-0-03 有科学价值的数据库,应能实现基于数据库的数据挖掘 多种来源的药材,即中药的多基源性。多基源药材大部性状 和科学研究。数据库是支持知识发现的基础工程。要获得 相同,如黄芩、贝母、细辛、柴胡同属多种,并具有相同的疗 高信息含量的、有用的知识,理想情况是原始数据是不含噪 效;但部分性状有明显区别,如细辛中的紫背细辛和深绿细 声的正确数据¨J。中药数据库系统是数据库技术在中药领 辛含有大量具有致癌作用的黄樟醚,不能作为细辛用p1。其 域的运用,是在中药信息研究过程中,对大量不规范的原始 二,不同药用植物可能却有同一个叫法,如地瓜,在四川指的 数据进行分析、整理、补充和完善建立起来的。中药数据库 是豆薯,两者分别为旋花科和豆科”J。 与其它数据库最大的不同就在于,它的内容考虑了中药理论 构建高质量的中药数据库,必须对原始数据进行数据预 语言以及概念的特殊性口1。因此,数据库建设中最基础性的 处理,特别是中药名称,使其具有统一性和规范性。 工作当从数据源的选择和原始数据的预处理做起。本研究 2数据源的选择与分析 结合中草药信息系统课题,就构成信息资源本土化、科学化 数据是组成数据库的基本单元,中医药数据预处理方法 特色的中药数据加工处理部分工作做一回顾。 需要设计与实现pJ。首先优质数据来自优质数据源,数据源 1中药数据的概况 科学性和权威性是建库质量保证第一关,因此,数据源的选择 1958年,1966年,1983年3次全国中药资源大规模普成为数据库建设的第一步。但数据源不只是来自一种出版 查,我国药用植物12694种p1,是药用植物资源大国。中药物,是多种权威出版物集大成,由于各出版物在体例、用药名 根植于中国,带有极强的本土特色。由于幅员辽阔,地理环 称、拉丁名等用法上不尽相同,甚至出错,因此,在数据源选择 境多样,气候复杂多变,并受历史、地域条件、用药习惯等因 之后还要针对原始数据种种问题进行预处理,归一处理等。 素的影响,使有些中药材品种产生混乱现象HJ,表现在中药 2.1建立权威文献集群本系统数据源依次选择如下蓝 材的同名异物和同物异名现象,中药材的多基源情况等,严 本:032005年版《中国药典》,@2006年版《新编中药志》,③ 重影响临床使用、科学研究和中医药的发展。 1975年版《中药大辞典》,④1994年版《中国中药资源志要》, “同物异名”现象与语言和文字的不同习惯用法相关。 ⑤1999年版《中华本草》。同时还选择若干权威版本数据源 各地均有其习用的植物名称,就是在一个国家内

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档