基于数据仓技术的中药科学实验信息数据库.doc

基于数据仓技术的中药科学实验信息数据库.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于数据仓技术的中药科学实验信息数据库

基于数据仓库技术的中药科学实验信息数据库 陆嘉明 中药实验数据仓库是科技部基础性课题----“中医药科技信息数据库”的子课题之一。收录范围是自1990年以来公开出版在中文医学期刊上的有关中药单味药、方剂、化学成份在药理、临床药理、毒理方面的一次实验文献。课题总周期三年,目前已经进行了两年。 1. 概况: 本数据库采用计算机数据仓库技术,在忠实于原文献内容的基础上,按照中药学研究的特点,建立了十五个空间维,将收录内容进行编辑和结构化存储,实现了对中医药文献资料中出现的术语进行规范表达以及术语间的相互关系的多重组合形式,用户可以进行研究数据的统计和相关多维的频次统计,作为药厂、临床、科研、管理、教学工作者必需的查询工具,将为启发科研思路,发掘出具有突出疗效的新药提供依据。 在科技部领导的关怀,中医研究院领导的支持下,我们采用远程建库的新模式,在浙江大学计算机系的技术支持下,由全国六家省级中医药学院和研究院的50余位中药专业人员通过互联网进行建库工作。经历了基础工作准备阶段、人员培训与程序测试阶段、大量数据加工阶段,经过课题组全体人员近两年的共同努力,克服了多重困难,解决了多项技术难点,到目前为止,数据已经做到2002年,文献量已经达到20000余篇,数据量达到38900余条,原文图片达到55000余张。整体工作已经基本完成,可以提供网上数据查询与服务。部分数据已经投入使用与应用,实现了网上科技实验数据的便利检索与精确统计分析利用。 2. 目标与计划: 2.1 目标:依据中医药科技期刊文献科学实验数据,利用数据仓库技术,建立中医药科学实验信息数据仓库,为中药新药开发、科研创新及中医临床决策提供科研数据与思路。 2.2 任务计划:初步完成中药药理、毒理、临床药理数据库的整体结构的设计,合理搭建结构关联型数据库字段。在完成数据库应用程序的设计与开发的基础上,完成上述数据库1990-2002年约20000条数据的存储与加工,提供网上数据查询与服务。 3. 课题设计思路与理念: 3.1 关于数据仓库的概念: 数据仓库(Data Warehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。 中药药理数据仓库就是针对结构不同的药理学文献数据源,进行抽取、清理,并有效集成,按照主题进行组织编辑,最后达到可以进行数据统计和分析的目的。 3.2 数据仓库的建模方式: 数据仓库建立的基础是Oracle Warehouse Builder,而逻辑建模是其实施中的重要一环,因为它能直接反映出技术需求,同时对系统的物理实施有着重要的指导作用。本数据仓库采用了两种建模方法,即第三范式和星型模式。 范式是数据库逻辑模型设计的基本理论,一个关系模型进行无损分解的过程称为规范化。在数据仓库的模型设计中目前一般采用第三范式,它有非常严格的数学定义。即必须具有三个条件:属性量值唯一,不具有多义性;非主属性必须完全依赖整个主键;非主属性不能依赖于其他关系中的属性。 星型模式由一个事实表(Fact Table)和一组维表(Dimension Table)组成,是一种多维的数据关系。事实表主键的每个元素都是维表的外键。事实表的非主属性称为事实(Fact),它们一般都是数值或其他可以进行计算的数据;而维大都是文字、时间等类型的数据实体。 4. 课题设计策略与原则: 4.1 依照中药药理学科分类,筛选中药实验药理数据归类; 根据中药药理学科分类特点,按照中药药理学范围进行实验药理数据归类;选择主要数据项,利用结构化形式,表达数据特征与数据关联方式。 4.2 依照数据特点与现状,设计中药药理实验仓库的结构; 利用数据仓库的概念和技术,从一般数据库中抽取相关主题所需要的数据。找出中药科学实验数据分布特点,研究数据的主题信息抽取数量,是构思数据仓库的基础。在前期对中药实验药理血瘀证专题的数据进行分析与统计时,发现实验方法种类繁多,实验角度各有不同,数据值表达分散、涉及范围广泛,数据具有“高维、小样本”的特点,过分细化结构很难发现共性规律;因而针对中药药理实验数据的现状,降解难度,减少实验数据仓库的建模方式,筛选了有一定分析与统计意义的十五个数据维(文献出处、单味药、化学成分、方剂、剂型、疾病、证候、症状、病理生理、效应部位、微生物、药理分类、临床药理分类、毒理分类、指标),十五个维基本全面表达了中药科学实验数据的内涵值,可以支撑数据统计与分析。 4.3 依照数据仓库建模方法,编辑加工中药药理

文档评论(0)

1444168621 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档