信息整流与知识增值服务.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

信息整流与知识增值服务

【内容提要】本文提出数字图书馆的主要功能目标是信息整流与学问增值服务;信息与学问转换是数字图书馆的关键理论和技术问题。图书馆受到Internet的巨大冲击、不再是文献信息服务的唯一供应者,数字图书馆如何才能挽回失去的老用户,吸引新用户?学问管理工程将使数字图书馆成为21世纪学习的大平台、文化学问的大平台和学问资源中心。【摘要题】信息服务1数字图书馆的信息整流数字图书馆把传统图书馆的功能由信息的查询和图书资料的借阅扩展到学问服务的新阶段。实现这一雄伟目标须要解决很多技术和社会问题,其中有两个最关键的技术是信息的整流和学问的创新。前者涉及数字图书馆的学问链建立问题,后者涉及数字图书馆的信息变换成学问的学问增值服务问题。1.1数字图书馆的学问链数字图书馆是一个浩大的数字资料库,包括全部资料的数字化存储,在线网上资料、多媒体资料、电子出版物等。数字图书馆依据用户对信息的不同需求,将文本、图片等原件制作成不同数字形式。一般有纯图像形式,书目文本形式,正文图像形式,全文本形式和全文索引形式。但关键还是学问链的建立。为实现学问链信息,数字图书馆将资源分成为元数据和对象数据。对象数据指数字化的文本、图像、声言、影像等,元数据则指那些描述和管理对象的数据。对象数据分布式地存放在各地的资源站点内,元数据则集中存放在数字图书馆中心的超大规模服务器上。用户查询时,中心调度系统通过元数据来调度各对象数据库以供应服务。学问的限制单位长期停留在文献这一级上,而人对学问的需求一般不是以文献为单位的。早在20世纪70头后期就有专家指出,学问的限制单位将从文献深化到文献中的数据、公式、事实、结论等最小的独立的“学问元”.一旦实现学问的限制单位由文献深化到“学问元”,大量文献中所包含的“学问元”及相关信息间的链接将产生极大的学问增值,从而大大推动人类对学问的利用,促进新学问的创建,从而也将推动学问资源业的重大发展[1].一篇文献反映作者的科学探讨成果,包含着作者的学问创新的过程。于是文本结构本身就隐含着对某学科问题的学问链。假如我们把每篇文献的学问看成是人类学问结构中的一个学问单元,学问单元与学问结构就组成了特性学问与共性学问的学问系统。特性学问体现在学问的创新上,共性学问结构则表现在学问的完整性上。于是我们就建立了特性学问与共性学问的学问链。事实上,专利文献就明显地表现了特性学问单元与人类学问结构的学问创新链关系[2].数字图书馆对文本的学问标引,既体现了标引者应用学科学问结构的背景学问的实力,同时又体现了标引者识别和提炼作者的学问创新点的推断和学问组织实力。因此,是一个学问链建立的学问增值过程。1.2数字图书馆的学问发觉学问链的建立过程是学问发觉和学问再组织的过程。学问发觉的主要目标是采纳有效的算法,从大量现有或历史数据集合中发觉并找出最初未知、但最终可理解的有用学问,并用简明的方式显示出来。学问发觉一般包含如下几个步骤:(1)理解相应的问题领域;(2)打算相关数据子集;(3)发觉模式(数据挖掘);(4)所发觉模式的后处理;(5)应用发觉结果。(1)文本学问结构分析技术尽管与多媒体信息相比,文本信息显得比较一般,但文本仍旧是记载和传播信息的最主要媒体,因此对文本信息学问发觉技术的探讨具有非常重要的意义和广泛的应用前景。文本结构分析的目的在于发觉文本表达主题概念的物理组织结构,由物理结构自动重组主题概念的逻辑结构,实现对文本学问的抽象化和详细化推理检索。文献[3]把文本结构分成物理结构和逻辑结构。物理结构={标题,段落,句子,词汇},它表示了文本的组成状况。可采纳向量空间模型表示文本及文本各个部分,进行文本结构分析,其中主要是文本的层次分析,从而得到文本的逻辑结构。逻辑结构={主题,层次,段落,句子,主题词},它更着重于表示文本所包含的思想内容和表达的逻辑方式。(2)学问链结构文本的物理结构是文本的外表形式,逻辑结构体现了作者表达目的的逻辑依次,而文本的学问链结构则是作者的目的和灵魂,学问链结构={问题,已有解的优缺点,新解的方案,性能评价,今后方向}.探讨文本的目的是为了获得文本的学问链,以创建新的学问链。引文方法是一种很好的文献链,表现了引用文献与被引用文献之间的多种关系。但它并不完全干脆表现学问链关系。文献链是一种浩大的文献引用系统。学问链则是一种巨大的学问引用系统。若能完成这一巨大的系统,人类将可能进行更有效的学问学习。1.3信息整流的实现学问链是文本学问结构的普遍特性,是人类学习、创新的纽带。信息整流与信息滤波不同。信息滤波的目的主要有两点,即过滤掉不相关的文档以及将相关文档列表分为新的文档和已经查阅过的文档,并按相像度大小排序,对已

文档评论(0)

celkhn5460 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档