网站大量收购闲置独家精品文档,联系QQ:2885784924

信息检索基础知识 第二讲信息检索系统工具及语言.ppt

信息检索基础知识 第二讲信息检索系统工具及语言.ppt

  1. 1、本文档共69页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索基础知识 第二讲信息检索系统工具及语言

第二讲 信息检索基础知识 本将主要内容 信息及相关概念 信息的分类 信息检索 计算机检索系统 信息检索语言 信息及相关概念 信息(Information)的概念 信息论的创始人克劳德·香农(Claude E. Shannon)从通信系统理论的角度把信息定义为:信息是用来消除不确定性的东西 。 控制论的创始人、美国科学家维纳(N. Wiener)对信息的含义做了进一步的阐述 :信息是人们在适应外部世界并使这种适应反作用于外部世界的过程中,同外部世界进行互相交换的内容的名称 。 中国学者钟义信对信息的解释:信息是事物运动的状态与方式,是物质的一种属性 。 普遍认同的一个概念--  信息普遍存在于自然界、人类社会和思维领域中,  它是客观世界中各种事物变化和特征的反映,  是客观事物之间相互作用和联系的表征,  是客观事物经过感知或认识后的再现。 信息的特性 客观性 传递性 时效性 转换性 共享性 知识(knowledge)的概念 知识是人们对客观事物存在和运动规律的认识,  是经过人脑加工处理过的系统化了的信息。     人们对事物由表及里、由现象到本质、由感性到理性的认识深化,便形成了知识。知识是人类经验和智慧的总结,是人们科学地认识世界、改造世界的力量。 知识的存在形式 1、存在于人脑记忆中 2、存在于实物中 3、用文字、图形、符号、代码、声频、视频等技术手段记录在一定载体上的知识。    其中第三种形式称作文献 文献(literature、document)的概念 《中华人民共和国国家标准·文献著录总则》给文献下的定义是:“文献是记录有知识的一切载体”。   人类最初是依靠自身来记录和传递知识的,但因受自身条件的限制,无法将信息传递至远方和后世。文献的产生,使信息的记载和传递形成一个飞跃。 文献构成三要素 本课程所涉及的信息主要为文献信息 信息、知识、文献的关系 文献信息的分类 按载体类型分 一、按载体形式划分 (1)印刷型: 载体:纸张 记录手段:手写、打字、印刷和复印等 优点:便于直接阅读,使用方便 缺点:较笨重、存储密度低,不便于加工、整理和收藏。 此类型文献有:期刊、图书等 (2)缩微型: 载体:感光材料 记录手段:缩微照相 优点:存储密度较大、体积小、便于收藏保存、便于远距离传递 缺点:缺点是不能直接阅读,需借助缩微阅读机才能阅读 此类型文献有:缩微胶卷、缩微胶片等  (3)视听型(声像型) 载体:磁性和感光材料 记录手段:借助于特殊的机械装置(如复录机、摄像机、录像机等)直 接记录声音、图像 优点:直观、生动 缺点:制作成本较高,需要借助于一定的设备才能阅读 此类型文献有:唱片、录音带、录像带、幻灯片、电影片、多媒体资 料等 (4)电子型(数字型) 载体:光、电、磁介质 记录手段:利用计算机进行存储 优点:存储密度高,,出版周期短、易更新,传递信息迅速,存取速 度快,可以融文本、图像、声音等多媒体信息于一体,信息共 享性好、易复制,识别和提取易于实现自动化 缺点:需借助计算机等先进技术设备才能阅读 此类文献有:电子图书、电子期刊、联机数据库、网络数据库、光盘数据库 信息检索 检索过程分析 信息存储与检索过程图 信息检索的概念 将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。 广义的信息检索包括存储和检索两个过程,狭义的信息检索就是指用户查找出所需信息的过程。 信息检索原理    检索系统将用户的请求与信息集合中的信息进行匹配运算,再将命中信息反馈给用户。 信息检索类型 按检索对象的性质划分:事实检索、数据检索、文献检索 按检索方式划分:手工检索和计算机检索 计算机检索又包括联机检索、光盘检索和网络检索。 联机检索 联机检索是指用户利用计算机终端,通过通信线路或网络,在联机中心的数据库中获取信息。 特点  同时检索多个数据库、数据质量高、检索机与主机是主仆关系、对检索人员要求高、而且检索需要的费用高。 光盘检索 用光盘作为信息存储介质的数据库。 分为单机检索和局域网内的联机光盘检索。 网络信息检索 用户在自己的客户端上,通过互联网和浏览器界面对网络信息进行检索。 特点     数据库分布式存储,数量多,信息量大;由于超文本语传输协议,提供了大量相关链接;    内容向多媒体发展,不仅有文本,还有图像、声音等;    数据库更新速度快;    检索功能强,索引多,易学易懂;但目前各数据库检索界面和检索技巧不尽相同,给使用者造成不必要的麻烦;    检索环境宽松,检索费用比联机检索低很多。   (网络信息检索也包括通过网络进行的数据库检索) 信息检索发展历

您可能关注的文档

文档评论(0)

189****7685 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档