- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 信息检索基础 3.1 信息检索概述 3.2 信息检索技术 3.3 信息检索效果评价 3.1 信息检索概述 从信息资源开发与利用的角度讲,信息检索是将信息按一定的方式组织和存储起来,并根据信息用户的需求找出有关信息的过程; 从信息用户的角度讲,信息检索就是从已存储的信息资源中检索出与用户提问的相关的文献、知识、事实、数据的逻辑运算和技术造作过程; 从社会角度讲,检索广泛存在于人们的日常生活行为当中,比如去实验室、图书馆、食堂、超市等找到个人所需要的物质,精神物品等。 3.1.1 信息检索的特征 3.1.2 信息检索与查找 信息检索:从信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。简单说就是从信息集合中迅速,准确地查找出所需信息的过程和方法。 信息集合:指有组织的信息资源总体,可以是:馆藏目录,数据库、(印本)检索工具等。 检索与查找的区别: 3.1.3 信息检索原理 从技术上讲,信息检索是以信息的存储和检索之间的相符性为基础的,检索的全过程包括两个子系统:存储子系统和检索子系统。如下图为“信息检索原理图”。 3.1.4 信息检索的类型(如下图:信息检索分类示意图) 3.1.5 信息检索的意义及步骤 意义: 避免重复研究,提高研究效率 节省查找资料时间,提高信息获取效率 获取新知识的捷径,培养创新型人才 第3章 信息检索基础 3.1 信息检索概述 3.2 信息检索技术 3.3 信息检索效果评价 3.2 信息检索技术 检索技术是指利用光盘数据库、联机数据库、网络数据库、有哪些信誉好的足球投注网站引擎等进行信息检索时采用的相关技术,主要包括布尔检索、截词检索、字段检索、限制检索、临近检索等。 计算机信息检索技术是用户信息需求和文献信息集合之间的匹配比较技术。 由于信息检索提问式是用户需求和信息集合之间匹配的依据,所以信息检索技术是信息提问式的构造技术。 目前,计算机检索已经从基本的布尔逻辑检索、截词检索、临近检索、限制检索、短语检索、字段检索发展为高级的加权检索、自然语言检索、模糊检索、概念检索和相关检索等多种技术并存。 3.2.1 选择合适的检索词 检索主题1:提高电子邮件的安全可以通过改善邮件程序、对邮件地址进行认证以提高用户的警惕性。 检索主题2:通过对上网者的研究,发现长时间使用网络将影响人的心理健康。有调查显示,上网时间过长会导致人抑郁和孤独。 1,主题词:网络,internet,上网者,上网,影响,健康,沉溺,调查,抑郁,孤独。2,找到主要关键词的同义词:(internet)网络,互联网,电脑,信息高速公路,在线,web,world wide web等3,列出其他词的同义词或可替代词(如心理健康)高兴,愉悦,健康,沮丧,郁闷,孤独,孤单,难过,悲伤,情绪低落等。 3.2.2 布尔逻辑检索 AND(*)()(空格) A and B 逻辑与 A和B都为真时才为真,即AB。逻辑含义用图表示为: 分析实例: 郑州零售业的现状及发展趋势 郑州,零售业,现状,发展趋势 郑州and 零售业and(现状or发展趋势) 3.2.3 截词检索 3.2.4 字段检索(range searching) 字段检索即指定检索词出现的字段,被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。西文数据库,字段检索常用代码表示。 3.2.5 限制检索 针对特定年代、特定类别、特定检索点等作限制,包括前缀限制符和后缀限制符。 3.2.6 邻近检索 邻近检索用于规定检索词相互之间的邻近关系的检索,包括在记录中的顺序的相对位置。常用的位置算符有(W)、(nW)、(N)、(nN)、(F)、(S)等,各个检索系统中位置算符有所不同,具体查看其使用说明。 3.2.7 网络检索 短语检索(半角双引号) 自动纠错检索(如:李熬,你是不是要检索李敖) 自动转换检索(如:汉语拼音转换成文字) 自然语言检索 概念检索(同义词/近义词/狭义词,如有哪些信誉好的足球投注网站引擎Excite) 相关检索 第3章 信息检索基础 3.1 信息检索概述 3.2 信息检索技术 3.3 信息检索效果评价 3.3 信息检索效果评价 检索效果(retrieval effectiveness)是指检索系统检索的有效程度,它反映检索系统的能力。 也涉及实施检索的人所能发挥检索系统的最大能力、效益等因素。 包括6个方面:收录范围、查全率、查准率、响应时间、用户负担及输出形式。其中两个主要的衡量指标是查全率(Recall ratio)和查准率(precision ratio),分别用 R 和 P 大写字母表示。 小结
文档评论(0)