信息检索技术概论.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索技术与方法 主讲:黄艳娟 huangyanjuan@ Tel 提 纲 信息检索方法 信息检索途径 信息检索技术 信息检索步骤 网络信息资源检索 信息检索方法 直接检索法 间接检索法 追溯检索法 循环检索法 间接检索方法 顺查法:按时间顺序,从过去到现在,由远及近地利用检索系统进行文献信息检索的方法。 倒查法:利用检索工具从最近期向早期查找。 抽查法:根据检索课题的特点,选择有关课题的文献发表较多的年代,利用检索工具进行重点检索的方法。 追溯检索法 是指不利用检索工具,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献的信息范围,一环扣一环地追查下去的方法。 信息检索途径 责任者途径 题名途径 分类途径 主题途径 序号途径 引文途径 信息检索技术 布尔逻辑检索 截词检索 邻近检索 字段限制检索 模糊检索 布尔逻辑检索 截词检索 对于词干相同而词尾不同的词,如computer compute computing等,可以采用截词检索。Comput* 截词的方式有前截断、中截断和后截断。 bas?s= basis bases等 截词符号有 *? $ #等。 邻近检索 邻近检索表示两词之间的位置邻近关系,常用到的位置算符有(W)(nW)(N) (nN)等 W算符是word或with的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除了有一个空格或一个标点外不得夹有其他的单词或字母。 information 2W management 可包括 Information technologies and management和 Information management N 算符是near的缩写,表示在此算符两侧的检索词必须紧密相连,词序可颠倒。 nN表示两检索词之间最多可以插入n个单词,且词序可颠倒。 information N retrieval information 2N retrieval 字段限制检索 字段限制检索是限定检索词在数据库中出现的字段范围的一种检索方法。 如:作者=张三 题名=金属热处理 模糊检索 模糊检索(fuzzy search)也称概念检索。是指检索系统不仅能检索出包含指定的检索词,还将与检索词主题概念相同的信息检索出来。当输入一个只表达所要查检信息的检索词或词语,系统即可以反馈一串与此内容相近的词或词语。 信息检索的步骤 课题分析 选择相关信息资源 制定检索策略,选择检索入口 试验性检索和修改检索策略 检索结果的评价 课题分析 1 明确检索目的 * 需要关于某一课题的系统详尽的信息 * 需要关于某课题的必威体育精装版信息 * 了解一些片段信息,解决一些具体问题 2 明确课题的主题或主要内容 要形成若干个既能代表信息需求又具有检 索意义的主题词(关键词),及其关系 3 课题涉及的学科范围 4 所需信息的数量、语种、年代范围等指标 课题 一 深潜器的发展综述 二 我国近3年深潜器的研究 三 哈尔滨工程大学2005年发表的有关机器人方面的论文 四 纳米管的结构和制备 五 聚氯乙烯的机理及应用研究 选择相关信息资源 是否所有与检索课题相关的信息资源都检索 选择哪些学科的信息资源 选择哪些语种的信息资源 信息资源覆盖的年限范围 信息资源的特点及针对性 制定检索策略,选择检索入口 检索策略是为完成检索课题,实现检索目的,对检索的全过程进行谋划之后所制定的全盘检索方案。 检索式:是检索策略的逻辑表达式,是用来表达用户检索提问的,由基于检索概念产生的检索词和各种组配算符构成。 (篇名=深浅器 or 潜器) and 年代=2000-2007 选择检索入口(检索途径/字段) 题名 责任者 篇名 主题词 文摘 关键词 试验性检索和修改检索策略 无论是手工检索还是计算机检索,对于较大的检索课题,一般应先进行快速、少量的试验性检索,以检验检索策略是否合理有效。然后根据试验见过确认或修改原定的检索策略。 检索结果的评价 查全率:从数据库中检出的相关文献量与数据库中总文献量的比率。 查准率:指数据库中检出的相关文献量与检出的文献总量的比率。 KEY 查全率 47.1% 查准率 82.5% 索原文 原文的含义 如果索取原文 什么是原文 原文就是原始文献。相对于题名、文摘、参考文献等从不同侧面描述文献的检索标识和著录信息来说,原文就是我们所要查找的文献本身。 如何索取原文 通过相应的链接直接获取原文 通过专门收

文档评论(0)

xiaofei2001129 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档