古籍数字化 第七章 信息检索技术.ppt

古籍数字化 第七章 信息检索技术.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 信息检索技术 第一节 信息检索的概念 1、检索的意义 信息具有共享性,信息资源共享(information resource sharing)是当今社会的一个热点问题。为了分享人类共同的知识财富、研究成果,人们必须通过一种科学的方法从取之不尽的信息源中去识别和获取所需要的那部分信息,这个过程就是检索(searching)。 信息的检索、利用和创造是一个循环和增值的过程,人们通过工具(数据库)检索获得信息,经过处理筛选出需要的部分,在利用信息的过程中又创出新的信息,这些信息经过核准后又被标引、组织进检索工具(数据库),再提供人们使用,信息在这个循环的处理过程中不断得到扩充,它的增长是没有穷尽的。 2、检索的基本原理 信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。其图示如下: 3、检索点 1)分类检索(classification) 2)主题检索 3)作者检索 4)名称检索 5)号码检索 图书期刊的号码 ISSN号: 4、检索手段 计算机检索(computer-based retrieval) 计算机检索的优势 第二节 信息检索数据库(工具) 检索工具(数据库)的功能 检索工具(数据库)的分类 检索工具(数据库)的构成 检索工具(数据库)的功能 1)事实检索 2)目录检索:目录检索是间接的、相关性检索,给出来源文献线索,指引原始文献。 3)文摘索引检索 3、检索工具(数据库)的构成 第三节 检索语言和检索效果评价 检索语言 检索语言(retrieval language)概念 检索语言的分类 人工语言和自然语言 分类语言和主题语言 检索效果评价 检索效果(retrieval effectiveness) 查全率和查准率 提高检索质量的措施 检索语言的概念 检索语言的分类 人工语言 (规范语言) 和自然语言(非规范语言) 分类语言和主题语言 常用的检索技术 2、检索效果评价 查全率 R(Recall ratio) 查准率 P(precision ratio) 实验结果表明查全率与查准率之间存在互逆关系 提高检索质量的措施 第四节 信息检索的基本流程 检索的程序 1、明确检索目的 2、检索前的准备工作 检索要求:新、准、全 3 、选择检索系统和数据库 4、规划检索程序 4 规划你的检索程序 选定检索主题词 利用关键词的上下位词、特有名词及同义词,查阅工具如字典、分类表等。 或 即时检索 5、分析检索结果 不满意 不满意 –非目标性结果 不满意 –结果太多 设定限制条件、特定的检索字段及年代 增加检索名词的准确性—查阅工具:主题词表、字典、分类表等 修改检索策略—增加使用AND,减少使用OR。 不满意 –结果太少 检查检索词的正确性、准确性 增加检索词的普遍性—查阅工具:主题词表、字典、分类表等 拓宽检索策略—减少使用ANDs;使用OR连接增加的同义我词和近义词 增加检索数据库—确定其他数据库是否覆盖你所需要的检索主题 满 意 是否获得全部所需? 打印、Email或存档 是否需要获取全文 ? 连接全文连接;图书馆期刊、资料;原文传递服务鸿老师) 检索技巧和提示 本 章 结 束 检索效果(retrieval effectiveness)是指检索系统检索的有效程度,它反映检索系统的能力,这是对机检提出,有些指标对手检也有意义。 技术效果主要指系统的性能和服务质量,它是由检索系统实现其功能的能力所确定的; 经济效果主要指检索系统服务所花费的成本和时间,它是由检索系统完成其检索服务的代价所确定的。 6项评价检索效果的指标: 收录范围、查全率、查准率、响应时间、用户负担、 输出形式。 检索结果涉及四个方面:相关文献、非相关文献、被检出的文献和未被检出的文献。 提高检索系统的质量:对用户而言,则要选择适合课题的学科覆盖范围的、优质的检索工具,包括其收录的全面、著录的清楚、标引的准确、完善等等。 提高用户使用检索系统的能力:充分发挥检索系统的功能。这里涉及到下一章要讨论的检索策略问题。检索语言、检索技术、方法的正确、灵活的使用,以使检索者(用户)能更好地与检索系统协调、配合。另外,要根据不同的检索课题的需要,适当调整对查全率和查准率的要求,比如要求查全率很高的查新工作,就要放弃对查准率的苛刻要求。 当代科技信息检索系统能达到的查全率和查准率分别是60%~70%和40% ~50% 。 目的: 让你以最有效的方法 收集及筛选所需数据 以提高科学研究能力 1、明确检索的目的 2、检索前的准备工作 3、选择检索系统和数据库 4、规划检索程序 5

文档评论(0)

flyben + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档