网站大量收购闲置独家精品文档,联系QQ:2885784924

信息管理和信息系统第9章.pdf

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章信息检索评价与实验 本章目录 9.1 引言 9.2 信息检索相关性理论 9.3 信息检索评价指标体系 9.4 信息检索评价的过程与方法 9.5 经典的信息检索评价实验 9.6 信息检索评价实验平台:TREC 2 第一节 引言 信息检索系统评价的内容包括:资源的收录状况、数 据的质量、检索的功能与效率、系统的功能以及检索 结果的反馈形式等。 数据的评价主要从两个方面考察: 一是数据的录入质量,如数据的错误率,数据的结 构是否合理,数据的完整性如何,数据的著录是否 完备等; 二是数据的加工质量,如数据的加工深度,数据的 标引质量,数据的分类是否合理等。 3 第一节 引言 检索的功能与效率的评价主要考察检索入口能否满 足用户的需求,检索的组配是否丰富,查准率和查 全率是否得当,检索的响应速度如何等。 检索功能和效率与检索算法有密切的关系,由于检 索算法难以分辨出优劣,因此,可以通过检索界 面、查全率和查准率以及检索响应时间等来判断检 索的效率。 4 第一节 引言 近年来,信息检索评价研究已从系统的输入方面的 特性逐渐向检索者输入方面的特性转移,开始注重 研究检索专家的特性(如教育背景、经验、个性 等)与检索成功率之间的关系。有些评价者还考察 了采用不同检索键所引起的变化,例如,分别用题 名关键词、文摘关键词、叙词、原文中的词,或者 分别用主题词与引文对相同的课题进行检索时,检 索结果之间的差异。 5 第一节 引言 整体而言,信息检索评价活动范围扩大了,评价水 平在不断提高,积累了大量有价值的试验或调查数 据,初步揭示了检索系统及其各组成部分的运行机 制及对系统性能的影响。不过需要指出的是,就目 前状况而言,我们对用户需求相关性判断和系统行 为的本质方面的探索还显得不足,有些评价方法还 需要进一步完善,评价结果的解析和验证也有待进 一步深入和加强。 6 第二节 信息检索相关性理论 1 9.2.1 相关性概念及其特征 2 9.2.2 影响相关性判断的变量 3 9.2.3 面向系统的相关性 43 9.2.4 面向用户的相关性 7 9.2.1 相关性概念及其特征 (一)相关性的概念 相关性问题的出现:1958年,著名学者B.C.Vickery 在ICSI (the International Conference for Scientific Information )上的两篇会议论文引发对“相关性”概 念的最初讨论,“相关性” 问题由此得到明确提出。 所谓“相关性判断”,是指信息检索中判断者在某一 时刻对某种相关性的一种赋值操作。这个定义中包 含了相关性判断的四个基本组成要素,分别是:相 关性类型、判断者类型、判断时间和判断结果表达 方式。 8 9.2.1 相关性概念及其特征 相关性类型,指基于何种相关性进行判断; 判断者类型,指实施判断的主体,通常分为用户 (user )与非用户(non-user )两大类,其中,用户 指检索系统的真实用户,非用户则包括检索系统设 计者、检索中介等在内的各类人员; 判断时间,很明显在不同的时间点,相关性判断的

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档