信息檢索基础.pptVIP

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息檢索基础

;;;1、文献标引 标引就是将文献和提问的内容特征用情报检索语言的形式表达出来的过程 文献标引步骤: ;【例】一篇题为《代德景问题的机械算法》的文章,经分析,它谈的是“代德景问题”的“计算机证明”(概念标引),我们把它标引成如下形式: “代德景问题,定理证明”(主题标引) “TP11”(分类标引:TP11是中国图书分类法“定理证明”的分类号) 这样我们从主题词“代德景问题”“定理证明”的主题角度,以及从“TP11”的分类角度都可以查到这篇文献。;2、分类表标引 《中国图书馆分类法》(原称《中国图书馆图书分类法》)是新中国成立后编制出版的一部具有代表性的大型综合性分类法,是当今国内图书馆使用最广泛的分类法体系,简称《中图法》。《中图法》使用字母与数字相结合的混合号码,基本采用层累制编号法。包括马列主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书五大部类。;二、文献标引基础;【例】《计算机在图书馆管理中的应用》一书应该分到计算机类还是图书馆类?应该用什么符号作该类的分类号? 解决这类问题,我们必须依据文献分类法来进行分类。分类表就是分类法的具体体现。 《计算机在图书馆管理中的应用》有二个主题内容:计算机应用、图书馆管理。依据《中国图书馆分类法》有二组类目可供考虑:G25图书馆学、图书馆事业;TP39计算机的应用。;3、主题标引 主题词表 主题词表是对检索和标引用词进行规范并显示其中关系的词表,有以下作用: (1)通过同义词的互见对检索和标引用词进行规范,将不同形式的同义词转换成事先选择好的唯一形式,从而避免由于对同义词的不同选择而造成的漏检。 ;3、主题标引 主题词表 (2)通过上位词、下位词的显示来增加机器的缩检和扩检功能。 (3)通过内容互有关联的主题词的“参见”提高检全率。;3、主题标引 下面是英国INSPEC数据库采用的主题词表的格式:;3、主题标引 主题标引有两种方式:第一,用主题词标引,即选择主题词表中的词对文献进行标引;第二,用自由词标引,即当文献的主题在主题词表中找不到合适的词来表达,就用词表之外的词进行标引。;【 例】 一篇题为 《代德景问题的机械算法》 的文章, 经分析, 它谈的是 “ 代德景问题” 的“计算机证明” ( 概念标引) , 我们把它标引成如下形式: “代德景问题, 定理证明” ( 主题标引) “TP11” ( 分类标引: TP11 是中国图书分类法 “定理证明” 的分类号) 这样我们从主题词 “代德景问题” “ 定理证明” 的主题角 度, 以及从 “ TP11 ” 的分类角度都可以查到这篇文献。;;一、信息检索概念;1.分类检索语言 ①《中国图书馆图书分类法》(简称《中图法》) ②《中国科学院图书馆图书分类法》(简称《科图法》) ③杜威十进分类法(DDC)与国际十进分类法(UDC) ④美国国会图书馆分类法(LC) ;①《中国图书馆图书分类法》;② 《中国科学院图书馆图书分类法》 (简称《科图法》);科图法;DDC:Dewey Decimal Classification 根据培根关于知识分类的思想,将人类知识分为记忆(历史)、想象(文艺)和理性(哲学、即科学)三大部分,并将其倒置排列,展开为10个大类 。 UDC:Universal Decimal Classification 又称通用十进分类法;000 总论 100 哲学 200 宗教 300 社会科学 400 语言 500 自然科学和数学 600 技术(应用科学) 700 艺术、美术和装饰艺术 800 文学 900 地理、历史及辅助学科;④ 《美国国会图书馆分类法》(LC);2、主题检索语言 直接以自然语言中代表事物、问题和现象的术语作为表达信息主题内容的检索词。 ;;1、信息检索使用的工具 互联网及其有哪些信誉好的足球投注网站工具 数据库及其检索平台 数据库提供的检索形式:一般检索/二次检索、高级检索 其他检索工具 ;一、信息检索途径;(1)主题途径 主题途径是按文献信息的内容主题进行检索的途径,对课题进行主题概念分析,提炼主题概念,选择能表达主题概念的语词,确定主题词、关键词、叙词或标题词。 ;3、代码途径 许多文献信息具有惟一的或一定的代码,如化学分子式、结构式、化学物质登记号等。根据各种代码编制成了不同的代码索引,在已知代码的前提下,利用代码途径能查到所需文献,满足特性检索的需要。利用代码途径,需对代码的编码规则和排检方法有一定的了解,往往可以从代码判断文献的种类、出版的年份等,有助于文献检索的进行。 ;2、外表特征途径;题名途径 题名途径是根据文献信息的题名来查找文献的途径,文献信息的题名包括书刊名称、论文名称、专利名称、标准名称等。 ;机构名称途径 根据机构名称检索该机构

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档