- 1、本文档共38页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二講 信息组织方法论
第二讲 信息组织方法论
刘炜
wliu@
第五章 主题法
主题法
直接以表示文献主题的语词作标识,提供字顺检索途径,并主要采用参照系统结石词间关系的标引和检索文献的方法。其中的语词可以是自然语言,也可以是受控语言。 (p.114)
主题法的特点
揭示文献的内容属性
以自然语言为基础(不用标记制度)
直接以局部(语词)指代文献
以特性检索为主,族性检索通过词间的关联达到
以明确性的检索为主,模糊检索通过技术的手段达到
主题法的类型
标题法(Subject Heading)
用规范化的自然语言语词作标题,直接表达文献主题概念,按照标题字顺排列,并用参照系统(已借鉴叙词表的参照关系:用代属分参)显示标题之间关系。
最早产生(1876年克特出版《字典式目录规则》)
标题含义明确、易于使用
标题列举、先组式,概念表达能力有限,难以多向成族,检索途径少,标识的通用性差(由于采用自然语言?)
单元词法Uniterm
又称元词法,以取自自然语言、经过规范化处理的语词作标识,通过子面组配表达主题。
最基本的、概念上不可再分解的词,表示文献主题
克服标题不足
后组式,易轮排(每个词)索引,灵活
20世纪50年代用于穿孔卡系统(最早的机检系统)
字面分拆,语义准确性差
词间缺乏联系,缺乏参照系统
主题法的类型
主题法的类型
叙词法,又称主题词法Thesaurus
以规范化的自然语言语词作为文献主题的标识,通过叙词的概念组配表达主题概念。
20世纪50年代末提出。吸取了元词法、标题法以及分面组配分类法的优点而发展起来
能够多向成族、多检索途径、多因素组配、灵活扩检/缩检/改变检索范围
灵活性、专指度、可扩展性俱佳
主题法的类型
关键词法(又称自由词)
直接以文献中能够表达主题概念的关键词作为标识。来自于计算机自动抽词
关键词:出现在文献的题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。
自然语词,不做规范化处理(不受控)
无词间关系,但编制禁用词表
现在计算机也能结合一定的受控功能,以提高检索的准确性
叙词法的综合性
与元词法和标题法一样采用自然语言,但规范控制严格,保证标识与概念的唯一对应;
适当采用标题法的预先组配,而不是元词法尽可能细分,以表达组合、专有概念,减少组配误差;
借鉴分面组配分类法,采用概念组配而不是字面组配;
完善了标题法的参照系统;
采用体系分类法的叙词分类索引和等级索引(词族索引),甚至直接引入体系分类表或分面分类表,实现分类主题一体化;
采用关键词法的轮排方法,编制叙词轮排索引
主题法的功能
对信息内容进行标引的功能(指代用以检索);
对主题内容及其相关信息予以集中或揭示相关性的功能;
对大量信息加以系统化或组织化的功能;
便于将标引用语与检索用语进行相符性比较的功能
叙词表
叙词表是词汇控制(vocabulary control)的工具之一。
叙词表是索引用语及检索词汇的authority list。
叙词表是由已知的概念查得代表该概念的适当用语。[concept ? term]
叙词表透过标准化词汇的选用,使同一概念产生类聚(grouping)的作用。
《汉语主题词表》
1975 年,中国情报所、北京图书馆、国防科工委情报所、电子科技情报所、六二八所、机械科技情报所等单位组建全国1048个单位、7519人参加的《汉语主题词 表》研究编辑工作,是全国汉学信息处理系统工程(简称748工程)的组成部分,目的是建立全国统一的联机情报检索网络。该主题词表是中国第一部大型综合性 检索工具书,全书包括主表、附表、词族索引、范畴表、英汉对照索引等、共分3卷10个分册。其收词范围之广、编辑技术之先进、结构体系之严谨,当时是国内 外一流的。该成果获1985年国家科技进步二等奖。
叙词表详解(略)
Introduction
Thesaurus 的原义为:Treasury, Collection
通常用于同义字字典。
“A book of words and their synonyms”(Merriam-Webster’s Dictionary)
“A book of words that are put in groups together according to connections between their meanings rather than in an alphabetical list.” (Longman Dictionary of Contemporary English)
e.g., Roget’s Thesaurus of English Words and Phrases
1957AD – H. P. Luhn最早以Thesaurus代表「主題索引用语词典」(简称叙词表),并以之为词汇控制
文档评论(0)