- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本体论在基于内容信息检索中的应用
第29卷第4期Vol.29№4计算机工程ComputerEngineering2003年3月March2003·人工智能及识别技术·文章编号:1000—3428(2003)04—0122—02文献标识码:A中图分类号:TP312本体论在基于内容信息检索中的应用万捷,滕至阳(东南大学计算机科学与工程系,南京210096)摘要:网络信息的激增和多样化给有效的信息检索带来了种种困难,目前的检索工具仅提供了基于关键字的检索,而忽视了关键字本身所含的语义内容。该文提出的信息检索原型系统,利用本体论中概念规范、语义丰富的特点,将用户的检索要求扩充成语义集。并且将检索到的文档通过文档分析器进一步过滤,使用户最终得到与检索要求内容匹配度较高的文档。关键词:本体论;信息检索;语义Application of Ontology in Content-based Information RetrievalWAN Jie , TENG Zhiyang(Department of Computer Science and Engineering, Southeast University, Nanjing210096)【Abstracts】TherapidgrowthanddiversitiesofWebinformationbringalotofdifficultiestotheefficientinformation-retrieval.Thecurrentinformationretrievaltoolsjustofferkeywords-basedsearching,butignorethesemanticcontentofthekeywordsitself.Theauthorsinformation-retrievalsystemtakesfulladvantageofontology,whichexpandstherequirementofuserstothesemanticwordssetandprovidesthedocumentanalyzerthatcanfiltertheWebpagesreturnedbythesearchagentaccordingtothecertainalgorithm.Consequentlyitpresentsthemostrelevantdocuments to the users.【 Key words】Ontology;Information retrieval;Semantics随着Internet/Intranet的普及与推广,网络上的信息已是(hypernymy), 下 位 关 系[4]NT(hyponymy)[3],属关系海量。作为网络的基本工具,有哪些信誉好的足球投注网站引擎为用户提供了一种可RT(positiveassociatin)。其中同义词关系SYN表达了在相似以方便快捷地检索到自己所需信息的途径。目前的有哪些信誉好的足球投注网站引擎主要是基于关键词的全文匹配或是基于主题分类( 例如[1]数据源间的一种等价关系,是一种对称关系。 上下位关系是不对称的,是一种偏序关系,具有传递性。上位关系BTYahoo)进行检索的。结果往往会返回大量无关的链接,使表示is-a关系,例如:person is-ateacher,person是teacher的上得用户将大量的时间耗费在排除无关信息上。同时,用户和位概念;而下位关系则与之相反。属关系RT表示一类事物[5]网络文档对同一概念的表述形式往往会有差异,导致无法接包含于另一类事物,如part-of关系。各个概念间复杂的语收到有用信息。因此在检索过程中应该导入概念的内容表述——语义,使检索过程由原来的关键词(组)匹配进化为内容义关系组成了语义网络图,概念在其中表现为节点,而节点间的弧则代表了上述的关系。图1描述了语义网络图的部分。匹配,以克服上述仅有表达形式上的匹配所带来的种种缺陷。在这种检索的智能化过程中,本体论扮演了一个十分重要的角色。本文借助于本体论,提出了基于内容的信息检索原型系统,在一定程度上实现了用户检索要求与网络文档的内容匹配。2基本框架结构在本体论的帮助下,我们构建了一个智能化的信息检索原型系统。该系统由如下几个模块组成:本体论服务器(ontoserver) 、用户需求构建模块、数据处理模块、文档分析器。它们之间的结构关系如图2所示。1本体论概述图1部分语义网络图2.1本体论服务器图 2 信息检索原型系统结构本体论,就是指对概念化对象(conceptulization)的明确[2]本体论作为元数据结构(metadata schemas),提供了一个表示和描述。一个概念化对象就是对世界的一些抽象且简明化的观点。在这儿,概念化对象C可由3部分表示: 领域D,该领域中相关事
文档评论(0)