I基于本体的信息检索.docVIP

下载本文档

1
0
约3.98千字
约 7页
2017-01-12 发布于北京
举报
版权申诉

I基于本体的信息检索.doc

1、本文档共7页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

I基于本体的信息检索

基于本体的信息检索吴素坤（东华大学图书馆上海图书馆）摘要：近年来，本体论（ontology）目前的信息检索，不论是网络检索还是在特定数据库内检索，其有哪些信誉好的足球投注网站机制往往是基于关键词或主题内容的检索。传统信息检索模型可示意如下图：图1 传统的信息检索模型[1] 从图1上可以看出，传统的信息检索是基于关键字的检索技术，需要用户将要寻找的事件以关键词的形式较准确地描述出来，并最终以检索表达式的形式提交给查询系统。由于字义本身与其概念的延伸不在同一级上，造成利用传统信息检索所寻找的信息可能仅仅是字面本身的信息，但往往人们想要的是这个信息的概念及相关的成分，而不仅仅是字面所表达的信息。换言之，传统信息检索只是关注词的模式匹配，而没有能够关注与处理词的语义概念本身及其相关关系。理想的智能信息检索系统的目标是：提供友好的用户检索交互界面；基于自然语言或实例的查询；依据用户浏览和检索的习惯信息，熟悉用户的兴趣爱好，建立一定的用户描述，主动向用户提供相关的信息；针对用户查询请求自动向用户提供相关文档页面，不需用户重复发现知识；综合利用个性化检索和集中浏览的优势；检索速度快，能够快速地返回查询结果；高检索率（多）和高检索精度（准）。因此已有的信息检索系统与理想的智能信息检索系统相比，存在着很多不足。这就需要在现有信息检索系统的理论和技术的基础上，设计并实现符合特定领域需要的智能信息检索系统和该系统的体系架构，从而实现分布式异构信息的预处理和远程信息的自动获取。有学者提出，基于本体的信息检索模式是一种最有前途的检索方法。知识本体的定义及其在信息检索中的应用知识本体的定义近十年来，本体的研究日趋成熟。在各种文献中，尽管与本体相关的概念和术语的用法并不完全一致，但是事实的使用约定已经出现。以下仅列出本体的几种比较有代表性的定义。(1)????本体是对于“概念化”conceptualization）的某一部分的明确的总结或表达。? (2)????本体在不同的场合分别指“概念化”或“本体理论”ontological theory）。?(3)????本体是用于描述或表达某一领域知识的一组概念或术语。它可以用来组织知识库较高层次的知识抽象，也可以用来描述特定领域的知识。? (4)????本体属于人工智能领域中的内容理论（content?theories），它研究特定领域知识的对象分类、对象属性和对象间的关系，它为领域知识的描述提供术语。? ntoBroker检索界面[4]，但是，这种应用途径对信息检索人员提出了很高的要求，防碍了非专家用户的使用。下图描述了典型的基于本体的信息检索模型。图2基于本体的信息检索模型[5] 图2描绘了共享本体是如何改变在信息检索过程中检索表达式以及文献的展现。另外，检索表达式的制定过程中可以获得一个或者多个本体的支持，这些本体都是在开始检索之前用户根据所需信息所属的领域选择的。另外文献的展现应包括其一些逻辑概念的描述，使文献本身成为本体结构中的集成的一个部分，那么具体的文献通过本体概念的描述管理使其在完整的本体结构找到自己的位置，这样，信息检索过程中的匹配过程就可以归结为一种探察（exploration）过程，这种过程可以根据检索提问的形式和逻辑解释不同，有多种不同的实现方式。国内外基于本体的信息检索研究近来，国内外关于基于本体的信息检索方面的研究日益增多，以下作简要介绍。 Ontobroker[4]是用来处理HTML、XML和RDF格式的信息源和信息源语义描述的系统，提供信息检索、查询和维护支持服务。核心是用形式化本体描述背景知识，并明确化Web文档的语义，以便综合利用本体论的表达能力和推理机制。OntoSeek[5]是基于内容从在线黄页和产品目录中进行检索的系统，把本体用作有语义信息的领域词汇表，将本体驱动的内容匹配机制与一个表示形式化系统相结合，试图将本体论和大词典库相互集成，以便提供一个可以用领域内任意词汇进行交互式语义查询的系统询的系统。P. Varga等[6]描述了一种用于从各种信息源检索到的信息的存储和呈现的总的构架和原型应用。其语言背景为匈牙利语，适用领域为金融知识领域。所提出的构架受多种挑战因素制约，如知识的精细领域、非结构化文本信息的内容挖掘、其它语言问题的解决等。其中在应用过程中最关键的问题是合适的领域本体的开发，因为要构建一个结构与人类描述世界的方式完全一致的本体还只是在理论上能够实现。图3为所提出的信息检索系统的构架。图3 文献检索系统的构架王　进2004年第3期Onto-CLIR，该模型在传统信息检索技术的基础上，利用本体来刻画不同语言中对应的领域知识，以解决从查询语言到检索语言之间转换过程中出现的语义损失和曲解等问题，从而保证在检索过程中能够有效地遵循用户的查询意