网站大量收购独家精品文档,联系QQ:2885784924

图书领域dee web数据库选择方法研究.pdf

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图书领域dee web数据库选择方法研究

摘 要 摘 要 目前 Web 中存在大量可以访问的在线数据库,而且各数据库与用户特定查询的相 关度不同,因此如何快速准确地选择出与用户查询密切相关的数据库变得越来越重要。 在此,本文提出了一种基于信息检索的 Web 数据库选择方法。 首先,在原有数据库选择方法的基础上做了相应改进,即在数据库选择之前,根据 Web 数据库的主题分布对数据库进行了分类,从而避免了对所有数据库进行查询检索, 有效地提高了 Web 数据库的访问效率,且该分类仅是对图书领域进行地更详细的分类。 然后,本文提出借助领域本体构建文本查询词,该方法充分利用了领域本体实例的 唯一性及各属性信息,为通过文本属性进行 Web 数据库选择奠定了基础。 接着,本文提出的 Web 数据库选择方法充分考虑了信息检索性能的各项评价指标, 在结合原有评价参数的基础上做了相应改进,并提出了新的信息检索性能评价指标,实 现了结构化 Web 数据库选择。改进的方法摒弃了原信息检索性能各评价参数的缺点, 继承了其优点,而且改进的方法能够评价多个系统的性能水平。 最后,在选择排序的基础上,通过设定阈值选择出既高效又准确的部分 Web 数据 库。针对新的查询词,采用 FP 增长算法寻找被频繁查询的数据库,并将其作为 Web 数 据库选择的默认候选对象。 实验表明,本文提出的基于信息检索的 Web 数据库选择方法,在一定程度上提高 了信息检索效率和查询准确度。 关键词 Web 数据库 信息检索 领域本体 FP 增长算法 I Abstract Abstract There are a lot of online databases which are available to visit, and the different databases vary with the correlation degree of user-specific queries, therefore how to quickly and accurately find the Web databases which are closely related with the user’s query becomes more and more important. This paper proposed a database selection method which is based on information retrieval. First, we improve the database selection method based on the original one, that is to say, classify the databases according to the database topic before the database selection, and therefore avoid to retrieval all the databases, which improved the access efficiency. And it is only a more detailed classification just for the books area. Second, this paper propose using of domain ontology to build text query terms, the method makes the full use of the uniqueness and attributes

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档