- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络信息检索系统设计与技术分析
网络信息检索系统设计与技术分析
【摘 要】当前,随着互联网的普及和网上信息的爆炸式增长,信息检索系统及其核心技术搜检索擎的性能和效率问题已成为人们研究和关注的焦点。影响一个搜检索擎系统的性能有很多因素,但最主要的是信息检索模型,通过对信息检索模型研究的主要内容和构建策略进行了描述,就相关的问题进行了探讨,总结了信息检索模型的研究。
【关键词】信息检索模型;相关性;查询;搜检索擎
随着网络应用的不断普及,网络已经成为人们获取信息的重要场所。在对新的检索工具和检索技术进行探索和研究的过程中,应克服当下网络信息检索给我们带来的困难,加强对不同需求进行信息搜集和发送的智能化服务功能。
一、网络环境下信息检索的含义及特点
智能化信息检索是在信息检索的基础上提出来的,它是以用户为中心的信息检索技术,为不同用户提供不同的服务,并满足同一用户在不同时期的需求,通过收集和分析用户信息来学习用户的兴趣和行为,并综合利用这些用户信息,提高信息检索系统的性能,满足用户的个体信息需求。在具体实现过程中主要是通过观察和分析用户的有哪些信誉好的足球投注网站行为,从中识别出用户对信息需求的偏好,并且能够根据用户对有哪些信誉好的足球投注网站结果的评价,自觉地调整有哪些信誉好的足球投注网站策略,使得对于不同的检索请求,不同用户都能够得到最贴近自己需要的信息服务。
数据量巨大。在网络环境下,数据量大的惊人。大数据量会导致一些难以预料的软件异常,流量也会难以控制,对各个环节的策略和算法选择将会更加复杂。
多用户服务。多用户模式的信息检索服务必须注重快速反应,注重对并发访问的支持,对公共数据的共享,对临时工作数据的清理等。如果要针对不同用户开展不同服务,就要获取并管理不同用户的个性化需求,使大量的信息通过不同的渠道,主动送到用户的手上。
用户层次复杂。网络环境下信息检索服务的用户中,大多数都不是专业用户,他们的层次区别较难,拥有不同的操作技能和操作知识,面对这些非专业的用户,将更加需要人性化的引导式信息服务。
二、网络信息检索的原理
随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。
网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式:
1.布尔逻辑模型
这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,有哪些信誉好的足球投注网站工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所有哪些信誉好的足球投注网站的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。
2.模糊逻辑模型
它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。
3.概率模型
它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。
三、网络信息检索系统主要功能模块
(一)Oracle数据集成工具(ODI)
ODI(Oracle Data Integrator)是Oracle公司采用ELT理念进行数据抽取、加载、转换的数据集成中间件工具,其最大特点是提出了知识模块的概念。ODI将一些场景(如文件加载到数据库,从MySQL数据库抓取数据到Oracle数据库等)的详细实现步骤使用Jvthon脚本语言结合数据库SQL语句录制成详细的步骤记录下来,形成知识模块,ODI中共有超过100种主流数据库引擎和应用系统的知识模块,基本上包含了普通应用所涉及的所有场景,因此ODI可以实现对校园网内多种异构数据库的支持。在一个数据集成任务中,ODI通过声明设计运用接口和关系图等概念声明数据集成规则,使集成的逻辑和技术层面分离,底层的技术方面由知识模块描述和定义,系统只需要把重点放在集成任务规则的制定上面,再将制定好的集成规则封装为一个服务模型。发布和订阅该模型便可实现类似于数据增量定时更新的功能,系统以全局数据库为核心通过ODI工具对校园网内异构数据库数据进行抽取、转换、清洗和加载,集成后的数据质量得到了提高,对异构数据源的处理也得到了加强。在对数据处理的过程中提取了信息的标题、作者、正文、发布时间、URL地址等字段,可定时对各异构数据库数据进行增量更新操作,从而替代利
文档评论(0)