网站大量收购独家精品文档,联系QQ:2885784924

web数据库重估计技术研究.pdf

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
web数据库重估计技术研究

Web数据库重叠估计技术研究 中文摘要 Web数据库重叠估计技术研究 中文摘要 Web中的数据信息是一项非常重要的工作,在这项工作中常会遇到信 集成Deep 息冗余和记录去重问题,它们常成为集成工作成败的关键。估计web数据库重叠率, 可以优化信息冗余和记录去重工作,减少集成的盲目性。 本论文主要包含三部分内容: 1.提出了在理想情况下的web数据库重叠估计方法,包括一种朴素方法和在朴素 方法基础上的改进方法。朴素方法研究覆盖了从采样到估计的整个流程,但忽略了 web的复杂性;改进方法通过高频字采样,提高采样和估计效率。 2.针对理想情况下的web数据库重叠估计方法省略掉的web数据库记录匹配问 w.eb查询接1:3和返回 题,提出了web数据库重叠估计中的实体识别方法。根据Deep 记录的特点,引入领域知识和预处理,计算记录相似度,从工程的角度降低识别复杂 度,提高识别准确性和效率。 3.为了进一步提高重叠估计的适应性,提出了web数据库重叠估计的修正方法, 通过回归分析建立数据库相似度和估计偏差之间的关系,利用数据库相似度预测估计 偏差,提供真实值可能存在的范围。 本文进行了大量的实验,验证提出的各种理论和方法,同时提出了有待进一步深 入解决的问题,展望该领域科研发展的方向和前景。 Web,web数据库,重叠,估计,高频字 关键词:Deep 作 者:苗忠义 指导老N-崔志明 Abstract Researchon Estimation forWebDatabases Overlap Technology Researchon Estimation forWebDatabases Overlap Technology Abstract datainformationin webisavery thiswork Integrating Deep importantjob,in people oftenencounterthe ofredundantinformationand the database problem removingduplicate oftenbecomethe totheSuccessorfailureof the records,they key ratebetweenWebdatabasescan to theworkof overlapping helpoptimize resolving and database reducethe redundantinformation the records,to removingduplicate blindnessofthe work. integration Thethesiscontainsthreemain

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档