网站大量收购独家精品文档,联系QQ:2885784924

deep we数据抽取及集成技术研究.pdf

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
deep we数据抽取及集成技术研究

Web数据抽取及集成技术研究 Deep 中文摘要 中文摘要 随着万维网技术和数据库技术的结合,网络开始迅速的深化。大量的信息都隐藏 在Web数据库中,用户通过查询可以动态的获取这些信息,学者们将这类资源称为 Deep Web站点,使用起来较为不便,因 Web。由于.DeepWeb资源分布在各个Deep Web的数据集成系统便应运而生。 此,面向Deep 本文对DeepWeb领域的数据抽取及集成技术进行了研究,并提出了相关的算法 Web的有哪些信誉好的足球投注网站引擎原型系统。本文的主要研究 和解决方案,最后设计了一个面向Deep 工作如下: (1)将Web数据对象从查询结果页面中抽取出来是DeepWeb数据集成的第一步, 本文基于文档对象模型,通过页面预处理、抽取候选Web数据对象集、去除非Web 数据对象三个阶段提出了一种自动抽出Web数据对象的方法。 (2)提出了一种对模式异构的Web数据对象进行集成的方法。该方法以向量空间 Web站点的异构Wreb数据对象进行了集 模型为基础,以聚类为手段对来自不同Deep 成,并以区分度为基础,以相似度为度量手段检测出了重复的Web数据对象,实现 了Wreb数据对象的去重。 (3)分析了海量数据的组织方法对查询响应速度的影响,在此基础上提出了一种 对海量Web数据对象进行组织的方法。该方法通过递增聚类使Web数据对象根据自 身的特征自然的聚集在一起,形成一个科学的类别层次,为查询的快速响应奠定基础。 Web的有哪些信誉好的足球投注网站引擎原型系统。 (4)在上述研究的基础上设计了一个面向Deep 本文还对文中提出的方法和技术进行了实验,结果表明本文提出的方法技术是可 行有效的。 Web,数据集成,数据抽取,聚类,有哪些信誉好的足球投注网站引擎 关键词:Deep 作 者:刘桂峰 指导老师:崔志明(教授) Abstract With the ofthe WorldWideWebandDatabase development is amountofinformationare in deepeningrapidly.Large hiddenWeb are Databases,which called Web.Userscall them Deep get to dynamiclybysubmiuingqueries query forms.BecauseWebresources in distributedifferent Deep Web itisnot

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档