- 1、本文档共80页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
deep we数据抽取及集成技术研究
Web数据抽取及集成技术研究
Deep 中文摘要
中文摘要
随着万维网技术和数据库技术的结合,网络开始迅速的深化。大量的信息都隐藏
在Web数据库中,用户通过查询可以动态的获取这些信息,学者们将这类资源称为
Deep Web站点,使用起来较为不便,因
Web。由于.DeepWeb资源分布在各个Deep
Web的数据集成系统便应运而生。
此,面向Deep
本文对DeepWeb领域的数据抽取及集成技术进行了研究,并提出了相关的算法
Web的有哪些信誉好的足球投注网站引擎原型系统。本文的主要研究
和解决方案,最后设计了一个面向Deep
工作如下:
(1)将Web数据对象从查询结果页面中抽取出来是DeepWeb数据集成的第一步,
本文基于文档对象模型,通过页面预处理、抽取候选Web数据对象集、去除非Web
数据对象三个阶段提出了一种自动抽出Web数据对象的方法。
(2)提出了一种对模式异构的Web数据对象进行集成的方法。该方法以向量空间
Web站点的异构Wreb数据对象进行了集
模型为基础,以聚类为手段对来自不同Deep
成,并以区分度为基础,以相似度为度量手段检测出了重复的Web数据对象,实现
了Wreb数据对象的去重。
(3)分析了海量数据的组织方法对查询响应速度的影响,在此基础上提出了一种
对海量Web数据对象进行组织的方法。该方法通过递增聚类使Web数据对象根据自
身的特征自然的聚集在一起,形成一个科学的类别层次,为查询的快速响应奠定基础。
Web的有哪些信誉好的足球投注网站引擎原型系统。
(4)在上述研究的基础上设计了一个面向Deep
本文还对文中提出的方法和技术进行了实验,结果表明本文提出的方法技术是可
行有效的。
Web,数据集成,数据抽取,聚类,有哪些信誉好的足球投注网站引擎
关键词:Deep
作 者:刘桂峰
指导老师:崔志明(教授)
Abstract
With
the ofthe
WorldWideWebandDatabase
development is
amountofinformationare in
deepeningrapidly.Large hiddenWeb are
Databases,which
called Web.Userscall them
Deep get to
dynamiclybysubmiuingqueries
query
forms.BecauseWebresources in
distributedifferent
Deep Web itisnot
您可能关注的文档
最近下载
- 南芯产品规格书SC8905.pdf
- 浙江省工程勘察设计大师申报表.doc
- 科学教师教学用书五年级上册 - 义务教育课程标准实验教材.pdf VIP
- A成都轨道交通工程机电系统施工工艺标准(第二版)2018.5.pdf
- (高清版)B-T 18380.36-2022 电缆和光缆在火焰条件下的燃烧试验 第36部分:垂直安装的成束电线电缆火焰垂直蔓延试验 D类.pdf VIP
- 电商平台账单导出流程.docx VIP
- 2024年人教版生物七年级上册《第二单元 多种多样的生物》第三章微生物大单元整体教学设计.docx
- 新版FMEA培训课件【第五版】.pptx
- 固态锂电池试制线生产线建设项目申请可行性研究报告.doc
- 护理工作职责与岗位职责培训课件.pptx
文档评论(0)