- 1、本文档共55页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文献异构检索中eep web数据集成研究
目录
目 录
I
摘 要I
II
II
II
ABSTRACTIIII
第一章 引 言1
1.1 研究目的及意义 1
1.2 国内外研究现状 2
1.3 本文的创新点3
1.4 本文的组织结构 3
第二章 科技文献异构数据库共享检索平台5
第三章 DEEP WEB 数据集成8
3.1 DEEP WEB 数据集成机制 8
3.1.1 DEEP WEB 数据集成技术8
3.1.2 两种DEEP WEB 数据集成机制8
3.1.3 科技文献异构数据库共享检索平台中的集成机制确定11
3.2 DEEP WEB 数据集成关键技术 12
3.2.1 DEEP WEB 数据的特点12
3.2.2 DEEP WEB 数据抽取方法13
3.2.3 DEEP WEB 页面与DOM 树的对应15
3.2.4 查询结果排序处理技术15
3.3 一种基于DOM 树匹配的DEEP WEB 自动抽取算法 18
3.3.1 算法主要思想18
3.3.2 DOM 树匹配计算算法19
3.3.3 数据区域识别算法20
3.3.4 抽取规则生成21
3.3.5 实验分析22
3.4 一种基于LUCENE 的改进排序算法 23
3.4.1 算法主要思想24
3.4.2 词和文档的位置关系度量24
3.4.3 基于Lucene 的改进排序算法25
3.4.4 实验分析26
第四章 DEEP WEB 数据集成在科技文献异构检索平台中的应用28
4.1 DEEP WEB 异构数据集成解决方案 28
4.1.1 项目建设的需求28
4.1.2 项目的技术难点和关键问题分析29
4.1.3 开发技术架构30
4.1.4 科技文献的异构数据集成框架31
目录
文档评论(0)