网站大量收购独家精品文档,联系QQ:2885784924

deep we数据源的自动识别与分类研究.pdf

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
deep we数据源的自动识别与分类研究

目 录 摘 要………………………………………………………………………………….I Abstract……………………………………………………………………………………………………………III 第1章绪论……………………………………………………………………………5 1.1研究背景及意义………………………………………………………………5 1.2国内外研究现状………………………………………………………………6 1.2.1国外研究现状…………………………………………………………..6 1.2.2国内研究现状…………………………………………………………一7 1.3主要研究工作…………………………………………………………………8 1.4论文的组织结构………………………………………………………………9 1 第2章相关概念与技术……………………………………………………………..1 1 2.1数据挖掘技术………………………………………………………………..1 2.1.1数据挖掘技术的产生…………………………………………………11 1 2.1.2数据挖掘的概念………………………………………………………1 2.2相关算法简介…………………………………………………………………12 2.2.1决策树分类算法……………………………………………………….12 2.2.2朴素贝叶斯算法……………………………………………………….14 2.2.3粗糙集算法…………………………………………………………….15 2.3本章小结……………………………………………………………………..19 第3章网页表单特征分析及提取…………………………………………………21 3.1 网页表单分类………………………………………………………………21 3.2 HTML网页表单特征描述…………………………………………………21 3.3表单特征分析………………………………………………………………一22 3.3.1 对表单中INPUT控件的value属性值的统计和分析……………..22 3.3.2对表单中INPUT控件的name属性值的统计和分析……………..25 3.3.3 对表单中“search”语义特征的统计和分析………………………….26 3.4表单特征提取方案……………………………………………………………28 Web数据源识别研究…………………………………………………29 第4章Deep 4.1引言…………………………………………………………………………..29 4.2 Web查询接口识别研究总体思路及架构……………………………..29 Deep 4.3通用有哪些信誉好的足球投注网站引擎…………………………………………………………………29 4.3.1 定义……………………………………………………………………………………….29 1 4.3.2工作流程……………………………………………………………..3 4.4 Web与通用有哪些信誉好的足球投注网站引擎的关系……………………………………….32 Deep 4.5 Web自动识别的难点……………………………………………….32 Deep 4.6 制作贝叶斯分类器…………………………………………………………33 4.7实验结果与分析………………………………………………………………34 4.7.1 实验环境………………………………………………………………34 4.7.2 Web样本数据的来源…………………………………

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档