网站大量收购独家精品文档,联系QQ:2885784924

数据挖掘与信息检索技术指南.docVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据挖掘与信息检索技术指南

TOC\o1-2\h\u11554第一章数据挖掘基础 3

290341.1数据挖掘概述 3

21421.2数据挖掘任务与流程 3

251621.2.1数据挖掘任务 3

229381.2.2数据挖掘流程 3

341.3数据挖掘常用算法 4

21525第二章数据预处理 4

314302.1数据清洗 4

295712.1.1错误识别 4

14172.1.2缺失值处理 5

211682.1.3异常值处理 5

147882.1.4重复记录处理 5

205782.2数据集成 5

170622.2.1数据源识别 5

154672.2.2数据抽取 5

175662.2.3数据转换 6

220052.2.4数据加载 6

176142.3数据转换 6

280552.3.1数据聚合 6

147042.3.2数据分割 6

206652.3.3数据变换 6

292072.3.4特征选择与特征提取 6

44162.4数据归一化与标准化 6

161692.4.1数据归一化 7

50382.4.2数据标准化 7

14863第三章信息检索基础 7

243343.1信息检索概述 7

235223.2信息检索模型 7

177583.3信息检索评价指标 8

160453.4信息检索系统架构 8

28777第四章文本挖掘技术 8

13914.1文本预处理 8

322844.1.1文本清洗 9

24394.1.2分词 9

288964.1.3词性标注 9

82444.1.4停用词过滤 9

70504.1.5词干提取 9

85184.2文本表示与特征提取 9

117244.2.1词袋模型 9

246344.2.2TFIDF 9

279984.2.3Word2Vec 9

49514.3文本分类与聚类 10

187364.3.1文本分类 10

165154.3.2文本聚类 10

80374.4文本相似度计算 10

178924.4.1余弦相似度 10

50924.4.2Jaccard相似度 10

11784.4.3Dice相似度 10

1224第五章关联规则挖掘 10

97315.1关联规则概述 10

212355.2关联规则挖掘算法 11

308295.3关联规则的评价指标 11

103825.4关联规则挖掘应用 11

1581第六章聚类分析 12

297616.1聚类分析概述 12

251836.2聚类分析方法 12

182746.2.1层次聚类方法 12

166256.2.2基于距离的聚类方法 12

303216.2.3基于密度的聚类方法 12

234506.2.4基于网格的聚类方法 12

57826.3聚类分析的评价指标 13

296736.3.1内部评价指标 13

20536.3.2外部评价指标 13

6746.3.3相对评价指标 13

318496.4聚类分析应用 13

26350第七章分类算法 13

86477.1分类算法概述 13

154087.2常见分类算法 14

75577.2.1决策树算法 14

295767.2.2支持向量机(SVM) 14

82967.2.3朴素贝叶斯算法 14

302697.2.4随机森林算法 14

255487.3分类算法的评价指标 14

1687.3.1准确率(Accuracy) 14

85527.3.2精确率(Precision) 14

85417.3.3召回率(Recall) 14

251727.3.4F1值(F1Score) 15

262667.4分类算法应用 15

100377.4.1文本分类 15

215827.4.2图像识别 15

150247.4.3医疗诊断 15

20277第八章机器学习方法 15

185838.1机器学习方法概述 15

199218.2监督学习 15

264828.3无监督学习 16

261978.4强化学习 16

28491第九章信息检索系统设计 17

186169.1

您可能关注的文档

文档评论(0)

180****1188 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档