- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据挖掘与信息检索技术指南
TOC\o1-2\h\u11554第一章数据挖掘基础 3
290341.1数据挖掘概述 3
21421.2数据挖掘任务与流程 3
251621.2.1数据挖掘任务 3
229381.2.2数据挖掘流程 3
341.3数据挖掘常用算法 4
21525第二章数据预处理 4
314302.1数据清洗 4
295712.1.1错误识别 4
14172.1.2缺失值处理 5
211682.1.3异常值处理 5
147882.1.4重复记录处理 5
205782.2数据集成 5
170622.2.1数据源识别 5
154672.2.2数据抽取 5
175662.2.3数据转换 6
220052.2.4数据加载 6
176142.3数据转换 6
280552.3.1数据聚合 6
147042.3.2数据分割 6
206652.3.3数据变换 6
292072.3.4特征选择与特征提取 6
44162.4数据归一化与标准化 6
161692.4.1数据归一化 7
50382.4.2数据标准化 7
14863第三章信息检索基础 7
243343.1信息检索概述 7
235223.2信息检索模型 7
177583.3信息检索评价指标 8
160453.4信息检索系统架构 8
28777第四章文本挖掘技术 8
13914.1文本预处理 8
322844.1.1文本清洗 9
24394.1.2分词 9
288964.1.3词性标注 9
82444.1.4停用词过滤 9
70504.1.5词干提取 9
85184.2文本表示与特征提取 9
117244.2.1词袋模型 9
246344.2.2TFIDF 9
279984.2.3Word2Vec 9
49514.3文本分类与聚类 10
187364.3.1文本分类 10
165154.3.2文本聚类 10
80374.4文本相似度计算 10
178924.4.1余弦相似度 10
50924.4.2Jaccard相似度 10
11784.4.3Dice相似度 10
1224第五章关联规则挖掘 10
97315.1关联规则概述 10
212355.2关联规则挖掘算法 11
308295.3关联规则的评价指标 11
103825.4关联规则挖掘应用 11
1581第六章聚类分析 12
297616.1聚类分析概述 12
251836.2聚类分析方法 12
182746.2.1层次聚类方法 12
166256.2.2基于距离的聚类方法 12
303216.2.3基于密度的聚类方法 12
234506.2.4基于网格的聚类方法 12
57826.3聚类分析的评价指标 13
296736.3.1内部评价指标 13
20536.3.2外部评价指标 13
6746.3.3相对评价指标 13
318496.4聚类分析应用 13
26350第七章分类算法 13
86477.1分类算法概述 13
154087.2常见分类算法 14
75577.2.1决策树算法 14
295767.2.2支持向量机(SVM) 14
82967.2.3朴素贝叶斯算法 14
302697.2.4随机森林算法 14
255487.3分类算法的评价指标 14
1687.3.1准确率(Accuracy) 14
85527.3.2精确率(Precision) 14
85417.3.3召回率(Recall) 14
251727.3.4F1值(F1Score) 15
262667.4分类算法应用 15
100377.4.1文本分类 15
215827.4.2图像识别 15
150247.4.3医疗诊断 15
20277第八章机器学习方法 15
185838.1机器学习方法概述 15
199218.2监督学习 15
264828.3无监督学习 16
261978.4强化学习 16
28491第九章信息检索系统设计 17
186169.1
您可能关注的文档
- 工程审计工作流程规范及质量管理体系构建实务.doc
- 智能供应链管理优化策略研究.doc
- 零售电商运营作业指导书.doc
- 年度环保工程项目实施合作书.doc
- 经济法律风险防控手册.doc
- 建筑方案设计指南.doc
- 市场营销策略深化指导.doc
- 软件测试与质量保证体系完善作业指导书.doc
- 游戏开发项目流程优化及资源整合计划书.doc
- 全新环卫工人劳动合同.doc
- 区委书记、市国资委党委领导班子2025年组织生活会对照“四个带头”含反面典型案例举一反三剖析方面检查材料【两篇文】.docx
- 局党组书记、市国资委党委领导班子2025年组织生活会对照“四个带头”含反面典型案例举一反三剖析方面个人检查材料2篇文.docx
- 市交通运输局局长2025年专题生活会对照“四个带头”含落实意识形态工作责任制方面个人对照检查发言提纲与检察院领导班子“四个带头”检查材料【2篇文】.docx
- 市投资促进局党支部书记2025年组织生活会对照“四个带头”个人对照检查发言材料与党组书记“四个带头”个人对照检查材料(内蒙古地区四个对照,反面典型案例检视剖析)【2篇文】.docx
- 市教育局党委副书记、市国资委党委领导班子2025年“四个带头”个人对照检查发言材料(上年度整改+个人事项+典型事例剖析)2篇文.docx
- 2025年专题生活会“四个带头”方面对照检视材料(问题+原因+措施+意识形态)与纪检委员专题生活会“四个带头”方面个人对照检查材料【2篇文】.docx
- 检察院领导班子2025年专题生活会对照“四个带头”检查材料与县司法局专题生活会党组书记个人对照“四个带头”对照检查材料(含反面典型案例全面剖析)2篇文.docx
- 市机关事务局党支部书记、局党组书记2025年组织生活会对照“四个带头”含反面典型案例举一反三剖析方面个人发言材料、检查材料【2篇文】.docx
- 2025年领导干部专题生活会“四个带头”对照检查材料与市审计局领导班子专题生活会“四个带头”含反面典型案例剖析对照检查材料2篇文.docx
- 2025年县司法局专题民主生活会班子围绕“4个带头”对照检查材料与反面典型案例回顾与剖析对照检查发言材料2篇文.docx
最近下载
- 毫针刺法(刺法灸法学).pptx VIP
- 环境污染与防治31环境污染.pptx VIP
- 对乡镇领导班子个人的意见和建议(通用6篇).doc VIP
- 开学安全法治第一课.pptx VIP
- 文献检索与科技论文写作 课件全套 第1--9章 绪论、科技文献检索基础知识---科技论文的投稿.pdf VIP
- 污水厂一期监理大纲.doc VIP
- 急诊与灾难医学绪论.ppt
- 2025年泰山职业技术学院高职单招语文2018-2024历年参考题库频考点含答案解析.docx
- 【地理】亚洲的人文环境 2024-2025学年七年级地理下册教学课件(人教版2024).pptx VIP
- 幼儿园后勤管理经验分享.pptx VIP
文档评论(0)