网站大量收购闲置独家精品文档,联系QQ:2885784924

数据分析与挖掘优化指南.pdf

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据分析与挖掘优化指南

第一章数据准备与预处理3

1.1数据收集3

1.1.1明确数据需求3

1.1.2数据源选择3

1.1.3数据采集方法3

1.1.4数据存储3

1.2数据清洗3

1.2.1数据去重3

1.2.2数据校验3

1.2.3数据填充4

1.2.4数据标准化4

1.3数据整合4

1.3.1数据合并4

1.3.2数据转换4

1.3.3数据整合4

1.3.4数据质量控制4

第二章数据可视化4

2.1基础图表绘制4

2.1.1选择合适的图表类型4

2.1.2图表绘制步骤5

2.2高级图表绘制5

2.2.1复合图表绘制5

2.2.2高级图表绘制技巧5

2.3动态数据可视化5

2.3.1动态数据可视化的意义5

2.3.2动态数据可视化工具6

第三章数据摸索性分析6

3.1描述性统计分析6

3.1.1数据分布分析6

3.1.2数据可视化6

3.1.3数据清洗与预处理7

3.2关联性分析7

3.2.1变量类型分析7

3.2.2相关系数计算7

3.2.3关联性可视化7

3.3异常值检测7

3.3.1简单统计量检测7

3.3.2基于模型的异常值检测7

3.3.3异常值处理8

第四章数据建模8

4.1建模方法选择8

4.2模型训练与评估8

4.3模型优化与调整9

第五章数据挖掘算法9

5.1决策树9

5.2支持向量机10

5.3神经网络10

第六章机器学习应用11

6.1分类问题11

6.2回归问题11

6.3聚类问题12

第七章数据挖掘评估与优化12

7.1评估指标选择12

7.2交叉验证13

7.3特征选择与降维13

第八章文本挖掘14

8.1文本预处理14

8.1.1文本清洗14

8.1.2分词14

8.1.3词性标注14

8.1.4词语相似度计算14

8.2词向量表示15

8.2.1OneHotRepresentation15

8.2.2TFIDF15

8.2.3Word2Vec15

8.2.4FastText15

8.3主题模型15

8.3.1隐马尔可夫模型(HMM)15

8.3.2模型15

8.3.3非参数主题模型15

8.3.4深度学习主题模型16

第九章数据仓库与大数据分析16

9.1数据仓库构建16

9.1.1数据仓库概述16

9.1.2数据仓库设计原则16

9.1.3数据仓库构建流程16

9.2大数据分析技术16

9.2.1大数据概述16

9.2.2大数据分析方法16

9.2.3大数据分析工具17

9.3大数据应用案例17

9.3.1金融行业17

9.3.2零售行业17

9.3.3医疗行业17

9.3.4智能交通17

第十章数据分析与挖掘项目管理17

10.1项目规划与管理17

10.2团队协作与沟通18

10.3项目风险与质量控制18

第一章数据准备与预处理

1.1数据收集

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档