Python数据挖掘与机器学习实战-选题 .pdfVIP

Python数据挖掘与机器学习实战-选题 .pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

Python数据挖掘与机器学习实战-选题

Python数据挖掘与机器学习实战—选题大纲(一组一章,第一章

除外)

或从下列选题中选择:(除第1讲)

选题名称内容结构内容要求

第1讲

机器学习与Python库(该讲不可选)解释器Python3.6与IDE:

Anaconda/Pycharm

1.Python基础:列表/元组/字典/类/文件

2.numpy/scipy/matplotlib/panda

的介绍和典型使用

3.多元高斯分布

4.典型图像处理

5.scikit-learn的介绍和典型使用

6.多种数学曲线

7.多项式拟合

8.快速傅里叶变换FFT

9.奇异值分解SVD

10.Soble/Prewitt/Laplacian算子

与卷积网络

代码和案例实践

1.卷积与(指数)移动平均线

2.股票数据分析

3.实际生产问题中算法和特征的关系

4.缺失数据的处理

5.环境数据异常检测和分析

第2讲回归线性回归

1.Logistic/Softmax回归

2.广义线性回归

3.L1/L2正则化

4.Ridge与LASSO

5.ElasticNet

6.梯度下降算法:BGD与SGD

7.特征选择与过拟合

8.Softmax回归的概念源头

9.最大熵模型

10.K-L散度

代码和案例实践

1.股票数据的特征提取和应用

2.泰坦尼克号乘客缺失数据处理和存活率

预测

3.环境检测数据异常分析和预测

4.模糊数据查询和数据校正方法

5.PCA与鸢尾花数据分类

6.二手车数据特征选择与算法模型比较

7.广告投入与销售额回归分析

8.鸢尾花数据集的分类

第3讲

决策树和随机森林熵、联合熵、条件熵、KL散度、互信息

1.最大似然估计与最大熵模型

2.ID3、C4.5、CART详解

3.决策树的正则化

4.预剪枝和后剪枝

5.Bagging

6.随机森林

7.不平衡数据集的处理

8.利用随机森林做特征选择

9.使用随机森林计算样本相似度

10.异常值检测

代码和案例实践

1.随机森林与特征选择

2.决策树应用于回归

3.多标记的决策树回归

4.决策树和随机森林的可视化

5.社会学人群收入预测

6.葡萄酒数据集的决策树/随机森林分类

7.泰坦尼克乘客存活率估计

第4讲SVM线性可分支持向量机

1.软间隔

2.损失函数的理解

3.核函数的原理和选择

4.SMO算法

5.支持向量回归SVR

6.多分类SVM

代码和案例实践:

1.原始数据和特征提取

2.调用开源库函数完成SVM

3.葡萄酒数据分类

4.数字图像的手写体识别

5.MNIST手写体识别

6.SVR用于时间序列曲线预测

7.SVM、Logistic回归、随机森林三者的

横向比较

第5讲聚类各种相似度度量及其相互关系

1.Jaccard相似度和准确率、召回率

2.Pearson相关系数与余弦相似度

3.K-means与K-Medoids及变种

4.AP算法(Sci07)/LPA算法及其应用

5.密度聚类DBSCAN/DensityPeak(Sci14)

6.谱聚类SC

7.聚类评价和结果指标

代码和案例实践:

1.K-Means++算法原理和实现

2.向量量化VQ及图像近似

3.并查集的实践应用

4.密度聚类的异常值检测

5.谱聚类用于图片分割

第6讲

隐马尔科夫模型

HMM主题模型LDA

1.词潜入和word2vec

2.前向/后向算法

3.HMM的参数学习

4.Baum-Welch算法详解

5.Viterbi算法详解

6.隐马尔科夫模型

您可能关注的文档

文档评论(0)

Xiniuwangyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档