Python机器学习基础-全套PPT课件.pptx

  1. 1、本文档共538页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第1章概述;1.1什么是机器学习

;

;

;1.2机器学习的算法

;

监督学习;

无监督学习;

半监督学习;

1.3监督学习;

;

;

1.4无监督学习;

;

;1.5数据集;

;

;

;泛化、过拟合、欠拟合;

;

1.6机器学习项目的流程;

;

;

;

;

;

;

;1.7小结;THANKS;第2章Python机器学习的使用;2.1Python语言介绍;Python被称为“胶水语言”,不仅可以使用Python编程,还可以使用C语言、C++编写,他把耗时的代码交给C/C++等高效率的语言进行实现,然后通过粘合来使用,这样就使得Python运行时间得到简化。;Python还具有列表、元组、字典等核心数据类型,以及集合、队列等无需进一步编程就能直接使用。;由于Python可以应用到多个领域,功能比较广泛,可扩展性强,所以基于Python生成了非常多的第三方库,这些库Python本身不带,运用时需要先安装,然后才能导入,Python包含了大量的第三方库可以运用到机器学习,比如:图形库,数学函数库,机器学习算法库等。;2.2Python平台搭建;Python下载;软件安装;第三方库的安装;2.3Python入门;数据类型;;;;基本运算;;控制语句;;复杂数据类型;;;;;;;;;;;;2.4Python库的使用;;;;;;;;;;;;;;;;;;;;2.5小结;THANKS;第2章监督学习;3.1K近邻算法;;;;;;;;;;工作原理

k=1;;;;;;;对二分类数据可视化决策边界可视化;;;;;;;;;;;3.2线性回归;;;;;;;;;; 线性回归在线性可分的情况下表现得非常出色,但对于线性不可分的情况下,会表现得束手无策,比如对于以下数据:;;;;;;;;;3.3岭回归;;;;;;;;;;;3.4LASSON回归;;;;;;;;;3.5逻辑回归;;;;;;;;;;3.6朴素贝叶斯算法;;;;;;;因为多项式朴素贝叶斯只适用于处理非负离散数值,所以在下面对数据进行了归一化。;;;;;;3.7决策树;;;;;;;;;;;;;;;;;

;;3.8随机森林;;;;;接下来实现又三棵树组成的随机森林。

fromsklearn.datasetsimportload_iris

fromsklearn.model_selectionimporttrain_test_split

fromsklearn.ensembleimportRandomForestClassifier

importmatplotlib.pyplotasplt

importmglearn

iris=load_iris()

X=iris.data[:,2:4]

y=iris.target

X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=3)

forest=RandomForestClassifier(n_estimators=3,max_depth=3)

forest.fit(X_train,y_train)

fig,axes=plt.subplots(2,2,figsize=(6,6))

fori,(ax,tree)inenumerate(zip(axes.ravel(),forest.estimators_)):

ax.set_title(tree{}.format(i))

mglearn.plots.plot_tree_partition(X_train,y_train,tree,ax=ax)

mglearn.plots.plot_2d_separator(forest,X_train,fill=True,alpha=0.4)

axes[-1,-1].set_title(Randomforest)

mglearn.discrete_scatter(X_train[:,0],X_train[:,1],y_train)

plt.show();; 从图中可以看出每棵树都有不同的决策边界,而随机森林最后的模型由三棵树综合而成。随机森林比任何一棵树的过拟合都要小,给出的决策边界也更符合直觉。还查看随机森林对数据集中特征重要的的处理。

fromsklearn.datasetsimportload_iris

fromsklearn.model_selectionimporttrain_test_split

fromsklearn.ensembleimportRandomForestClassifier

iris=load_iris()

X_train,X_test,y

您可能关注的文档

文档评论(0)

153****9532 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6101234030000022

1亿VIP精品文档

相关文档