网站大量收购闲置独家精品文档,联系QQ:2885784924

Python机器学习与项目实践- 课件 chap3-线性模型.pptx

Python机器学习与项目实践- 课件 chap3-线性模型.pptx

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

线性模型;教学内容;矩阵微积分;关于概率的一些基本概念;概率的一些基本概念;概率的一些基本概念;概率的一些基本概念;线性回归模型;模型:

增广权重向量和增广特征向量

;第1步,我们需要导入所需的包。

增广权重向量和增广特征向量

1.from?sklearn?import?datasets???#导入sklearn?中的数据集??

2.from?sklearn.model_selection?import?train_test_split?#导入数据集划分模块??

3.from?sklearn.linear_model?import?LinearRegression?#导入线性回归模型??

4.from?sklearn.metrics?import?mean_squared_error?#导入均方差评价指标?

?

;第2步,首先加载数据集

增广权重向量和增广特征向量

1.#加载波士顿房价数据集??

2.boston_data=datasets.load_boston()??

3.#获取波士顿房价数据集的特征集??

4.bonston_x=boston_data.data???

5.#获取波士顿房价数据集的目标值??

6.bonston_y=boston_data.target??

7.#查看数据集键值对??

8.print(boston_data.keys())??

9.#查看数据集描述??

10.print(boston_data.DESCR)??

11.#查看数据集特征值形状,可以看出有506个样本,每个样本有13个特征??

12.print(bonston_x.shape)????

13.#查看数据集目标值形状,有506个目标值。可以发现没有缺失值??

14.print(bonston_y.shape)??

?

;通过结果可以知道共有506个样本,特征向量维度为13,也就是说房价有13个影响因素。增广权重向量和增广特征向量

?

;第3步,划分训练集和测试集,其中测试集占数据集的20%。

1.#对数据集进行划分,其中测试集占数据集的20%??

2.features_train,features_test,target_train,target_test?=train_test_split(bonston_x,bonston_y,test_size=0.2)

?

;第4步,实例化模型并进行训练。

1.#实例化模型??

2.model?=LinearRegression()??

3.#进行模型训练??

4.model.fit(features_train,target_train)?

?

;第5步,对测试集进行预测,并输出预测目标值和真实目标值,从而直观地感受预测目标值与真实值目标的差距。

1.#进行预测??

2.target_test_predict=model.predict(features_test)??

3.#查看预测目标值

4.print(target_test_predict)??

5.#查看真实目标值??

6.print(target_test)??

?

;第6步,对模型进行评价,采用的是均方??评价函数:

1.#?对模型效果进行评价??

2.error=mean_squared_error(target_test,target_test_predict)??

3.print(测试数据的误差:,error)??

?

;逻辑回归模型;

?

;

?

;导入需要使用的包。

1.#导入需要使用的包??

2.#导入划分训练集、测试集需要使用的包??

3.from?sklearn.model_selection?import?train_test_split??

4.#导入鸢尾花数据集??

5.from?sklearn.datasets?import?load_iris??

6.#导入sklearn中的逻辑回归模型??

7.from?sklearn.linear_model?import?LogisticRegression??

?

;然后加载鸢尾花数据集,查看数据集键值对,查看数据集描述,查看特征集形状。

1.#加载鸢尾花数据集??

2.iris_data=load_iris()??

3.#查看鸢尾花数据集的键值对??

4.print(iris_data.keys())??

5.#查看鸢尾花数据集的描述??

6.print(iris_data.DESCR)??

7.#查看鸢尾花特征集的形状??

8.print(iris_data.data.shape)?

??

?

;接下来划分数据集。

1.#将数据集划分为测试集和训练集,使用默认划分比例,测试集占数据集的25%,查看划分后训练集的形状??

2.features_trai

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档