- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
??
?
??
机器学习线性模型训练:线性回归和逻辑回归
?
??
?
?
?
?
?
?
?
???
?
?
?
?
?
?
?
由于高等数学底子太差的原因,机器学习无法深入学习下去,只能做一个简单的尝试者,甚至连调优也未必能算的上,不过这样也好,可以把重心放到对业务的理解上,以及业务和模型的选择上。
线性模型包括了传统的线性回归、岭回归、Lasso回归,主要用于连续值的预测;逻辑回归虽然也是回归,但却是一种分类方法;LDA线性判别分析,则是一种降维方法;多项式回归,是使用线性模型训练数据的非线性函数。
总的来说,尝试着回顾一下,也挺有意思的。
importmatplotlib.pyplotasplt
importnumpyasnp
fromsklearnimportdatasets,linear_model,discriminant_analysis,model_selecTIon,preprocessing
fromsklearn.pipelineimportmake_pipeline,Pipeline
defload_data():
diabetes=datasets.load_diabetes()
#datasets.load_diabetes()定义
#C:\Python\Python37\Lib\site-packages\sklearn\datasets\_base.py
#returnBunch(data=data,target=target,DESCR=fdescr,
#feature_names=[age,sex,bmi,bp,
#s1,s2,s3,s4,s5,s6],
#data_filename=data_filename,
#target_filename=target_filename)
#print(diabetes)
#得到一个字典
#print(diabetes.keys())
#dict_keys([data,target,DESCR,feature_names,data_filename,target_filename])
#print(diabetes[data].shape)
#(442,10)
#print(diabetes[target])
#print(diabetes[target].shape)
#(442,)
#print(diabetes[feature_names])
#[age,sex,bmi,bp,s1,s2,s3,s4,s5,s6]
#print(diabetes[data_filename])
#C:\Python\Python37\lib\site-packages\sklearn\datasets\data\diabetes_data.csv.gz
#压缩包中有个X.csv文件,数据格式如下
#3.81E-025.07E-026.17E-022.19E-02-4.42E-02-3.48E-02-4.34E-02-2.59E-031.99E-02-1.76E-02
#-1.88E-03-4.46E-02-5.15E-02-2.63E-02-8.45E-03-1.92E-027.44E-02-3.95E-02-6.83E-02-9.22E-02
#8.53E-025.07E-024.45E-02-5.67E-03-4.56E-02-3.42E-02-3.24E-02-2.59E-032.86E-03-2.59E-02
#print(diabetes[target_filename])
#C:\Python\Python37\lib\site-packages\sklearn\datasets\data\diabetes_target.csv.gz
#压缩包中有个y.csv文件,数据格式如下
#1.51E+02
#7.50E+01
#1.41E+02
returnmodel_se
文档评论(0)