- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
回归分析1回归分析的基本概念2回归分析的参数计算3编程举例说明未来的深度学习备用:深度学习:人工智能展望与挑战回归分析在现实生活中,往往需要分析若干变量之间的关系,如碳排放量与气候变暖之间的关系、某商品的广告投人量与销售量之间的关系等,这种分析不同变量之间存在关系的研究叫回归分析,刻画不同变量之间关系的模型称为回归模型。一旦确定了回归模型,就可以进行预测等分析工作,如从碳排放量预测气候变化程度、从广告投人量预测商品销售量等。2.5.1回归分析的概念二氧化碳浓度在逐年缓慢增加,→二氧化碳浓度=a*年份+b设时间年份为x、二氧化碳浓度为y,即y=ax+b。利用表中8组数据可确定模型中参数a和b的值,一旦求解出a和b的值,输入任意的时间年份(甚至是1970年之前的时间年份),该模型可估算出该时间年份所对应的二氧化碳浓度值。这种建立变量之间关联关系,且利用这种关联关系进行预测分析的方法叫回归分析。“监督学习”与“无监督学习”区别监督学习:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。无监督学习:根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题的过程。在回归分析中,刻画数学关系的模型包含了一些未知参数(如y=ax+b中的参数a和b)这些参数需要从已有数据中计算得到。那么如何预设一个合理的模型?又如何对模型中的未知参数进行计算呢?说明:为了简化问题,往往假设模型是符合线性分布2.5.2回归分析中参数计算最简单的线性回归模型就是一元线性回归模型,只包含一个自变量x和一个因变量y,并且假定自变量和因变量之间存在如y=ax+b的线性关系。一元线性回归分析实际上就是寻找“ax+b”形成的一条直线,使得这条直线尽可能靠近或穿过这8组(x,y)数据,即能够以最小的误差来拟合这8组(x,y)数据。如何计算参数a和b使误差最小化?如何表示误差?2.5.2回归分析中参数计算?一旦给定了参数a和b,通过计算ax+b得到的值记为=ax+b,接着计算y和之间差的绝对值|-y|,将这个差的绝对值作为对应的真实值(即y)和模型预测值(即)之间的误差,这个误差通常称为“残差”。为了计算方便,在实际中一般使用(-y)2而不是|-y|引作为“残差”。这样对于给定的n组(x,y)数据,可用不同的a和b来刻画这n组数据所隐含的y=ax+b关系。对于这些不同的参数,最佳回归模型是最小化残差平方和的均值,即要求n组(x,y)数据得到的残差平均值最小。从残差的定义可看出,残差平均值最小只与参数a和b有关,最优解即使得残差最小所对应的a和b的值。2.5.2回归分析中参数计算?可通过最小二乘法(leastsquare)来求解使得残差最小的a和b。8组(x,y)样本数据点记为(x1,y1),(x2,y2),(x8,y8),时间年份变量x的平均值记为,因变量y的平均值记为,那么a和b值的计算公式如下:预测莫纳罗亚山地区二氧化碳浓度的一元线性回归模型为:二氧化碳浓度=1.5344x时间年份-2698.9,即y=1.5344x-2698.9。拓展链接——最小二乘法最小二乘法是一种机器学习的优化技术,其将残差平方之和最小化作为目标,找到最优模型来拟合已知的观测数据,使得模型所预测的数据与实际数据之间误差的平方和最小,一般有线性最小二乘法和非线性最小二乘法两种方法。用线性最小二乘法来解决线性回归模型存在封闭形式(closed-formsolution)唯一解,这个解得到的回归模型使得所有观测数据都在一条直线上或直线附近。非线性最小二乘法需要用数值方法来求解,比如随机梯度下降或者牛顿法等。梯度下降:是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(GradientDescent)是最常采用的方法之一,另一种常用的方法是最小二乘法。在机器学习中,基于基本的梯度下降法发展了两种梯度下降方法,分别为随机梯度下降法和批量梯度下降法。2.5.2回归分析——实例分析二氧化碳浓度的一元线性回归模型y=1.5344x-2698.9对莫纳罗亚山地区1970年之前和2005年之后的二氧化碳浓度进行估算:2.5.2回归分析——实例分析进一步探究地球气温变化与二氧化碳浓度之间的关系二氧化碳浓度和温度之间有怎样的一元线性关系呢?【演示python程序】2.5.2回归分析——实例分析任务1:使用matplotlib工具包将当前二氧化碳浓度和温度数据绘制散点图2.5.2回归分析——实例分析任务2:根据最小二乘法计算公式,使用当前给定的数据来计算参数a和b。在散点图代码之前添加一段计算参数的代码,绘制拟合直线。由图可以看出,计算所得直线是符合数据点变化趋势的。这说明了最小二乘法在一元线性回归中的有
您可能关注的文档
- 队列 课件 选修一《数据与数据结构》高中信息科技.pptx
- 高中信息技术浙教版:1-1 人工智能的起源-教学课件.pptx
- 高中信息技术浙教版:1-2 数据、信息与知识-教学课件.pptx
- 高中信息技术浙教版:2-2 网络体系结构与TCP_IP协议-教学课件 (1).pptx
- 高中信息技术浙教版:2-4 三维模型渲染-教学课件.pptx
- 高中信息技术浙教版:4-1 三维作品的发布形式-教学课件.pptx
- 高中信息技术浙教版:4-2-4相关分析-教学课件.pptx
- 高中信息技术浙教版:5-3-2 排序算法的应用-教学课件 (1).pptx
- 高中信息技术浙教版:5-3-2 排序算法的应用-教学课件.pptx
- 技术的性质 课件.pptx
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
- GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 20867.1-2024机器人 安全要求应用规范 第1部分:工业机器人.pdf
- 中国国家标准 GB/T 20867.1-2024机器人 安全要求应用规范 第1部分:工业机器人.pdf
最近下载
- 新动物防疫管理制度.doc
- 电工培训课件PPT(共-95张).ppt
- 第1课 社会主义在中国的确立与探索【中职专用】-【名师课堂】高一思想政治《中国特色社会主义》备课精品课件(高教版2023·基础模块).pptx
- 质量控制实验室GMP指南1300问完整版.pdf VIP
- 做情绪的主人 一 认识情绪 课件.ppt
- 医学影像学-消化系统的影像学诊断.ppt
- 旅游界app项目创业计划书.pptx VIP
- 第1课 铰链四杆机构的组成及分类公开课教案教学设计课件资料.pptx VIP
- 提高护士输液时PDA扫描率品管圈护理课件.pptx
- 地球与地球仪课件 2024-2025学年人教版地理七年级上册.pptx VIP
文档评论(0)