《数据挖掘》课件 第4章 回归.pdfVIP

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘 高级大数据人才培养丛书之一,大数据挖掘技术与应用 第四章回归 回归是一种基于统计原理,对大量统计数据进行数学处理,并确定变量(或属性)之间的相关关系, 建立一个相关性的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化的方法。 根据因变量和自变量的函数表达式分为:线性回归分析、非线性回归分析。 根据因变量和自变量的个数可分为:一元回归分析、多元回归分析、逻辑回归分析和其它回归分析 。 高级大数据人才培养丛书之一,大数据挖掘技术与应用 第四章回归 4.1回归基本概念 4 一元回归分析 4.3 多元线性回归分析_________________ 4.4 逻辑回归分析 , 4.5 其他回酸析 4.6 实战二用回।旦分析方法给自旦的房主定价 习题 I 4.1回归基本概念 第四章回归 4.1.1回归分析的定义 对于社会经济现象,很难确定因变量和自变量之间的关系,因为它们大多是随机 的,只有通过大量的观察统计,才能找出其中的规律,随机分析是利用统计学原理描述 随机变量关系的一种方法。 回归分析可简单理解为信息分析与预测,信息即统计数据,分析即对信息进行数 据处理,预测就是加以外推,也就是适当扩大已有自变量取值范围,并承认该回归方程 在该扩大的定义域内成立,然后就可以在该定义域上取值进行 〃未来预测 〃。当然,对 回归方程可以进行有效的控制。 因此,回归分析主要解决下面两方面的问题: 1)确定变量之间是否存在相关关系,若存在,则找出数学表达式。 2)根据一个或几个变量的值,预测或控制另一个或几个变量的值,且要估计这种 控制或预测或以达到何种精确度。 4.1回归基本概念 第四章回归 4.1.2回归分析步骤 1)根据自变量与因变量的现有数据以及关系,初步设定回归方程。 2)求出合理的回归系数。 3)进行相关性检验,确定相关系数。 4)在符合相关性要求后,即可根据已经得到的回归方程与具体条件相结合,来确 定事物的未来状况,并计算预测值的置信区间。 回归分析中常用到的几个概念: 实际值:实际观测到的研究对象特征数据值; 理论值:根据实际值我们可以得到一条倾向线,用数学方法拟合这条曲线,可以 得到数学模型,根据这个数学模型计算出来的、与实际值相对应的值,称为理论值; 预测值:实际上也是根据数学模型计算出来的理论值,但它是与未来对应的理论 值。 表示符号:实际值,用表示;理论值,用只表示;预测值,用yo表示。 4.1回归基本概念 第四章回归 4.1.2回归分析要注意的问题 为使回归分析方程较能符合实际,首先应尽可能判断自变量的可能种类和个数, 并在观察事物发展规律的基础上定性回归方程的可能类型;其次,力求掌握较充分的高 质量统计数据,再运用统计方法,利用数学工具和相关软件,从定量方面计算或改进定 性判断。 高级大数据人才培养丛书之一,大数据挖掘技术与应用 第四章回归 4.1 回归基本概念 4.2 一元回归分析

文档评论(0)

xf118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档