- 1、本文档共38页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]统计学概念和方法-第10章
第十章 两个数值型变量的回归分析 数学与信息科学学院 王 坤 TELfellowang@163.com 主要内容 回归的含义 一元线性回归 最小二乘估计 回归方程的检验 残差分析 多元回归分析 回归的含义 高尔顿(1822-1911,Galton)是生物学家达尔文的表弟.他早年在剑桥学习数学,后到伦敦攻读医学.1860年当选为皇家学会会员,1909年被封为爵士.1845—1852年深入到非洲腹地探险、考察. 高尔顿是生物统计学派的奠基人,他的表哥达尔文的巨著《物种起源》问世以后,触动他用统计方法研究智力遗传进化问题,第一次将概率统计原理等数学方法用于生物科学,明确提出“生物统计学”的名词. 现在统计学上的“相关”和“回归”的概念也是高尔顿第一次使用的,他是怎样产生这些概念的呢 Galton于1886年在论文“Regression towwards mediocrity in hereditary stature”中正式提出回归(regression)一词。他在研究人类身高的遗传时,发现子女的身高趋势与父母的身高有微妙的关系:高个子的父母的子女,其身高有低于父母身高的趋势,反之,矮个子父母的子女,其身高有高于他们父母身高的趋势。从总体看,高个子的人“回归”于一般人身高的平均值,而矮个子的人则作相反的“回归”,这就是“回归的最初涵义。 Galton收集了1078对父母的身高x与子女的身高y数据,建立了一条回归直线 y=33.73+0.516x (单位:英寸,一英寸=2.54厘米) 他用这条回归直线来描述子女身高与父母身高的关系。如x=80,y=75.01;x=60,y=64.99。 散点图(scatter diagram) 2. 一元线性回归 例1 在NaNO3的溶解度试验中,测得在不同的温度x(0C)下,溶解于100份水中的NaNO3份数y如下表所示: 绘出(xi,yi)的散点图 3. 最小二乘估计 设给定n个点(x1,y1), …,(xn,yn)。 图示 续例1 于是得到回归方程: 回归方程的作用: 预测:由自变量x的值预测因变量y的值。(点估计) 控制:要求y1yy2,那么x在什么范围?(置信区间) 置信区间、预测区间、回归方程 4.回归方程的检验 回归方程的显著性检验 回归系数的显著性检验是要检验y对x的影响程度是否显著,为此; H0:b=0 若b=0,显然,回归方程无意义。 为此可以采用t检验、F检验法。而多数软件皆提供此功能。 P值远小于显著水平a=0.05,故拒绝H0:b=0,认为一元线性回归的效果显著。 4.3离差平方和的分解(三个平方和的关系) 离差平方和的分解 (三个平方和的意义) 总平方和(SST) 反映因变量的 n 个观察值与其均值的总离差 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 残差平方和(SSE) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和 4.3拟合效果的度量-决定系数 样本相关系数(相关系数) 相关系数的显著性检验(检验的步骤) 1. 检验两个变量之间是否存在线性相关关系 采用R.A.Fisher提出的 t 检验 检验的步骤为 提出假设:H0:r ? ? ;H1: r ? 0 5. 残差分析 残差定义: 残差图:以自变量x为横轴(或以因变量回归值作横轴),以残差作纵轴,将相应的残差点画在直角坐标系中,即得残差图。 如,例1的残差图为: 可看到此例中残差在 e=0附近随机变化,并 在一条带子之内。 可化为线性的一元非线性回归 许多问题中,两个变量之间并不一定是线性关系,而是某种非线性关系。有的非线性模型可以转化为线性模型来处理,有的则不可以。 常见的可以转化为线性模型的非线性函数形式有: 通过转换,仍然可以使用一元线性回归的方法。 例2 下表给出了一批混凝土的抗压强度X和抗剪强度Y的对应数据,求Y与X的关系式:Y=AXB. 解:对Y=AXB两边取对数,得: LnY=LnA+BLnX 令y=LnY,x=LnX,上式可以化为: y=a+bx 对题中表格数据相应取对数得: 算得a=-0.2005, b=0.678 于是A= ea=e-0.2005, B=b=0.678 因而X与Y的关系式为: Y=0.818X0.678 例 已知11颗树的直径(单位:寸)和高度(单位:尺)数据如下: 此例应用方程y=aLnx+b来进行回归。 6 多元线性回归 一
您可能关注的文档
最近下载
- 婚前医学检查相关知识考核试题.pdf VIP
- 社保2024年新规培训.pptx VIP
- 人教版数学二年级上册第六单元 表内乘法(二)大单元整体教学设计.pdf
- DLT 5707-2014 电力工程电缆防火封堵施工工艺导则-行业标准.pdf
- 2024年医疗招聘中医类-中医妇科学考试历年高频考点题库含答案.docx VIP
- 2023年辽宁省营口市中考生物试卷(含答案).doc VIP
- 北师大版生物中考试题(含解析).docx VIP
- 2024年医疗招聘中医类-针灸推拿考试历年高频考点题库含答案.docx VIP
- 初中生物复习选择题.doc VIP
- 北师大版八年级生物上册单元测试-第19章.doc VIP
文档评论(0)