- 1、本文档共68页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[农学]田间试验与统计方法直线回归与相关
1、函数关系与统计关系 函数关系 是一种确定的关系。例如圆面积与半径的关系为: 定义结果变数为依变数(dependent variable),以Y 表示。 如果两个变数并不是原因和结果的关系,而呈现一种共同变化的特点,则称这两个变数间存在相关关系。 相关关系中没有自变数和依变数之分。 相关关系:x、y相互影响,平行变化,不存在自变数x和依变数y之分。(两个随机变量X,Y,对于任一随机变量的每一可能的值,另一个随机变量都有一个确定的分布与之相对应,称这两个随机变量间存在相关关系)。如穗长和穗重的关系、身高和体重的关系。在大量测量各种玉米穗长的穗重时发现:虽然在同样穗长下,穗重并不完全一样。但在每一穗长下,都有一个确定的穗重分布与之相对应;反之,测量玉米各种穗重的穗长时会发现:在每一穗重下,都有一个穗长分布与之相对应。我们称穗长与穗重之间存在相关关系。 3、回归分析和相关分析 (1)对具有因果关系的两个变数,统计分析的任务是由实验数据推算出一个表示Y 随X 的改变而改变的方程,称之为回归方程(regression equation of Y on X ),这一过程称为回归分析。 称为散点图(scatter diagram)。 从图中看出,干物重与NaCl的含量间呈直线关系,但这些点并不在一条支线上。若增加在每一NaCl含量下的观测次数,这种直线关系可以更明显。如下表:使每一NaCl含量下的10次重复值。 散点图使用以上数据绘成的。从图中可以看出,增加观察次数,并求出每一xi处Y的平均数,用这些平均数做出来的图比上一图的7个散点更接近于直线。如果继续增加观察次数,他们的平均数就更趋近于直线,我们就用这样一条直线描述两变量间存在的数量关系。在实际应用时,不可能无限重复实验,在散点图上,只能作出少数有限个点。在点比较少的情况下,表示两变量之间的关系的直线可以画出许多条,其中那一条是最好的呢?我们就要讨论这一问题。 一、直线回归方程 称为直线回归方程(linear regression equation)。其中a 是x=0时的值,即回归直线在y 轴上的截距,叫回归截距(regression intercept);b 是x 每增加一个单位数时, 平均地将要增加(b0时)或减少(b0时)的单位数,叫回归系数(regression coefficeint)。 从上图得知,要使 能够最好地代表y和x在数量上的互变关系,必须使 分别对a和b求偏导并令其为0,即: 式中 是x的离均差和y的离均差的乘积之和,简称乘积和(sum of products),记作SP。 因而有: (三)、直线回归方程的图示 (四)、直线回归的估计标准误 满足 为最小的直线回归方程和实测的观察点并不重合,表明该回归方程仍然存在随机误差。 Q 就是误差的一种度量,称之为离回归平方和(sum of squares to deviation from regression)或剩余平方和。 由于在建立回归方程时用了a 和b 两个统计数,故Q 的自由度ν=n-2。因而,可定义回归方程的估计标准误为: Q值的计算: (五)、直线回归的数学模型和基本假定 1、数学模型 若X是可控制的变量,如上表数据,在实验无限重复之后,则可以得到在各xi上的Y的条件平均数μY.X,这些平均数构成一条直线。μY=α+βX 其中α为直线的截距, β为斜率。含义是,对于变量X的每一个值,都有一个Y的分布,这个分布的平均数是μY=α+βX所给出的线性函数。Y的每一分布方差都必须是σ2,它完全独立于X。对于每一给定的X,Y始终服从正态分布。另外,记ε为对于给定的X,Y的观测值与直线μY.X的离差,该离差为一随机变量,它独立于X且服从同一正态分布N(0, σ2)。归纳为:Y=α+βX+ ε ε:N (0, σ2);Y:N(α+βX, σ2) 以上所得出的回归模型,只包含一个自变量X且具有正态性,所以称为一元正态线性回归模型 2、基本假定 (1)、Y 变数是随机变数,而X 变数则是没有误差的固定变量,至少和Y 变数比较起来 X 变数的误差小到可以忽略。 (2)在任一X上都存在着一个Y 总体,它是作正态分布的,其平均数是X 的线性函数。 二、 直线回归的假设测验和区间估计 (一)、直线回归的假设测验 1、回归关系的假设测验 (1)t 测验 若总体不存在直线回归关系,则总体回归系数β=0;若总体存在直线回归关系,则总体回归系数β≠0。 所以对直线回归的假设测验为: H0: β=0对HA: β≠0。 回归系数b的标准误为: [例9.3P163]试测验9.1资料回归关系的
文档评论(0)