- 1、本文档共68页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
简单相关与简单回归.ppt
第九章 简单相关与简单回归 本章主要介绍简单相关和简单回归的基本概念;相关系数、回归方程的推导和相应的计算公式;相关系数和回归系数的显著性检验;等级相关;回归分析的用途和注意事项 第一节 概念 复习:数学中的函数关系 自然界中:现象之间的关系 性状之间的关系 依变量和因变量之间的关系: 人的身高与年龄的关系 疫病的发生与消毒的关系 等等 这些关系在取得数据后可以进行量化、也可以用某一个关系式来表示,这就是相关和回归 变量之间的关系有以下几种: 两个变量的关系: 与 ◆简单相关(线性关系) ◆曲线相关(非线性关系)+多项式 多个变量的关系: ◆多元相关(线性关系) 与 (非线性关系) ◆典范相关 与 第二节 相关关系 一、相关系数的确定 对某一个样品,同时测量其两个指标(或性状),得到两个变量,一个记为x,另一个记为y 每一样品就有一对x和y,共观测了n个样品,因而记录了n对(x,y) 将这n对(x,y)在一个直角坐标系内描点,并观察这些点的位置、排列和趋向 这些点排列得越整齐,表明这两个变量的关系越紧密,即这两个指标的关系越密切 反之,则表示这两个指标的关系越松散 两个指标的这种关系及其性质可以用一个数值来表示,这个数值就是相关系数 在已经描点的直角坐标系中找到这些点的中心位置 将直角坐标系平移到以 为新原点的位置上,所有点的相对位置并没有变,但各个点的坐标值变了,即由原来的 变为 并被新坐标系分到4个象限中 分布在Ⅰ、Ⅲ象限内的点其坐标乘积为 分布在Ⅱ、Ⅳ象限内的点其坐标乘积为 求所有点的坐标乘积和 这一坐标乘积和将出现三种情况: 表示分布在Ⅰ、Ⅲ象限内的点多 表示分布在Ⅱ、Ⅳ象限内的点多 表示这些点在4个象限内分布很均匀 称为离均差乘积和,简称乘积和:SP 第一、二两种情况所得到的数值的绝对值越大,就表示两个变量的关系越紧密 因此我们可以用乘积和的大小来表示两个变量关系的性质和密切程度 但 x、y 是有单位的,且变异程度也不同,每批资料所得到的数值对子数也不等 因此,应对变量进行标准化,将其化成相对数,相乘并相加后再行平均 对总体而言,就得到: 对样本而言,就得到: 和 是纯量,无单位,可以用来表示不同总体和样本两个变量的密切程度和性质 称为双变量总体的相关系数 称为双变量样本的相关系数 样本的相关系数还可以这样写: 即分子为乘积和,或协方差 分母为两变量平方和的乘积平方根,或两个标准差 相关系数的性质和取值范围: 当大多数点在Ⅰ、Ⅲ象限时, , 则 当大多数点在Ⅱ、Ⅳ象限时, , 则 当所有的点:或全在Ⅰ、Ⅲ象限,或全在Ⅱ、Ⅳ象限内,则这些点必排成一条直线,这时, 这就是函数关系,函数关系在生物界是不存在的 当这些点很均匀地分散于4个象限时, 则 或 ,表示两变量不相关,称为零相关 的取值范围为 , 的绝对值越大,表示两变量的关系越紧密;反之, 的绝对值越小,则表示两变量的关系越松散 在实际工作中,我们总是以样本的相关系数 来估计总体相关系数 ,因此, 也有以上这些性质 在生物学科中,许多变量的关系是不确定的,因此用一个数量关系来表示两变量的关系就尤为重要 在讨论两变量的关系时,有两种情况需要考虑: 如果仅考虑两变量关系的性质及密切程度,而不考虑两者的依从关系或因果关系,这两变量是平行的,仅仅为了方便和人为的需要,将其中一个作为 x,另一个作为 y,这样所得到的数学关系称为相关模型 如果两变量的确有主从关系或因果关系,而我们也希望知道两者的依从变化规律,这样的数学关系就称为回归模型 相关模型和回归模型两者关系紧密,但性质不同 这由两变量在不同的模型中所扮演的角色能看出来 决定系数 的取值范围为 ,且均为正值,因此 不能表示
文档评论(0)