- 1、本文档共77页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第三节双变量回归与相关直线回归直线相关秩相关
2024/11/5变量间关系问题年龄~身高、肺活量~体重、药物剂量与动物死亡率等两种关系依存关系:应变量Y随自变量X变化而变化———回归分析互依关系:应变量Y与自变量X间的彼此关系———相关分析回归分析与相关分析
2024/11/5“回归”(regression)一词最早由英国统计学家F·Galton在一项有关父亲与儿子身高的研究中提出。以父亲的身高作为自变量(independentvariable),儿子的身高作为应变量(dependentvariable),将结果在平面直角坐标系上绘成散点图,发现其趋势近乎一条直线。无论是身材高还是身材矮的父亲所生儿子的身高都有向人群的平均身高“回归”的趋势,这就是“回归”的生物学内涵。第一节直线回归
2024/11/5
Galton数据散点图〔英寸〕
2024/11/5例9-1某地方病研究所调查了8名正常儿童的尿肌酐含量〔mmol/24h〕如表9-1。表9-18名正常儿童的年龄X(岁)与尿肌酐含量Y(mmol/24h)编龄X131196810127尿肌酐含量Y3.543.013.092.482.563.363.182.65实例
2024/11/5
2024/11/5回归的一般概念回归概念的提出说明我们可以用理想化的数学函数关系来解释应变量y与自变量x在数量变化方面的相互数量比例依存关系,因而可以用自变量x的变化来预测应变量y的取值,这是回归分析的数理逻辑根底。回归分析的目的用或易测或可测的变量对未知或难测或不可测变量的状态进行估计。一、直线回归的概念
2024/11/5直线回归分析的核心任务是建立两个连续型变量间最优化的直线回归模型,从而采用x对y进行估计或预测。其统计模型可表述为:用样本数据获得该数学模型的估计称为回归方程,即:直线回归的统计模型
2024/11/5每个观测的y值都可以分解成三个局部:常量α〔constant〕:即回归直线在纵坐标上的截距〔intercept〕,它是y的本底水平,即x对y没有任何作用时,y的数量表现。回归局部βx:它刻画了应变量y的取值改变中,由y与自变量x的线性相关关系所引起的局部,即可以由x直接估计的局部。其中,x是自变量的取值。β称为回归系数〔coefficientofregression〕,或回归直线的斜率〔slope〕,β的数值的意义是指当自变量x每改变一个度量单位时,因变量y的改变量的平均估计值。上述两局部之和用回归方程解释,就是yi在xi处的平均估计值,即为〔a+bxi〕回归估计误差εi〔errorsofregressionestimation〕线性回归模型的含义
2024/11/5LINE假定xy等方差Equalvariance
对于任何X值,随机变量Y的标准差?Y|X相等独立Independence
每一观察值之间彼此独立?y|X=α+?x线性Linearity
反响变量均数?与X间呈线性关系
?Y|X=α+?X正态Normality
对于任何给定的X,Y均服从正态分布,均数为?Y|X,标准差为?Y|X二、直线回归模型的前提假设〔LINE〕
2024/11/5最小二乘法原那么(leastsquaremethod):使各实际散点〔Y〕到直线〔〕的纵向距离的平方和最小。即使最小。三、回归参数的估计
2024/11/5Yi(Y的估计值)=a+bXiYi估计值i残差i=Yi–估计值i寻找使S(残差i)2最小的直线最小二乘法图解
2024/11/5因为直线一定经过“均数”点a和b的样本估计算法样本测量数据估计b的算法样本的截距a的计算公式
2024/11/5例9-1某地方病研究所调查了8名正常儿童的尿肌酐含量〔mmol/24h〕如表9-1。估计尿肌酐含量〔Y〕对其年龄〔X〕的回归方程。表9-18名正常儿童的年龄X(岁)与尿肌酐含量Y(mmol/24h)编龄X131196810127尿肌酐含量Y3.543.013.092.482.563.363.182.65实例
2024/11/5编号年龄X肌酐YX2Y2XY1133.5416912.5346.022113.011219.0633.11393.09819.5527.81462.48366.1514.
文档评论(0)