- 1、本文档共110页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
直线回归和相关;引言
这一章研究的对象:
由一个变数 两个或多个变数,因为在实际生产实践和科学实验中所要研究的变数往往不止一个,例如:
研究温度高低和作物发育进度快慢的关系,就有温度和发育进度两个变数;
研究每亩穗数、每穗粒数和每亩产量的关系,就有穗数、粒数和产量三个变数。;第一节 回归和相关的概念;有精确的数学表达式;函数关系是一种确定性的关系,例如圆面积
与半径的关系为 。其不包含误差的干扰。
统计关系是一种非确定性的关系。例如,作物的产量与施肥量的关系,两类变数受误差的干扰表现为统计关系。;因果关系:两个变数间的关系若具有原因
和反应(结果)的性质。
相关关系:呈现一种共同变化的特点,则称这两个变数间存在。
回归分析:计算回归方程为基础的统计分析方法。;为Y 依X 的回归方程(regression equation of Y on X )。;一般规则:
当两个变数中Y 含有试验误差而X 不含试验误差时着重进行回归分析;而当Y 和X 均含有试验误差时则着重去进行相关分析。
4. 两个变数资料的散点图
对具有统计关系的两个变数的资料进行初步考察的简便而有效的方法,是将这两个变数的n对观察值(x1,y1)、(x2,y2)、…、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上,获得散点图(scatter diagram)。; 根据散点图可初步判定双变数X 和Y 间的关系,包括:①X 和Y 相关的性质(正或负)和密切程度;
②X 和Y 的关系是直线型的还是非直线型的;
③是否有一些特殊的点表示着其他因素的干扰等。
例如图9.1是水稻方面的3幅散点图,图9.1A是单株的生物产量(X )和稻谷产量(Y ),图9.1B是每平方米土地上的总颖花数(X )和结实率(Y ),图9.1C是最高叶面积指数(X )和每亩稻谷产量(Y )。从中可以看出:① 图9.1A和9.1B都是直线型的,但方向;相反;前者Y 随X 的增大而增大,表示两个变数的;x,生物产量(g)
水稻单株生物产量与稻谷产量的散点图;x,每m2颖花数(万)
水稻每m2颖花数和结实率的散点图;x,最高叶面积指数
水稻最高叶面积指数和亩产量的散点图;第二节 直线回归;一、直线回归方程;时,分别对a和b 求偏导数并令其为0,可得正规方程组(normal equations):;(9·3);y
①;(二)直线回归方程的计算
[例9.1] 一些夏季害虫盛发期的早迟和春季温度高 低有关。江苏武进连续9年测定3月下旬至4月中旬旬 平均温度累积值(x,旬·度)和水稻一代三化螟盛发期 (y,以5月10日为0)的关系,得结果于表9.1。试计算其直线回归方程。
首先由表9.1算得回归分析所必须的6个一级数据(即由观察值直接算得的数据):;;n = 9;SSx =;故得表9.1资料的回归方程为:
=48.5485-1.0996x
上述方程中回归系数和回归截距的意义为:当3月下旬至4月中旬的积温(x)每提高1旬·度时,一代三化螟的盛发期平均将提早1.1天;若积温为0,则一代三 化螟的盛发期将在6月27—28日(x=0时,=48.5;因y 是以5月10日为0,故48.5为6月27—28日)。
由于x变数的实测区间为[31.7,44.2],当x<31.7 或>44.2时,y的变化是否还符合=48.5-1.1x的规律,观察数据中未曾得到任何信息。; 所以,在应用=48.5-1.1x于预测时,需限定x的区间为[31.7,44.2];如要在x<31.7或>44.2的区间外延,则必须有新的依据。;(三)直线回归方程的图示
直线回归图包括回归直线的图象和散点图,它可以醒目地表示x 和y 的数量关系。
方法:制作直线回归图时,首先以x为横坐标,以y为纵坐标构建直角坐标系(纵、横坐标皆需标明名称和单位);然后取x坐标上的一个小值x1代入回归方程得 ,取一个大值x2代入回归方程得 ,连接坐标点(x1, )和(x2, )即成一条回归直线。如例9.1;以x2=44.2代入回归方程得;x,3月下旬至4月中旬旬平均温度累积值图旬平均温度累积值和一代三化螟盛发期的关系; 图9.3的回归直线是9个观察坐标点的代表,它不仅 表示了例9.1资料的基本趋势,也便于预测。如某年 3月下旬至4月中旬的积温为40旬·度,则在图9.3上可查到一代三化螟盛发期的点估计值在5月14—15日,这和将x=40代入原方程得到
=48.5485-(1.0996×40)=4.6是一致的。因为回归
直线是综合9年结果而得出的一般趋势,所以其代表性比任何一个实际的坐标点都好。当然,这种估计仍然有随机误差,下文再作讨论。;(四)直线回归的估计标准误
Q 就是误差的一种度量,称为离回归平方和(sum of squares du
文档评论(0)