- 1、本文档共48页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
只有散点图中的点呈条状集中在某一直线周围的时候,才可以说两个变量之间具有线性关系,才有两个变量的正线性相关和负线性相关的概念,才可以用回归直线来描述两个变量之间的关系 思考1:回归直线与散点图中各点的位置应具有怎样的关系? 整体上最接近 整体上最接近 方案一:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。 三、如何具体的求出这个回归方程呢? O 45 50 55 60 65 20 25 30 35 40 年龄 脂肪含量 5 10 15 20 25 30 35 40 方案二: 在图中选取两点画直线,使得直线两侧的点的个数基本相同。 三、如何具体的求出这个回归方程呢? O 45 50 55 60 65 20 25 30 35 40 年龄 脂肪含量 5 10 15 20 25 30 35 40 方案三: 在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距。 三、如何具体的求出这个回归方程呢? O 45 50 55 60 65 20 25 30 35 40 年龄 脂肪含量 5 10 15 20 25 30 35 40 设已经得到具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn) 当变量x取x1,x2,…,xn时,可以得到: 它与实际收集得到的 之间偏差是: (x1, y1) (x2,y2) (xi,yi) (xn,yn) 这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。 设所求的回归直线方程为 其中a,b是待定系数。 这n个偏差的和: 为了方便运算,人们更喜欢用: 根据有关数学原理分析,当 时,总体偏差 为最小,这样 就得到了回归方程,这种求回归方程的方法叫做最小二乘法. (其中,b是回归方程的斜率,a是截距) 最小二乘法的步骤: (1)收集样本数据,(xi,yi). (2)作散点图,确定x、y具有线性相关关系. 例2、(07广东)下表提供了某厂节油降耗技术发行后生产甲产品过程中记录的产量(吨)与相应的生产能耗y(吨标准煤)的几组对应数据. X 3 4 5 6 y2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y= ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 求样本数据的线性回归方程,可按下列步骤进行: 第一步,计算平均数 , 第二步,求和 , 第三步,计算 第四步,写出回归方程 练习2-1、 观察两相关量得如下数据: x -1 -2 -3 -4 -5 5 3 4 2 1 y -9 -7 -5 -3 -1 1 5 3 7 9 求两变量间的回归方程. 解:列表: i 1 2 3 4 5 6 7 8 9 10 x -1 -2 -3 -4 -5 5 3 4 2 1 y -9 -7 -5 -3 -1 1 5 3 7 9 xiyi 9 14 15 12 5 5 15 12 14 9 计算得: 所求回归直线方程为 注意:求回归直线方程的步骤: 第一步:列表 第二步:计算: 第三步:代入公式计算b,a的值 第四步:列出直线方程。 练习2-2、:给出施化肥量对水稻产量 影响的试验数据: 455 450 445 405 365 345 330 水稻产量y 45 40 35 30 25 20 15 施化肥量x (1)画出上表的散点图; (2)求出回归直线并且画出图形. 从而得回归直线方程是 解:(1)散点图(略). (2)表中的数据进行具体计算,列成以下表格 20475 18000 15575 12150 9125 6900 4950 xiyi 455 450 445 405 365 345 330 yi 45 40 35 30 25 20 15 xi 7 6 5 4 3 2 1 i .(图形略) 故可得到 * * 问题提出 1.函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个
文档评论(0)