1.上节学习了回归分析的基本方法.线性回归模型y=bx+a+e不.ppt

1.上节学习了回归分析的基本方法.线性回归模型y=bx+a+e不.ppt

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.上节学习了回归分析的基本方法.线性回归模型y=bx+a+e不.ppt

* * 1.上节学习了回归分析的基本方法.线性回归模型y=bx+a+e不同于一次函数y=bx+a,含有__________,其中x为_________,y为__________. 温故夯基 随机误差e 解释变量 预报变量 样本点的中心 残差平方和 1.2 独立性检验的基本思想及其初步应用 在统计学中,独立性检验就是检验两个分类变量是 否有关系的一种统计方法。 所谓“分类变量”,就是指个体所属的类别不同,也 称为属性变量或定型变量。 在日常生活中,我们常常关心两个分类变量之间是 否有关系,例如吸烟是否与患肺癌有关系?性别是否对 于喜欢数学课程有影响等等。 9965 9874 91 总计 7817 7775 42 不吸烟 2148 2099 49 吸烟 总计 不患肺癌 患肺癌 吸烟与患肺癌列联表 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人) 列联表2×2 在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 0.54% 2.28% 3)通过图形直观判断 患肺癌 比例 不患肺癌 比例 等高 条形图 问题1:判断的标准是什么? 吸烟与不吸烟,患病的可能性的大小是否有差异? 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大 问题2:差异大到什么程度才能作出“吸烟与患病有关”的判断? 问题3:能否用数量刻画出“有关”的程度? 独立性检验 H0: 吸烟和患肺癌之间 没有关系 通过数据和图表分析,得到结论是:吸烟与患肺癌有关 结论的可靠程度如何? a+b+c+d b+d a+c 总计 c+d d c 吸烟 a+b b a 不吸烟 总计 患肺癌 不患肺癌 吸烟与患肺癌列联表 吸烟的人中不患肺癌的比例: 不吸烟的人中不患肺癌的比例: 若H0成立 引入一个随机变量:卡方统计量 作为检验在多大程度上可以认为“两个变量有关系”的标准 。 通过公式计算 9965 9874 91 总计 7817 7775 42 不吸烟 2148 2099 49 吸烟 总计 不患肺癌 患肺癌 吸烟与患肺癌列联表 已知在 成立的情况下, 故有99%的把握认为H0不成立,即有99%的把握认为“患肺癌与吸烟有关系”。 即在 成立的情况下, 大于6.635概率非常小,近似为0.010 现在的 =56.632的观测值远大于6.635,出现这样的观测值的概率不超过0.010。 a+b+c+d b+d a+c 总计 c+d d c a+b b a 总计   一般地,对于两个分类变量X和Y。X有两类取值: 即类 和 (如吸烟与不吸烟);Y也有两类取值: 即类 和 (如患病与不患病)。于是得到下列样 本频数的2×2列联表为: 用卡方统计量来确定在多大程度上可以认为 “两个分类变量有关系”的方法称为这两个分类变 量的独立性检验。 要推断“X和Y有关系”,可按下面的步骤进行: (1)提出假设H0 :X和Y没有关系; (3)查对临界值,作出判断。 (2)根据2×2列联表与公式计算 的值; 10.828 7.879 6.635 5.024 3.841 0.001 0.005 0.010 0.025 0.05 2.706 2.072 1.323 0.708 0.455 0.10 0.15 0.25 0.40 0.50 P( ) 反证法原理与假设检验原理 反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。 假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。 例1.在某医院,因为患心脏病而住院的665名男性病人 中,有214人秃顶;而另外772名不是因为患心脏病而住 院的男性病人中有175秃顶.分别利用图形和独立性检 验方法判断秃顶与患心脏病是否有关系?你所得的结论 在什么范围内有效? 秃顶与患心脏病列联表 1437 772 665 总计 1048 597 451 不秃顶 389 175 214 秃顶 总计 患其他病 患心脏病 有99%的把握认为“秃顶与患心脏病有关” 说明:在熟悉独立性检验的原理后,可以通过直接计算K2的观测值(不画等高条形图)来解决两个分类变量的独立性检验问题,但是,借助图形更直观。 犯错误的概率是指将“秃顶与患心脏病有关系”错判成“秃顶与心脏病没有关系”的概率 例2 为考察高中生的性别与是否喜欢数学课程之间的关 系。在某城市的某校高中生随机抽取300名学生。得到 如下列联表: 性别与喜欢数学课程列联表 300 228 72 总计 178 14

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档