- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《案例统计1
高二数学讲义
统计案例
一、本章知识脉络:
二、本章要点追踪:
1.样本点的中心(,)
其中=xi,= yi .
2.线性回归模型的完美表达式
3.类比样本方差估计总体方差的思想,可以用
=i=Q(,)(n>2)
作为σ2的估计量 其中=-
=
4.我们可以用相关指数R2来刻画回归的效果,其计算公式是:
R2=1-
R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.
5.建立回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+x);
(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。
6.作K2来确定结论“X与 Y有关系”的可信程度.
三、几个典型例题:
例1 某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机制取了189名员工进行调查,所得数据如下表所示:
积极支持企业改革 不太造成企业改革 合 计 工作积极 54 40 94 工作一般 32 63 95 合 计 86 103 189 对于人力资源部的研究项目,根据上述数据能得出什么结论?
例2 有人统计了同一个省的6个城市某一年的人均国内生产总值(即人均GDP)和这一年各城市患白血病的儿童数量,如下表:
人均GDP(万元) 10 8 6 4 3 1 患白血病的儿童数 351 312 207 175 132 180 (1)画出散点图;
(2)求对的回归直线方程;
(3)如果这个省的某一城市同时期年人均GDP为12万元,估计这个城市一年患白血病的儿童数目;
的值,即可确定回归直线方程,然后再进行预测.
例3 寒假中,某同学为组织一次爱心捐款,于2008年2月1日在网上给网友发了张帖子,并号召网友转发,下表是发帖后一段时间的收到帖子的人数统计:
天数 1 2 3 4 5 6 7 人数 7 11 21 24 66 115 325 (1)作出散点图,并猜测与之间的关系;
(2)建立与的关系,预报回归模型并计算残差;
(3)如果此人打算在2008年2月12日(即帖子传播时间共10天)进行募捐活动,根据上述回归模型,估计可去多少人.
例6 有人发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少.为了研究国籍和邮箱名称里是否含有数字的关系,他收集了124个邮箱名称,其中中国人的70个,外国人的54个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.
(1)根据以上数据建立一个2×2的列联表;
(2)他发现在这组数据中,外国人邮箱名称里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?
分析:按题中数据建列联表,然后根据列联表数据求出值,即可判定.
解:(1)2×2的列联表
中国人 外国人 总计 有数字 43 27 70 无数字 21 33 54 总计 64 60 124 (2)假设“国籍和邮箱名称里是否含有数字无关”.
由表中数据得,
因为,所以有理由认为假设“国籍和邮箱名称里是否含有数字无关”是不合理的,即有的把握认为“国籍和邮箱名称里是否含有数字有关”.
例7 针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧人数占女生人数的.
(1)若有的把握认为是否喜欢韩剧和性别有关,则男生至少有多少人;
(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人.
分析:有的把握认为回答结果对错和性别有关,说明,没有充分的证据显示回答结果对错和性别有关,说明.设出男生人数,并用它分别表示各类别人数,代入的计算公式,建立不等式求解即可.
解:设男生人数为,依题意可得列联表如下:
喜欢韩剧 不喜欢韩剧 总计 男生 女生 总计 (1)若有的把握认为回答结果的对错和性别有关,则,
由,解得,
∵为整数,∴若有的把握认为回答结果的对错和性别有关,则男生至少有12人;
(2)没有充分的证据显示回答结果的对错和性别有关,则,
由,解得,
∵为整数,∴若没有充分的证据显示回答结果的对错和性别有关,则男生至多有6人.
文档评论(0)