- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
教学目标:会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异。会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异。
从图中可以看出,基本上分成下面四组:(1)巴哈马,巴基斯坦,巴拉圭,巴林,尼日利亚和土库曼斯坦;(2)芬兰,新西兰,瑞典和美国;(3)中国,日本,泰国,韩国,拉脱维亚,多米尼加和汤加;(4)土耳其,斐济和俄罗斯。
这个过程叫做聚类分析,它的基本思想是:
在一批样本数据中,定义能度量样本数据或类别间相近程度的统计量,在此基础上计算出个样本数据或类别之间的相近程度度量值;再按相近程度的大小,把样本逐一归类,关系密切的聚集到一个小的分类单位,关系疏远的聚集到一个大的分类单位,直到所有的样本数据都聚集完毕;最后把不同的类别一一划分出来,形成一个关系密疏图,并用以直观地显示分类对象的差异和联系。
上例向我们展示了对数据进行的聚类分析的过程, 一般来说,进行聚类分析需要解决两个问题:一是如何确定度量两个数据的接近程度的方法;二是究竟分成多少类合适。这两个问题都需要根据实际问题的背景和数据本身的意义来确定。统计上对此提出了一套程序化的方法:
(1)选择一种确定接近程度的方法,最直接的就是点之间的距离,我们上面的分析即是基于此;(不同的方法将得到不同的分类结果)
(2)设要分类的对象有n个;我们以这n个对象分成n类开始,按所选择的方法确定这n个对象两两的接近程度度量值,将最接近的两个对象合并为一类,如此我们得到了至多n-1类;
(3)确定类与类之间接近程度的方法;
(4)对n-1类重复步骤(2),如此下去到完全归为一类止。至于究竟分成多少类合适,需要分析者根据所讨论的问题来决定。在实际问题中,往往需要对几种分类方案进行比较后,再加以选择。
(2)为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50位患者服用安慰剂,得到下列实验数据:
副作用
药物 有 无 合计 新药 15 35 50 安慰剂 4 46 50 合计 19 81 100 请问服用新药是否可产生副作用?
问题(2)的分析:
假定服用新药与产生副作用没有关联.那么,首先要给“没有关联”下一个“能够操作”的定义。根据直观的经验,在服用新药与产生副作用的情形下,这个定义可以是这样的:如果服用新药与产生副作用没有关联,就意味着,无论服用新药与否,产生副作用的概率都是一样的。就此例题而言:
二者相差较大。由此可以推断,开始的假设是不成立的。也就是说,服用新药与产生副作用是有关联的。
由统计的常识知道,要求等号成立是非常苛刻的条件,实际上一般也是办不到的,我们所能追求的是在概率意义下的可靠性。对于上面的独立性问题,类比在聚类分析讨论中的想法,我们应当寻找一个适当的统计量,用它的大小来说明独立性是否成立。在统计中,我们引入下面的量
副作用B
药物A 有副作用B1 无副作用B2 合计 新药A1 安慰剂A2 合计
在前面的例子中
a=15,b=35,c=4,d=46。注意到独立性要求:
P(全体生实验者产生副作用)=P(服用新药产生副作用)
即
这等价于
因此,可以用的大小来衡量独立性的好坏。
问题:
(1)用+++
是不是更好些?
(2)用比用合理,你认为有道理吗?
(3)为了得到统计量的近似的分布,统计学家最终选用了:
Q2=
用它的大小来衡量独立性的大小,你能把它化简得到下式吗?
从上面的表达式可以直观地看出:的值越小,事件A与B之间的独立性将会越大(当的值为0时,事件A与B完全独立)。通过有关统计量分布的计算可知:当时,事件A与B在概率为95%的意义下是相关的;当时,事件A与B在概率为99%的意义下是相关的。
我们来算一算本题中的值:
于是得出结论:在概率为99%的意义下,服用新药与产生副作用是相关联的。从数据可以进一步看出,服用新药更容易产生副作用。
上述过程在统计推断叫做独立性检验,它的基本思想是:
如何选用一个标准,用它来衡量事件之间的独立性是否成立。
在独立性检验中,我们要特别关注方法的直观及合理性。
- 1 -
您可能关注的文档
最近下载
- 短视频使用入门.pdf VIP
- 2022年度四川省专业技术人员继续教育公需科目考试题(含答案).pdf
- unitoperationsofchemicalengineering化工单元操作.doc
- 愚公移山故事.docx VIP
- 2023贵州省公路建设养护集团有限公司招聘试题及答案解析.docx
- Viacontrol 威盾V3_用户手册.doc VIP
- 川教版(2024)三年级上册信息科技 3.10在线攻略全有哪些信誉好的足球投注网站 课件.pptx VIP
- 华科自控原理王永冀课后答案.doc
- 关注信息安全预防信息诈骗课件.pptx VIP
- 气道净化护理(2023年中华护理学会团体标准).pptx VIP
文档评论(0)