- 1、本文档共65页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
吴喜之-统计学基本概念和方法-第一章
案例分析(魅力) 比如有两条这样的新闻,他们都是关于高压电线是否会导致附近的儿童得白血病,它的理论是因为电流会产生磁场,磁场往往会引起白血病,所以生活在有电的环境里,会使人暴露在磁场中,那么住在高压电线附近,会增加这种暴露的程度。第一条 新闻是找了一位能说会道的母亲,她的孩子得了白血病,刚好她家就在高压电线附近,因此这位母亲向观众介绍了在高压电线附近是如何的危险这一情况;另一条新闻呢,是国家癌症所的一则报道,他们用了5年的时间和100万资金,走访了全国十几个省进行高压电线附近的儿童白血病情况的调查,最后得出结论,在白血病和暴露在高压电线所在的磁场之间,找不到任何的相关关系。 那么对于这样的两条新闻,我想一般的观众都会倾向于后者,这主要的原因可能就是在于统计数字的魅力,人们往往对具有统计数字的新闻和文章都比较信服。 援沸太地砍小端至遣律窍屠江抉每喇额劣打辨咨信糊收闪盆双着匡蹲魏揣吴喜之-统计学基本概念和方法-第一章吴喜之-统计学基本概念和方法-第一章 案例分析(方式) 某个机构花费了很多的资金在某一城市做一个调查,他们将城区分成两个部分,一个上层区,一个下层区,分别对应工资的高与低,目的是想了解,哪个层区的住户更加注重资源的回收,他们所采用的度量变量就是路边资源回收垃圾每周的重量。结果得出上层区均超过下层区,由此,这个机构得出结论认为上层区的居民更加注重资源回收。 那么对于这样的数据报告,我们就要表示怀疑了,事实上,这个事件的本身是跟这个机构的分析结果不符合的。因为上层区在丢回收箱的物品都比较重,而下层区的就比较轻,比如单拿饮料来说,上层区的多半的丢入的是玻璃瓶的酒,而下层区的丢入的多半是塑料的饮料。这样的话,单单从重量上来比较,统计数据就不是那么有效了。 相依笔稿典连事猜蚂府限沥癣祷颂奏借蓉悼糯奠三笋亭雾代阐涵鬼芒鉴编吴喜之-统计学基本概念和方法-第一章吴喜之-统计学基本概念和方法-第一章 案例分析(质量) 当我们看到一则新闻和一篇统计报告的时候,往往不知道它的样本是如何取得的,这样就给文章的可信度打了折扣。样本也有好样本和坏样本的区分。我们首先来看看坏样本,比如:我们要检查一车桔子是不是优质的,那么最容易的方法就是在摆在每箱最上面的桔子中抽取,然而这样得出的结论就值得怀疑了,首先在运送的过程中,在下部的桔子是最容易受到碰撞的,其次如果供货商也了解这一点的话,把最好的桔子都放在上部,那么对于这样的统计结论就没有很大的意义。这样的果,我们用统计学的术语来说是,有偏的。也就是说样本的情况对于整个总体来说是有偏误的。 解决方法:利用随机抽取的形式,来消除有偏性。比如,随机数字表,电脑随机生成数字 坏样本还有一个特性就是它的高变异性,不过它可以利用扩大样本容量的方法来消除。这个我们在以后的章节再详细说。可能大家对于坏样本的有偏和变异还不是很理解,这里我讲一个非常直观的概念,就是射箭原理。 偏差:意思是我们的瞄准有问题,射出的箭都往同一个方向偏离靶心:样本值没有以总体值为中心点。变异性:箭着点在靶上分散得很广“重复抽样所得结果并不接近,彼此间差异很大。有时候会出现低变异性,高偏差或者低偏差,高变异性的情况。 啼析瓮巩孩剥碧君哗捏茎逝猛揪岩映晰蝴愁患躯衰趾抽裂痛腊监才阑傣肩吴喜之-统计学基本概念和方法-第一章吴喜之-统计学基本概念和方法-第一章 案例分析(措辞) 有一个调查机构想做一个关于居民拥有股票的比例的问卷调查,他在采访中问道:“是否拥有stock”(股票,也是家禽),结果大部分的农场主的回答都是yes,可是他们实际拥有股票的却很少。那么这样的统计分析结果往往很容易迷惑到不了解数据来源的读者。 stock=(股票,也是家禽) 错龚盖犹械黄沮炼控铱厢腺勺逾馈粪渗债雹皮群莱遇妓殖右炳秩陛鳞某搽吴喜之-统计学基本概念和方法-第一章吴喜之-统计学基本概念和方法-第一章 案例分析(文化) 在调查全球的自杀率问题中,社会文化就占有很大的因素,在日本这样的国家,有遇到耻辱就光荣自杀的传统,这就使得日本的自杀事件报道的比例较高,而在大部分信奉天主教的国家,他们都以自杀为耻辱,因此所公布的自杀率自然比其他的国家低很多。而随着文化的发展,很多国家都将抑郁症视为生理上的疾病,而不是个性上的弱点,自杀是这种病的悲剧性结束,而不是道德瑕疵。这使得这些国家的家属和医生更愿意将自杀列为死因。也使着自杀率在逐年升高,这个并非真的数据在增加,而是人们的观念发生了变化。 因此我们在看待类似这样的数据报表的时候,不能被数据值的外表迷惑,要弄清楚数据的来源是怎样的,他调查的方式又是怎样的。 辟紊思访邦萄蛔替核痛崔奢中磁迄派岗逗刁芜耙牡皇邓糟睛埋似肢掳缝楔吴喜之-统计学基本概念和方法-第一章吴喜之-统计学基本概念和方法-第
文档评论(0)