- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计概率讲义要点
临夏志成中学985班统计概率讲义统计学与概率论的区别与联系区别:统计学反应已经发生的事实的结果,概率论研究未来发生的随机事件的可能性联系:概率论以统计学的研究为基础统计学普查收集数据简单随机抽样抽样调查分层抽样系统抽样统茎叶图整理数据频率分布直方图计集中分析 样本分析学分析数据离散分析总体估计线性回归应用数据独立性检验一、收集数据 1.普查:需要耗费大量的人力、物力、财力,一般在总体很少时采用 2.抽样调查:从调查的总体中抽取一部分个体组成一个样本进行研究其中样本中含有的个体数称为该样本的样本容量①简单随机抽样适用条件:总体数较少,且没有明显的结构差异常用方法:随机数表法,抽签法,抓阄法例:用随机数表从300个调查对象中抽出10个个体个体进行研究随机数表如下:582146697521520365412862541231023203321003320015845975102584769254106350215846202158214446258429702158036489320125412547021则抽取出的10个个体的编号为②分层抽样适用条件:总体数较多,且有明显的结构差异本质:样本中各层次的比例与总体中各层次的比例相同例:志成中学从小学600,初中300,高中100抽取20人进行校长访谈,则分别抽取的人数为③系统抽样适用条件:总体数很多,无明显结构差异操作步骤:第一步:编号,将总体中所有的个体从1开始编号,一直到N(N为最后一个人编号)第二步:确定组数,样本容量n即为组数第三步:确定间隔T(此步较为重要):[即T为N除以n的商的整数部分,不管小数部分多大,只取整数]第四步:分组,从编号1开始,每T个个体构成一组,共n组,多余的人省略第五步:在第一组中抽取:采取随机抽样的方法抽取到编号为的个体第六步:抽取样本:在剩下的n-1组中每组只抽取一个个体,遵循以下原则:编号分别为:例:从320个学生中采用系统抽样的方法抽取10个学生参加篮球赛,请你写出一组满足条件的学生编号:例2:志成中学840人参加野外宿营,其中编号为1-360的360人在I区宿营,依次下来280人在A区,其余人在B区,先采用系统抽样的方法抽取28位同学作为区安全员,若在第一组中抽到的编号为12,则三区的区安全员人数分别为 最后需要特别强调的是,不管采用哪一种抽样方法,每个个体被抽到的概率始终是相等的。二、整理数据采用抽样方法收集的数据比较杂乱,需要进行整理,是数据有序,目前比较常用的两种方法:茎叶图,频率分布直方图 1.茎叶图适用条件:样本容量较少优势:①保留了原始数据;②便于比较两个样本操作:选择合适的数作为茎,茎确定后,将对应的数写到前面或后面作为叶例:(2015年全国卷2)某公司为了解用户对其产品的满意度,从,两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可);(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.2.频率分布直方图适用条件:样本容量较大不足:丢失了原有数据,只能保留数据的大致范围操作步骤:第一步:求极差:收集得到的数据中的最大值-最小值=极差L第二步:确定组距d,根据收集的数据选择合适的数据,以各组中含有的个体数差异不要过大为原则第三步:确定组数n:[与系统抽样不同的是,系统抽样只取商的整数,而在频率分布直方图这儿,不管商的小数部分有多小,我们都要给整数部分+1,为什么呢?例:极差L:20.4,组距d:5则组数n=5()]第四步:列频率分布表(如下)分组频数累计频数频率合计样本容量 1说明①所谓频数累计,在整理数据时,对于某个数据,该数据属于哪一组,则改组的频数增加1②频数/样本容量;频数=样本容量*频率样本容量=频数/频率③频数之和为样本容量,频率之和为1第五步:根据频率分布表做出频率分布直方图 频率/组距 分组 说明:①标准的频率分布直方图纵坐标
文档评论(0)