- 1、本文档共18页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《04统计推断
第4章 统计推断
4.1 样本与抽样分布。
(1)总体与样本。
总体:调查对象的全体叫总体。
样本:由总体中抽出的若干个体组成的集合叫样本。
统计量:样本的函数叫统计量。例如样本均值:= 和样本方差:S 2 = 都是统计量。
(2)抽样分布。
① 抽样的基本概念。前面介绍收集数据的方式有二种:
优点:对每一个个体都进行观测。
全面调查(普查) 要花费大量的时间,人力,物力,财力。
缺点: 对无限总体无法作普查。
容易出现观测误差。
节省资金、节省时间、精确度高。
优点:
抽样调查 对于只有用破坏性实验才能取得数据的总体只能采用抽样调查。
缺点:有抽样误差。
② 样本的二重性:(1)样本特征在某种程度上反映了总体特征。(2)又不能完全精确地反映总体特征。
③ 实际中要解决二个问题:抽样方法。怎样抽(包括方式和容量)才能更合理地反映总体。统计推断。怎样用样本对总体做出科学的推断。
随机数表
对于有限总体:(1) n个随机变量与总体X有相同的概率分布。(2) 它们是相互独立的(对每个个体都进行独立观察)。(3) 要保证有限总体中每个可能的样本组合都有相等的概率被抽中。这种抽样方法称作简单随机抽样。如此得到的样本,称简单随机样本,简称样本。
实践中怎样保证得到简单随机样本呢?只要样本容量n与总体容量N的比值? 0.05,则先建立抽样框,利用抽签或随机数表连续抽取n个个体就可近似看作为一个简单随机样本。简单随机抽样分有放回抽样,和无放回抽样。但一般采取无放回抽样。这种抽样的特点是每个个体被抽中的概率是不同的,但每个样本作为随机变量的组合被抽中的概率是相同的。
对于无限总体:常采用连续观测的方式获得样本。
(3)样本平均数的抽样分布
① 设 (x1, x2, …, xn) 是总体x ? N (? , ? 2 ) 的随机样本,=,则
? N(? ,), U = ? N(0, 1)
n ? ∞,? ?,样本容量越大,离 ? 越近。
② 当x不服从正态分布时,在n ? 30 条件下,依据中心极限定理可认为,
渐近服从正态分布N(?,),U = 渐近服从N (0, 1)
从实际中看也是这样。例如有8042张发票面额的分组频数表显示该总体是非正态、右偏倚的(文件名:stat06),? = 20,? = 30(见图 4.1)。以样本容量为 n =3,n = 10,n = 100 各抽取600次,得到关于的三个频数分布,见图 4.2。随着样本容量的增大,的分布越来越接近正态分布。
图 4.1 发票面额的分组频数表 (? = 20,? = 30) 图4.2 n=3, n=10, n=100的抽样分布(=30.3)
(4) t分布
t分布密度曲线见图4.3。t分布以纵轴对称,也呈钟形。当n为有限值时,t分布的峰值小于正态分布的峰值,而尾部要比正态分布的厚,即t分布呈低峰厚尾特征。当t ? ?,t分布趋近于标准正态分布。实际中,当n 30,t分布就很近似于标准正态分布。
t分布的均值和方差分别为
E(t(n) ) = 0, Var(t(n) ) = n / (n -2), n 2
图4.3 t分布密度曲线
(5)样本平均数的分布。
t = ? t(n –1)
如果减均值除以的样本标准差,则统计量服从(n –1)个自由度的t分布。当t分布的自由度在30以上时,t分布已经很接近标准正态分布。
学习查t分布表。t0.95(30) = 1.70
(6)F分布
图4.4 F分布密度曲线
服从F分布的密度曲线见图4.4。F分布密度曲线是单峰的,右偏倚的。随着自由度n1和n2的加大,F分布的众数趋近于1。F分布的分布密度曲线随二个自由度的不同而不同。
学习查F分布表。F0.05 (5, 30) = 2.16。
(7) 样本比率的抽样分布
设容量为N的总体中,具有某种性质的元素数为X个,则关于具有这种性质的元素数的总体比率是
p =
若从该总体中抽取容量为n的样本,具有该种性质的元素数为x,则关于该种元素的样本比率是
=
E() = E(x) =n p = p
Var() =Var (x) ==
对于大样本(n p ? 5, n (1-
您可能关注的文档
- 《阅读五写事概括中心思想.doc
- 《浅析中国古典园林意境的组织规律.doc
- 《浅析中国山水画的空间表现形式.doc
- 《长流项目.doc
- 《阳光板规格介绍、雨棚阳光板安装方法及保养注意事项.doc
- 《长沙江山帝景花园楼盘项目简介.doc
- 《浅析中国的传统政治文化.docx
- 《浅析中国移动的核心竞争力论文.doc
- 《浅析中国饮食文化特征.doc
- 《浅析中国科学体制改革.docx
- 中国国家标准 GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- 《GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计》.pdf
- 中国国家标准 GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- 《GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置》.pdf
- 中国国家标准 GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- GB/T 17889.4-2024梯子 第4部分:铰链梯.pdf
- 《GB/T 17889.4-2024梯子 第4部分:铰链梯》.pdf
最近下载
- 企业存货管理问题研究——以森马服饰为例.doc
- 2012年数学建模竞赛答案之一 葡萄酒.pdf VIP
- 手机游戏的营销策略分析以《明日方舟》为例.docx VIP
- 急诊POCT专项测试卷附答案.doc
- 2023年全国数学建模竞赛D题的答案.doc VIP
- 100m3每天医疗污水处理方案.docx VIP
- PreSonus 普瑞声纳 Temblor T10EN,CN T10 OwnersManual 04272021说明书用户手册.pdf
- 2021年全国数学建模竞赛D题的答案.pdf VIP
- PreSonus 普瑞声纳 Eris E44EN,CN Eris E44 and E66 OwnersManual EN V3 01112021.说明书用户手册.pdf
- 2003全国大学生数学建模竞赛b题参考答案.docx
文档评论(0)