- 1、本文档共44页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
预备知识概率与抽样分布
概率与抽样分布 Probability and Sampling Distributions 连续型随机变量及常用分布 分布只与自由度,即样本含量有关 均匀分布:Uniform Distribution 指数分布:Exponential Distribution 正态分布:Normal Distribution 分布:Chi Square Distribution t分布:Student t Distribution F 分布:F Distribution 当样本统计量被计算出以后可以自由改变的观测值数目。 举例:3 个数之和是 6X1 = 1 (或其他数)X2 = 2 (或其他数)X3 = 3 (不能改变)自由度df=n-1=2 确定一个式子自由度的方法是:若式子包含有 n 个独立的随机变量,和由它们所构成的 k 个样本统计量,则这个表达式的自由度为 n-k。 t分布的特征 ①以0为中心,左右对称的单峰分布; ②t分布曲线是一簇曲线,其形态变化与自由度的大小有关。 自由度越小,则t值越分散,曲线越低平; 自由度逐渐增大时,t分布逐渐逼近Z分布(标准正态分布);当趋于∞时,t分布即为Z分布。 6.F 分布 F 分布曲线 用随机数发生器随机抽样 使用Excle可产生服从二项分布、泊松分布、均匀分布、正态分布等的随机数。 用随机数发生器随机抽样 假设要从编号为101~2500的普通员工中随机抽出50位员工接受问卷调查。 用随机数发生器随机抽样 用随机数发生器随机抽样 利用“抽样”进行系统抽样 它是把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。 利用“抽样”进行系统抽样 假定在50名随机排序且不连续的员工编号内以系统抽样抽选10位。 需要先计算出间隔数:总体数/样本数=50/10=5 利用“抽样”进行系统抽样 利用“抽样”进行系统抽样 利用“抽样”进行系统抽样 置信度(Confidence Level) 也称置信水平,指总体参数值落在样本统计值某一区间内的概率,或指总体参数值落在样本统计值某一区间中的把握性程度。 反映的是抽样的可靠性程度(信度)。 置信水平= (1-?????,???是参数不落在区间内的概率,通常取值 99%, 95%, 90%,即?=0.01, ?=0.05, ?=0.10 置信区间( Confidence Interval) 是指在一定的置信度下,某总体指标所在的区间范围,也称区间估计。 反映的是抽样的精确性程度。 N (0,1) — 标准正态分布 ? (x) 是偶函数,其图形关于纵轴对称它的分布函数记为? (x),其值有专门的表可查。 4.χ2分布 4.χ2分布 3.84 7.81 12.59 P=0.05的临界值 4.χ2分布 5.99 4.χ2分布 5. t 分布 随机变量X N(m,s2) 标准正态分布 N(0,12) Z变换 均数 标准正态分布 N(0,12) Student t分布 自由度:n-1 S s 不同自由度下的t 分布图 利用“抽样”进行系统抽样 参数估计的理论基础 大数定理 中心极限定理 表明大量随机-现象平均结果具有稳定性的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。 如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。 参数估计中的相关概念 * * * * * * * * * * 若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。 这里的0.05或0.01称为小概率标准,农业试验研究中通常使用这两个小概率标准。 小概率原理 §2.3 连续型随机变量及其分布 定义 设 X 是一随机变量,若存在一个非负可积函数 f ( x ), 使得 其中F ( x )是它的分布函数 则称 X 是连续型随机变量,f ( x )是它的概率密度函数( p.d.f. ),简称为密度函数或概率密度。 连续型随机变量及常用分布 自由度 (Degree of freedom ) (a ,b)上的均匀分布,记作 1.均匀分布 若X 的密度函数为 ,则称X服从区间 其中 X的分布函数为 其他 x f ( x) a b x F( x) b a 1.均匀分布 即X的取值在 (a,b) 内任何长为 d – c的小区间的概率与小区间的位置无关, 只与其长度成正比。这正是几何概型的情形。 在进行大量
文档评论(0)