- 1、本文档共42页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
07正态分布.ppt
正态分布 频率和概率概念复习 关于频率和概率: 频率:对于随机事件A,在相同的条件下进行了n次实验,事件A发生的次数为m,比值m/n为频率 ,记为fn(A) 概率:描述某随机事件A发生的可能性大小,记为P(A) 当n??时,频率fn(A) ?概率 P(A) 例:在某地区7岁正常发育的男孩中随机抽110个人,测量他们的身高,并以身高观察值(cm)为数据,试刻画7岁男孩身高分布。 复习频数分布和频率分布性质 频率密度图(纵坐标为频率/组距) 频率密度图性质 频率密度图性质(n?∞) 频率密度图性质(n?∞) 频率密度图性质(n?∞) 概率密度曲线 正态分布的概率密度 正态曲线(normal curve):高峰位于中央,两侧逐渐下降并完全对称,曲线两段永远不与横轴相交的钟型曲线。 正态曲线的函数表达式 称为正态分布密度函数: 正态分布的参数 如果变量X的概率密度函数服从上述函数,则称该变量服从正态分布。记做 总体均数(位置参数) :描述正态分布的集中趋势的位置 总体标准差(变异度参数) :描述正态分布离散趋势, 越小,分布越集中,曲线形状越“瘦高”;反之越“矮胖”。 正态曲线的形状由 , 两个参数决定 不同参数的正态分布曲线 不同参数的正态分布曲线 正态分布曲线的特点 始终位于横轴上方 关于 左右对称,正态高峰位于中央 在 处取得该概率密度函数的最大值,在 处有拐点,表现为钟形 靠近 处曲线下面积较为集中,两边减少,意味着正态分布变量取值靠近 处的概率较大,两边逐渐减少 正态分布的总体偏度系数和峰度系数均为0 正态分布曲线下面积 正态分布变量X的取值为(-∞,∞) 任意两点x1,x2且(x1?x2),X在 (x1, x2)范围内取值的概率P,即正态分布曲线在(x1, x2)下面积 正态分布曲线的对称性质 设X服从 ,则正态曲线在X=?处对称,正态曲线(-∞, ?)处的曲线下面积为0.5, 正态分布曲线下面积 求概率 相当于正态分布曲线段(a,b)下的面积 例:求 范围内曲线下面积 正态分布曲线下的特殊位置的面积 标准正态分布N(0,1) 对任意一个正态分布可以进行标准化变换,U变换 变换后的随机变量U服从标准正态分布, 即:U~N(0,1) 标准正态分布曲线下面积 表、图 正态分布的特色点的概率 标准正态分布的概率计算 例2.18:设X服从标准正态分布, 求概率P(-0.3 X -1.83) 解:即:求标准正态分布曲线下在 (-1.83,-0.30)范围内的面积 标准正态分布的概率计算 是 又如:设X服从标准正态分布,求概率 P(X0.3) 解:标准正态分布关于X=0对称,所以 P(X0.3)=P(X-0.3)= 正态分布的概率计算 例2.19 例2.1中已得110名7岁男孩身高(121.9?4.5),现欲估计该地1995年身高界于116.7cm 到119.1cm范围内的7岁男童的概率。 解:由该例的频数图可知, 可以认为7岁男孩身高近似服从正态分布,由于本例样本量较大,不妨假定: 正态分布的概率计算 作标准化变换: X1=116.7 X2=119.1 正态分布的概率计算(续) 7岁男童的身高界于116.7cm 到119.1cm的概率为 问题:同上:但求身高界于116.7cm 到130.0cm的概率。 解:用标准化变换,得到u1=-1.16,u2=1.8 正态分布的概率计算(续) 计算概率为 正态分布应用 确定医学参考值范围 医学参考值范围---决大多数正常人的某项指标值范围 ”正常”人群:排除了影响所研究指标的疾病和有关因素的同质人群 大多数个体;90%,95%,99%等 统计方法 百分位数法:任何分布的指标 正态分布法:服从正态分布的指标 注意:根据研究背景确定单双侧范围 确定医学参考值范围 例2.21 估计某地健康成年女子的血红蛋白的95%医学参考值范围 具体步骤如下: 根据研究背景确定研究对象的入选标准和排除标准。这类研究一般要求参加体检并且要求除研究指标血红蛋白指标外,其他指标均正常的对象。 根据研究背景,确定血红蛋白过高或过低均属于不正常(双侧范围)。 确定医学参考值范围(续) 血红蛋白检测的容许误差和研究背景容许误差的范围,确定受检者的样本量。 由于在实际研究中,总体均数和方差均不知道的,需要用样本资料进行估计,所以一般至少在100人以上,这样参数估计的平均误差是资料的离散程度的1/10
文档评论(0)