- 1、本文档共40页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计资料分布的识别及聚集性分析 公共卫生学院卫生统计教研室 易 静 一、识别统计资料分布的意义 1 . 资料分布明确后,分布规律自然呈现,按规律科学分析。 2 . 资料分布不同,描述的特征数(参数)种类不同,采用不同统计量估计和对比。 3 . 某些分布资料相应要求具备一定条件,如独立试验结果在医学生物学有专业含义──无聚积性(传染性疾病、遗传性疾病、地方病 有聚积性),可以通过考察分布拟合情况间接推断“聚积性”含义是否存在。 二、识别统计资料分布的思维方法和程序 1. 依据资料性质和样本大小,给出不同分布框架。 2. 依据散点图(小样本)或频数分布表(大样本:连续分布 组段数值~;离散分布 x)进一步探知分布方向。 3. 分布拟合。 4. 拟合优度统计检验。 5. 若不成功,则改变数据表达方式或结构再度拟合和检验。 三、统计资料分布识别方法的特点 1. 方法较多。方法不同,原理亦不同,但采用何种分布拟合,用该分布主要统计量作标准。 2. 原则上资料要排序(除峰度与偏度)。 3. 直接检验判定法:样本统计量(参数比较)间接检验判定法:拟合理论分布频数与实际频数差,用x2分布识别。 四、正态分布(Normal Distribution)(一)正态分布(二)正态分布的识别五、二项分布(Binomial Distribution)与Poisson分布 (一)二项分布与Poisson分布 (二)二项分布的识别及聚集性分析六、游程检验四、正态分布(Normal Distribution) 1. 正态分布曲线的数学函数X为连续随机变量,μ为X值的总体均数, 为总体方差,记为X~N(μ, ) 2. 正态分布曲线的理论特征 (1)以X= μ为中心,μ左右X值对称性减少。 (2)在X= μ处曲线最高,f(X=μ)为最大值。 (3)μ 、σ决定 正态分布曲线位置和形状 固定σ ,随μ 不同,曲线位置不同,称μ为位置参数。 固定μ ,σ越大,曲线形状不同, 称σ为形状参数。 3. 正态曲线下面积(概率)的分布规律 横轴上、曲线下的面积为1。 横轴上、曲线下对称于μ的面积相等。 问题 X~N(1.256,0.0382) 1.0的比例? 4. 标准正态分布 标准正态变换:标准正态分布: X~N(0,1) 曲线下的面积分布规律附表1(不同位置上数的意义,图示) (二)正态分布的识别 1. 作图法P-P 、Q-Q 2. 直接检验判定法峰度与偏度 、W检验、D检验 3. 间接检验判定法卡方检验 、K-S法 、对数似然比法 原始数据的正态分布的检验(Page125) 峰度(偏度) W检验 D检验 频数表资料的正态分布拟合优度的卡方检验 五、二项分布(Binomial Distribution)与Poisson分布 (一)二项分布与Poisson分布 1. 二项分布 例0.2、0.8、 2表 实验结果 二项分布的条件 在重复实验中,如果对每一次实验,出现的结果只有两种情况。 每次试验的条件不变。即每次试验中,结果A发生的概率不变(假设均为? )。 各次试验独立。即一次试验出现什么样的结果与前面已出现的结果无关。 二项分布的图形 X~B(, n) 二项分布的参数 E(x)=nπV(x)=nπ(1-π) 2. Poisson分布试验中出现概率很小的事件称作稀有事件,如地震、火山爆发、特大洪水、意外事故等等。 设随机变量X所有可能取的值为0 , 1 , 2 , … , 且概率分布为: (二)二项(Poisson)分布的识别及聚集性分析计数(分类变量、定性)资料的二项(Poisson)分布拟合优度的卡方检验(Page161)例:某医师对一社区82户3口之家进行了某疾病患病调查,见下表。判断该病分布有无聚积性? 六、游程检验在聚积性分析中的作用 1. 什么是游程依时间顺序或空间顺序排列的二分类定性现象或数值现象数列中,具有相同性质或范围数值的现象划定为符号+或—,符号+或—的序列中,符号连续部分称为一个游程。在一个游程中,符号的个数称为游程的长度。如- - -++ - ++++- - +符号序列中有6个游程,r=6;游程长度l依次为3,2,1,4,2,1 。 2. 符号+或-序列的随机性检验,可以通过 (1)游程个数检验 (2)游程长度检验加以推断存在随机性,则无聚积性;拒绝随机性,则推断有聚积性。End!稀有事件在单位时间、空间出现的次数近似服从 Poisson分布。 X~P( ) n很大, 很小 ,。 E(x)=λV(x)=λ 7.2320 69.7690 -8.3528 9.6472 0.11765 18 3 0.1496 4.5069 2.1229 30.1229 0.36735 28 2
文档评论(0)