- 1、本文档共62页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基础统计学方法介绍
基础统计学方法介绍 韦桂峰 2009年11月21日 基础统计学方法 统计学基础知识 t检验:比较两组样本平均值的差异 单样本t检验 两独立样本的成组数据t检验 两配对样本的配对数据t检验 方差分析 相关分析、回归分析 主成分分析 一、统计学基础知识 科研工作的目的是为了揭示事物运行的规律,但这些规律总是被各种各样的因素所掩盖,难以直接看到。 我们所关心的这部分现实世界可用总体来代表,要了解总体的情况,就需要通过采样调查等实验方法来获取样本,用样本来推断总体。 概率论是统计学的基础。 大样本?小样本? 在统计学的发展过程中,早先的统计学家遵循“大数定理”,即样本数量越多,就越接近总体的实际情况; 1908年,Gosset发表t分布的论文,自此统计学进入小样本时代,可根据所能接受的精度来确定所需的最小样本,节省时间、人力和物力。 统计的基本程序 变量的两个特征 常见分布之(1)正态分布 又称“高斯分布” 两头少,中间多,两侧对称。 正态分布 N(μ,?2) 为连续型分布 确定总体均值μ和总体方差?2 ,正态分布的图形就确定了。 标准正态分布记为N(0,1) 在生物统计中,正态随机变量起着特别重要的作用,如测量误差就是服从正态分布的随机变量。 u分布 正态分布的标准化公式: 常见分布之(2)t分布 在总体标准差未知时,样本平均数服从t分布。 两侧对称,与正态分布类似,但与自由度有关,当自由度趋向无穷大时,与标准正态分布重合。 什么是自由度? 自由度(degree of freedom, df)在数学中能够自由取值的变量个数,如有3个变量x、y、z,但x+y+z=18,因此其自由度等于2。 在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。其中n为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。自由度通常用于抽样分布中。 常见分布之(3)F分布 两个样本方差比的分布服从F 分布 由两个自由度df1和df2决定的。属于不对称分布,分布曲线 统计假设检验 于20世纪30年代提出,现在常用的统计学方法都是在统计假设检验的基础上建立起来的。 假设检验的目的是为了决定一个关于总体的定量的断言(提出零假设H0 )是否真实,通过从总体抽出的随机样本来计算适当的统计量来检验这一假设,若得到的统计量的实现值在假设为真时应该是罕见的(小概率事件),则有理由拒绝这个假设。 小概率事件 在概率论中我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件,一般多采用1%、5 %两个值,即事件发生的概率在0.01以下或0.05以下的事件称为小概率事件,这两个值称为小概率标准(或“显著性水平”)。 在一次试验中,小概率事件不应该发生,若发生了,则否定原假设H0,接受与其对立的备择假设HA。 统计、计算机与统计软件 数据的整理和识别、方法的选用、输出结果的理解、…… 常见的统计软件有: SPSS: “Statistical Package foe the Social Science”(社会科学统计软件包), 2000年改名为“Statistical Product and Service Solutions”(统计产品与服务解决方案) 特点:容易操作、输出漂亮、功能齐全、价格合理、“傻瓜化” 常见的统计软件 Excel:为数据表格软件,具备一定的计算功能,其数据分析的“分析工具库”必须安装才能使用。可用于简单的分析。 SAS :功能齐全,价格不菲,编程功能强大。 Statistica:功能强大、齐全、傻瓜化,但应用不普遍。 二、常用统计学分析方法 1、t 检验 目的:通过样本数据来推断总体均值的情况。 (1)根据一个样本对其总体均值大小进行检验——One sample T Test 举例说明 例:监督部门称了50包标有500g重的红糖,均值为498.35g,少于所标的500g,对厂家生产的这批红糖平均起来是否够分量,需要进行统计检验。 H0:μ=500 HA:μ500 SPSS:在Data View中输入数据后,选择[Analyze]=[Compare Means]=[One Sample T Test] 结果见下表 因计算机输出的是双尾检验的p值,比单尾的要大一倍,应除以2,故p值计算为0.005 结论:拒绝H0 ,即这批红糖的均值小于500g (2)根据来自两个总体的独立样本对其总体均值的检验 例:分别测得14 例老年性慢性支气管炎病人及11 例健康人的尿中17 酮类固醇排出量(mg/dl)如下,试比较两组均值有无显著性差别(α=0.05) H0:μ1=μ2 HA: μ1≠μ2 SPSS操作: 1)在Data View中输入数据后,选择
文档评论(0)