统计重点整理.pdf

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计重点整理 (打的比较快,所有公式只写了页码,而且人人日志显示不出来上下 标和均数x...所以跟计算、符号相关的以书上为准!!) 第1章 医学统计工作的基本步骤 •.统计工作的基本步骤是对科研项目进行设计、收集资料、整理资料 和分析资料(知道步骤) 设计原则:随机、对照、盲法、重复 •.总体:是根据研究目的确定的,同质个体所构成的全体。 •.样本是从总体中随机抽取的部分个体,一定要具备代表性和可靠性 •. 同质:研究对象具有某些相同性质或特征 •.变异是同质基础上个体某项指标之间的差异 •.变量:同质研究对象的某些特征值具有变异性,构成研究的变量 •.资料类型分为计量资料、计数资料和等级资料。(会判断是哪一种 资料)变量分为定量变量、定性变量。 a) 计量资料:可用定量方法获得变量的测量值,具有计量单位, 一般是由定量变量构成 b) 计数资料:按属性或类别分组获得变量的个数,由定性变量 中的分类变量构成 c) 等级资料:按程度或级别分组获得变量的个数 第3章 定量资料的统计述 一般而言,对于所收集到的一组同质个体的定量资料,为了了解数据 分布的区间范围、数据集中的位置以及分布的形状等,需要首先绘制 频数分布表和绘制直方图。 频数是指资料中相同或同类属性的观察单位的个数 •.频数表的绘制步骤: a) 计算极差:也称全距 b) 确定组距和组段:建议8-15组,组距i=极差/组段数,确定 各组段的界限,每一组段的起点称为该组段的下限,终点称为上限。 第一组段必须包括最小值,一般取小于或等于最小值的某个数值,后 一组段的下限为上一各组段的下限加组距。各组段需要覆盖整个数据 范围,但不能重叠,不能重叠的意义在于使得每个观察单位能够唯一 的分到一个租段中去,所以每个组段均为半开闭区间 c) 汇总各组段的频数和计算累计频数:频数是指落入该组段的 观察单位个数,累计频数为各组段频数的累加之和 d) 计算频率与累计频率:各组段频数之和等于总例数n,频数 除n为频率。频率反映各组频数占总例数的权重。累计频数除n为累计 频率 •.频数表和直方图的用途 a) 了解资料分布类型。资料分布类型按照是否对称可分为对称 分布和偏态分布,其中偏态分布分为正偏态和负偏态。若频数较多的 组段居中,各组段的频数在左右基本对称,成为对称分布,各组段频 数不对称,称为偏态分布。若频数最多的组段在左侧,频数尾部偏向 数轴右侧,称为正偏态分布或右偏态分布(看尾巴),反之为负偏态 分布或左偏态分布。了解资料分布类型的重要性在于,分布类型不同 所选择的统计述指标和统计分析方法不同 b) 述频数分布特征:频数分布包括两个重要特征,集中趋势 和离散趋势,集中趋势是指大多数观察值所在的中心位置,离散趋势 反映的是各观察值远离中心值的程度,即观察值围绕中心位置的分布 情况 c) 频数表可作为原始数据的一个概括,也可作为进一步统计分 析的基础材料 d) 利用频数表和直方图可发现数据中是否存在离群值,以及直 观的判断数据的正态性 •.平均数是述定量资料集中趋势的一类统计指标,用来说明该组资 料的平均水平。常用的平均数包括算术均数、几何均数、中位 数 •.算术均数:简称均数。用来述一组满足对称分布,特别是正态分 布或者近似正态分布资料的平均水平。总体均数µ,总体例数N, 样本均数X表示,样本例数n表示(计算见书P34) •.几何均数G:多用于对数正态分布的资料,或观测值之间存在倍数 关系的资料。所谓对数正态分布是指原始变量经对对数变换后 服从或近似服从正态分布,常用于血清学和微生物学。计算几 何均数资料中不能同时有正有负,也不能为零,如果观察值全 部为负,则先按正值计算几何均数,结果加上负号(计算见书 P35) •. 中位数和百分位数 a) 中位数M:是之一组观察值按大小顺序排列后,位置居中的 数值,在一个数列中,大于和小于中位数的观察值个数是相等的。 b) 百分位数Px,读作第X百分位数,是将一组观察值从小到大 排列后,第X位的观察值即为Px,实际上Px将全部观察值分成了两部 分,理论上有X% 的观察值比Px小,有(100-X )%的观察值比Px大。 中位数是一个特殊的百分位数,即第50个百分位数(P50),表示在

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档