- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学统计学(点睛之笔很经典).
Chapter 基本概念
显著性检验(test of significance):计算P值
医学统计工作的内容:
1、实验设计:最关键最重要
2、收集资料:最基础
原始资料:实验数据
现场调查资料
医疗卫生工作记录
报表
报告卡
质量控制——精度和偏倚
3、整理资料
资料的逻辑检查(坏数)
一致性检查
原始数据加工:频数分布表
4、分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断统计描述类型的选择: 集中趋势 离散趋势 对称、正态 μ
对数正态 G S lgX
偏态及其他 M 单位不同或均数差别大 CV 资料类型:计量资料、计数资料、等级分组资料
医学统计学的对象:有变异的事物
总体(population)的特性。
概率(probability):P(A)
小概率事件:P≤0.05(有统计学意义)或PChapter 集中趋势的统计描述
手工整理资料频数表(frequency table)的步骤:
1、求极差(全距)
2、确定组数、组距
参考组距=全距 / 组数
3、确定组段
4、手工编制划记表
直方图(histogram):
高度:各组的频数 纵轴
宽度:组距 横轴表示组限
均数(average):
适用:对称分布或偏度不大的资料,尤其适合正态分布。
1、算术均数(mean):
2、加权均数:
3、几何均数:
,
中位数(median):观察值按照从小到大排列时,居中心位置的数值。
适用于1、分布明显成偏态时,2、频数分布的一端或两端无确切数值时。不便于统计计算。
M:中位数;LM:M所在组的上限;f L:M所在组之前积累的频数;fM:M所在组的频数;i:组距。
百分位数(percentile):Px。在一组中找到这样一个数值P,全部观察值的x%小于P。P75、P25描述资料离散程度。
众数:一组观察值中,出现频率最高的那个观察值。若为分组资料,则为频率最高组的组中值。适用于大样本,但粗糙。
Chapter 离散程度的统计描述
离散的表述指标:
1、按间距计算:极差、四分位数间距
2、按平均差距:离均差平方和、方差、标准差、变异系数
极差(range,R):即全距。粗略。适用于任何分布。
四分位数间距(quartile,Q):一组观察值按大小排序后,分成四个数目相等的段落,每个段落观察值的数目占总例数的25%。去掉两端含有极端数值的25%,取中间的50%的观察值的数据范围即为~。
越大则数据变异越大。适用于偏态分布。
Q=P75 - P25
离均差平方和(sum of square of deviation):
方差(variance):
样本方差
总体方差
标准差(standard deviations):
适用于近似正态分布。
p.s.1、可用于合并资料的直接计算
2、与均数结合可以完整概括一个正态分布。
变异系数(CV):用于均属相差交大或单位不同的几组数据观察值的比较。
CV=
正态分布(normal distribution):
1、正偏态分布:高峰向左,长尾向右
负偏态分布:高峰向右,长尾向左。
2、μ和σ是正态分布总体的两个参数,对应样本统计量中的S和X。实际应用中μ和σ通常未知,可以将S和X作为总体参数的估计量使用。
注意对比:
2、μσ是变异参数。
描述方法:N(μ,σ2)
3、曲线下面积的意义:X1~X2出现的概率。
μ±σ 68.3%
μ±1.96σ (单侧μ±1.645σ) 95%
μ±2.58σ(单侧μ±2.33σ) 99%
标准正态分布(standard~):是μ=0,σ=1的正态分布。
对于任何参数为μ、σ的正态分布,都可以通过变量变换转化成标准正态分布:。
医学参考值范围(reference value range)的制定方法:
1、选择足够数量的正常人作为参照样本
2、对选定的参照样本进行准确的测定
3、决定取单侧范围还是双侧范围值
4、选择适当的百分范围
5、估计参考值范围的界限
Chapter 抽样误差与可信区间
中心极限定理:在样本含量很大的情况下(n≥50),无论样本测量量(X)服从什么分布,样本均数的抽样分布都近似服从以μ为均数的正态分布N(μ,σ2/n)
标准误(standard error):样本均数之间变异的标准差。
实际工作中总体标准差σ 未知,,用样本的标准差S代替:
标准差与标准误的区别:
标准差 标准误 含义 描述观察值的变异程度的大小的指标 描述样本均数的抽样误差大小的指标 公式 () 意义 标准差较小,表示观察值围绕均数波动较小,
说明样本均数代表性好 小,表
文档评论(0)