医学统计学知识点..doc

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学统计学知识点.

第一章 绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。 抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。 医学科研中, P(A)≤ 0.05作为事物差别有统计意义, P(A)≤ 0.01作为事物差别有高度统计意义。 第二章 定量数据的统计描述 定量数据的统计描述方法:频数表、直方图、统计指标。 (1)频数分布 频数分布的目的:了解数据的分布范围、集中位置以及分布形态等特征,以便根据资料分布情况选择合适的统计方法。 频数分布的用途: ①作为陈述资料的形式; ②便于观察数据的分布类型; ③便于发现数据中特大或特小的可疑值; ④当样本量大时,可用各组段的频率作为概率的估计值。 计算全距(range,R):是一组数据的最大值与最小值之差。R=Max-Min 确定组数与组距 样本量在100例左右,组数选择8~15之间,一般取10组左右。 组距≈全距/组数 确定组限 第一组段必须包括最小值,最后一组段必须包括最大值。 最后一组段包括最大值,且一般情况下应包含该组段上限,其余各组段区间左闭右开。 计算各组段频数(frequency):即计算各组段内观察值的个数。 计算各组段频率(percent):即计算各组段频数与总观察值个数之比,用百分数表示。 计算累计频数(cumulative frequency)和累计频率( cumulative percent):累计频数是由上至下将频数累加;累计频率是由上至下将频率累加。 (2)直方图 直方图,是以垂直条段代表频数分布的一种图形。 (3)频数分布表的用途 1、作为称述资料的形式,可以代替原始资料,便于进一步分析。 2、便于观察数据的分布类型。资料分布类型分为:对称分布和偏态分布。 在统计分析时常需要根据资料的分布形式选择相应的统计分析方法,因此对数据分布形式的判定非常重要。 3、便于发现资料中某些远离群体的特大或特小值。 4、当样本含量比较大时,可用各组段的频率作为概率的估计值。 集中趋势的统计指标 平均数,是描述一组观察值集中位置或平均水平的统计指标,常作为一组数据的代表值用于分析和进行组间的比较。 常用的有算术均数、几何均数、中位数、百分位数等。 算术均数,等于一个变量所有观察值的和除以观察值个数。 总体均数用希腊字母μ表示,样本均数用符号Χ拔 表示。 算术均数适用于对称分布的资料,如分布均匀的小样本数据或近似正态分布的大样本数据。 算术均数易受极端值的影响,并且受极大值的影响大于受极小值的影响。

文档评论(0)

jiulama + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档