- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
5.1 统计常用的名词术语 5.2 描述性统计分析 练习 5.1 常用的名词术语 (3)描述分布形状的量 一、常用SAS过程 在PROC MEANS语句中几个主要选项如下: 其SAS输出结果与说明 实例理解反映资料变异度的统计量 葡萄品种果穗上有许多性状,其平均数、标准差及单位各不相同,判断以下性状变异大小。 * * * 第五章 描述性统计分析 总体: 根据研究目的而确定的、符合指定条件的全体观察对象所构成的集合称为总体。 1.总体与样本 样本:在抽样调查中观察的所有个体的集合称为样本。 ?样本容量: 样本中的个体数称为样本容量,记为n。 连续型随机变量 在定义域范围内可以取任意实数值的变量是连续型随机变量 离散型随机变量 在定义域范围内只可以取一些不连续实数值的变量是离散型随机变量。 2. 变量 反映总体某一性状的数量标法叫变量。 其测定数值叫观察值。 变量分两类型: 数值型变量:用数值进行记录 字符型变量: 用字符进行记录 数值型变量又分: 3.参数与统计量 参数:指由总体的全部观察值而算得的总体特征数。 统计量:指由样本的全部观察值而算得的样本特征数。 统计分析的核心在于由样本的情况推断集团的信息,保证一定精确度、可靠度。 计算 统计量 描 述 抽样 推断 总 体 样 本 统计量 4. 常用的统计量 (1).表现数据的集中趋势-----平均数 (2).反映资料变异度(离散特性)的统计量 ---极差、方差、标准差、变异系数等 (3). 描述分布形状的量---峰度系数和偏度系数 几何平均数(G):是n个数值乘积的n次方根。 对计算平均增长率具有独特的应用价值。 中位数(Md):如果一组数据按大小顺序排列, 中间位置的数值即为中位数。 众数(Mo):是样本里具有次数最多的那个数值。 算术平均数: (1).表现数据的集中趋势的量-----平均数 应用最普遍的是算术平均数。 (复习) (2)反映资料变异度(离散特性)的统计量 ---极差、方差、标准差、变异系数 复习: 1.标准差: S:刻画平均到每一独立数据的变异度,估计试验误差。 CV:比较两个样本的变异度(由于单位不同或均数不同) 2.变异系数: 3.标准误: 反映同一个集团内抽样所得的样本平均数间的差异。 实例 2.峰度系数(Kurtosis) 分布在均值两侧极端数据有多少的度量。 峰度0 两侧极端数据较多,呈偏平式分布. 峰度0 两侧极端数据较少 ,呈尖峰式分布 偏度系数≈0 --分布对称 右偏分布的偏度为正数;左偏分布的偏度为负数。 (复习) 1.偏度系数(Skewness) 是以正态分布为标准来描述样本数据对称性的统计量。 1、MEANS 过程 格式:proc means 选项; var 分析变量表; by 分组变量; class 分类变量表; freq 频数变量; output out=数据集 ; 例:proc means mean std maxdec=2; var x1; 2、UNIVARIATE过程 格式:proc univariate 选项; var 分析变量表; 3、两过程比较: UNIVARIATE过程除可计算基本统计量外,重点在于描述变量的分布。 其中选项: freq 产生频数和累积频数分布表。 normal 进行正态性检验 plot 生成统计图 4、MEANS过程所计算的统计量(关键词)及其含义: 样本容量 缺值个数 变异系数 峰度系数 偏度系数 在H0:μ= 0时的t 值 t值概率 μ的95%置信区间 单侧可信区间上限 单侧可信区间下限 N Nmiss CV Kurtosis skewness t Prt Clm Uclm Lclm 最小值 最大值 极差 和 均值 方差 标准差 标准误 平方和 平方总和 Min Max Range Sum Mean Var Std Stderr Css uss 统计量 关键词 统计量 关键词 1、DATA=(SAS 数据集):指出SAS 数据集的名称,若省略,则使用最近产生的数据集。 2、MAXDEC=(数字):指出所输出的结果中,小数部分的最大位数(0-8),缺省时为8 位。 3、FW=(域宽):指出打印的结果中每个统计量的域宽,缺省时为12。 二、应用举例 例5.3:某单位对100名健康的女大学生测定
文档评论(0)