网站大量收购闲置独家精品文档,联系QQ:2885784924

数据分析(SAS描述性统计分析过程).ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 数据分析 SAS软件 描述性统计分析过程 信息学院 张建新 2010.3-6. ? 几种描述性统计分析的SAS过程 和作图过程 proc means ? proc univariate ? proc corr ? proc plot // proc gplot ? proc capability ? ? proc means(1) Means过程的语句格式 Means过程的主要控制语句如下: proc means 输入数据集名 选项列表 ; var 变量列表 ; class 变量列表 ; by freq 变量列表 ; 变量 ; weight 变量 ; id 变量列表 ; output out=输出数据集名 统计量关键字=变量名 列表 ; run ; ? ? ? ? ? ? proc means(2) var语句——规定要求计算简单描述性统计量的数 值变量的次序。 by语句——按by语句定义的变量进行分组计算其相 应的简单统计量,要求输入数据集已按by变量排序。 class语句——与by语句一样,可用class变量定义 观测组,分别计算各组观测的描述统计量。输出格 式与by不同且事先不需要按class变量排序。 freq语句——指定一个数值型的freq变量,它的值 表示输入数据集中相应观测出现的频数。 weight语句——规定一个weight变量,它的值表示 相应观测的权数。 id语句——在输出数据集中增加一个或几个附加变 量,目的在于识别输出数据集里的观测。其值为生 成这个观测的输入数据集中相应观测组里id变量具 有的最大值。 ? n t cv proc means(3) proc means语句中可用的统计量关键字 统计量名称 含义 统计量名称 含义 未丢失的观测个数 mode 众数,出现频数最高的数 nmiss mean stderr sum std var uss css skewness kurtosis 丢失的观测个数 算术平均 均值的标准误差 加权和 标准偏差 方差 变异系数的百分数 加权平方和 关于均值偏差的加权平方和 对称性的度量——偏度 对尾部陡平的度量——峰度 sumwgt max min range median prt clm lclm uclm 权数和 最大值 最小值 极差,max—min 中间值 总体均值等于0的t统计量 t分布的双尾p值 置信度上限和下限 置信度下限 置信度上限 ? ? ? ? proc means(4) output语句中的选项。 out=输出数据集名——输出数据集 名。 统计量关键字=变量名列表——规定在 输出数据集中要包含的统计量并规定这 些统计量在新数据集中的变量名。 means过程对output语句的次数没有 限制,可以使用几个output语句来创建 内容不同的多个数据集。 N proc means(5) SAS程序 data examp1; input x @@; cards; 70.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.3 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.7 67.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.7 75.8 73.5 75.0 72.7 73.5 73.5 72.7 81.6 70.3 74.3 73.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4 ; proc means data=examp1 n mean cv skewness kurtosis range median ; var x; run; 输出 The MEANS Procedure Analysis Variable : x Mean Variation Skewness Kurtosis Range Median 50 73.7460000 5.4083794 0.1540111 0.3581179 19.3000000 73.5000000 ? ? proc univariate(1) 单变量统计分析 对一组单指标实验数据进行分析常采用两种 方法: ? 图示法——包括茎叶图、盒型图和正态概率 图。 ? 描述统计量——包括矩、分位数、极端值和 頻数分布表。 proc univariate(2) Univariate过程的主要控制语句如下: proc univariate

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档