- 1、本文档共31页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
sas第8章描述性统计过程
第八章 描述性统计过程
以下过程都可用于计算基本统计量,如频数、均值等,但它们又各有特色:
UNIVARIATE 进行单变量统计,包括分位数及描绘分布图。
SUMMMARY 按观测值分组计算基本单变量统计值。分组是由CLASS语句中的变量所决定。统计结果可输出到SAS数据集中而不产生打印输出。
MEANS 计算均值及其他描述统计量。
TABULATE 打印基本统计的复杂表格。
CORR 求变量间相关系数。
进行基本统计的其他过程还包括:
CHART 画频数、均值、总和的条形图、立体直方图、饼图及星图。
FREQ 对分类变量计算频数分布,并作多维列联表。
SAS基本统计过程及其一些重要统计量
统计量MEANSUNIVARIATESUMMARYTABULATECORR非缺项值数(N)√√√√缺项值数(NMISS)√√√√√权重和(SUMWEIGH_T)√√√√均值(MEAN)√√√√√和(SUM)√√√√√最小值(MIN)√√√√√最大值(MAX)√√√√√全距(RANGE)√√√√未修正平方和(USS)√√√√修正平方和(CSS)√√√√方差(VAR)√√√√标准差(STD)√√√√√变异系数(CV)√√√√偏度(SKEWNESS)√√峰度(KURTOSIS)√√T统计量值(t)√√√√大于t值的概率(PRT)√√√√中位数(MEDIAN)√四分位数(QUARTILE)√众数(MODE)√输出到SAS数据集YesYesYesNoYesCLASS语句YesNoYesYesNoBY语句YesYesYesYesYes第一节 MEANS 过程
MEANS过程对数值变量给出简单的描述性统计。
例: 数据集SCORE含有学生三门课程的成绩(见SORT过程),用MEANS过程可得到: PROC MEANS DATA=SCORE;
MEANS过程由下列语句控制:
PROC MEANS [选择项];
VAR 变量表;
BY 变量表;
CLASS 变量表;
FREQ 变量;
WEIGHT 变量;
ID 变量表;
OUTPUT [选择项];
除PROC语句之外的其他语句均为可选语句。
8.1.1 语句说明
1.PROC MEANS语句
PROC MEANS 选择项;
常用下列选择项:
DATA=SAS数据集 指出需做MEANS分析的SAS数量集名。
NOPRINT 说明不打印任何描述性统计值。此选择项仅仅是为了建立一新的数据集时才使用。
MAXDEC=N 指出MEANS用于打印结果的最大小数位(0~8),缺省值为2。
VARDEF=除数 指明用于方差计算的除数,缺省值是VARDEF=DF。
VARDEF=DF 用自由度(N-1)作除数。
VARDEF=WEIGHT|WGT 用权重和作除数。
VARDEF=N 用观测值数(N)作除数。
VARDEF=WDF 用权重和减1作除数.
统计量列表它们可以是N、MAEN、MAX、MIN.STD、STDERR、SUM、VAR、USS、CSS、NMISS、RANGE、T、PRT、SUMWGT、CV、SKEWNESS、KURTOSIS等18个统计量的任意组合。隐含为N、MIN、MAX,MEAN、STD。
2.OUTPUT语句
OUTPUT 选择项;
OUTPUT语句将MEANS过程产生的统计值输出到一个新的SAS数据集。
选择项包括:
OUT=SAS数据集 指定输出数据集名。
统计关键字=名字 指明新数据集中想要的统计项。并给包含这些统计项的变量起名。这些名字将作为统计值在新数据集中使用。等号右边第一个变量名代表VAR语句中第一个变量的相应的统计量;第二个名字代表VAR语句中第二个变量的相应的统计量等等。例如:
PROC MEANS;
文档评论(0)