网站大量收购闲置独家精品文档,联系QQ:2885784924

sas描述性统计分析课件.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
sas描述性统计分析课件

;数据的描述;在对数据进行深入加工之前,总应该对数据有所印象。 可以借助于图形和简单的运算,来了解数据的一些特征。 由于数据是从总体中产生的,其特征也反映了总体的特征。对数据的描述也是对其总体的一个近似的描述。;如何用图来表示数据?;定量变量的图表示:直方图;;定量变量的图表示:盒型图;盒型图;定量变量的图表示:茎叶图 ;茎叶图;定量变量的图表示:散点图 ;散点图;定性变量的图表示:饼图;饼图;定性变量的图表示:条形图;条形图;如何用少量数字来概括数据?;如何用少量数字来概括数据?;如何用少量数字来概括数据?;如何用少量数字来概括数据?;数据的“位置”;数据的“位置”;数据的“位置”;(样本)中位数(median) 是数据按照大小排列之后位于中间的那个数(如果样本量为奇数),或者中间两个数目的平均(如果样本量为偶数)。 由于中位数不易被极端值影响,所以中位数比均值稳健(robust)。;上下四分位数(或分别称为第一四分位数和第三四分位数,first quantile, third quantile)则分别位于(按大小排列的)数据的上下四分之一的地方。;数据的“位置”;数据的“尺度”;数据的“尺度”;数据的“尺度”;数据的“尺度”;数据的“尺度”;-3;为了了解某地区居民家庭收入状况,现从这一地区家庭中随机抽查了100户居民,调查其家庭人均收入,调查结果如下(单位:百元): 271 396 287 399 466 269 295 330 425 324 228 113 226 176 320 230 404 487 127 74 234 523 164 336 343 330 436 141 388 293 464 200 392 265 403 259 426 262 221 355 324 374 347 261 287 113 135 291 176 342 443 239 302 483 231 292 373 346 293 236 223 371 287 400 314 468 337 308 359 352 273 267 277 184 286 214 351 270 330 238 248 419 330 319 440 427 314 414 299 265 318 415 372 238 323 412 493 286 313 412 试根据以上数据计算:这100户家庭的平均人均收入,并据此推断地区人均收入水平; 这100户家庭的人均收入的离散程度; 这100户家庭人均收入的分布形状:偏度和峰度。;变量的概括描述;变量的概括描述;输出或记入数据集的统计量可用以下的关键名: CSS MIN SKEWNESS SUMWGT CV N STD T KURTOSIS NMISS STDERR USS MEAN PRT SUM VAR MAX RANGE; PROC CAPABILITY [DATA=数据集名 GRAPHICS NOPRINT]; [VAR 变量名列; [HISTOGRAM 变量名列; [/ MIDPOINTS=中点列 NORMAL[(MU= SIGMA= )] EXP(THETA= ) LOGNORMAL(THETA= )];] [CDFPLOT [/ NORMAL[(MU= SIGMA= )] EXP(THETA= ) LOGNORMAL(THETA= )];] [INSET [=‘’┄;] BY 变量名; ID 变量名; RUN; ;变量的分类计数;;;;;MEASURES 对每层的二维表计算一系列关联指标及相应的标准误,包括Pearson和Spearman相关系数,以及Gamma和Kendall系数等。对于2×2表,还给出常用的危险度指标及其标准误。 CMH 给出Cochran-Mantel-Haenszel统计量,可检验在调整了TABLES语句中其它变量后,行变量与列变量之间的关联程度。对于2×2表,FREQ过程给出相对危险度估计及其可信区间,还给出各层关联度指标是否齐性的Breslow检验。 ALL 给出CHISQ、MEASURES、CMH所请求的全部统计量。 ALPHA=p 给出检验水准。缺省为0.05。 ;;

文档评论(0)

gm8099 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档