- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据分析与统计软件复习课 SAS系统是大型集成应用软件系统,具有完备的以下四大功能:数据访问、数据管理、数据分析、数据呈现 SAS系统包含了众多的不同的模块,可完成不同的任务,主要模块有: SAS/BASE(基础)——初步的统计分析; SAS/STAT(统计)——广泛的统计分析; SAS/QC(质量控制)——质量管理方面的专门分析计算; SAS/OR(规划)——运筹决策方面的专门分析计算; SAS/ETS(预测)——计量经济的时间序列方面的专门分析计算; SAS/IML(距阵运算)——提供了交互矩阵语言; SAS/GRAPH(图形)——提供了许多产生图形过程并支持众多图形设备; SAS/ACCESS(外部数据库接口)——提供了与大多数流行数据库管理系统的方便接口并自身也能进行数据管理; SAS/ASSIST(面向任务的通用菜单驱动界面)——方便用户以菜单方式进行操作; SAS/FSP(数据处理交互式菜单系统) SAS/AF(面向对象编程的应用开发工具) 另外SAS系统还将许多常用的统计方法分别集成为两个模块LAB和INSIGHT,供用户利用图形界面和菜单直接对数据进行统计分析 显示管理系统 显示管理系统窗口 1显示管理系统(Display Manager)三个主要窗口: PROGRAM EDITOR窗口:提供一个编写 SAS程序的文本编缉器 LOG窗口: 显示有关程序运行的信息 OUTPUT窗口:显示程序运算结果的输出 永久的和临时的SAS数据集 SAS的存储方式有二种: 永久的SAS数据集 临时的SAS数据集 输入和输出格式 SAS数据集的数据值的内部存放格式并不一定与该数据值的输入和输出格式一致,这取决于SAS的两个重要功能:输入格式(Informats)和输出格式(Formats)。 输入格式指示SAS系统如何读入数据,而输出格式指示SAS系统如何输出数据。它们的一般形式如下: 输入格式:$informatw.d 输出格式:$formatw.d 其中$符号指示这是个字符输入输出格式,没有$符号表示是数值输入输出格式; Informat是一个输入格式的名字,format是一个输出格式的名字; w是宽度值,对许多输入输出格式这个值是输入输出数据的列数; d在数值输入输出格式中是小数部分的长度; 点”.”是所有输入输出格式中必须包含的分隔符,作为名字的一部分。如果在格式中省略w和d值,SAS系统使用缺省的值。 选择变量(即选择列) 使用DATA语句的DROP=和KEEP=选项可以控制从原始数据库中读出的变量是否被写入将要创建的数据集。 例如,假设我们要从CLASS2数据集中产生只包含ID、AVERAGE和TOTAL变量,而不包含TEST1、TEST2、TEST3、TEST4、TEST5变量的新数据集CLASS3。 有二种程序编法都能达到相同的目的: 一是使用DATA语句的DROP=选项,表示从原有变量中去掉DROP=中指明的变量; 二是使用DATA语句的KEEP=选项,表示从原有变量中只保留KEEP=中指明的变量。 程序一: Data class3 (drop=test1 test2 test3 test4 test5 ) ; Set class2 ; Proc print data=class3 ;Run; 程序二: Data class3 ( keep=id average total ) ; Set class2 ; Proc print data=class3 ; Run ; 程序一和程序二的运行结果相同。 拼接和合并数据集 在SAS数据步中用SET语句可以拼接数据集,而用MERGE语句可以合并数据集。 例如我们有二个数据集A和B,要拼接和合并成新的数据集C,二种不同方法的程序和结果见示意图所示: 作图 一PROC PLOT过程 使用PLOT过程可以在两个不同的坐标系中对两个变量作散布图、折线图和层次图。用于数据处理中,直观地了解数据的变化趋势和数据间的相互关系等。 它的一般形式为: Proc Plot DATA=数据集 /选项列表 ; Plot 纵坐标变量Y*横坐标变量X……/选项列表; Run ; PLOT语句 PLOT语句里首先要规定数据集中的哪两个变量作为图形中的垂直变量和水平变量,以及在图形中用于画点的作图字符。 PLOT语句的几种使用格式如下: plot y*x ; plot y*x =’+’; plot y*x=符号变量 ; plot y*
文档评论(0)