数据分析实验指导书.docVIP

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

-

.z.

目录

实验一 描述性分析

实验二 正态总体的均值检验

实验三 非参数检验

实验四 方差分析

实验五 回归分析

实验六 判别、聚类分析

实验七 主成分分析

实验八 因子分析

实验一 描述性分析

【实验目的】

掌握数字特征的计算〔A〕;

2. 掌握相关矩阵计算〔A〕。

【实验原理】

数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进展分析,以求最大化地开发数据资料的功能,发挥数据的作用;是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

要对数据进展分析,当然要分析数据中包含的主要信息,即要分析数据的主要特征,也就是说,要研究数据的数字特征。对于数据的数字特征,要分析数据的集中位置、分散程度。数据的分布是正态的还是偏态等。对于多元数据,还要分析多元数据的各个分量之间的相关性等。

【实验工程设计】

给定一组单变量数据,分组计算均值、方差、Q1、Q3、偏度、峰度。

给定一组多变量数据,计算相关矩阵。

【实验容】

一、单样本的数字特征计算

(习题1.4)从*商店的营业日中随机抽取12天,得日营业额数据为〔单位:万元〕:

12.5,17.2,9.1,25.4,31.2,20,18.9,22.8,21.1,17.8,25.1,27.7

试求样本均值、样本方差、样本变异系数、样本中位数、上样本四分位数、下样本四分位数、样本四分位数间距和极差。

1. 建数据集

Datad4;

Input*;

Cards;

12.517.29.125.431.22018.922.821.117.825.127.7

;

Run;

2. 使用SAS/分析家〞菜单

翻开分析家〞界面。

选择SAS界面的级联菜单:解决方案〞?分析〞?分析家〞。

调出数据文件Work.D4。

在界面的空白处,右键弹出菜单,选择级联菜单:文件〞?按SAS名称翻开〞。依次选择逻辑库和文件对象,分别为Work〞、D4〞,单击确定〞按钮。

确定分析方法。

选择界面上的级联菜单:统计〞?描述性统计〞?分布〞

输送变量。

首先选中变量*〞,然后单击Analyst〞按钮。即完成变量的输送,确定变量*〞作为分析变量。单击OK〞。

得到输出结果

上述使用分析家〞的调用过程等价于程序调用univariate过程:

procunivariatedata=d4;

Var*;

Run;

3. 解答

样本均值mean=

样本方差Variance=

样本变异系数CoeffVariation=

样本上四分位数75%Q3=

样本中位数Median=

样本下四分位数25%Q1=

极差Range=

样本四分位数间距InterquartileRange=

二、相关矩阵计算

(例3.2.3)今对31个人进展人体测试,考察或测试的七个指标是:年龄(*1)、体重(*2)、肺活量(*3)、1.5英里跑的时间(*4)、休息时的脉搏(*5)、跑步时的脉搏(*6)和跑步时记录的最大脉搏(*7)。数据列于表3.2.1。现欲对这些指标作一些相关分析。

1. 对于给定E*CEL数据文件,导入数据建数据集e323.sas7bdat

2. 使用SAS/INSIGHT菜单

3. 输出

实验二 正态总体的均值检验

【实验目的】

掌握单正态总体样本的均值检验〔B〕;

掌握两独立组样本(服从正态总体)进展均值比较〔A〕;

掌握两对照组样本(服从正态总体)进展均值比较〔A〕;

了解两组样本均值差的置信区间计算〔C〕。

【实验原理】

单样本总体均值的t检验

两独立组样本总体的方差比较

【实验工程设计】

单个正态总体的均值检验;

两独立组样本(服从正态总体)进展均值比较检验;

两对照组样本(服从正态总体)进展均值比较检验。

【实验容】

一、单个正态总体的均值检验

(习题1.4)从*商店的营业日中随机抽取12天,得日营业额数据为〔单位:万元〕:

12.5,17.2,9.1,25.4,31.2,20,18.9,22.8,21.1,17.8,25.1,27.7

试检验:μ0=10。

1. 建数据集

Datad4;

Input*;

Cards;

12.517.29.125.431.22018.922.821.117.825.127.7

;

Run;

2. 使用SAS/分析家〞菜单

翻开分析家〞界面。

调出数据文件Work.D4。

确定分析方法。

选择界面上的级联菜单:统计〞?假设检验〞?均值的单样

文档评论(0)

bookst + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档