数据分析方法与技术-描述性方法统计实验报告..docVIP

下载本文档

304
0
约5.76千字
约 10页
2017-01-28 发布于重庆
举报
版权申诉

数据分析方法与技术-描述性方法统计实验报告..doc

1、本文档共10页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据分析方法与技术-描述性方法统计实验报告.

电子科技大学政治与公共管理学院本科教学实验报告（实验）课程名称：数据分析技术系列实验电子科技大学教务处制表电子科技大学实验报告学生姓名：学号：指导教师：一、实验室名称：电子政务可视化实验室二、实验项目名称：描述性统计方法三、实验原理通过调查或观察，采集到样本以后，常用一些统计量描述这些数据的分布状态，并通过这种认识，对数据的总体特征进行总结和归纳。数据的分布状态常通过数据的进行描写。本实验主要对数据统计分析的最基础分析——描述性统计分析进行实验，主要包括集中趋势和离中趋势分析，其主要算法原理如下： 1. 描述集中趋势的统计 (1) 算术平均值(Mean)：样本数据的总和除以样本数据的个数即是算术平均值。 (2) 中位数(Median，Me) 首先将样本数据(假设有n个数)按升序或降序排列，如果 n 为奇数，则数列中间的数值为中位数；如果n为偶数，则中位数为其中两数值的均值。 (3) 众数(Mode，Mo) 样本数据中出现频数(次数)最多的那个数称为众数。众数不易确定，与中位数一样，它不受极值影响。但有时会出现两个甚至多个众数，有时又没有众数。所以，众数的使用受到严格限制。 (4) 几何平均数(Geometric Mean) 假定银行每年本利(本金加利率)为 X1 有 f1 年，X2 有f2 年，X3 有 f3 年，? ，Xn 有 fn 年， (5) 四分位数(Quartiles) 最低数与中位数之间的中位数是25分位数，原中位数与最高数之间的中位数是75分位数。类似集中趋势的度量还有十分位数和百分位数。 2. 描述离中趋势的统计量 (1) 极差(Range) 是样本数据中最大值与最小值的差值。极值舍弃了最大值与最小值之间的其他数据信息，仅仅依靠端点值来确定，因而稳定性差。 (2) 平均差(Average Difference) 指各样本数据与均值间差异绝对值的均值，也称为平均绝对差。 (3) n个数据的方差(Variance) 定义如下式，其中为这 n 个数的均值。 (4) 标准差 (Standard Deviation, Std Dev) 是方差的算术平方根。标准差是变量与算术平均数的平均离差，也是最常用的反映数据离中趋势的统计量。但是，在抽样调查中总体标准差往往未知，需要用样本标准差代替总体标准差，总体方差的无偏估计量应该为原方差乘以修正因子 (n / n－1)，并由此得到无偏标准差的估计量。四、实验目的掌握常用的描述性统计方法的原理及操作，包括：算术平均值、中位数、众数、几何平均数、调和平均数、极差、平均差、方差、标准差等。五、实验内容及步骤使用“Analyze” 莱单中的“Descriptive Statistics”功能进行描述性统计分析。 1.频数分析 “Frequencies” 过程通过单个数据的频数分析(Frequencies )来达到整理数据的目的，利用该过程，得到一系列描述数据分布状况的统计量。单击“Frequencies ” 命令则可打开相应对话框（如图示），对对话框中各选项进行设置。图 2 (1)对话框左侧的源变量名列表框中，给出了当前数据文件中所有变量的变量名。 (2)“Variable(s)” 列表框，在变量名列表框中单击变量名以后，单击对话框中间的右箭头按钮，将变量名移到该列表框中。选定变量名以后，将对选定变量的数据进行频数分析。 (3)选择“Display frequency tables” 选项，将在浏览器中显示频数分布表，否则只显示直方图,不显示频数表。 (4)若单击“Statistics” 按钮，则打开统计量选择对话框，如图示，该对话框中各选项的意义如下。图 3 ① “Percentile Values” 选项区，可计算并显示如下内容: 四分位数(“ Quartiles” )、等间隔n 分位数(“Cut points for” 后文本框中输入数值为 n ) 和不等间隔“ Percentile(s)” 分位数 p %、q % 。“Percentile(s)” 选项后面的文本框中依次先后输人数值p、q，单击“Add” 按钮，显示在文本框中，利用“Change” 和“Remove” 按钮，可以对文本框中列表进行修改。 ②“Central Tendency”将显示样本的集中趋势，如计算并显示样本数据的均值“Mean” ，数据的中位值“Median” ，数据的众数“Mode” ，数据的累加和“sum” 。 ③“Values are group midpoints”选项，表示假设数据已经分组，数据取值为组中值，选择此项，可计算百