4 模块四 数据描述性分析.pptx

  1. 1、本文档共127页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

电子商务数据分析基础模块四数据描述性分析

CONTENT目录单元一描述性统计分析单元二趋势分析单元三对比分析单元四其他分析方法

1.熟悉描述性统计量的类型、指标含义,并掌握利用Excel进行数据描述性统计分析的方法;2.熟悉图表趋势预测法和时间序列预测法,并掌握利用这两种方法对电子商务日常运营数据进行趋势分析的技能;3.熟悉比较分析的概念和常用的使用场景,并掌握比较分析的方法,包括同比分析法、环比分析法;4.了解频数分析、分组分析、结构分析、平均分析、交叉分析和漏斗图分析的使用场景,并掌握相应的数据分析方法。学习目标

知识导图

单元一描述性统计分析

单元一描述性统计分析一、认识描述性统计量描述变量集中趋势的统计量描述变量离散程度的统计量描述变量分布情况的统计量

单元一描述性统计分析描述变量集中趋势的统计量平均值(Mean)表示变量值的平均水平,包括算术平均值、加权算术平均值、调和平均值和几何平均值。中位数(Median)一组数据中处于最中间位置的数,中位数是将各变量值按大小排序后,处于序列中间位置的那个变量值。当变量个数为偶数时,中位数是位于中间位置的两个变量的算术平均数。众数(Mode)一组数据中出现频率最高的数据值,众数只有在总体上单位较多而又有明确的集中趋势的数据中才有意义。和(Sum)某变量的所有变量值之和。

单元一描述性统计分析描述变量离散程度的统计量标准差(Std.deviation)描述变量关于均值的偏离程度方差(Variance)标准差的平方,是各个观测值与其均值离差平方的均值最大值(Maximum)某变量所有取值的最大值

单元一描述性统计分析最小值(Minimum)某变量所有取值的最小值极差(Range)又称区域、全距,用R表示,是某变量极大值与极小值之差均值标准误差(S.E.mean)均值的标准误差,是反映抽样误差大小的统计指标,是统计推算可靠性的指标

单元一描述性统计分析描述变量分布情况的统计量偏度衡量的是样本分布的偏斜方向和程度峰度衡量的是样本分布曲线的尖峰程度如果样本的偏度接近于0,而峰度接近于0,就可以判断总体的分布接近于正态分布。偏度(Skewness)某变量所有取值的最小值描述变量分布的对称程度和方向。偏度为0表示对称,大于0表示右偏,小于0表示左偏峰度(Kurtosis)描述变量分布的陡峭程度。峰度为0表示陡峭程度和正态分布相同,大于0表示比正态分布陡峭,小于0表示比正态分布平缓。

单元一描述性统计分析二、数据的描述性统计分析在Excel中添加“数据分析”加载项打开Excel,点击“文件”选项卡,进入“文件”功能区,单击“选项”按钮,在弹出的Excel选项框中点击“加载项”按钮,在加载项对话框里找到“管理”功能区,点击其下拉列表,选择“Excel加载项”,并单击“转到”按钮,即可弹出“加载宏”对话框。1

单元一描述性统计分析在“加载宏”对话框中选中“分析工具库”、“分析工具库-VBA”(分析工具库的编程加载项)复选框,点击“确定”按钮,即可完成“数据分析”加载项的添加。在Excel的“数据”菜单的右上角即出现了“数据分析”功能项。2

单元一描述性统计分析利用Excel进行数据的描述性统计分析案例

单元一描述性统计分析打开“活动访问数据.xlsx”文件,选择“数据”选项卡,单击“数据分析”按钮。在弹出的“数据分析”对话框中选中“描述统计”分析工具,单击“确定”按钮,便弹出了“描述统计”对话框。1

单元一描述性统计分析在“描述统计”对话框中完成各类参数的设置。2输入输入区域:选择需要分析的数据源区域,可选多行或多列,可以采用鼠标进行框选,也可以用键盘进行输入,输入时需要带上绝对引用符号“$”,如本例中数据源区域为$B$1:$B$21(后文中都采用简写,如:B1:B21)。分组方式:选择分组方式,如果需要指出【输入区域】中的数据是按行还是按列分组,则选择“逐行”或“逐列”,如本例中选择“逐列”。标志位于第一行:若数据源区域第一行含有标志(字段名、变量名),则应勾选,否则,Excel字段将以“列1、列2、列3……”作为列标志,本例勾选【标志位于第一行】。

单元一描述性统计分析输出选项输出区域:可选当前工作表的某个活动单元格、新工作表组或新工作簿,本例将结果输出至当前工作表的D2单元格;汇总统计:包括有平均值、标准误差(相对于平均值)、中位数、众数、标准差、方差、峰度、偏度、区域、最小值、最大值、求和、观测数等相关指标,本例勾选【汇总统计】复选框。第K大(小)值:表示输入数据组的第几位最大(小)值。本例勾选此复选框,并输入“1”,结果出现最大值和最小值。平均数置信度:置信度也称为可靠度,或置信水平、置信系数,是指总体参数值落在样本统计值某一区内的概率,常用的置信度为9

文档评论(0)

gayl22 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档