商务数据分析 网店数据分析及应用 如何七周成为数据分析师04:数据可视化之经典图表合集.doc

商务数据分析 网店数据分析及应用 如何七周成为数据分析师04:数据可视化之经典图表合集.doc

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
如何七周成为数据分析师04:数据可视化之经典图表合集 本文是《如何七周成为数据分析师》的第四篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉数据可视化,大可不必再看这篇文章,或只挑选部分。 Excel的课程告一段落,今天开始第二周的内容,数据可视化阶段。 数据可视化是一个热门的概念,是分析师手中的优秀工具。好的可视化是会讲故事的,它向我们揭示了数据背后的规律。 大家对可视化的使用认知或许来源于下面这张图。虽然结构清晰,但它只针对Excel图表,不够丰富。本文会结合数据分析师的使用场景展示更多的可视化案例。 为方便演示,文中绝大多数视图为ECharts.js的范例。 了解可视化前,先知悉基础概念。 维度 数据分析中经常会提及维度。维度是观察数据的角度和对数据的描述。我们可以说地区是一种维度,这个维度包含上海北京这些城市。也可以认为销售额是一个维度,里面有各类销售数据。 维度可以用时间、数值表示,也可以用文本,文本常作为类别。数据分析的本质是各种维度的组合,我想了解和分析全国各地的销售额,就需要将地区维度和销售维度结合,如果想知道各个年份的变化,那么再加入时间维度。 说的再透彻点,Excel首行各字段就可以理解成维度。 互联网行业的PV、UV、活跃数也能算作维度。 图表的绘制依赖多个维度的组合。 维度类型和转换 维度主要是三大类的数据结构:文本、时间、数值。地区的上海、北京就是文本维度(也可以称为类别维度),销售额度就是数值维度,时间更好理解了。不同图表有维度使用限制。 数值维度可以通过其他维度加工计算得出,例如按地区维度,count出有多少是上海的,有多少是北京的。 维度可以互相转换。比如年龄原本是数值型的维度,但是可以通过对年龄的划分,将其分类为小孩、青年、老年三个年龄段,此时就转换为文本维度。具体按照分析场景使用。 接下来介绍主要的可视化图表。 主要的可视化图表 1.散点图 散点图在报表中不常用到,但是在数据分析中可以算出镜率最高的。散点图通过坐标轴,表示两个变量之间的关系。绘制它依赖大量数据点的分布。 散点图的优势是揭示数据间的关系,发觉变量与变量之间的关联。 散点图需要两个数值维度表示X轴、Y轴,下图范例就是身高和体重两个维度。 为了进行分析,该图又引入性别维度,通过颜色来区分。 当我们想知道两个指标互相之间有没有关系,散点图是最好的工具之一。因为它直观。尤其是大数据量,散点图会有更精准的结果。 后续的学习中,我们也会多次借用到散点图,比如统计中的回归分析,比如数据挖掘中的聚类。 2.折线图 折线图是观察数据的趋势,它和时间是好基友,当我们想要了解某一维度在时间上的规律或者趋势时,就用折线图吧。 折线图一般使用时间维度作为X轴,数值维度作为Y轴。 3.柱形图 柱形图是分析师最常用到的图表之一,常用于多个维度的比较和变化。 文本维度/时间维度通常作为X轴。数值型维度作为Y轴。柱形图至少需要一个数值型维度。 下图就是柱形图的对比分析,通过颜色区分类别。当需要对比的维度过多,柱形图是力不从心的。 柱形图和折线图在时间维度的分析中是可以互换的。但推荐使用折线图,因为它对趋势的变化表达更清晰。 柱形图还有许多丰富的应用。例如堆积柱形图,瀑布图,横向条形图,横轴正负图等。 直方图是柱形图的特殊形式。它的数值坐标轴是连续的,专用于统计,表达的是数据分布情况。在统计学的内容会专门讲解。 4.地理图 一切和空间属性有关的分析都可以用到地理图。比如各地区销量,或者某商业区域店铺密集度等。 地理图一定需要用到坐标维度。可以是经纬度、也可以是地域名称(上海市、北京市)。坐标粒度即能细到具体某条街道,也能宽到世界各国范围。 除了经纬度,地理图的绘制离不开地图数据,POI是很重要的要素。POI是“Point of Information”的缩写,可以翻译成信息点,每个POI包含四方面信息,名称、类别、经度纬度、附近的酒店饭店商铺等信息。借助POI,才能按地理维度展现数据。 5.饼图 饼图经常表示一组数据的占比。可以用扇面、圆环、或者多圆环嵌套。商务类的汇报中应用较多。 为了表示占比,拼图需要数值维度。 饼图是有缺陷的,它擅长表达某一占比较大的类别。但是不擅长对比。30%和35%在饼图上凭肉眼是难以分辨出区别的。当类别过多,也不适宜在饼图上表达。 对数据分析师来说,除了做报告,饼图没啥用。 6.雷达图 也叫蛛网图。可能男同胞们在游戏中看到它比较多。它在商务、财务领域应用较大,适合用在固定的框架内表达某种已知的结果。常见于经营状况,财务健康程度。 比如我对企业财务进行分析,划分出六大类:销售、市场、研发、客服、技术、管理。通过雷达图绘制出预算和实际开销的维度对比,会很清晰。如下图: 7.箱线图 箱线图一般人了解的不多,它能准

文档评论(0)

WanDocx + 关注
实名认证
内容提供者

大部分文档都有全套资料,如需打包优惠下载,请留言联系。 所有资料均来源于互联网公开下载资源,如有侵权,请联系管理员及时删除。

1亿VIP精品文档

相关文档