- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
干货大牛据分析师养成日记
以上是一位资深的数据分析师写的自嘲的段子,却是很多分析师的真实写照。在耀眼的职业光环下,数据分析师自身的成长,几乎是与孤寂相伴,在高级打杂中,锻造而成。最近接到一个职业访谈的邀请,要给对数据分析感兴趣的新人Y(目前在知名电商从事系统开发和维护)一些建议,才突然发现自己在这个领域打滚了一段时间,一阵感叹后,写下自己的一些体会,尽管不全面,但或许能够给新人一些借鉴。如有不妥地方,请各位数据大牛轻拍。一、数据分析师有哪些要求?1、理论要求及对数字的敏感性,包括统计知识、市场研究、模型原理等。2、工具使用,包括挖掘工具、数据库、常用办公软件(excel、PPT、word、脑图)等。3、业务理解能力和对商业的敏感性。对商业及产品要有深刻的理解,因为数据分析的出发点就是要解决商业的问题,只有理解了商业问题,才能转换成数据分析的问题,从而满足部门的要求。4、汇报和图表展现能力。这是临门一脚,做得再好的分析模型,如果不能很好地展示给领导和客户,成效就大打折扣,也会影响到数据分析师的职业晋升。二、请把数据分析作为一种能力来培养从广义来说,现在大多数的工作都需要用到分析能力,特别是数据化运营理念深入的今天,像BAT这样的公司强调全员参与数据化运营,所以,把它作为一种能力培训,将会让你终生受益。三、从数据分析的四个步骤来看清数据分析师需具备的能力和知识:数据分析的四个步骤(这有别于数据挖掘流程:商业理解、数据理解、数据准备、模型搭建、模型评估、模型部署),是从更宏观地展示数据分析的过程:获取数据、处理数据、分析数据、呈现数据。(一) 获取数据获取数据的前提是对商业问题的理解,把商业问题转化成数据问题,要通过现象发现本质,确定从哪些纬度来分析问题,界定问题后,进行数据的采集。此环节,需要数据分析师具备结构化的思维和对商业问题的理解能力。推荐书籍:《金字塔原理》、麦肯锡三部曲:《麦肯锡意识》、《麦肯锡工具》、《麦肯锡方法》工具:思维导图、mindmanager软件(二) 处理数据一个数据分析项目,通常数据处理时间占70%以上,使用先进的工具有利于提升效率,所以尽量学习必威体育精装版最有效的处理工具,以下介绍的是最传统的,但却很有效率的工具:Excel:日常在做通报、报告和抽样分析中经常用到,其图表功能很强大,处理10万级别的数据很轻松。UltraEdit:文本工具,比TXT工具好用,打开和运行速度都比较快。ACCESS:桌面数据库,主要是用于日常的抽样分析(做全量统计分析,消耗资源和时间较多,通常分析师会随机抽取部分数据进行分析),使用SQL语言,处理100万级别的数据还是很快捷。Orcle、SQL sever:处理千万级别的数据需要用到这两类数据库。当然,在自己能力和时间允许的情况下,学习新流行的分布式数据库及提升自身的编程能力,对未来的职业发展也有很大帮助。分析软件主要推荐:SPSS系列:老牌的统计分析软件,SPSS Statistics(偏统计功能、市场研究)、SPSS Modeler(偏数据挖掘),不用编程,易学。SAS:老牌经典挖掘软件,需要编程。R:开源软件,新流行,对非结构化数据处理效率上更高,需编程。随着文本挖掘技术进一步发展,对非结构化数据的分析需求也越来越大,需要进一步关注文本挖掘工具的使用。(三) 分析数据分析数据,需要用到各类的模型,包括关联规则、聚类、分类、预测模型等,其中一个最重要的思想是对比,任何的数据需要在参照系下进行对比,结论才有意义。推荐的书籍:1、《数据挖掘与数据化运营实战,思路、方法、技巧与应用》,卢辉著,机械出版社。这本书是近年国内写得最好的,务必把它当作圣经一样来读。2、《谁说菜鸟不会数据分析(入门篇)》和《谁说菜鸟不会数据分析(工具篇)》,张文霖等编著。属于入门级的书,适合初学者。3、《统计学》第五版,贾俊平等编著,中国人民大学出版社。比较好的一本统计学的书。4、《数据挖掘导论》完整版,[美]Pang-Ning Tan等著,范明等翻译,人民邮电出版社。5、《数据挖掘概念与技术》,Jiawei Han等著,范明等翻译,机械工业出版社。这本书相对难一些。6、《市场研究定量分析方法与应用》,简明等编著,中国人民大学出版社。7、《问卷统计分析实务—SPSS操作与应用》,吴明隆著,重庆大学出版社。在市场调查领域比较出名的一本书,对问卷调查数据分析讲解比较详细。(四) 呈现数据该部分需要把数据结果进行有效的呈现和演讲汇报,需要用到金字塔原理、图表及PPT、word的呈现,培养良好的演讲能力。推荐书籍:1、《说服力让你的PPT会说话》,张志等编著,人民邮电出版社。2、《别告诉我你懂ppt》加强版,李治著,北京大学出版社。3、《用图表说话》,基恩。泽拉兹尼著,马晓路等翻译,清华大学出版社。(五) 其他的知识结构数据分析师除了具备数学
您可能关注的文档
- 山东省平玻璃产业转型升级实施方案.doc
- 展馆多媒展示技术汇总.doc
- 山东省农用水灌溉定额2010.doc
- 山东省征补偿标准.doc
- 山东省威文登市2013届高三3月质量检测(文综).doc
- 居民健康案建档对象流程图.doc
- 山东安全术资料之十一.doc
- 山东省水产业转型升级实施方案.doc
- 山东省劳防护用品配备标准(专家审批稿).doc
- 山东省建用地集约利用控制标准.doc
- DeepSeek培训课件入门宝典:第2册 开发实战篇 .pptx
- 全面认识全过程人民民主-2024春形势与政策课件.pptx
- 2024春形势与政策-全面认识全过程人民民主.pptx
- 2025年春季学期形势与政策第二讲-中国经济行稳致远讲稿.docx
- 2024春形势与政策-铸牢中华民族共同体意识课件.pdf
- 2024春形势与政策-走好新时代科技自立自强之路课件 (2).pptx
- 2024春形势与政策-走好新时代科技自立自强之路课件.pptx
- 形势与政策学习指导教学-整套课件.pdf
- 2023年春季形势与政策讲稿第三讲-开创高质量发展新局面.pdf
- DeepSeek培训课件-清华大学-DeepSeek模型本地部署与应用构建.pptx
文档评论(0)