- 1、本文档共31页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一讲:数据分析基本原理介绍(基于excel工具) 主讲人:邓光耀 1、数据分析概述 1.1定义:数据也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出。数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。 1.2 通常需分析的数据有商务与经济数据、医药统计数据、游戏运行数据等。数据分析工作者需要有多学科背景,首先要对所分析的对象要有比较全面的了解。 1.3 数据分析的常规方法是用excel做统计表与统计图,专业方法有RFM模型、回归分析、时间序列分析、聚类分析、神经网络、正交设计、方差分析、结构方程模型、关联分析等。这些方法的具体内涵等用到时再讲。 1.4 常用的数据分析软件简介: spss软件是全球范围内最流行的数据分析软件;sas软件具有比较强大的编程功能,适合专业人士使用;eviews软件进行计量经济分析的人员用得比较多;dps软件是浙江大学唐启义发明的数据分析软件,它是目前唯一的中国人自己发明的数据分析软件,是spss软件与excel的山寨版;其它的数据分析软件还有gauss与minitab等。这些软件的基本功能都差不多,只是侧重点有些差别。 excel也有数据分析功能,对于一般的数据分析用excel也就足够了,本讲后面讲述excel函数与绘图功能。 1.5 数据分析的一般步骤: 1、数据的收集、整理、录入、校对等; 2、对收集的数据进行描述性统计分析,选择数据分析的方法。 3、利用已知数据建立模型,发现数据的内在规律,并利用模型对未来作出预测或者做出理性的决策。 4、比较预测的数据与现实数据,校正模型,提高预测的准确性或者做出更理性的决策。 2、判定数据计算错误的办法 2.1 在数据收集的过程中,或多或少会出现数据误差或者错误。数据校对工作者有必要掌握一些判定数据计算错误的办法。当然多算几次会提高计算的准确率,但是数据较多时,如何快速有效的判定计算的正误就需要一些专业的方法了。 2.2 位数估计与首位、末尾数据校对法:这是一个简单的办法,当你没有时间来校对数据时可以采用此法做些粗略的判断。 2.3 弃九法:此法的数学原理是利用同余的性质。我们先从例子开始叙述: 加法: 例1:假设商品一的销售金额为1568964元,商品二的销售金额为3625878元,统计表上两者的结果为5194742元,问此表有没有问题?我们计算1568964的各位数字的和,注意超过9就取除以9的余数即可,这样我们可以口算得到数字3,同理3625878可以用弃九法得到数字3,5194742用弃九法得到数字5,由于3+3=6不是5,故可以判定数据计算有误。 减法:我们可以先转化到加法,再用弃九法判断。 乘法: 例2:假设某件商品的单价是137元,销售量为128793件,经计算得判断此计算结果的正误。137用弃九法处理等于2,128793经处理等于3,那么2×3=6处理等于7,故可以判定数据计算失误。我们用正确的数据来验证弃九法的合理性,正确结果应该此数经弃九法处理等于6,满足弃九法。 除法:我们可以先转换到乘法,再用弃九法处理。 弃九法的数学原理:记 那么此数除以九之后所得余数与各位数字相加除以九之后得到的结果相同。即由于 最后一个式子表示两边除以九后的余数相同,是同余理论中的符号。 不知道听者有没有发现,用弃九法判断计算的正确性有时候失效,实质上用此法判断计算正误,如果判断计算是错误的,那么一定是计算错了,但是判断是正确的,却实质上计算不一定正确。例如上面的乘法的例子,如果我们计算得那么按照弃九法,不能判断出此结果是错误的,但是实质结果应当 不过由于出现计算错误的原因一般是忘记进位,或者用计算机计算时少输入一个数字等,故用弃九法来检验计算的正确性还是比较有效的。 3、描述性统计 3.1 频数与频率:频数指样本中某数据出现的次数;频率指频数除以样本的数目。 例3:我们分析下列数据: 上面数据中2出现的频数为3,频率为3/20=0.15。 我们在RFM模型中会遇到这样的数据组。 我们用excel函数求上面数据的频数与频率:假如我们依次把以上数据输入在A1到A20中,那么我们可以在B1中用countif函数计算2出现的频数,即输入=countif(A1:A20,2)即可得到2的频数为3;我们在B2中输入=B2/20或者=countif(A1:A20,2)/20即可。 注: 1.我们可以用=count(A1:A20)计算这组数
您可能关注的文档
- 教师专业能力培养与训练.ppt
- 教师下水文写作技巧余俊.ppt
- 教师主题班会.ppt
- 教师业务考绩档案正本填法指导.ppt
- 教师培训项目实施方案的制定.ppt
- 教师如何做课例研究.ppt
- 教师如何写教育叙事.ppt
- 教师如何写案例【20120331】.ppt
- 教师培训专题汇报.ppt
- 教师如何写论文-新北区教育信息网.ppt
- 四年级数学下册 重难点题型同步训练第六章《数据的表示和分析》章节常考题集锦 带解析(北师大版).doc
- 四年级数学下册 (提高版)期末复习精选题—2020年期末常考题集训带解析(苏教版).doc
- 四年级数学下册 重难点题型训练第七章《三角形、平行四边形和梯形》第一课时:三角形的特征 带解析(苏教版).doc
- 四年级数学下册 重难点题型同步训练第二章《认识三角形和四边形》第一课:图形分类(北师大版).doc
- 四年级数学下册 (基础版)期末复习精选题—期末常考题集训(北师大版).doc
- 四年级数学下册 重难点题型训练第三章《三位数乘两位数》章节常考题集锦 带解析(苏教版).doc
- 阳极隔膜项目可行性研究报告.doc
- 企业办公室正规化管理活动开展情况汇报.doc
- 龙晚会PPT课件课件.ppt
- 锡林广场广场改造管理用房广场小品喷泉工程等城市广场配套基础设施工程可研报告.doc
文档评论(0)