- 1、本文档共30页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
数据分析基础年级:高中学科:信息技术(浙教版)
数据分析基础数据分析及其发展数据分析的一般过程常用的数据分析软件
本节课教学目标:1、知道什么是数据分析2、知道数据分析的用途3、了解统计分析、数据挖掘和大数据分析
数据分析目的数据数据。。。。。。信息信息数据。。。。。。提炼探索数据对象的内在规律
数据分析全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。请同学们列举生活中数据分析的例子,并思考总结数据分析的定义?
数据分析数据处理计算有意义的结论这个过程都是数据分析
数据分析常用于现状分析、原因分析、预测分析等。现状分析:对当前某一现状进行合理解释,从多个指标揭示整体情况,或从内部构成指标的发展及变动进行深入剖析原因分析:揭示某一状态为什么发生。通过原因分析有助于策略的调整与优化预测分析:估算未来结果或趋势,帮助用户评估和权衡潜在决策
随着数据量的急剧增长,数据分析的方法、工具和技术也在不断的发展。从数据分析发展的角度,数据分析可以分为统计分析、数据挖掘、大数据分析等。
1、统计分析4.1.1数据分析及其发展——统计分析举例:请证明身高和成绩是有关系的搜集身高和成绩的样本数据,算出数据之间的相关系数,来表明两者的相关程度。来验证假设是否成立,从而得出相应的结论。如何证明?以样本信息推断总体情况分析、推测总体特征、规律计算样本数据的相关指标
1、统计分析描述性统计的方法计算集中趋势离中趋势相关系数。。。。。。以样本信息推断总体情况分析、推测总体特征、规律4.1.1数据分析及其发展——统计分析基础
1、统计分析相关分析回归分析。。。。。。4.1.1数据分析及其发展——统计分析平均分析对比分析分组分析常用的统计分析方法
1、统计分析目标思路假设或判断已知模型数值计算数据统计结论4.1.1数据分析及其发展——统计分析
1、统计分析统计分析的作用是将繁杂的数据进行简化和抽象,以便抓住事物的本质和特征。分析者通过分析报告表达观点和立场,为决策提供支持。4.1.1数据分析及其发展——统计分析通过统计学方法对数据进行处理,提取有用信息,形成结论的过程。
2、数据挖掘数据挖掘是为了改进传统分析方法的不足,针对大规模数据的分析处理而产生的。4.1.1数据分析及其发展——数据挖掘通过挖掘顾客购物车中商品之间的关联,分析顾客的购物习惯,帮助零售商制定营销策略。关联分析
2、数据挖掘关联分析:是找出描述数据项之间存在的关联关系,即发现隐藏在数据间的关联或相关关系。4.1.1数据分析及其发展——数据挖掘例子:购物车分析、找出相关功能的基因组等。
2、数据挖掘根据文章出现词的相似性,对文章进行分组。4.1.1数据分析及其发展——数据挖掘聚类分析
2、数据挖掘聚类分析:是把一组数据按照相似性和差异性分为几个类别,使同一类中的成员彼此相似,而与其他类别的成员不同。4.1.1数据分析及其发展——数据挖掘例子:相关顾客分组、压缩数据、识别模式、处理图像等。
2、数据挖掘4.1.1数据分析及其发展——数据挖掘数据库统计学模式识别机器学习人工智能可视化等大量的不完全的有噪声的模糊的随机的从数据信息和知识隐含在其中的未知的潜在有用的基于技术提取
2、数据挖掘目标4.1.1数据分析及其发展——数据挖掘发现隐藏于数据背后的规律或数据间的关系常见的任务主要有预测建模关联分析聚类分析异常检测等
2、数据挖掘4.1.1数据分析及其发展——数据挖掘数据挖掘一开始就是面向应用的,随着数据挖掘技术的日趋完善,它广泛应用于科学研究、商业应用、金融投资、互联网应用等领域。
4.1.1数据分析及其发展—统计分析VS数据挖掘
4.1.1数据分析及其发展—统计分析VS数据挖掘数值、文本、声音、图像等不明确寻找未知的模式与规律评估、预测、建议描述性
3、大数据分析4.1.1数据分析及其发展——大数据分析统计分析分布式计算系统数据挖掘迁移大数据分析
3、大数据分析最具代表性的批处理模式4.1.1数据分析及其发展——大数据分析MapReduce核心设计思想:分而治之。目前主流的三大分布式计算系统:Hadoop、Spark、Storm
3、大数据分析大数据分析需要解决的难题是海量数据在多台机器上的存储以及如何对存储在多台机器上的数据进行计算分析。4.1.1数据分析及其发展——大数据分析
3、大数据分析4.1.1数据分析及其发展——大数据分析统计分析分布式计算系统数据挖掘迁移大数据分析大数据的分析方法是基于常规统计分析或数据挖掘算法,很多分析方法都是对原有算法的改进,将原来单机实现的算法改成多台机器的分布式
您可能关注的文档
- 1.2 数据、信息与知识课件-浙教版(2019)高中信息技术必修一第一章.pptx
- 1.2数据编码 课件【高效课堂精研】粤教版(2019)高中信息技术必修一.pptx
- 1.3 数据采集与编码课件【高效课堂精研】浙教版(2019)高中信息技术必修一.pptx
- 1.古诗三首 课件【高效课堂精研】三年级下册语文统编版.pptx
- 1《古诗三首》课件【高效课堂精研】语文五年级下册统编版.pptx
- 2 我是什么 课件【高效课堂精研】语文二年级上册(统编版) .pptx
- 2.1 知识与智慧 说课课件【高效课堂精研】粤教版(2019)高中信息技术必修一.pptx
- 2.2+抒情与写意——文人画+课件【高效课堂精研】高中美术人美版(2019)美术鉴赏.pptx
- 2.3《圆柱的体积》【高效课堂精研】六年级下册数学苏教版.pptx
- 2.3+描绘人间温情——怎样刻画人物+课件【高效课堂精研】高中美术人美版(2019)选择性必修1+绘画.pptx
文档评论(0)