- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据分析 课程标准
一、课程定位
现在企业为了提升客人使用体验,提高业务效率,在大数据蓬勃发展的阶段里,
需要对现有业务系统进行转型升级;作为大数据核心部分,大数据研发工程师应用成为
有大量数据的企业必备人才,在数据处理,数据分析方面,大数据研发是不可或缺的技
能。
随着大数据应用的大量普及,开源框架,比方hadoop,spark等,也得到长足发展。
本课程除了着力于统数据的收集和搭建,使得作为大数据的研发/分析带来基础设施,
让学员掌握,同时,对大数据的离线/实时处理和部分数据分析进行深度理解和把握。
通过本课程,掌握大数据平台并且对大数据分析的基本技能和方法,为将来在企业分析
大数据做决策打下基础。
二、课程性质与作用
课程性质 大数据分析课程。
课程作用
大数据分析是数据清洗过后使得数据产生价值的过程。在企业丰富应用场景中,通
过标准的大数据分析方法不能胜任的情况下,就需要通过先验知识来验证大数据并找出
规律来到达业务目标。在实际工作中,掌握大数据研分析需要展示的数理统计分析的知
识,敏锐的数据观察力,和部分软件开发的知识,也需要比较扎实的电脑基础。本课程
大纲是完整的课程,实际培训课程中,会根据学员实际情况进行分组。通过本课程的学
习。
三、课程目标
课程教学以灵活运用分析方法为目标,以实际项目为中心,以合理知识结构分解为
手段,结合实际的应用场景,对大数据进行文本,图标等大数据进行分析和学习,主要
以实际操作让学员对相关知识点掌握,到达理论与实际结合,教学与企业融合的内容。
学员学成后,能够利用清洗后的数据,根据提供的先验知识,可以做出模型并能够预测
业务数据。课程内容始终围绕全面提升学生的理论和操作的熟练程度、标准化程度以及
职业素质三个方面展开。
〔一〕知识目标
1. 理解大数据概念及应用场景,先导课程Linux 的操作
2. 掌握开发语言R 或python
1 / 8
3. 掌握大数据HDFS、HBase、Hadoop 集群搭建及数据批处理。
4. 离线工具 ETL 和 hive 的安装及应用。
5. 数据可视化的应用
6. 真实
〔二〕能力目标
1.全局的眼光理解大数据,理解大数据的应用,并有总体的概念。
2.理解企业中实际生产环境的大数据搭建,收集,分析,应用的过程。
3.具备在实际应用场景中,能对数据处理流程,数据挖掘进行个性化处理。
四、课程设计
主要指课程设计的总体思路:
课程设计围绕大数据分析的基础和方法,考虑到实际企业生产环境中的应用场景,
课程中采用实际案例, 从案例分析、启动、实施、验证各环节剖析讲解,与真实环境
同步。
Hadoop
先导知识 R语言
生态
大量案例 算法及模
型
课程案例选取:
以搭建支持 10GB 的数据为目标,在目标3 机器上部署大数据仓库,并能实际
运行。模拟 1GB 的数据,能够通过Hive 进行查询,为将来数据清洗和数据分析提供
基础。
五、课程内容与要求
知识块 知识点 课程目标 课时 案例
2 / 8
先导知识
Linux系统 Linux 基础 先导课程,以
Linux-常用命令介 掌握Linux基本操
绍 作未基础,加上对
文档评论(0)