- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
《大数据技术导论》教学大纲
课程名称
大数据技术导论
先修课程
计算机基础、Python编程
课程类别
专业基础课
课程类型
理论+实践
总学时
48
理论学时
24
实践学时
24
教学目的
大数据是国家发展战略,是各专业培养数智化、复合型技术技能人才的必修课程。通过本课程的学习学生能够了解大数据相关基础知识,知晓大数据行业各岗位的技能需求,体验各岗位工作任务,掌握大数据相关工具的使用,最终能够利用大数据思维和工具解决专业问题,提升学习效率。具体包括:
掌握大数据相关基础理论知识,包括大数据特征、发展历程,行业应用,岗位需求邓;
了解大数据平台的整个数据处理流程,掌握大数据采集、预处理、存储、分许、可视化的主流技术架构级常用工具的使用方法,例如爬虫、HDFS数据存储、Python数据挖掘分析和可视化;
能够应用一些主流的大数据工具进行实践任务,如数据爬取、简单的数据分析、以及数据可视化展现等;
能够利用数字思维解决专业问题,从数据中挖掘寻找未知信息,辅助专业实践创新。
教学主要内容
以二手房数据主线介绍大数据的采集、预处理、存储、分析挖掘、可视化等核心技术。课程内容包括大数据概念和特征、发展历程、行业应用、岗位技能、平台架构等理论知识以及Hadoop环境搭建、Python爬虫和预处理、大数据存储、Spark数据分析挖掘、Python数据可视化等全流程的实践实验。
教学方式
本课程的教学方式主要采用课堂讲授和实验操作,包括:课堂讲授、多媒体教学、实验操作、习题解析、课堂讨论等多种形式相结合,培养学生的自学能力、分析问题和解决问题的能力。
教学方法:采用启发式教学和探究式教学,以学生为主体,鼓励学生在掌握书本知识的基础上针对特定需求动手实践,培养学生的自学能力。
教学手段:充分利用电子教案、课件和网络教学平台等多种教学手段和资源。
教学进度
项目
主要内容
学时安排
大数据与大数据时代
大数据时代概念、产生原因、对社会产生的变革,大数据基本特征和处理流程
4
大数据与大数据时代
大数据技术发展历程,大数据产业结构和行业应用,大数据岗位需求
4
大数据处理平台
大数据处理平台产生的原因和特征,Hadoop大数据处理平台架构和两大基础组件HDFS、MapReduce
4
大数据处理平台
大数据处理流程,大数据4种计算模式,5种主流的大数据处理平台架构
4
Hadoop开发环境搭建
虚拟机基础知识和安装使用
4
Hadoop开发环境搭建
Hadoop环境的搭建以及词频统计案例得运行
4
数据采集与预处理
大数据采集的定义,常用的数据采集工具,爬虫的基础知识,Python爬虫环境搭建
4
数据采集与预处理
网页基本结构,网站数据的爬取过程,Python爬虫采集网站上二手房租房数据并进行简单的预处理
4
数据计算与数据存储
常见的大数据计算框架,NOSQL数据库基础知识、HBase数据库基础知识
4
数据计算与数据存储
利用Spark对二手房数据进行简单处理并存储在MySQL
4
数据分析与可视化
常见的大数据分析工具,数据挖掘的常见算法,常见的数据可视化工具
4
数据分析与可视化
利用Python对二手房数据进行分析挖掘并可视化展示结果
4
合计
48
作业要求
完成课堂布置的每章节课后习题。
依照书中的步骤完成每章的实验项目。
考核方式
期末笔试+大作业
成绩构成
期末笔试成绩占50%,大作业成绩占50%
文档评论(0)