网站大量收购闲置独家精品文档,联系QQ:2885784924

《机器学习基础及应用》教案 第2课 搭建机器学习开发环境(二).docx

《机器学习基础及应用》教案 第2课 搭建机器学习开发环境(二).docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE8

PAGE8

PAGE9

PAGE9

课题

搭建机器学习开发环境(二)

课时

2课时(90min)

教学目标

知识技能目标:

(1)掌握机器学习的一般过程

(2)了解Python机器学习常用库

(3)能够使用JupyterNotebook编写简单程序

素质目标:

了解时代新科技,激发学习兴趣和创新思维,增强民族自信心

帮助学生树立履行时代使命的责任担当,激起学生报效祖国的理想情怀

教学重难点

教学重点:机器学习的一般过程

教学难点:使用JupyterNotebook编写简单程序

教学方法

案例分析法、问答法、讨论法、讲授法

教学用具

电脑、投影仪、多媒体课件、教材

教学过程

主要教学内容及步骤

课前任务

【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务,请大家提前了解机器学习的一般流程有哪些

【学生】完成课前任务

考勤

【教师】使用APP进行签到

【学生】班干部报请假人员及原因

问题导入

【教师】提出以下问题:

机器学习一般有哪些过程?

【学生】思考、举手回答

传授新知

【教师】通过学生的回答引入要讲的知识,介绍机器学习的一般过程、python机器学习常用库等内容

1.3机器学习的一般过程

机器学习的基本思想是通过从样本数据中提取所需特征构造一个有效的模型,并使用所建模型来完成具体的任务。

?【教师】通过多媒体展示“机器学习的一般过程”图片(详见教材),并介绍相关知识

利用机器学习解决问题时,首先要获取所研究问题的数据,其次是对获取到的数据进行适当处理,然后选取合适的算法训练模型,最后对训练好的模型进行评估,以判定其是否满足任务需求,如满足,即可使用模型。机器学习的过程是一个繁琐复杂的过程,下面介绍各个阶段需要做的一些工作。

1.3.1数据获取

机器学习的第一步是收集与学习任务相关的数据,这是最基础也是最重要的一步。虽然现在是大数据时代,但对于一个给定任务,要得到与之相关的数据有时却很困难。业界广泛流传这样一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限的方法而已。因此,数据的获取尤为重要。

在训练最优的机器学习模型时,一定要选择最有代表性的数据集。只有选择最合适的属性作为特征,才能保证机器学习项目能应用于实际。

1.3.2特征提取

特征提取是使用专业的背景知识和技巧最大限度地从原始数据中提取并处理数据,使得特征在机器学习的模型上得到更好的发挥,它直接影响机器学习的效果。例如,在机器自动分辨筷子和牙签两种物品的实验中,收集到的样本数据集如表1-1所示。

?【教师】通过多媒体展示““筷子和牙签”样本数据集”表格,介绍相关知识

序号

长度/(cm)

质量/(g)

材质

类别

1

25

8

筷子

2

23

7

筷子

3

20

4

筷子

4

6

0.1

牙签

5

5

0.08

牙签

6

5.8

0.09

牙签

观察表中的数据集可发现,根据长度和质量这两个特征即可分辨筷子和牙签,材质这个特征对区分筷子和牙签的作用并不明显,故可在特征属性中提取长度和质量这两个特征,而将材质这个特征删除,这个过程称为特征提取。

1.3.3数据预处理

现实生活中,收集到的数据往往会有数据量纲(数据的度量单位)或数据类型不一致等问题。因此,在获取样本之后,通常需要对数据进行预处理。数据预处理没有标准流程,通常包含去除唯一属性,处理缺失值、重复值和异常值,以及数据定量化等几个步骤。

表1-2的数据集是某平台上的“客户信息样本数据集”,要求使用机器学习方法,进行聚类,将客户划分为几种类型,以便为其推销相关的产品。在训练模型之前,我们需要对数据集中的数据进行预处理,才能得到理想的机器学习样本数据集。

?【教师】通过多媒体展示“客户信息样本数据集”表格,介绍相关知识

表1-2客户信息样本数据集

序号

姓名

年龄/(岁)

年收入/(元)

性别

学历

年消费/(元)

1

张三

36

50000

本科

30000

2

赵琦

42

45000

本科

40000

3

李武

23

30000

高中

4

王波

61

70000

本科

20000

5

刘玉琦

38

20000

大专

10000

6

赵琦

42

45000

本科

40000

7

赵倩

?5

30000

本科

90000

1.去除唯一属性

唯一属性通常指ID、姓名等属性,每个样本的取值都不一样且唯一,这些属性不能刻画样本自身的分布规律,在做数据预处理时,需将这些属性删除。表1-2中的数据经过“去除唯一属性”处理后的结果如表1-3所示。

?【教师】通过多媒体展示“去除唯一属性后的客

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档