- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE8
PAGE8
PAGE9
PAGE9
课题
搭建机器学习开发环境(二)
课时
2课时(90min)
教学目标
知识技能目标:
(1)掌握机器学习的一般过程
(2)了解Python机器学习常用库
(3)能够使用JupyterNotebook编写简单程序
素质目标:
了解时代新科技,激发学习兴趣和创新思维,增强民族自信心
帮助学生树立履行时代使命的责任担当,激起学生报效祖国的理想情怀
教学重难点
教学重点:机器学习的一般过程
教学难点:使用JupyterNotebook编写简单程序
教学方法
案例分析法、问答法、讨论法、讲授法
教学用具
电脑、投影仪、多媒体课件、教材
教学过程
主要教学内容及步骤
课前任务
【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务,请大家提前了解机器学习的一般流程有哪些
【学生】完成课前任务
考勤
【教师】使用APP进行签到
【学生】班干部报请假人员及原因
问题导入
【教师】提出以下问题:
机器学习一般有哪些过程?
【学生】思考、举手回答
传授新知
【教师】通过学生的回答引入要讲的知识,介绍机器学习的一般过程、python机器学习常用库等内容
1.3机器学习的一般过程
机器学习的基本思想是通过从样本数据中提取所需特征构造一个有效的模型,并使用所建模型来完成具体的任务。
?【教师】通过多媒体展示“机器学习的一般过程”图片(详见教材),并介绍相关知识
利用机器学习解决问题时,首先要获取所研究问题的数据,其次是对获取到的数据进行适当处理,然后选取合适的算法训练模型,最后对训练好的模型进行评估,以判定其是否满足任务需求,如满足,即可使用模型。机器学习的过程是一个繁琐复杂的过程,下面介绍各个阶段需要做的一些工作。
1.3.1数据获取
机器学习的第一步是收集与学习任务相关的数据,这是最基础也是最重要的一步。虽然现在是大数据时代,但对于一个给定任务,要得到与之相关的数据有时却很困难。业界广泛流传这样一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限的方法而已。因此,数据的获取尤为重要。
在训练最优的机器学习模型时,一定要选择最有代表性的数据集。只有选择最合适的属性作为特征,才能保证机器学习项目能应用于实际。
1.3.2特征提取
特征提取是使用专业的背景知识和技巧最大限度地从原始数据中提取并处理数据,使得特征在机器学习的模型上得到更好的发挥,它直接影响机器学习的效果。例如,在机器自动分辨筷子和牙签两种物品的实验中,收集到的样本数据集如表1-1所示。
?【教师】通过多媒体展示““筷子和牙签”样本数据集”表格,介绍相关知识
序号
长度/(cm)
质量/(g)
材质
类别
1
25
8
竹
筷子
2
23
7
竹
筷子
3
20
4
木
筷子
4
6
0.1
竹
牙签
5
5
0.08
竹
牙签
6
5.8
0.09
竹
牙签
…
…
…
…
…
观察表中的数据集可发现,根据长度和质量这两个特征即可分辨筷子和牙签,材质这个特征对区分筷子和牙签的作用并不明显,故可在特征属性中提取长度和质量这两个特征,而将材质这个特征删除,这个过程称为特征提取。
1.3.3数据预处理
现实生活中,收集到的数据往往会有数据量纲(数据的度量单位)或数据类型不一致等问题。因此,在获取样本之后,通常需要对数据进行预处理。数据预处理没有标准流程,通常包含去除唯一属性,处理缺失值、重复值和异常值,以及数据定量化等几个步骤。
表1-2的数据集是某平台上的“客户信息样本数据集”,要求使用机器学习方法,进行聚类,将客户划分为几种类型,以便为其推销相关的产品。在训练模型之前,我们需要对数据集中的数据进行预处理,才能得到理想的机器学习样本数据集。
?【教师】通过多媒体展示“客户信息样本数据集”表格,介绍相关知识
表1-2客户信息样本数据集
序号
姓名
年龄/(岁)
年收入/(元)
性别
学历
年消费/(元)
1
张三
36
50000
男
本科
30000
2
赵琦
42
45000
女
本科
40000
3
李武
23
30000
男
高中
4
王波
61
70000
男
本科
20000
5
刘玉琦
38
20000
女
大专
10000
6
赵琦
42
45000
女
本科
40000
7
赵倩
?5
30000
女
本科
90000
1.去除唯一属性
唯一属性通常指ID、姓名等属性,每个样本的取值都不一样且唯一,这些属性不能刻画样本自身的分布规律,在做数据预处理时,需将这些属性删除。表1-2中的数据经过“去除唯一属性”处理后的结果如表1-3所示。
?【教师】通过多媒体展示“去除唯一属性后的客
您可能关注的文档
- 《HBase数据库应用案例教程》教案 项目5 HBase原理实现.docx
- 《HBase数据库应用案例教程》教案 项目6 HBase性能优化.docx
- 《HBase数据库应用案例教程》教案 项目7 HBase与MapReduce的集成.docx
- 《Excel数据处理与分析案例教程》教案 项目二 数据统计计算.docx
- 《Excel数据处理与分析案例教程》教案 项目六 使用宏与VBA实现高效数据分析.docx
- 《Excel数据处理与分析案例教程》教案 项目七 线上水果交易数据处理与分析.docx
- 《Excel数据处理与分析案例教程》教案 项目三 数据整理.docx
- 《Excel数据处理与分析案例教程》教案 项目四 数据分析.docx
- 《Excel数据处理与分析案例教程》教案 项目一 数据处理与分析基础.docx
- 《Excel数据处理与分析案例教程》教案 项目五 数据可视化.docx
- 智能制造周报:AI深度耦合机器人:解锁智能时代产业“密钥”.pdf
- 天风证券-中际旭创(300308)算力CapexAI应用开始螺旋共振,长期成长空间打开-250206.pdf
- EqualOcean 2024中国出海企业品牌战略报告.pdf
- 天津大学:2025深度解读DeepSeek:原理与效应.pdf
- 罗兰贝格:2024年AI在制药领域的应用报告.pdf
- 《贵州茶叶中风味挥发性物质的测定_气相色谱质谱法》.docx
- 庄信万丰(张家港)贵金属材料科技有限公司3000吨年贵金属催化剂回收项目环境影响报告书.docx
- 00素材:现象篇1.8_纯图版.docx
- 24国考专项刷题-申论4天-206P.pdf
- 浅析城市社区应急管理体制现状问题 .docx
最近下载
- 潍柴WP13GTA发动机零件图册 英文.pdf
- 2024-2025学年高中英语下学期开学第一课(时事版)课件.pptx VIP
- EN 15227-2020铁路设施 — 铁路车辆的防撞性要求(中文版).doc
- 住宅地上模板、钢筋、混凝土的成本.docx VIP
- 人体生理学课件-血液生理.ppt VIP
- 2025江苏中职职教高考-语文-讲义知识考点复习资料.pdf VIP
- 必威体育精装版华师大版七年级数学下册电子课本课件【全册】.pptx VIP
- 刘徽生平简介【优质公开课】精品PPT课件模板.pptx
- 工业大模型技术应用与发展报告1.0(1).pptx
- 黑布林阅读初二11《杰克的威士本游园会》中文版.pdf
文档评论(0)