- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
备课日期:年月日
授课时间
课时(理论+实验)
周次
星期:节次:
授课课题
绪论
教学目标
1.理解机器学习基本原理与数学本质;
2.掌握机器学习关键术语与主要过程;
3.了解机器学习的主要应用与发展趋势。
教学重点
1.机器学习数学本质;
2.机器学习的关键术语。
教学准备
PPT、点名册等。
教学方法
案例法。
教学过程设计
备注
课题引入
【思考】“一朝被蛇咬,十年怕草绳”的内存原因?
=机器可以象人类一样学习知识(规律)吗?
【关键】强调机器学习在人工智能领域的重要性及本课程的重要性。
【时间】分钟
【重点】学习?知识(规律)?预测(推断)
教学步骤及主要内容
【主板书】§1.绪论
基本原理
从观测数据中寻找规律(模型),然后利用规律(模型)对未知数据进行预测。
【主板书】基本原理
例1:兔子食量预测问题(回归)。
例2:狗与兔子分类问题(分类)。
〖PPT〗回归与分类。
两类问题的求解有什么不同与相同之处?
(1)不同之处:回归问题求取的浮点数;分类问题求取的是类别标记。
(2)相同之处:求取直线(数学模型)。
【思政】著名学者赫伯特?西蒙教授(HerbertSimon,1975年图灵奖获得者、1978年诺贝尔经济学奖获得者)将“学习”定义为“如果某个系统能通过执行某个过程改进其性能,则这个过程就是学习”,因而,学习的核心目的就是改善性能。其实,对人类而言,此定义也是适用的;例如,我们现在正在学习“机器学习”的知识,其本质目的就是为了提升自己在机器学习方面的认知水平。如果仅仅是低层次的重复性学习,而没有达到认知升级的目的,那么即使表面看起来非常勤奋(比如天天去图书馆上自习),其实也仅仅是个“伪学习者”,因为这样的“我们”并没有改善性能。按照这个解释,毛泽东主席那句著名的口号“好好学习,天天向上”就会焕发新的含义:如果没有性能上的“向上”,即使非常辛苦地“好好”,即使长时间的“天天”,都无法视为“学习”。殊途同归,无论是“人类学习”,还是“机器学习”,提高性能、改善自己,才是关键。
【时间】分钟。
【提问】。
数学本质
【提出问题】机器学习可以对兔子的食量进行预测、可以对牛兔所属类别进行分类,其根本原理是什么呢?
【主板书】数学本质
1.输入数据与输出目标之间的映射函数(如直线y=kx+b)。
例1:数量?食量。
例2:狗兔(耳朵、尾巴)特征?牛兔类别。
y
其中,y表示模型的输出目标,θ表示需根据观测数据确定的模型参数,Φx表示输入数据x的特征表达(即将非数值型的属性转化为计算机可处理的数值型数据,如(尾巴,耳朵)特征值为(0.87,0.99
【副板书】Φx
【强化与拓展】对于简单回归与分类问题,函数f(?)可通过先验知识事先确定(如直线L1:y=kx+b),然后再根据观测数据确定相关的参数(如k、b);然而,对于复杂问题,函数
2.风险函数
无论采用哪种方式确定函数f(?),通常均需要采用特定的标准衡量其好坏。在机器学习中,此标准一般称为风险函数,可理解为在求解函数f(?)时当前所采取的函数形式或被优化的参数相对于训练样本所产生的风险,即:
R
其中,L(yi,yi)为
L
【副板书】Ly,
3.经验风险最小化
风险函数Rθ是在已知训练样本上计算得来的,因此被称为经验风险;当经验风险最小时可获取较好的函数f(?),此为“经验风险最小化”原则
θ
4.结构风验最小化
为了解决过拟合问题,通常需要在经验风险最小化的基础上对参数进行正则化,此即为“结构风险最小化”原则,即:
θ
其中,θ2是L2范数正则化项,参数λ
5.模型求解
机器学习的本质即为根据特定的标准利用训练样本确定函数f(?)参数,此过程通常称为训练过程。
例1:游客快速下山。
〖PPT〗梯度下降法基本原理。
【时间】分钟。
【提问】。
三、基本术语
【主板书】基本术语
1.特征:根据当前问题所涉及的对象(如牛与兔子的分类)抽取原始数据中具有代表性的部分(如耳朵、尾巴等),并将多个可以表征原始数据的数值型特征组合为向量的形式(称为特征向量)以用于模型的求解。
2.样本
样本与样本集主要用于相关模型的求解。
【强化与拓展】训练集、验证集、测试集。以x表示输入特征向量,y表示输出数据(如分类标记),样本通常表示为(x,y),样本集表示为T={(x
〖PPT〗样本图示。
3.监督学习
监督学习可以理解为使用标记的训练数据来学习从输入变量(X)到输出变量(Y)的映射函数。
4.无监督学习
无监督学习问题只有输入变量(X),但没有相应的输出变量。
【强化与拓展】聚类、关联、降维。
5.半监督学习
半监督学习是指
文档评论(0)