2023台大机器学习笔记.pdfVIP

  1. 1、本文档共107页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

台大机器学习笔记

NTUML1.学习问题

机器学习的概念

我们可以从人类的学习思维入手。人类的学习过程,是从观察出发,经过大内化以后,变成有用的技巧。机器学习,类似地,是我们希

望能让电模拟类似的过程.这时,电的观察到的东西被称作是数据,而思考过程实际上是计算过程,技巧则是增强某一方面的表现.

因此,

机器学习的过程是从数据出发,经过计算过程以后,最终获得某种表现上的增进

那么为叶么需要机器学习呢?想象如下的例子,给定一张照片,判断照片里的物体是不是一棵(大自然中的)树。如果我们不使用机器

学习算法,就需要对什么是树做一个回答,给出树的定义,并且动手将这个定义实现为程序。传统的做法是按照规则进行判断,而将规

则表述出来是很难的。然而,我们认识树的方法其实也是通过观察,经过经验的积累判断这个是树或者不是,并不是教条地从长辈那里学

习判断规则.类似地,我们也可以编写代码,让机器自己从数据中学习树的判断方法.因此,机器学习是构建复杂系统的另一种方法

机器学习在以下情况下尤其适用

•当我们不能提前想好各种情况,手工编码规则时。例如要让机器人在火星上导航,而我们不可能提前想到它在火星上会遇见什么样

的情况

・当我们无法容易地定义问题的解决方案时.例如要做语音识别/视觉识别,而我们无法对音频信号做出准确定义

・当人们需要做出快速决策时。例如高频交易

•当要让机器服务于海量使用者时。例如做服务个性化定制

因此,我们可以从三个关键点进行判断,看是否适合使用机器学习

1.问题应该是“可以学习的”,即存在一些潜在的模式,以及目标

2.这些规则难以清晰定义

3.手里掌握了对应的数据

机器学习的应用

机器学习目前在衣食住行四个方面都得到了广泛应用

•衣:Abu-Mostafa2012利用销售数据和对用户的调研结果构建推荐系统给用户推荐穿搭

・食:Sadileketal.2013利用机器学习,以推特上的文本和地理位者信息为据,判断餐厅的卫生状况

・住:TsanasandXifara2012利用已有房间的特点和耗能,预测房屋的能源消耗

・行:Stallkampetal.2012利用交通标志照片和对应的意义,来提升认识交通咏志的准确率

此外还有两个领域:教育和娱乐

•教育:系统根据学生的答题状况,有针对地提供题目让学生练习其薄弱的部分,同时将太难的题推后给出.即,给定一名学生的答

题历史和一个题目,预测学生是否能作对这道题(KDDCup2010

・娱乐:系统根据用户的历史打分,预测用户对新电影的打分(KDDCup2011

机器学习的过程

问题背景

以银行信用卡发卡这一问题为例.假设银行收集了一些用户的基本信息,例如下表

项目值

年龄23岁

性别

年薪20万人民币

在所在地居住年1

0.5

工龄

负债额4万人民币

银行要解决的问题是,对于这样的客户,是否应该给她发放信用卡

问题的形式化描述

为了更加形式化地描述这个问题,我们需要定义一些符号:

・输入:X£X,例如上面的这些基本信息

•输出:y£丫,是我们期望得到的答案.例如在上面的问题中就是“发”或“不发”

•目标函:f:x一Y,是我们期望学到,但是目前不知道的东西。是最理想的公式

・据:D={(XI,y1,仅2,y2),...,(xn,yn,是之前积嶷的记录

•假设:g:X-Y,是机器从据中学到的函。我们通常都希望g的表现足够好,即g«fo注意这里g不一定等于f(事实上,

我们永远也不知道真正的f是什么样子,只知道由f产生的据D)

•机器学习算法:A,是由D产生g的算法,可以理解为A会从各种不同假设hk(这里hk有

文档评论(0)

zsmfjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档