网站大量收购闲置独家精品文档,联系QQ:2885784924

监督学习与无监督学习的快速介绍.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

监督学习与无监督学习的快速介绍

机器学习领域包含大量可用于理解数据的算法。这些算法可以分为两类之一:

1.监督学习算法:涉及构建模型以根据一个或多个输入估计或预测输出。

2.无监督学习算法:涉及从输入中查找结构和关系。没有“监督”输出。

本教程解释了这两种算法之间的区别以及每种算法的几个示例。

监督学习算法

当我们有一个或多个解释变量(X1?,X?2?,X?3?,…,X?p?)和响应变量(Y)并且我们希望找到一些描述之间关系的函数时,可以使用监督学习算法解释变量和响应变量:

Y=?f?(X)+ε

其中f表示X提供的有关Y的系统信息,其中ε是独立于X且平均值为零的随机误差项。

监督学习算法主要有两种类型:

1.回归:输出变量是连续的(例如体重、身高、时间等)

2.分类:输出变量是分类的(例如男性或女性、通过或失败、良性或恶性等)

我们使用监督学习算法有两个主要原因:

1.预测:我们经常使用一组解释变量来预测某些响应变量的值(例如使用平方英尺和卧室数量?来预测房价)

2.推论:我们可能有兴趣了解响应变量随着解释变量值的变化而受到影响的方式(例如,当卧室数量增加一间时,房价平均上涨多少?)

根据我们的目标是推理还是预测(或两者的混合),我们可以使用不同的方法来估计函数f。例如,线性模型提供更容易的解释,但难以解释的非线性模型可能提供更准确的预测。

以下是最常用的监督学习算法的列表:

线性回归

逻辑回归

线性判别分析

二次判别分析

决策树

朴素贝叶斯

支持向量机

神经网络

无监督学习算法

当我们有一个变量列表(X?1,X?2,X?3,...,X?p)并且我们只想找到数据中的底层结构或模式时,可以使用无监督学习算法。

无监督学习算法主要有两种类型:

1.聚类:使用这些类型的算法,我们尝试在数据集中找到彼此相似的观察“聚类”。当公司想要识别具有相似购物习惯的客户群时,这通常用于零售业,以便他们可以针对某些客户群制定特定的营销策略。

2.关联:使用这些类型的算法,我们试图找到可用于绘制关联的“规则”。例如,零售商可能会开发一种关联算法,该算法表示“如果客户购买产品X,他们很可能也会购买产品Y”。

以下是最常用的无监督学习算法的列表:

主成分分析

K-均值聚类

K-中心点聚类

层次聚类

Apriori算法

摘要:监督学习与无监督学习

下表总结了监督学习算法和无监督学习算法之间的差异:

下图总结了机器学习算法的类型:

您可能关注的文档

文档评论(0)

晶方科技 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档