人工智能概论通识课 第6章 机器学习与知识发现(一).pptx

 人工智能概论通识课 第6章 机器学习与知识发现(一).pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共52页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章 机器学习与知识发现(一) 6.1 概述 6.2 基本原理与分类 6.3 符号学习 6.4 强化学习 延伸学习导引; 6.1 概述 学习是系统积累经验或运用规律指导自己的行为或改进自身性能的过程,而发现则是系统从所接收的信息中发现规律的过程。学习与发现相辅相成,关系密切,以致在不少文献中二者几乎是同义语。 当今人工智能中的机器学习主要指机器对自身行为的修正或性能的改善(这类似于人类的技能训练和对环境的适应)和机器对客观规律的发现(这类似于人类的科学发现)。 机器学习从20世纪50年代就开始被研究,现在已取得了不少成就,并分化出了许多研究方向,主要有符号学习、连接学习(即神经网络学习)、统计学习和交互学习等。 ; 6.2 基本原理与分类 6.2.1 机器学习的概念 心理学中对学习的解释是:学习是指(人或动物)依靠经验的获得而使行为持久变化的过程。 Simon认为:如果一个系统能够通过执行某种过程而改进它的性能,这就是学习。 Minsky认为:学习是在人们头脑中(心理内部)进行有用的变化。 Tom M. Mitchell在《机器学习》一书中对学习的定义是:对于某类任务T和性能度P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么,我们称这个计算机程序从经验E中学习。 当前关于机器学习的许多文献中也大都认为:学习是系统积累经验以改善其自身性能的过程。 ;6.2.2 机器学习的原理 研究发现: ① 学习与经验有关; ② 学习可以改善系统性能; ③ 学习是一个有反馈的信息处理与控制过程。因为经验是在系统与环境的交互过程中产生的,而经验中应该包含系统输入、响应和效果等信息。因此经验的积累、性能的完善正是通过重复这一过程而实现的。;6.2.3 机器学习的分类 1. 基于学习途径的分类 (1) 符号学习 模拟人脑的宏观心理级学习过程,以认知心理学原理为基础,以符号数据为输入,以符号运算为方法,用推理过程在图或状态空间中有哪些信誉好的足球投注网站,学习的目标为概念或规则等。符号学习的典型方法有:记忆学习、示例学习、演绎学习、类比学习、规则学习、解释学习等。 (2) 神经网络学习(或连接学习) 模拟人脑的微观生理级学习过程,以脑和神经科学原理为基础,以人工神经网络为拓扑结构模型,以数值数据为输入,以数值运算为方法,用迭代过程在权向量空间中有哪些信誉好的足球投注网站,学习的目标为函数或类别。典型的连接学习有权值修正学习、拓扑结构学习。;(3) 统计学习 运用统计、概率及其他数学理论和方法对样本数据进行处理,从中发现相关模式和规律的一种机器学习方法。 (4) 交互学习 智能体通过与环境的交互而获得相关知识和机能的一种机器学习方法。交互学习的典型方法就是强化学习(增强学习)。强化学习以环境反馈(奖/惩信号)作为输入,以统计和动态规划技术为指导,学习目标为最优行动策略。 ; 2. 基于学习方法的分类 (1) 归纳学习 基于归纳推理(由特殊到一般)的学习,又可分为: ? 符号归纳学习:如目标为概念的示例学习,目标为规则的决策树学习。 ? 函数归纳学习:如目标为函数的统计学习和神经网络学习。 ? 类别归纳学习:如无监督学习。 (2) 演绎学习 基于演绎推理(从一般到特殊)的学习。 (3) 类比学习 基于类比推理的学习。如案例(范例)学习(case-based learning)、实例学习、迁移学习。 (4) 分析学习 利用先验知识和演绎推理来扩大样例提供的信息的一种学习方法。典型的分析学习有解释学习。;3. 基于样本数据特点的分类 (1) 有监督学习(supervised learning,亦称有导师学习) 有监督学习的样本数据为一些由向量(x1, x2,..., xn)和一个对应值y组成的序对。监督学习就是用当前由(x1, x2,..., xn)所求得函数值y’与原对应值y做比较,然后根据误差决定是否对所选用的函数模型的参数进行修正。监督学习以概率函数、代数函数或者人工神经网络为基本函数模型,采用迭代计算的方法,来拟合相应的数据集,学习结果为函数(即隐藏于样本数据中的规律)。监督学习被用于分类问题和回归问题,以对未知进行预测。 ; ;4. 基于数据形式的分类 (1) 结构化学习 以结构化数据为输入,以数值计算或符号推演为方法。典型的结构化学习有神经网络学习、统计学习、决策树学习、规则学习。 (2) 非结构

您可能关注的文档

文档评论(0)

dllkxy + 关注
实名认证
内容提供者

本文库主要涉及建筑、教育等资料,有问题可以联系解决哦

版权声明书
用户编号:5213302032000001

1亿VIP精品文档

相关文档