- 1、本文档共42页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
绪 论新工科建设之路·人工智能系列教材机器学习(MATLAB 版)第一章
01机器学习的基本定义
机器学习的基本定义众所周知,机器学习是人工智能的核心研究领域之一,旨在使计算机系统具有人的学习能力,以便实现人工智能。那么,什么是机器学习呢?机器学习(Machine Learning)是对研究问题进行模型假设,利用计算机从训练数据中学习得到模型参数,并最终对数据进行预测和分析的一门学科。目前被广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能”。由于“经验”在计算机系统中主要是以数据的形式存在的,因此机器学习需要运用机器学习技术对数据进行分析,这就使得它逐渐成为智能数据分析技术的创新源之一,并且为此而受到越来越多的关注。STM32拥有丰富的外设、强大的开发工具、易于上手的固件库,在32位微控制器选型中,其已经成为许多工程师的首选。据统计,从2007年到2016年,STM32系列微控制器出货量累计约20亿个,十年间ST公司在中国的市场份额从2%增长到14%。
机器学习的基本定义对于人们要解决的各种实际问题,计算机程序都取得了远远超过人类的成绩。例如,在使用智能导航软件时,任意给定出发点和目的地,导航软件都可以很快计算出最优路线。可以肯定地说,一个实际问题只要有了确定的逻辑和数学模型,就可以用计算机进行很好的解决,并且其处理能力是人类所望尘莫及的。然而,到目前为止,还有许多无法用数学或逻辑模型准确描述的问题,如情感表达、图像识别、小说创作等,对于这些问题计算机处理的能力一般还不如人类。这些用计算机难以处理的问题,是当前人工智能要解决的核心问题。而机器学习正是解决这类问题的有力工具。
02机器学习的基本术语
STM32核心板电路简介掌握一门学科的基本术语对学好这门学科是至关重要的。假定我们通过记录的方式获得了一个关于西瓜的数据集,如表 1.1 所示。我们将以这个数据集中的数据为例对机器学习的基本术语进行具体化,以便加深对有关概念的理解。记录表 1.1中各项数据集合为“据”或“本”其中的一数据(这是对每一个西瓜的描述称为一个“示例”或“样本”反映事件或对象在某方面的表现或性质的事项,称为“特征”,如表 1.1 中的“色泽”“蒂”“声”等;而每个特征的取值,称为“特征值”,例如表 1.1 中的“青绿”“鸟黑”等。特征张成的空间称为“特征空间”(或“属性空间”“输入空间”如将表1中的“”“根”“”作为三个标轴,则它们张成一个用于描述西瓜的三维空间,每个西瓜都可在这个空间中找到自己的坐标位置。由于属性空间中的每个点对应着一个坐标向量,因此可以把一个样本称为一个“特征量”。对于表1.1中的某一行数据,用“泽”“根”“”三个属性进行取值记录,可认为该样本的“维数”为 3。从数据中学得模型的过程称为“学习”或“训练”这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为“训练数据”,其中每个样本称为一个“训练样本”,训练样本组成的集合称为“训练集”。
STM32核心板电路简介“标记/标签”用来表示样本的结果信息,例如表 1.1 中的“是否好瓜”。“样”是指既包含样本属性值又包含标签的样本。注意样例与样本的区别,后者包括训练样本和测试样本,样本不一定具有标签。所有标签结果的集合称为“标签空间”或“输出空间”。
STM32核心板电路简介没有用于模型训练的样本都可认为是对该模型的“新样本”。学得模型适用于新样本的能力,称为“泛化”能力。学得模型后,使用其进行预测的过程称为“测试”,被预测的样本称为“测试样本”。例如在学得映射?后,对测试样本x,可得到其预测签 y=?(x)。还可以对样本做“聚类”,也就是将训练集中的样本分成若干组,每个组称为一个“簇”这些自动形成的簇可能对应一些潜在的概念划分,例如“浅色瓜”“深色瓜”等。这样的学习过程有助于人们了解数据内在的规律,为更深入地分析数据建立基础。值得注意的是,在聚类学习中,“浅色瓜”“深色瓜”这样的概念事先是不知道的,是学习过程中得到的。而且,学习过程中使用的训练样本通常不拥有标签信息。
03机器学习算法的分类
1.监督学习与无监督学习日常生活中,监督学习的应用例子很多,例如人脸识别、垃圾邮件分类、语音识别、手写体辨识等。这类问题需要先收集训练样本,并对样本进行标注,然后用标注好的样例(样本+ 标签)去训练模型,最后用训练好的模型对新样本进行预测。
1.监督学习与无监督学习无监督学习对没有标签的样本数据进行分析,去发现样本集所具有的内在结构或分布规律。无监督学习的典型代表是聚类和数据降维等,它们所处理的样本都不带有标签信息。聚类属于分类问题,但不具有训练过程。聚类把一批没有标签的样本数据划分成多个“簇”,使得在某种相似度指标下每个簇内的样本尽量相似,而不同族的样本之间尽量不相似。聚类算法
您可能关注的文档
- 机器学习(MATLAB版)ch02-线性模型与逻辑斯谛回归 教学课件.pptx
- 机器学习(MATLAB版)ch03-决策树 教学课件.pptx
- 机器学习(MATLAB版)ch04-贝叶斯分类器 教学课件.pptx
- 机器学习(MATLAB版)ch05-k近邻算法 教学课件.pptx
- 机器学习(MATLAB版)ch06-支持向量机 教学课件.pptx
- 机器学习(MATLAB版)ch07-人工神经网络 教学课件.pptx
- 机器学习(MATLAB版)ch08-线性判别分析 教学课件.pptx
- 机器学习(MATLAB版)ch09-主成分分析法 教学课件.pptx
- 机器学习(MATLAB版)ch10-聚类 教学课件.pptx
- 机器学习(MATLAB版)ch11-EM算法与高斯混合聚类 教学课件.pptx
- 金融信贷及行业相关知识正误判断测试试卷.docx
- 2024-2025学年祁门县五年级数学第二学期期末达标检测试题含答案.doc
- 糖医帮认证考试题库及参考答案.pdf
- 2024-2025学年齐齐哈尔市铁锋区小升初考试数学试卷含解析.doc
- 中国农业银行信贷业务多领域知识要点测试试卷.docx
- 2024-2025学年祁县小升初数学检测卷含解析.doc
- 2024-2025学年奇台县五年级数学第二学期期末考试模拟试题含答案.doc
- 石化信贷等多行业项目风险审查要点及政策标准试卷.docx
- 2024-2025学年启东市四下数学期末复习检测模拟试题含解析.doc
- 个人住房及消费贷款相关知识要点测试试卷.docx
文档评论(0)