- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自动化科学与技术〔杨宜民〕第5章
自动化科学与技术 第五章 模式识别 * * 第五章 模式识别 杨宜民 研究生示范课程课件 5.1 模式识别及其进展 5.1.1 模式识别的定义 模式识别的定义:模式识别又称为模式信息处理,是一门研究用计算机对通常由人类感觉器官接受的图像、图形、表格、文字、语音等的模式信息进行处理、描述和分类的学科。 5.1.2 模式识别方法的研究进展 模式识别是基于统计方法而发展起来的。上世纪60年代,研究者们提出了以贝叶斯(Bayes)决策为基础的特征空间划分的分类器法,以K均值聚类为代表的聚类法和以K-L变换为基础的特征选择法。 上世纪70年代、80年代,虽然句法模式识别和模糊识别方面有了许多新思想,但统计方法依然有生命力。到了90年代,主要研究“统计与句法相结合、句法与语义相结合”的模式识别方法。把语义作为属性引入,形成属性文法,可反映模式属性,通过语义规则降低文法中句法规则的复杂性,则可提高识别率。 利用人工智能中的一些问题求解方法,如知识获取和表达、语义网络与产生式系统、框架和脚本(Script)、数据库和知识库等,正形成一类基于知识的模式识别法。 5.2 机器视觉(计算机视觉) 5.2.1 马尔视觉计算理论 1982年美国麻省理工学院的马尔(Marr)教授创立了“视觉计算理论”。 马尔视觉计算理论认为,视觉的识别过程分为三个阶段。第一阶段是初始简图(Primal Sketch),其目的是把二维图像中的边界、顶角、交边等重要信息表达清楚;第二阶段是“二维半计算”(2.5d Sketch),描述出景物的三维可见表面,可称为“早期视觉”;第三阶段是三维景物的恢复与识别,这需要增加约束和利用经验知识。 5.2.2 机器视觉简介 1.机器视觉的组成及原理 机器视觉的结构框图如图5.1所示。图像输入与数字化通常由CCD(Charge Coupling Device)摄像头(即机器视觉硬件)来完成。预处理的主要工作是图像的去噪声与信号增强。识别和理解是机器视觉研究中最主要的两大内容。图像识别除需一些算法外,有时还需要经验知识。图像理解主要是靠经验、知识来完成,因此系统中往往要加入知识库。 图5.1 机器视觉的组成 2.一些常用的概念 图像的种类:黑白图像(灰度图像)和彩色图像。 图像分割:指把关注的物体与背景分开来。 几种颜色空间:RBG、XYZ、YIQ、HIS。 颜色空间的转换。 5.2.3 立体视觉 立体视觉指的是从不同位置摄取二幅或二幅以上的图像,并恢复三维信息,即完成三维物体识别、理解。可见,立体视觉可以由二台或者二台以上的CCD所组成,也可以由一台移动的CCD来完成。 立体视觉要解决的问题: 1)抽取二幅图像的特征; 2)寻找二幅图像特征点的对应; 3)可视面的二维半恢复。 图像特征提取常用方法:Kalman滤波法、小波分析法、多尺度法。特征点对应可采用人为标志及内极线法、标记法、松弛法等处理技术。所谓二维半恢复就是根据二幅图对应点来恢复这些可见点、面的三维坐标,有时要用到经验、知识。 在机器人视觉中,摄像机定标指的是摄像机初始位置、方向、光轴中心、尺度因子等未知的参数的确定与校准。目前已提出多种摄像机定标算法。 立体视觉是本学科当前研究热点和方向之一。 5.2.4 移动视觉 移动视觉能获取一系列的动态图像。动态系列图像分析就是通过对运动景物的图像序列分析、研究图像分割、运动参数估计及恢复三维景物的结构参数等。目前常用的是光流法和特征点匹配法。光流法主要通过图像三维速度场恢复三维运动参数及物体结构参数。特征点匹配法主要通过特征点对应求取运动参数和结构参数。 单目移动视觉沿较大曲率半径的曲线方向运动时,获取的动态序列图像可用于立体景物的识别与理解,此时单目移动视觉可以看成立体视觉。但图像三维恢复是不完全的,结构参数和速度矢量中总有一个不能确定的常数因子。此时需要增加附加条件:已知某点的三维坐标或已知物体中一条边长(或增加一台摄像机)。 单目移动视觉沿近似直线方向运动(如高空摄影)时,获取的动态序列图像不能用于景物的立体恢复。此时单目移动视觉的作用是扩大视觉的观察范围。 移动视觉的另一作用是用于动态目标的跟踪。 移动视觉是本学科当前另一研究热点和方向。 5.2.5 文本识别与分析 文本识别与分析主要是利用计算机来阅读和处理各种文本、传真、电报、印章、签字等,是实现办公自动化不可缺少的重要技术。 由于汉字类别数太多(要解决4000类的分类)、字体有多种,特别是手写体字形千变万化,这给自动汉字识别带来了相当的困难。一个有效途径是把已有的
您可能关注的文档
- 答题说明:1、请根据4个条件中的关键词进行联系2、以提示.ppt
- 第四讲Struts2表现层技术.ppt
- 第四章轴心受力构件2.ppt
- 筹到创业启动资金的4大妙招.ppt
- 第六章胚胎工程1定.ppt
- 第四讲·数学一轮课件·2008年全品高考复习方案.ppt
- 筹码运用技巧-突破底部单峰密集3.ppt
- 第四章XML文档类型定义1.ppt
- 简单3视图的绘制.ppt
- 算法初步—高级语言程序设计—课件—北京工业大学—03.ppt
- [中央]2023年中国电子学会招聘应届生笔试历年参考题库附带答案详解.docx
- [吉安]2023年江西吉安市青原区总工会招聘协理员笔试历年参考题库附带答案详解.docx
- [中央]中华预防医学会科普信息部工作人员招聘笔试历年参考题库附带答案详解.docx
- [保定]河北保定市第二医院招聘工作人员49人笔试历年参考题库附带答案详解.docx
- [南通]江苏南通市崇川区人民法院招聘专职人民调解员10人笔试历年参考题库附带答案详解.docx
- [厦门]2023年福建厦门市机关事务管理局非在编工作人员招聘笔试历年参考题库附带答案详解.docx
- [三明]2023年福建三明市尤溪县招聘小学幼儿园新任教师79人笔试历年参考题库附带答案详解.docx
- [哈尔滨]2023年黑龙江哈尔滨市木兰县调配事业单位工作人员笔试历年参考题库附带答案详解.docx
- [上海]2023年上海市气象局所属事业单位招聘笔试历年参考题库附带答案详解.docx
- [台州]2023年浙江台州椒江区招聘中小学教师40人笔试历年参考题库附带答案详解.docx
最近下载
- 中国智能运维行业市场调查研究及投资潜力预测报告.docx
- 高职单招英语试卷高职单招英语试卷.doc
- 2023苏教版科学六年级下册教学计划、教学设计及教学总结(含目录)平铺式.docx VIP
- 《肖邦E大调夜曲 - Nocturne op 9 no 2》古典吉他谱.pdf
- 标准图集-20S515-钢筋混凝土及砖砌排水检查井.pdf VIP
- 统编版语文三年级下册第三单元教材解读解读与集体备课课件.pptx
- AI+行业应用研究报告:AI+办公.pptx VIP
- 苏教版二年级下册科学教学计划.pdf
- 《磁铁的秘密》幼儿园大班科学PPT课件.ppt VIP
- 2025顺德农商银行小微客户经理校园招聘笔试模拟试题及答案解析.docx
文档评论(0)