- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
武汉大学模式识别复习提纲概要
考试事项及复习提纲考试时间及地点:本周日(12月1号),(8:50—11:25)2-4节,在1区教三楼3-102 题目类型:满分100分6道简答+6道计算复习范围:09年试题+10年考试试题 2、课本例题(附章节和页面) 3、中科院考博题库题目透视:09年和10年试题预览: 题目+答案一 、简答题 1 简述模式识别系统的构成。2 简述机器学习方法中随机训练、成批训练和在线训练的区别。3 简述隐马尔可夫模型的三个核心问题。4 简述基于贝叶斯分类器的分类系统产生的最终分类误差的来源。5 简单列举出三种度量距离的方法。6 具有d个输入单元、n个隐单元、c个输出单元以及偏置的一个标准三层反向传播网,网络中有多少权值?最大似然方法与Bayes估计的差异答案:1、系统构成: 信息获取是指通过传感器将光或声音等信息转化为计算机可以处理的电信息;预处理包括A\D,二值化,图象的平滑,变换,增强,恢复,滤波等, 主要指图象处理;特征提取和选择是把测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征的过程;分类器设计的主要功能是通过训练确定判决规则,使按此类判决规则分类时,错误率最低;分类决策是在特征空间中对被识别对象进行分类。随机训练:模式是随机的从训练集中提取的,网络权值也根据不同的模式进行更新,训练数据可认为是一个随机变量;成批训练:所有的模式在训练前全部送往网络中;在线训练:每种模式只提供一次,不需要存储器来保存模式,当训练数据很多或者当内存消耗大而无法存储数据时,常采用在线训练。 隐马尔可夫模型的三个核心问题:估值:HMM的转移概率已知,计算这个模型产生一个特定观测值的概率;解码:已知一个HMM和一个它所产生的观测序列,确定产生该观测序列最有可能的隐状态序列;学习:只知一个HMM的大致结构,其转移概率都未知。如何从一组可见符号的序列中,决定这些参数简述基于贝叶斯分类器的分类系统产生的最终分类误差的来源:贝叶斯误差:由于不同的类条件概率密度函数之间的互相重叠引起的固有误差,无法消除;模型误差: 选择不正确的模型所导致的分类误差;估计误差: 采用有限样本进行估计带来的误差。简单列举出三种度量距离的方法:绝对值距离: 欧几里德距离: 切比雪夫距离: 明考夫斯基距离:具有d个输入单元、n个隐单元、c个输出单元以及偏置的一个标准三层反向传播网,网络中有多少权值?每个输入单元对应n个隐单元:d*n每个隐单元对应c个输出单元:n*c偏置单元连到每个隐单元和输出单元:n+c 一共 d*n+n*c+n+c个权值最大似然方法与Bayes估计的差异 :最大似然估计就是把待估的参数看做是确定性的量,只是其取值未知。最佳估计就是使得产生以观测到的样本的概率最大的那个值。Bayes估计则是把待估计的参数看成是符合某种先验概率分布的随机变量。对样本进行观测的过程,就是把先验概率密度转化成后验概率密度的过程,这样就利用样本的信息修正了对参数的初始估计值。二、1 (54页,12题)设为类别状态,对所有的,有。(a)证明(b)证明对于最小误差判定规则,平均误差概率为2、(116页,2题)令x具有均匀分布的概率密度:(1) 假设n个样本点都独立地服从,证明对于的最大似然估计就是D中的最大值点max[D].(2) 假设n=5个样本点是从这个分布中抽取的,并且有=0.6.画出区间0≤≤1上的似然函数。并且解释为什么此时不需要知道其余4个点的值。b) 当n=5时,由以上可知=,,因此当时就可以得到,不需要知道其余四个值。 3、应用题:计算两类问题中二维数据的贝叶斯判决边界,并绘出判决边界的图形。假设两类分布的先验概率相等。w1的样本为(2,6),(3,4),(3,8),(4,6),w2的样本为(0,3),(1,-2),(2,-4),(5,-2)。2.考虑下面的二维空间的3-类别问题:w1w2w3x1x2x1x2x1x2100510280-1005-525-25510-4画出用最近邻规则区分的决策边界。计算样本均值m1,m2和m3。在同一张图上,画出如果把样本归类为与之最接近的样本最值的那个类时的判定边界。 3.用伪逆矩阵构造线性分类器,分类两类二维点,并给出图示结果。4. 假设在某个局部地区细胞识别正常和异常两类的先验概率分别为:正常状态:异常状态:现有一待识别的细胞,其观察值为,从类条件概率密度分布曲线上查得并且已知试对该细胞用以下两种方法进行分类:①基于最小错误率的贝叶斯决策;②基于最小风险的贝叶斯决策。请分析两种分类结果的异同及原因。5.令:下面给出了3种划分:1)2)3)(a) 找出误差平方和最小的划分;(b) 找出行列式准则最小的划分。由
您可能关注的文档
- 人体解剖生理学 运动系统 第一节 骨(4、四肢骨).ppt
- 欧盟商标授权许可合同范本.docx
- 人如何感知环境的.ppt
- 欧洲的宗教改革.pptx
- 欧美卡通地球PPT模板.pptx
- 人体解剖学-循环系统-多动图.ppt
- 欧美文学史.doc
- 人工关节置换后不同磨损颗粒对全身多系统的影响.doc
- 人体的基本构成单位——系统 器官 组织 细胞.ppt
- 人教版-生物-高二-必修三第一章-第二节-内环境稳态的重要性.ppt
- 2024-2030年中国高智能微机变频控制柜项目申请报告.docx
- 2024-2030年中国高速齿轮箱行业需求趋势及投资战略研究报告.docx
- 2024-2030年中国风电运维行业发展环境分析及十三五规划研究报告.docx
- 2024-2030年中国预装式箱式变电站行业深度调研及发展规划研究报告.docx
- 2024-2030年中国频普分析仪行业运营模式及发展潜力研究报告版.docx
- 领导者的影响力与说服力培训课件.pptx
- 2024-2030年中国高空带电作业车行业发展环境分析及投资运作模式研究报告.docx
- 2024-2030年中国飞机电缆行业发展前景规划分析报告.docx
- 2024-2030年中国雷尼酸四乙酯行业当前经济形势及投资建议研究报告.docx
- 2024-2030年中国高压型液化气压缩机资金申请报告.docx
文档评论(0)