- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
模式识别基本概念模式识别(PatternRecognition):确定一个样本的类别属性(模式类)的过程,即把某一样本归属于多个类型中的某个类型。样本(Sample):一个具体的研究(客观)对象。如患者,某人写的一个汉字,一幅图片等。模式(Pattern):对客体(研究对象)特征的描述(定量的或结构的描述),是取自客观世界的某一样本的测量值的集合(或综合)。特征(Features):能描述模式特性的量(测量值)。在统计模式识别方法中,通常用一个矢量表示,称之为特征矢量,记为模式类(Class):具有某些共同特性的模式的集合。第5页,共16页,星期六,2024年,5月模式识别系统一个典型的模式识别系统由下图所示的结构框图组成,一般由数据获取,预处理,特征提取选择、分类决策及分类器设计五部分组成。分类器设计在训练过程中完成,利用样本进行训练,确定分类器的具体参数。而分类决策在识别过程中起作用,对待识别的样本进行分类决策。第6页,共16页,星期六,2024年,5月模式识别系统数据采集特征提取改进分类识别规则二次特征提取与选择训练样本改进采集提取方法改进特征提取与选择制定改进分类识别规则人工干预正确率测试数据采集特征提取二次特征提取与选择分类识别待识对象识别结果第7页,共16页,星期六,2024年,5月范例木板图象512×512d=3长度纹理亮度c=2松木\桦木维数无限有限/很大R有限d不大cdR无限模式采集模式空间特征提取/选择类型空间分类特征空间客观世界待识别对象识别过程错误概率检测制定分类的判决规则特征提取/选择方法校正学习过程采集方法校正已知对象预处理模式识别过程第8页,共16页,星期六,2024年,5月特征矢量和特征空间特征矢量:设一个研究对像的n个特征量测量值分别为X1,X2....Xn,我们将它们作为一个整体来考虑,让它们构成一个n维特征矢量特征空间:各种不同取值的特征矢量的全体构成了n维特征空间。第9页,共16页,星期六,2024年,5月随机矢量的描述随机矢量:在模式识别过程中,要对许多具体对象进行测量,以获得许多次观测值。每次观测值不一定相同,所以对许多对象而言,各个特征分量都是随机变量,即许多对象的特征向量在n维空间中呈随机性分布,称为随机矢量。随机矢量的分布函数:设为随机矢量,为确定性矢量。随机矢量的联合概率分布函数定义为:式中表示括号中事件同时发生的概率。第10页,共16页,星期六,2024年,5月聚类分析(ClusteringAnalysis)一、聚类分析的基本思想★相似的归为一类。★模式相似性的度量和聚类算法。★无监督分类(Unsupervised)。二、特征量的类型★物理量----(重量、长度、速度)★次序量----(等级、技能、学识)★名义量----(性别、状态、种类)三、方法的有效性取决于分类算法和特征点分布情况的匹配。第11页,共16页,星期六,2024年,5月聚类过程遵循的基本步骤三、聚类准则(clusteringcriterion)以蕴涵在数据集中类的类型为基础二、近邻测度(proximitymeasure)定量测定两特征如何“相似”或“不相似”一、特征选择(featureselection)尽可能多地包含任务关心的信息第12页,共16页,星期六,2024年,5月聚类过程遵循的基本步骤六、结果判定(interpretationoftheresults)由专家用其他方法判定结果的正确性五、结果验证(validationoftheresults)常用逼近检验验证聚类结果的正确性四、聚类算法(clusteringalgorithm)按近邻测度和聚类准则揭示数据集的聚类结构第13页,共16页,星期六,2024年,5月聚类应用的四个基本方向一、减少数据许多时候,当数据量N很大时,会使数据处理变得很费力。因此可使用聚类分析的方法将数据分成几组可判断的聚类m(mN)来处理,每一个类可当作独立实体来对待。从这个角度看
文档评论(0)