- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于广义置信度的样本选择算法-中文信息学报
第 2 1 卷 第 3 期 中文信息学报 Vol . 2 1 , No . 3
2007 年 5 月 J OU RN AL O F C H IN ESE IN FO RMA T ION PROCESSIN G May , 2007
文章编号 : (2007) 030 10605
基于广义置信度的样本选择算法
任俊玲
(北京信息工程学院 计算机信息系统系 ,北京 100 10 1)
摘 要 : 对模式识别系统而言 ,不同的训练样本在建立模式类模型时所起的作用不同 ,因此必须对训练样本进行选
择 。而在训练样本中 ,边界样本的判定方式以及训练样本中包含边界样本数量的多少对分类的精度起主要作用 。
为此 ,结合基于模板匹配的脱机手写汉字识别 ,定义了一种通过广义置信度判定边界样本的方法 ,并且在此基础上
建立了基于广义置信度的训练样本选择算法 。通过在脱机手写汉字数据库 HCL 2004 上进行实验 , 由该算法选择
出的训练样本集在训练样本数减少的同时 ,使得系统识别率有了较大的提高 ,从而证实了该算法的有效性 。
关键词 : 人工智能 ;模式识别 ;广义置信度 ;样本选择 ;手写汉字识别 ; HCL 2004
中图分类号 : TP39 1 文献标识码 : A
A Pattern Selection Algorithm Based on the General ized Conf idence
R EN J unling
(Beij ing Information Technology In stit ut e , Beij ing 100 10 1 China)
Abstract : In t he p rocess of t raining , some p att ern s are indi sp en sable becau se t hey describe t he charact eri stic of t he
class , but ot her p att ern s are di sp en sable . Sometimes , wit h t hese p att ern s t he sy st em p erformance even get s wor se .
So it i s necessary to select t he t raining p att ern s and find a more rep resent ative p att ern sub set . In t hi s p ap er , a defi
nition of t he boundary p att ern s based on t he generalized confidence i s given , and a new algorit hm of p att ern selection
i s founded on t hi s definition . Accor ding to t he exp eriment s on t he offline handwritt en Chinese charact er dat abase
HCL 2004 , t he p att ern sub set select ed by t hese algorit hm s have less p att ern s t han t he original set , but t he syst em
p erformance ba sed on t he sub set i s imp rove
文档评论(0)