- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
基于深度学习的印刷体文档字符识别的研究
?
?
徐长英赖伟财陈英
摘?要:针对传统基于模板匹配光学识别效果存在不理想的状态,提出改进的深度学习模型的印刷体文档字符识别算法。首先,生成包括一级字库、部分二级字库、英文大小写字母和标点符号的图片数据集,其数量大约为500万张;然后,在Lenet?5网络模型的基础上进行改进和重新构造,提出一种增强型的深度学习模型Lenet?5Pro,该模型可提高印刷体文档的识别率;最后,对比实验结果表明,该模型可以更加有效地提高印刷体字符识别的准确率,其字符识别准确率达到98%以上。
关键词:印刷体字符识别;深度学习;图片数据集;Lenet?5Pro;字符增强;仿真分析
:TN911.73?34;TP391?????????文獻标识码:A?????????:1004?373X(2020)23?0072?04
Abstract:Inviewoftheunsatisfactoryeffectofthetraditionalopticalrecognitionbasedontemplatematching,aprinteddocumentcharacterrecognitionalgorithmbasedonimproveddeeplearningmodelisproposed.Apicturedatasetincludingthefirst?levelfontlibrary,partofthesecondaryfontlibrary,Englishupperandlowercaseletters,andpunctuationmarksisgenerated,inwhichabout5millionpiecesofpicturesarecollected.AnenhanceddeeplearningmodelLenet?5Pro,bywhichtherecognitionrateofprinteddocumentscanbeimproved,isproposedbasedontheimprovementandreconstructionofLenet?5networkmodel.Thecomparativeexperimentalresultsshowthattheaccuracyofcharacterrecognitioncanbeimprovedbytheproposedmodel,anditscharacterrecognitionaccuracyisover98%.
Keywords:printeddocumentcharacterrecognition;deeplearning;imagedataset;Lenet?5Pro;characterenhancement;simulationanalysis
0?引?言
印刷体文档字符识别是光学字符识别(OpticalCharacterRecognition,OCR)技术的重要组成部分,印刷体文档的识别基本用途是把图片输入计算机,计算机输出识别字符,实现人与计算机信息的交互。文献[1]利用卷积神经网络构建了印刷体汉字识别模型,使用集成了传统OCR识别技术的MODI(MicrosoftOfficeDocumentImaging)进行身份证汉字识别。文献[2]提出了一种基于深度信念网络融合模型对手写汉字识别的方法,简单的汉字使用基于SVM(SupportVectorMachine)的二次判别函数分类器识别,使用深度信念网络模型处理较为复杂的汉字图像。文献[3]使用基于神经网络反馈的方法对所提取的文本行基于像素点进行判断而进行二值化,结合垂直投影方法对字符切分,提高OCR识别率。文献[4]提出了一种无分割的端到端神经模型,用于离线光学字符识别,结合卷积神经网络(ConvolutionalNeuralNetwork,CNN)和长期短期记忆(LongShortTermMemory,LSTM)复发网络,使用CNN进行特征提取,并使用堆叠的双向LSTM进行序列建模。文献[5]提出了一种基于前馈人工神经网络(ArtificialNeuralNetwork,ANN)的OCR算法,使用神经网络训练的对象特征数据集改进基于OCR的车牌识别技术。文献[6]提出了STN?OCR,以半监督方式从自然图像中
您可能关注的文档
- 上半中国空调器出口情况分析.docx
- 中国煤炭博物馆旅游体验的思考.docx
- 分析老年患者消化内科护理的安全隐患与对策.docx
- 建筑给排水工程常见施工质量问题及控制对策.docx
- 关于对污水处理BOT投资模式经济风险的分析.docx
- 高中英语阅读教学探究.docx
- 企业财务风险管理中内部审计的作用分析.docx
- 急性结石性胆囊炎的手术治疗体会及临床观察.docx
- 园林园艺施工与养护管理技术应用分析.docx
- 力系统运行中电气自动化技术的应用策略.docx
- GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs).pdf
- 中国国家标准 GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs).pdf
- 《GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs)》.pdf
- GB/T 39560.302-2024电子电气产品中某些物质的测定 第3-2部分:燃烧-离子色谱法(C-IC)筛选聚合物和电子件中的氟、氯和溴.pdf
- 中国国家标准 GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样.pdf
- 中国国家标准 GB/T 39560.302-2024电子电气产品中某些物质的测定 第3-2部分:燃烧-离子色谱法(C-IC)筛选聚合物和电子件中的氟、氯和溴.pdf
- GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样.pdf
- 《GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样》.pdf
- 《GB/T 39560.303-2024电子电气产品中某些物质的测定 第3-3部分:配有热裂解/热脱附的气相色谱-质谱法(Py/TD-GC-MS)筛选聚合物中的多溴联苯、多溴二苯醚和邻苯二甲酸酯》.pdf
- 中国国家标准 GB/T 39560.303-2024电子电气产品中某些物质的测定 第3-3部分:配有热裂解/热脱附的气相色谱-质谱法(Py/TD-GC-MS)筛选聚合物中的多溴联苯、多溴二苯醚和邻苯二甲酸酯.pdf
最近下载
- 老年冠心病慢病管理指南(2023版)解读PPT课件.pptx VIP
- ISO14001:2015环境管理手册.pdf
- 少先队活动课《我爱国旗》(课件)-小学生主题班会三年级.pptx
- 01-03 医院信息系统升级方案(昆医二院-Cache2010+HIS 7.0升级到Cache2016+HIS P8.0P).docx
- 3D打印技术--英文1.ppt
- 一次性使用医疗用品管理.pptx VIP
- 喘病的护理常规ppt.pptx
- 非简并态微扰能量三级修正波函数二级修正论稿.doc
- 第一单元 第三节 常用的栽培技术 课件 云南教育出版社劳技八年级上册.ppt
- 经济学基础(高鸿业第三版)课后习题答案.pdf VIP
文档评论(0)