人工智能OCR技术的智能化管理应用研究.docx

人工智能OCR技术的智能化管理应用研究.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
? ? 人工智能OCR技术的智能化管理应用研究 ? ? 摘 要:当前工业发展背景下,企业管理环节表现出流程繁琐、数量较大等问题,光学字符识别(Optical Character Recognition,OCR)方法逐步得到行业内的认可与应用,此方法基于人工智能辅助算法可显著增强兼容表现。本文通过对OCR方法的识别过程、关键方法、研究思路等层面进行阐述,并探讨此技术在广电公司的应用状态。 Keys:人工智能;OCR ;智能化管理 人工智能简写为AI,是人类仿照人脑所搭建出的机器大脑,可以让机器仿真人脑情感、意识等[1]。尽管人工智能技术的发展应用和成熟十分艰难,但是该项技术已经逐步推广至各个研究领域中。AI的应用不单单有助于推动与之交叉学科的发展,并且AI所覆盖的领域十分众多,而OCR技术即为此领域中最为关键的技术之一[2]。 伴随当前信息化程度的不断加深,企业内部各项管理流程中涵盖了较多流程繁琐且技术难度较大的测定工作,初始发展阶段的计算机算法无法有效满足当前企业成长需要 [3-4]。举例来说,基于智能验真辅助支撑的评标专家体系,能够智能化辅助评标进程,显著降低人工审定的工作量,且提升了整体工作效率和准确性。OCR技术是增强企业采购精益化管理能力与专业水平的关键性技术举措,也是企业促进质量革新的重要竞争优势 [5-6]。 1 人工智能领域中的OCR技术 1.1 OCR识别技术 OCR也可称之为光学字符识别方法,着重针对导入的图像信息进行有效剖分解析,进一步获取文本数据的过程。该方法的使用领域十分广泛,其中涵盖文案、驾照、车牌等读取与处理工作。对于企业而言,判定OCR技术性能的优劣可通过系统的正确率、识别速率以及可靠性等层面。此技术的基本技术路线可参照图1所示,而对应的识别过程可参见图2。 图1 OCR技术路线图例 图2 OCR识别流程 由于企业内发票的种类以及颜色等并非是统一的,而是具有明显差异,因此本次分析首先阐述分类流程,明确发票的类别和形式;之后以增值税发票为例,基于二次分割法增强图像数据信息,并矫正票面的斜度值,下图3是借助于AlexNet所训练出的辨识结果。 图3 OCR识别结果实例 1.2 OCR发展现状 传统的OCR识别方法在辨识复杂场景中所包含的文字时误判率较高,更多研究人员在探索怎样在复杂场景下保障识别准确率,该流程也可称之为场景文本识别。 1.3 OCR识别的关键技术 (1)数字化:此流程是OCR识别的前提条件,即借助于扫描设备或者相机将文件转换成数字图像的流程; (2)预处理:基本内容囊括文字定位、图像矫正等环节。二值化是把获取到的图像数据转变成单色,提升文本识别速率; (3)文字分隔:该过程将多行字符序列界定为单行,之后分割成单一字符,这也是识别环节保障正确率的关键; (4)特征提取:所划分的单个字符会由系统进行匹配,传统的提取技术包括结构分析、模板匹配等等,但是识别汉字往往错误率较高。引入深度学习算法可以较大程度确保文本识别效果。 1.4 OCR识别技术的功能 OCR 中还包含一种语音识别方法,即输入语言等音频信息来转变成文字信息。此系统内部集成有前端与后端语音分析处理,前者是对导入或者输入的音频信号作初始分析,保障整个语音周期的处理流程;后者是对说话人的语音作辨识,获取最佳识别结果。当前发展阶段,人工智能同各个领域、各个学科呈现出显著交融性特点,也是数字化与物联网发展的趋势所在。图4展示的是当前OCR技术的应用领域。 图4 OCR应用领域 1.5 OCR研究思路 (1)借助于OCR技术,并沿用现阶段数字化发展成果,确定整体的实施方略,为降低专家评审环节的工作量以及人工成本投入,提升审核效率做了支撑; (2)强化企业发展环节中数据信息模型的搭建与应用,按照评定环节中的各项工作要点,辨识证件的真伪,检索其中是否存在串标等违规活动; (3)借助于智能验定辅助系统的搭建,可以显著降低人力投入,如减少各类招标环节中各类文件的比对,提升系统的容错率水平。 整个研究可界定为以下三点: 首先是客观分智能求解,借助于NLP语义分析手段,对文件内所涵盖的资质、业绩等参量进行检索识别,具体可参见图5; 图5 客观分智能计算示意图 其次是投标文件自动定位系统,基于文本解析以及图像识别等手段,融合NLP语义分析工具,高效映射与之对应的评审因素项目,用于处理评审阶段无法有针对性定位的缺陷; 最后是智能辅助验定。基于OCR方法,有效采集获取文件内所包含的Keys句,搭建相应验定数据库,与后续获取的集合相互比对,智能显示数据真伪结果。相关结果可参见表1。 表1 客观分智能计算单元 所关联的客观分智能计算视图,如图6所示。 图6 客观分智能计算流程图例 1.6 应用案例 广东电网采用OCR识别技术可以有效处理前期人工智能的短

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

微软售前技术专家持证人

生命在于奋斗,技术在于分享!

领域认证该用户于2023年09月10日上传了微软售前技术专家

1亿VIP精品文档

相关文档