- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
吴玉章学院 07级创新班 导师:罗代升 教授 成员:杨俊勇 罗佳 卢维 张智 本项目是基于OCR(Optical Character Recognition光学字符识别)的文字自动识别技术。首先将需要处理的文本进行扫描,然后对载有文字信息的图像进行预处理,特征提取,文字匹配等操作,将其含有的文字信息提取出来,转化为编码文字并保存在计算机上,再通过与语音字库相比较,将存储的语音信息通过音频播放出来,最终将文本信息通过音频传送给盲人,实现盲人阅读器的功能。 目的:设计研制OCR盲人阅读器,用于盲人阅读报刊杂志等。 意义:自动化、智能化、快速方便地为广大盲人克服阅读障碍。 研究现状: 1.美国 Sungwoo Park设计的语音朗读笔(Voice Stick); 2.清华大学自动化系研制成功的“盲文点字显示器”可使盲人自由地阅读电脑中的文字。 OCR文字识别: 1.扫描采集文本图像; 2.图像预处理及增强图像质量(平滑去噪、滤波、矫形、增强对比度等); 3.文字字符处理(行字切分、二值化、倾斜校正、细化提取、字符分割等); 4.文字特征提取 (点阵特征、笔画特征、部首特征等); 5.字符匹配识别(初步采用相关识别与模版匹配); 6.输出识别结果。 文字语音播放: 1.接收文字识别结果; 2.调用语音字库,进行单词匹配; 3.播放匹配结果的音频,即将文字信息朗读出来; 系统实现: 1.采用可变焦摄像头采集视频图像; 2.利用计算机仿真研究OCR识别; 3.利用耳机将识别结果语音播放; 4.仿真成功后进行软件移植工作,使其工作在便携式OCR盲人阅读器上。 创新: 1.目前国内尚无此类OCR盲人阅读器; 2.具有可移植性,可以在便携设备上使用。 难点: 1.图像采集质量; 2.OCR识别的准确率。 罗佳:光信息科学与技术,熟练掌握C,C++等编程语言,了解数据库技术。主要负责项目整体规划。 杨俊勇:电子信息科学类,熟悉.NET框架下的C++编程,对数字图像处理有一定的基础。主要负责图像的输入与OCR文字识别处理。 卢维:电子信息科学类,熟悉C,C++编程,对数据库知识有所了解,熟悉单片机开发。主要负责语音信息的对照与播放工作。 张智:通信工程,熟悉MFC框架设计,对图像识别有所了解。主要负责应用程序以及盲人阅读器设备的设计。 1. 2009.6--2009.7:查阅相关文献资料,设计研究方案; 2. 2009.7--2009.8:选择购买摄像头、耳机等相关设备,进行图像采集工作; 3. 2009.8--2009.10:图像处理,字符处理、切分等研究; 4. 2009.10--2009.11:文字特征提取的研究; 5. 2009.12--2010.1:文字匹配识别的研究; 6. 2010.1--2010.2:语音合成以及播放的研究; 7. 2010.2--2010.4:系统的移植工作; 8. 2010.4--2010.6:完善改进OCR盲人阅读器。 * * * * * * * * * * * * * * * * * *
文档评论(0)