盲人阅读器解读.ppt

下载文档 降价啦

26
0
约1.3千字
约 9页
2017-04-06 发布于湖北
举报
版权申诉
保障服务

盲人阅读器解读.ppt

1、本文档共9页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

吴玉章学院 07级创新班导师：罗代升教授成员：杨俊勇罗佳卢维张智本项目是基于OCR（Optical Character Recognition光学字符识别）的文字自动识别技术。首先将需要处理的文本进行扫描，然后对载有文字信息的图像进行预处理，特征提取，文字匹配等操作，将其含有的文字信息提取出来，转化为编码文字并保存在计算机上，再通过与语音字库相比较，将存储的语音信息通过音频播放出来，最终将文本信息通过音频传送给盲人，实现盲人阅读器的功能。目的：设计研制OCR盲人阅读器，用于盲人阅读报刊杂志等。意义：自动化、智能化、快速方便地为广大盲人克服阅读障碍。研究现状： 1.美国 Sungwoo Park设计的语音朗读笔(Voice Stick)； 2.清华大学自动化系研制成功的“盲文点字显示器”可使盲人自由地阅读电脑中的文字。 OCR文字识别： 1.扫描采集文本图像； 2.图像预处理及增强图像质量（平滑去噪、滤波、矫形、增强对比度等）； 3.文字字符处理（行字切分、二值化、倾斜校正、细化提取、字符分割等）； 4.文字特征提取（点阵特征、笔画特征、部首特征等）； 5.字符匹配识别（初步采用相关识别与模版匹配）； 6.输出识别结果。文字语音播放： 1.接收文字识别结果； 2.调用语音字库，进行单词匹配； 3.播放匹配结果的音频，即将文字信息朗读出来；系统实现： 1.采用可变焦摄像头采集视频图像； 2.利用计算机仿真研究OCR识别； 3.利用耳机将识别结果语音播放； 4.仿真成功后进行软件移植工作，使其工作在便携式OCR盲人阅读器上。创新： 1.目前国内尚无此类OCR盲人阅读器； 2.具有可移植性，可以在便携设备上使用。难点： 1.图像采集质量； 2.OCR识别的准确率。罗佳：光信息科学与技术，熟练掌握C，C++等编程语言，了解数据库技术。主要负责项目整体规划。杨俊勇：电子信息科学类，熟悉.NET框架下的C++编程，对数字图像处理有一定的基础。主要负责图像的输入与OCR文字识别处理。卢维：电子信息科学类，熟悉C，C++编程，对数据库知识有所了解，熟悉单片机开发。主要负责语音信息的对照与播放工作。张智：通信工程，熟悉MFC框架设计，对图像识别有所了解。主要负责应用程序以及盲人阅读器设备的设计。 1. 2009.6--2009.7：查阅相关文献资料，设计研究方案； 2. 2009.7--2009.8：选择购买摄像头、耳机等相关设备，进行图像采集工作； 3. 2009.8--2009.10：图像处理，字符处理、切分等研究； 4. 2009.10--2009.11：文字特征提取的研究； 5. 2009.12--2010.1：文字匹配识别的研究； 6. 2010.1--2010.2：语音合成以及播放的研究； 7. 2010.2--2010.4：系统的移植工作； 8. 2010.4--2010.6：完善改进OCR盲人阅读器。 * * * * * * * * * * * * * * * * * *