基于图像识别技术的手机单词听写软件的研究与开发-教育技术学专业论文.docx

基于图像识别技术的手机单词听写软件的研究与开发-教育技术学专业论文.docx

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
研究生优秀毕业论文西南交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。本学位论文属于1.必威体育官网网址口,在年解密后适用本授权书;2.不必威体育官网网址面使用本授权书。(请在以上方框内打“4)学位论文作者签名:曙指导老师签名:馏瓜、\VEt期:)卅j.j、..90日期:乃D【r.y.2I万方数据西南交通大学硕士学位论文主要工作(贡献)声明本人在学位论文中所做的主要工作如下:(1)分析归纳手机成像的特点和常见成像问题;结合手机自身的特点,分析手机光学字符识别技术。(2)研究并设计了适于手机设备的OCR的预处理、特征提取和识别算法。通过预处理中的图片压缩、灰度处理、二值化处理、方向矫正、字符分割和归一处理,将计算机难于处理的彩色图片转换为易于处理的二值图片;通过特征提取将二值图片转化为文本数据,降低数据量、剔除冗余信息;最后通过识别算法对特征信息进行识别。(3)对光照情况不同的两类图片设计了两种二值化方法:光照条件较好的普通图像采用简单快速的全局阀值OTSU算法;对光照条件复杂的低质量图片,采用较复杂耗时的局部二值化算法。对传统的局部二值化Bemsen算法进行改进:先使用传统算法计算阀值T1;再对高斯滤波后的图片用Bemsen算法计算阀值T2,结合前后的阀值重新计算新的阀值。(4)对结构特征和统计特征两类特征提取方案进行研究和对比,结合二者优缺点,确立了本文的特征提取方案,即提取粗网格特征和提取穿透特征,粗网格特征的鲁棒性好、识别率高,穿透特征易于获取,适合英文字符。使用Matlab软件仿真编程,证明了识别效果比单一特征的识别效果均有较大提高。(5)在识别阶段采用三层结构的BP神经网络算法,对网络节点数的选取办法进行改进,采用自适应学习速率算法,通过实验对比选取合适的期望误差。在Matlab上仿真实现了该算法,通过实验数据证明了算法的良好收敛速度和识别效果。(6)在Android环境下编程实现了中小学单词听写软件,将本文的研究内容应用于实际。对软件中OCR功能的识别识别效果进行分析,通过对比手动输入和自动识别方式,证明了软件在批量录入单词中的优势,总结了本软件的特点验证了理论的可行性和正确性。通过该应用软件将OCR技术和教育教学内容结合起来,推动了OCR技术在多平台多范围应用。本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。本人完全了解违反上述声明所引起的一切法律责任将由本人承担。学位论文作者签名:甥日期:别、.r.万方数据西南交通大学硕士研究生学位论文第l页摘要随着全球信息化进程加速,提高信息处理的效率已成为当务之急。伴随Android操作系统的普及和光学字符识别技术(OpticalCharacterRecognition,简称OCR)的研究,如何利用智能移动设备高效地录入文档信息己成为一个的热门问题。本文分析了手机成像的特点,研究了光学字符识别技术中的字符预处理、特征提取和分类识别算法。在字符预处理中依次对原图像进行了压缩、灰度处理、二值化处理、方向矫正、字符分割和归一化处理。对原图片使用双线性插值算法成比例压缩;采用OpenCV开放库的灰度权值进行灰度化;在二值化处理中对传统方法进行比较研究,针对不同图像设计了不同的二值化处理方法,并对传统Bemsen算法进行改进,对原图片和高斯滤波后的图片分别用Bemsen算法计算,用求得的两个阀值重新计算新的阀值。采用平滑游程算法和细化处理对倾斜图片进行校正;利用水平投影和垂直投影方法分割图片字符;最后采用双线性插值法将每个字符图片归一为2436px。对结构特征和统计特征的两类提取方法进行研究,确立了本文的特征提取方案:提取54个粗网格特征向量和20个穿透特征向量,并合并写入特征文件。采用三层BP神经网络算法识别字符。为了提高算法效率,本文对网络节点数的选取办法进行改进最后在Matlab软件中对神经网络进行仿真实验,读取特征文件并分类识别,通过实验结果验证了该算法的可行性。结合对手机光学字符识别的研究和中小学英语单词听写的需求,本文在Android环境下设计实现了中小学生单词听写软件。软件主要分为图像识别、单词听写和系统功能三部分,听写可以选择手机听写和纸张听写。该应用通过OCR技术实现从手机图片到文本的转换,利用语音合成技术实现从文本到语音的转换。单词听写软件能够直接从图片中识别英文单词并朗读听写

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档