- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于视觉词组的图像高维索引结构的研究与实现.ppt
早期的研究主要关注图像检索地准确性 * 在基于文本块的字体识别方面,Yong等[3]采用Gabor滤波器提取字体特征,然后对其进行全局纹理分析,取得了较高的识别率。其后学者们[4-9]对此类方法做出改进,取得了新的进展。杨志华等[14,15]提出了一种基于经验模式分解(Empirical Mode Decomposition,EMD)的中文字体识别方法,该方法同样针对文本块进行识别。这种方法选择5个基本笔画特征来描述中文字体。对每一个给定的文本块计算笔画特征序列并且使用EMD进行分析,产生一个低维特征向量。最后,采用最小距离分类器识别字体。 基于单字符进行字体识别的代表方法是陈力等[10, 11] 提出的基于小波变换的方法。这种方法首先通过小波变换从字符图像中提取大量的小波特征,然后使用线性鉴别分析技术(Linear Discriminant Analysis,LDA) 选择与字体信息相关的特征,最后使用一种改进的二次鉴别函数(Modified Quadratic Discriminant Function,MQDF)分类器进行字体识别。其他使用小波方法进行字体识别的研究工作包括[12, 13]。Sun[16]利用汉字的笔画结构进行字体识别。这种方法自动提取单个字符的笔画部分,称为笔画模板(Stroke template)。相同字体的笔画模板被存储在字体数据库中。对于新输入的字符,将其笔画模板与字体数据库中的笔画模板一一比对,最后使用贝叶斯分类器决定最有可能的字体分类。王恺等[17]使用一种基于特征点的个体分析法来解决汉字字体识别问题。 * 性能,第二,是否提高了检索的速度,能够支持大规模数据量的图像检索。影响第二个性能的关键因素是索引的结构设计。 结合特征介绍已有的一些索引结构 * * * 借助骨架实现截取笔端的计算 * * * MFDCH取曲率直方图的低频部分 * * 特征笔端的提取 * * 王晓1,2,吕肖庆1,2,汤帜1,2 1 北京大学计算机科学技术研究所 2 数字出版技术国家重点实验室(北大方正集团有限公司) E-mail:Lvxiaoqing@pku.edu.cn * 背景及研究现状 笔端提取 笔端形状描述 字体相似性度量 实验与分析 总结 提纲 * 背景及研究现状 字体识别 文档电子化 光学字符识别(OCR) 版面分析、理解、恢复 新需求 厂商希望保护版权 设计师和用户“按形找字” 大规模集合上的字体识别 * 背景及研究现状 相关概念 输入 文本块图像 单字图像 输出 字体属性 字体名称:如方正剪纸、方正水黑 样式:正规、粗体、倾斜、粗斜等 * 背景及研究现状 字体识别方法的分类 文本相关 / 文本无关 基于文本块 / 基于单字 * 基于文本块 Gabor变换 笔画分布 基于单字符 小波变换 笔画模板 特征点 字体与笔端相似性 * 背景及研究现状 背景及研究现状 字体识别流程 * 多个汉字图像 字体特征笔端集合 待识别的单字图像 笔端提取 笔端描述 计算聚类中心 笔端与特征笔端间的相似度 字体识别结果 背景及研究现状 笔端提取 笔端形状描述 字体相似性度量 实验与分析 总结 提纲 * 笔端提取 笔端 笔画的起始与收尾 占笔画一定比例 点笔画和某些转折 如何精确计算 笔画起始与收尾 截断位置 截断方式 * 笔端提取 ? ? ? 笔画模板 (前人工作) 希望笔端 * ? ? 与形状相关的阈值 笔端提取 笔端与骨架的关系 笔端起始点 骨架端点 笔端截断点 骨架分叉点 * 借助骨架会有什么问题? 笔端提取 * 分叉与毛刺问题 笔端提取 * 笔端提取 笔画长宽比问题 * 笔端提取 动态计算长宽比(Stroke Aspect Ratio,SAR) * ? (a) (b) 笔端提取 取SAR=1时的截取效果 * 背景及研究现状 笔端提取 笔端形状描述 字体相似性度量 实验与分析 总结 提纲 * 笔端形状描述 笔端描述子的构造 基于基于多尺度曲率直方图的傅里叶描述子 ? ? ? ? ? ? … … * 笔端形状描述 * 背景及研究现状 笔端提取 笔端形状描述 字体相似性度量 实验与分析 总结 提纲 * 字体相似性度量 采用欧式距离计算特征相似度 采用支持向量机(SVM)进行训练与识别 * 背景及研究现状 笔端提取 笔端形状描述 字体相似性度量 实验与分析 总结 提纲 * 实验与分析 常用字体数据集 宋体、仿宋、黑体、楷体、隶书 正规、粗体、倾斜、粗斜 字号:18 扫描分辨率:1200dpi 参数设置 sar: 1 SDST 5个尺度,每个尺度100维 * 实验与分析 常用字体集合测试结果 五种方式划分测试集 ? 识别方法 测试文本块数
您可能关注的文档
- 县城初中仪器柜技术规格表-河南省政府采购网.doc
- 參考書籍.doc
- 双下肢使用弹力绷带预防剖宫产腰麻后低血压的临床观察万丽徐文平金.doc
- 双曲线型自然通风塔的外形,是双曲线的一部分绕其虚轴旋转所成的曲面.doc
- 双高铁-黄山、千岛湖【夜枕秀水】豪标纯玩四日(每周二)-莱芜山水旅行社.doc
- 双高铁-黄山三日游(天天发团).doc
- 反式脂肪TransFat.doc.doc
- 反渗透污染与清洗简介-新亚净化-华北工业水处理-工业水处理-天津工业.doc
- 反渗透膜清洗演示-石家庄华特伟业科技有限公司.ppt
- 发电机拆装试卷.doc-南京交通技师学院.doc
- 第二单元《第10课 循环结构——while循环》教学设计 -2023—2024学年浙教版(2020)初中信息技术八年级上册.docx
- 我为蔬菜洗洗澡 教案 通用版小学劳动.docx
- 2024-2025学年小学生道德判断力提升的德育教学设计.docx
- 2024-2025学年实事求是科学探究德育教学设计.docx
- 描述物体的位置(教学设计)-2024-2025学年人教版数学六年级上册.docx
- 2024-2025学年小学心理健康教育作品展示教学设计.docx
- 导言课 教学设计 2023-2024学年统编版七年级历史下册.docx
- 2024-2025学年实践活动与德育教学设计的融合.docx
- 2024-2025学年培养心理抗压能力的课程教学设计.docx
- 苏教版高中通用技术 必修2 2.2 流程的设计 (教案).docx
文档评论(0)