基于视觉词组的图像高维索引结构的研究与实现.ppt

基于视觉词组的图像高维索引结构的研究与实现.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于视觉词组的图像高维索引结构的研究与实现.ppt

早期的研究主要关注图像检索地准确性 * 在基于文本块的字体识别方面,Yong等[3]采用Gabor滤波器提取字体特征,然后对其进行全局纹理分析,取得了较高的识别率。其后学者们[4-9]对此类方法做出改进,取得了新的进展。杨志华等[14,15]提出了一种基于经验模式分解(Empirical Mode Decomposition,EMD)的中文字体识别方法,该方法同样针对文本块进行识别。这种方法选择5个基本笔画特征来描述中文字体。对每一个给定的文本块计算笔画特征序列并且使用EMD进行分析,产生一个低维特征向量。最后,采用最小距离分类器识别字体。 基于单字符进行字体识别的代表方法是陈力等[10, 11] 提出的基于小波变换的方法。这种方法首先通过小波变换从字符图像中提取大量的小波特征,然后使用线性鉴别分析技术(Linear Discriminant Analysis,LDA) 选择与字体信息相关的特征,最后使用一种改进的二次鉴别函数(Modified Quadratic Discriminant Function,MQDF)分类器进行字体识别。其他使用小波方法进行字体识别的研究工作包括[12, 13]。Sun[16]利用汉字的笔画结构进行字体识别。这种方法自动提取单个字符的笔画部分,称为笔画模板(Stroke template)。相同字体的笔画模板被存储在字体数据库中。对于新输入的字符,将其笔画模板与字体数据库中的笔画模板一一比对,最后使用贝叶斯分类器决定最有可能的字体分类。王恺等[17]使用一种基于特征点的个体分析法来解决汉字字体识别问题。 * 性能,第二,是否提高了检索的速度,能够支持大规模数据量的图像检索。影响第二个性能的关键因素是索引的结构设计。 结合特征介绍已有的一些索引结构 * * * 借助骨架实现截取笔端的计算 * * * MFDCH取曲率直方图的低频部分 * * 特征笔端的提取 * * 王晓1,2,吕肖庆1,2,汤帜1,2 1 北京大学计算机科学技术研究所 2 数字出版技术国家重点实验室(北大方正集团有限公司) E-mail:Lvxiaoqing@pku.edu.cn * 背景及研究现状 笔端提取 笔端形状描述 字体相似性度量 实验与分析 总结 提纲 * 背景及研究现状 字体识别 文档电子化 光学字符识别(OCR) 版面分析、理解、恢复 新需求 厂商希望保护版权 设计师和用户“按形找字” 大规模集合上的字体识别 * 背景及研究现状 相关概念 输入 文本块图像 单字图像 输出 字体属性 字体名称:如方正剪纸、方正水黑 样式:正规、粗体、倾斜、粗斜等 * 背景及研究现状 字体识别方法的分类 文本相关 / 文本无关 基于文本块 / 基于单字 * 基于文本块 Gabor变换 笔画分布 基于单字符 小波变换 笔画模板 特征点 字体与笔端相似性 * 背景及研究现状 背景及研究现状 字体识别流程 * 多个汉字图像 字体特征笔端集合 待识别的单字图像 笔端提取 笔端描述 计算聚类中心 笔端与特征笔端间的相似度 字体识别结果 背景及研究现状 笔端提取 笔端形状描述 字体相似性度量 实验与分析 总结 提纲 * 笔端提取 笔端 笔画的起始与收尾 占笔画一定比例 点笔画和某些转折 如何精确计算 笔画起始与收尾 截断位置 截断方式 * 笔端提取 ? ? ? 笔画模板 (前人工作) 希望笔端 * ? ? 与形状相关的阈值 笔端提取 笔端与骨架的关系 笔端起始点 骨架端点 笔端截断点 骨架分叉点 * 借助骨架会有什么问题? 笔端提取 * 分叉与毛刺问题 笔端提取 * 笔端提取 笔画长宽比问题 * 笔端提取 动态计算长宽比(Stroke Aspect Ratio,SAR) * ? (a) (b) 笔端提取 取SAR=1时的截取效果 * 背景及研究现状 笔端提取 笔端形状描述 字体相似性度量 实验与分析 总结 提纲 * 笔端形状描述 笔端描述子的构造 基于基于多尺度曲率直方图的傅里叶描述子 ? ? ? ? ? ? … … * 笔端形状描述 * 背景及研究现状 笔端提取 笔端形状描述 字体相似性度量 实验与分析 总结 提纲 * 字体相似性度量 采用欧式距离计算特征相似度 采用支持向量机(SVM)进行训练与识别 * 背景及研究现状 笔端提取 笔端形状描述 字体相似性度量 实验与分析 总结 提纲 * 实验与分析 常用字体数据集 宋体、仿宋、黑体、楷体、隶书 正规、粗体、倾斜、粗斜 字号:18 扫描分辨率:1200dpi 参数设置 sar: 1 SDST 5个尺度,每个尺度100维 * 实验与分析 常用字体集合测试结果 五种方式划分测试集 ? 识别方法 测试文本块数

文档评论(0)

ailuojue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档