版面分析中表格和图形的鉴别.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
版面分析中表格与图形的鉴别 % ! ! 卜飞宇 刘长松 丁晓青 %(中国科学院软件研究所,北京 %, ) !(清华大学电子工程系智能技术与系统国家重点实验室,北京 %,# ) : -./012 345617489:;6;=$66$1?@A40$6B4$:? 摘 要 在版面分析过程中,有时会将表格误判为图形或将图形误判为表格。为避免对误判的表格或图形进行识别而产 生的错误结果,文章提出了一种根据表格框线信息和表格单元信息来区分表格与图形的方法。该方法结合表格的结构特 征,提出了作为一个表格的重要组成要素的表格框线和表格单元所必须满足的若干约束条件,通过验证每个条件是否得 到满足来区分表格与图形。实验表明,该方法能有效地区分绝大多数表格与图形,极大地降低了对表格与图形的误判率。 关键词 版面分析 表格 图形 表格框线 表格单元 ’( 文章编号 ( ) 文献标识码 中图分类号 %!.,++%. !# %!.,+.C D EF+G% !#$%’#( )*+,-# ./01 2/*3(4# % 5*60’$ 7%*,6## 8’ 9-6’: 5’ ;(*%#0% !% =*0% %( , , ) H?146 95 I95J0;6 ’A1?66 D:0B6/7 95 I:16?:6 K61L1?@ %, !( , I06 M67 N039;09;7 95 H?6221@6? E6:A?929@7 0?B I76/ -26:;9?1: -?@1?66;1?@ O6P0;/6? , , ) E1?@A40 Q?1=6;17 K61L1?@ %,# : , 7+#$/*4$ E0326 /07 36 ;606B 0 @;0PA1: 0?B @;0PA1: /07 36 ;606B 0 0326 37 /10R6 95 20794 0?0271$H? , 9;B6; 9 0=91B A1 R1?B 95 6;;9; A1 P0P6; P;66? 0 /6A9B 9 B11?@41A 0326 5;9/ @;0PA1: 306B 9? A6 ;4:S , 4;02 :9?;01?6B 1?59;/019? 95 0326 5;0/6 21?6 0?B :622$D::9;B1?@ 9 A6 ;4:4;6 95 0 0326 9/6 ?6:60;7 ;6;1:S 19? A0 /4 36 01516B 37 022 5;0/6 21?6 0?B :622 1? 0 0326 0;6 P;66?6B 1? A1 P0P6;$D?B J6 =6;157 022 A66 ;6;1:19? 9 B11?@41A 0326 5;9/ @;0PA1:$-TP6;1/6? A9J A0 A1 /6A9B 1 6556:1=6$ : , , , , , ?-6@0/A# N0794

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档