科技文档中数学表达式的结构分析与识别.docVIP

下载本文档

12
0
约5.88千字
约 9页
2017-03-03 发布于北京
举报
版权申诉

科技文档中数学表达式的结构分析与识别.doc

1、本文档共9页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

科技文档中数学表达式的结构分析与识别.doc

科技文档中数学表达式的结构分析与识别　　摘要：与科学技术相关的文档中，针对数学表达式的识别通常可分为字符的分割与结构的识别。文章在这一框架下讨论了数学表达式的识别，尤其是在表达式结构的分析上，采用了优化的基准线结构分析方法。实验结果表明，采用上述方法后，数学表达式的识别率得到了显著提高。　　关键词：数学表达式；识别；基准线；识别率　　中图分类号：TP391 文献标识码：A 文章编号：2095-1302（2016）11-00-03 　　0 引言　　数学作为自然科学的通用语言，在科技的发展中有着举足轻重的地位。而数学表达式作为重要的数学载体，在科学技术相关文档中有着广泛的应用。光学字符识别（Optical Character Recognition，OCR）系统能够高效准确地识别文档中的文字，但对数学表达式却一直无法取得较高的识别率[1]。与普通的文字相比，数学表达式在字符和结构等方面都具有其特殊性[2]。为了能够更加快捷方便地共享科技文档等信息，对数学表达式识别技术的研究就变得非常重要。　　数学表达式识别的本质是从图片格式的数学表达式得出其空间结构与逻辑含义。在实际处理的文档图像中，除数学表达式外，还有文本与图表等，因而表达式处理的第一步通常是表达式位置的定位[3-5]。将定位好的表达式中所包含的所有符号进行切割，并根据符号库进行相应的识别。识别符号之后，需研究符号间的空间关系及对应的逻辑含义[6，7]。最后将分析结果按照一定的格式输出，达到复用和易于传输的目的[8]。　　国际上对数学表达式的识别研究始于20世纪60年代，但直到90年代，相关研究才越来越受重视。回顾已有的结构分析方法，所谓的数学表达式结构分析法是指依据字符含义、字符大小及空间位置等信息从整体上确定各字符间的位置关系，相应得出数学表达式的结构信息。在最初阶段，Anderson提出使用自上而下的结构分析方法，但这种方法略显粗糙，只能识别一些简单的数学表达式。Lee提出了关系树结构分析方法和矩阵分析方法，Lee的方法能够处理很多稍显复杂的单行数学表达式，但对结构更加复杂的多行表达式识别效果并不好[9]。Okamoto在总结已有研究成果的基础上，综合运用自顶向下和自底向上这两种常用的方法，针对字符间的水平及垂直方向的位置关系，统一使用自顶向下的策略，从而将表达式划分成多个子表达式。对于略显复杂的上下标、包含等关系，则采用自底向上的分析方法[10]。Okamoto的分析方法取得了较为满意的识别率，但对矩阵等特殊类型结构的识别上，仍然无法得到满意的识别率。Ha提出使用具有一定层次结构的表达式树，通常使用表达式树的节点表示对象。在更进一步的划分中，规定整体的表达式使用根部节点代表，而简单对象和复合对象分别使用叶子节点和内部节点表示[11]。Fukuda提出以数学元件代表各个符号，并详细说明了所有元件的空间关系，之后按照位置关系判定表达式的结构。Winkler使用有向图描述数学表达式，字符以节点表示，字符间的关系则用Yuko，使用网络图表示数学表达式，使用相关的数学方法计算出符合条件的生成树，以其来代表数学表达式的空间分析结果[12]。该方法受个别字符识别错误的影响不大，且局部识别错误对整体的正确率影响不大。Dimitriadis规定了句法和语义准则，将空间位置关系比较繁杂的表达式依据语义准则划分为简洁的式子，而具体各组成单元间的简单关系则依据句法准则分析[13]。Zanibbi和Blostein采用基准线对数学表达式进行结构分析，通过创建基准线结构树（Baseline Structure Tree， BST）描述数学表达式的结构[14]。这种方法能够克服诸如方言等特殊符号的限制，提高了结构分析的准确率。　　本文在借鉴上述文献所提方法的基础上，对基准线结构法作了优化。本文所用的基线结构分析法中，采用过分割方法对数学表达式的字符进行分割，使用字符比较、特征点提取等手段完成对数学符号的识别；而在对数学表达式的结构进行解析时，采用基准线结构分析方法。完成字符识别和结构解析后，以Latex的形式输出最终的数学表达式解析结果。　　1 字符分割　　在字符分割这一阶段，通过一定的数字图像处理技术，将整体的数学表达式切分成多个字符块，然后进一步切分为独立的单一字符。分割作为后续工作的基础，必须进行正确的分割才能保证之后的识别具有较高的有效性。比较常见的数学表达式符号切割方法有投影分割法及连通域分割法。但由于数学表达式自身的特殊性，这些常规的切割方法应用于数学表达式时，识别率一般会降低。为了取得更高的识别率，常常先通过连通域分割法进行初步分割，提取特殊的包围结构类型的字符，然后通过投影分割法切割出更多的字符块。　　此外还需分析解决常见的字符粘