网站大量收购闲置独家精品文档,联系QQ:2885784924

如何使用丹青中英文文件辨别系统辨识文稿?..docVIP

如何使用丹青中英文文件辨别系统辨识文稿?..doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
如何使用丹青中英文文件辨别系统辨识文稿?..doc

典型问题对应 文档标题: 如何使用丹青中英文文件辨别系统辨识文稿? 前言 书面文档不容易保存和携带,很多用户通过扫描仪把书面文档转换成图像格式的电子文档,例如:JPEG、BMP和TIFF格式的文档,这些文档最大的缺点是不容易进行编辑。通过爱普生公司随机提供的丹青中英文文件辨别系统(以下简称:丹青软件)可以把图像格式的文档转换成可以编辑的文本格式,例如:Microsoft Word格式(扩展名是DOC)或写字板格式(扩展名是TXT)。本文详细说明此软件的使用方法。 注:丹青中英文文件辨别系统仅适用于Windows操作系统 操作步骤 准备工作: 1.将扫描仪或超一体机与电脑连接好,并正确安装扫描仪驱动程序(操作方法请参考随机提供的用户指南)。 2.安装丹青中英文文件辨识系统。爱普生部分扫描仪或超一体机随机捆绑了该软件,安装方法请参考该软件的帮助文件。 3.将需要识别的文档放置在扫描仪的扫描板上,并打开扫描仪或超一体机的电源。 开始扫描: 选择“开始”—“程序”启动“丹青中英文文件辨识系统”软件,选择“文件” -- “扫描仪设定”选项,选择你所安装的扫描仪或超一体机型号。在工具栏中选择“扫描”按钮,系统自动调用“EPSON Scan”扫描程序,如图(1); 图(1)工具栏中选择“扫描” 调用“EPSON Scan”默认为“全自动模式”,推荐使用“专业模式”进行扫描,如图(2); 图(2)使用“专业模式”进行设置 注:确保扫描文本的质量,避免出现以下内容: a.复印件的复印件、传真、手写字符; b.字符间距或行间距很小的文本;; c.表格中的文本或带下划线的文本; d.草体或斜体字体和8磅以下的字体; 扫描普通文稿时,可以将“文稿类型”设置为“反射文稿”;“自动曝光类型”设置为“文稿”;“图像类型”选择为“黑白”,并且“分辨率”设置在300dpi-600dpi 之间(“分辨率”是影响文字识别效果的主要设置),如图(3); 图(3)“分辨率”是影响文字识别效果的主要设置 注:建议普通的五号印刷体采用250--300dpi ;四号以上的字体采用150--200dpi;如果是六号或七号字,使用400--600dpi。若扫描原件是较为粗糙的纸张(如:报纸等),建议您使用600dpi左右的分辨率。 3. 点击“预览”会弹出预览框,将需要扫描的部分通过鼠标框选出来,如图(4); 如图(4)选择要扫描区域 4.适当调整“阀值”,使需要扫描的文字尽量清晰 (“阀值”是影响文字识别效果的主要设置),如图(5); 图(5) “阀值”是影响文字识别效果的主要设置 注:若纸张过薄,扫描结果可能显示出纸张背面内容,影响到文字识别的效果。出现此现象时,请适当减小阀值。.若扫描结果显示出文字颜色较浅,请适当增加阀值。 5.当一切设置完毕后,选择“扫描”。扫描仪会将扫描的图像导入到软件中去,扫描完成后选择“关闭”。 文稿调整: 文稿辨识前先校正倾斜角度,选择“编辑”-“旋转”选项(文稿角度不正将影响文字识别的效果),如图(6); 图(6)使用“旋转”校正倾斜角度 使用“橡皮擦”工具将图片中的杂点去掉,如图(7)。 图(7)使用“橡皮擦”去掉图片的杂点 注:由于丹青系统无法辨识黑底白字的图片,若输入的正是此类图片可利用“编辑”-“反白”的功能将图片转换成白底黑字之后再进行辨识。 文稿识别: 文档识别 (1)选择工具栏中的“版面设定”按钮设置文稿的版面,在“表格设定”中选择-“非表格文件”,“内容设定”中选择文档中所使用字符,如图(8); 图(8)在“版面设定”中设置 (2) 选择“版面分析”,软件自动完成版面分析后,请点击工具栏中的“辨识”,软件会按照相应设置来识别文字,如图(9); 图(9)“版面分析”后自动框出要识别区域 (3)选择“词库校对”,软件会根据软件词库中常见的词语搭配关系,分析整篇文章,自动校对并修改文稿中没有被正确识别的常见词语,如图(10); 图(10)使用“词库校对”将修改没有正确识别的常见词语 (4)如果使用“词库校对”功能依然无法识别某些文字,可选择“查看”-“文稿编辑模式”选项,手动校正文稿,如图(11); 图(11)使用“文稿编辑模式”选项手动校正文字 (5) 校对完毕,选择“保存”,并将保存类型设置为“MS Word文件格式” 或者“TXT文本格式”。保存好之后就可以直接通过Word 等软件的进行文字编辑了,如图(12)。 图(12)选择“保存”并将保存类型设置为MS Word文件格式 注:表格识别与文档识别的操作步骤基本相同,只在“版面设定”窗口中,“表格设定”选择“一般表格文件”,“内容设定”选择文档中所使用字符,如图(13)。 图(13)表格识别的“版面设定” 文稿扫描识别过程结束

文档评论(0)

phljianjian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档