人工智能翻译的发展.pptVIP

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工智能翻译 付文青 14S101053 HIT 人工智能翻译的发展全文共19页,当前为第1页。 目录 机器翻译概述 1 机器翻译的原理及方法 2 理解语言,机器翻译的根本瓶颈 3 人工智能翻译的发展全文共19页,当前为第2页。 机器翻译 人工智能翻译的发展全文共19页,当前为第3页。 机器翻译的定义 机器翻译(Machine Translation),是使用电子计算机把一种自然语言(源语言,Source Language)翻译成另外一种自然语言(目标语言,Target Language)的一种学科。 这门新学科同时也是一门新技术,它涉及到语言学,计算机科学,数学等许多部门,是非常典型的多边缘交叉学科。 —在语言学中,机器翻译是计算语言学的研究领域 —在计算机科学中,机器翻译是人工智能的研究领域 —在数学中,机器翻译是数理逻辑和形式化方法的研究领域 人工智能翻译的发展全文共19页,当前为第4页。 机器翻译的方法 按转换层面划分 —直接翻译方法 —句法转换方法 —语义转换方法 —中间语言方法 按知识表示形式划分 —基于规则的方法 —基于实例的方法 —统计的方法 人工智能翻译的发展全文共19页,当前为第5页。 基于句法的统计机器翻译方法 基于统计的翻译方法是IBM的学者提出,可以归纳为三个重要部分,分别为语言模型的建模、翻译模型的建模以及解码三个子部分。 语言模型的建模问题是统计估计中的一个经典问题,即根据当前词预测下一个词。它是语音识别或光学字符识别的基础,同时也被用来进行拼写纠错、手写体识别以及统计机器翻译。 人工智能翻译的发展全文共19页,当前为第6页。 基于句法的统计机器翻译方法 基于短语的统计翻译方法的问题 ?泛化能力差 –中国大使馆、美国大使馆 →月球大使馆? ?产生的句子不符合语法 –短语的简单组合,没有句法结构 ?无法表示不连续的短语搭配的翻译 –召开了一次关于…的会议 hold a meeting on … ?无法进行长距离的语序调整 ?解决办法:引入句法结构! 人工智能翻译的发展全文共19页,当前为第7页。 基于句法的统计机器翻译方法 形式上基于句法的模型 –不使用任何语言学知识 –所有句法结构直接从未标注的语料库中自动学习得到 语言学上基于句法的模型 –使用语言学知识 –语言通常要从句法树库训练得到 ?树到串模型:只在源语言端使用语言知识 ?串到树模型:只在目标语言端使用语言知识 ?树到树模型:在源语言端和目标语言端都使用语言知识 人工智能翻译的发展全文共19页,当前为第8页。 基于句法的统计机器翻译方法 基于树到串对齐模板的翻译模型 ?基于树到串对齐模板(简称 TAT )的统计翻译模型是一种在源语言进行句法分析的基于语言学句法结构的统计翻译模型 ?树到串对齐模板既可以生成终结符也可以生成非终结符既可以执行局部重排序也可以执行全局重排序 ?从经过词语对齐和源语言句法分析的双语语料库上自底向上自动抽取 TAT 人工智能翻译的发展全文共19页,当前为第9页。 基于句法的统计机器翻译方法 解码 解码问题最重要的是如何设计合适的有哪些信誉好的足球投注网站策略来获得最佳翻译效果,以及如何解决空间爆炸问题,为尽可能在有限的时间内找到最优解,必须采用启发式算法。最常用的有柱有哪些信誉好的足球投注网站算法、A*算法以及堆栈有哪些信誉好的足球投注网站算法。 人工智能翻译的发展全文共19页,当前为第10页。 基于句法的统计机器翻译方法 解码 ?自底向上 ?柱有哪些信誉好的足球投注网站( Beam Search ) ?对于每一棵子树,找到所有与其根节点匹配的 TAT ,计算其候选译文( Candidate ) ?候选译文( Candidate )的数据结构: –TAT 序列 –部分翻译结果 –累积的特征值 –累积的概率值 人工智能翻译的发展全文共19页,当前为第11页。 基于句法的统计机器翻译方法 柱有哪些信誉好的足球投注网站算法 采用宽度优先的方式构建有哪些信誉好的足球投注网站树,在有哪些信誉好的足球投注网站树的每层采用启发式函数对扩展的状态进行评分,通过剪枝选取N个最优的状态进行扩展 人工智能翻译的发展全文共19页,当前为第12页。 基于句法的统计机器翻译方法 剪枝策略 *假设合并 —汉语词位置相同 —最后两个英语词相同 —上一次翻译的汉语短语的最后一个词的位置相同 *柱状图剪枝 若假设栈中假设的数目超过设定的最大值,将假设栈中评分低的剪去 *阈值剪枝 设置栈中假设的最低概率值,当新假设小于阈值的时候进行剪枝 人工智能翻译的发展全文共19页,当前为第13页。 基于句法的统计机器翻译方法 人工智能翻译的发展全文共19页,当前为第14页。 机器

文档评论(0)

武松 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档