网站大量收购独家精品文档,联系QQ:2885784924

基于人机交互的统计翻译方法.pptxVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1基于人机交互的统计翻译方法

2提纲1.简介2.基于人机交互的统计翻译方法3.实验结果及分析4.结论

提纲3实验结果及分析结论基于人机交互的统计翻译方法简介

简介4问题的提出Phrase-basedSMT采用短语精确匹配的策略数据稀疏问题严重,特别是长短语短语表中的大量短语无法得到充分利用我们的目标通过短语模糊匹配和人机交互,利用更多的短语,提高系统的翻译质量。

5简介Areyouheremeal-timeorout?Doyoueathereortogo?(1)(2)

提纲6简介01基于人机交互的统计翻译方法02实验结果及分析03结论04

短语模糊匹配7短语模糊匹配Dice系数编辑距离源语言句子扩展句子生成原始句子:扩展句子:未登录短语

扩展句子生成8两个问题:找到的相似短语是否能够提高句子的翻译质量?生成的新句子是否与原句语义相同?人机交互组合分类器

组合分类器设计——特征选择(1)9原则:扩展句子应该与原始句子非常接近,保证扩展句子的语义不会发生太大的变化。扩展句子的翻译应该与参考答案非常相似,与参考答案越接近,译文的BLEU得分就越高。未登录短语相似短语原始句子扩展句子参考译文扩展句子译文

组合分类器设计——特征选择(2)10特征说明解码器打分比值扩展句子译文与原始译文之间的解码器打分的比值未登录短语与相似短语的相似度相似程度包括:1.Dice系数2.编辑距离3.Overlap系数4.Jaccard系数5.长度比值扩展句子与原始句子的词性序列相似度扩展句子译文与参考译文的相似度

组合分类器设计——分类器训练11SVM工具:LIBSVM核函数:径向基函数(RadialBasisFunction,RBF)训练数据生成在训练语料上生成扩展句子BLEU打分提取特征

组合分类器设计——融合1201020304融合多个分类器结果的组合分类器在很多方面要优于参加组合的单个分类器多个参考答案可以训练多个分类器融合方法:投票规则(VoteRule)在测试语料上,将原始翻译结果作为参考答案

人机交互方法13短语模糊匹配采用了基于字符串的相似度,不能保证语义的一致性

人机交互方法14目的:选择语义保持不变的句子采用基于有限状态自动机的对话管理模型主要工作:设计系统的状态及状态转移函数系统输入状态的有限集合是初始状态终止状态的集合状态转移函数

基于FSA的对话管理模型15S0:初始状态S1:对用户提问S2:跳转到下一条短语S3:输出对应翻译Sg:终止状态S1?S2S1?S3S1?SgS1?S1状态集状态转移函数

基于FSA的对话管理模型16

人机交互流程图17

提纲1804030102简介基于人机交互的统计翻译方法实验结果及分析结论

实验结果及分析(1)19实验数据统计任务训练集开发集测试集短语长度限制短语表规模SMT07275,882句489句489句724.3M,394,910条SMT08321,770句764句507句10420M,4,420,370条在IWSLT2007及IWSLT2008BTEC中英文本翻译任务上进行了实验

实验结果及分析(2)20实验结果BLEU得分比较PBMT:我们实验室开发的基于短语的统计翻译系统IMT:基于人机交互的翻译系统系统SMT07SMT08PBMT0.37500.3543IMT0.38040.3624

实验结果及分析(3)21人机交互数据统计任务SMT07SMT08句子总数489507交互句子数201191总交互次数315313平均交互次数1.571.64交互成功句子3924

提纲22简介基于人机交互的统计翻译方法实验结果及分析结论

结论23利用短语模糊匹配生成扩展句子利用组合分类器判断句子的翻译质量是否有提高利用人机交互选择语义相同的短语下一步工作:分类器特征选择对话管理模块的改善

24谢谢!

文档评论(0)

shao12345 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档