网站大量收购独家精品文档,联系QQ:2885784924

语音处理上如何逐渐减少对具体语料依赖.PDF

语音处理上如何逐渐减少对具体语料依赖.PDF

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Report of Phonetic Research 2009 语音处理上如何逐渐减少对具体语料的依赖? 曹剑芬 1 李健 2 (1 中国社会科学院 语言研究所,北京 100732;2 东芝(中国)有限公司 北京 100738) 文 摘:为寻找解决语音处理上对大量具体语料的依赖及其繁重处理问题的出路,该文首先通过对语音处理 的根本目标与语音技术的当前工艺的分析,指出了这种依赖性的根源。接着通过对语音多变的不可避免性与“声 学不变量”的相对性的阐述,说明语音的变化并非完全不可知,进而指出解决问题的关键在于充分认识语音变化 的规律性和在处理系统中综合利用这些规律。最后,提出一个解决策略,基本原则就是通过完善语料库建设来 促进知识与语料的有机结合,逐步以相对关系上的“声学不变量”来取代具体语料的作用。并对相关语料库的 建设提出了初步设想。 关键词:语音的多变性;声学不变量;语料库建设 中图分类号:TP 3 ;H017 当今的言语技术极大地依赖于对自然语料的统计处 让机械智能化,或者说让智能机械化,是人类长期奋斗 理,这种方法在一定程度上提高系统性能的同时,也给系 的一个远大目标,“芝麻开门”的古老传说就是那个时代的 统带来了沉重的处理负担以及其它的负面效应。于是,“如 典型代表。自古以来,人类为之奋斗不息。现代科技的发展、 何才能不需要那么大量的语料及其繁重处理”便成了必然 特别是计算机的问世,使得这个美好憧憬得以付诸实施。20 的问题。 多年前的那个创建使用人工智能、包括言语智能在内的“第 言语技术之所以会极大地依赖于自然语料,主要由于 五代计算机”的宏伟计划,就是全面付诸实施的典型。该项 人类对自身言语的运行机制还远远没有认识清楚,还没有真 目计划大约十年完成。可是,就在语音技术正处于发展高潮 正掌握由言语自然机制决定的语音的变化规律。所以,在合 中的1983年,方特,作为最老一代的言语工程师兼语音学家, 成上就不得不用相近的语料来体现复杂多变的音段信息和 却以他在这个领域40多年的理论和实践的积淀,做出了“当 相对局部的韵律信息。在识别上,也由于摸不到语音变化的 前最需要的与其说是第五代计算机,不如说是第五代语音学 规律,而主要采用一般信号处理的方法,任由计算机通过对 家” 的著名论断[1]。他敏锐地意识到言语技术的航道上存 海量语料“大海捞针”的法子来处理。而这一切,归根结底 在着知识壁垒的暗礁。现在看来,他的话是在当时语音技术 还是因为对自然语音的属性及其多变性缺乏正确的认识和 发展高潮中最最冷静的思考。到了1989年[2],他又进一步 有效的应对措施。 指出,“推动言语解码需要许多基本知识。单单计算机技术 自然言语既具有自然属性,又具有社会属性。生理和 不可能铺平这条道路。”因此,他一直强烈主张建立更好的、 声学属性是自然属性,我们看到的变化就是这些自然属性 具有言语交际链所有层面知识的模型,包括语言理论、言语 的变化;功能属性(如基本语义、表达焦点、韵律和篇章 产生和言语感知。方特的主张体现了真正的言语智能仿生的 结构、语用、情态,等等社会交际因素)是社会属性。自 观点,也就是人们熟知的创建理想的语言机器的远大目标。 然属性的种种变化主要都是由这些社会交际因素决定的。 根据这个长远目标,理想的语言机器不应该只满足于 通常,在我们进行言语处理时候,我们的目的明明是要机 模拟人类言语的浅表功能,而要着眼于模拟人类言语交际 器模拟自然言语的社会交际功能,但是,却只顾处理言语 过程的深层机制,即不仅仅是让机器模仿言语的

文档评论(0)

150****0990 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档