- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
FPGA代做-基于matlab的短时幅度谱估计在语音增强中的100ok
1 引言
1.1 课题背景
情感是人类进行交流时的最自然最直接的表现方式,是人类内心活动的真实表露。当前人类已经开始进入了信息化时代,用现代手段研究语音情感的识别技术,可以使人们能更加有效地判断说话人的情感强度,正确的判断说话人的心情。情感识别技术是计算机技术重要的发展方向,它已成为计算机在亿万百姓中普及的关键技术,并且必将成为信息产业的标志性技术和计算机的重要[1]。情感识别具有广泛的市场前景,它可应用于自动远程电话服务中心,及时发现客户的不满情绪;用于远程教学和婴儿教育,及时识别学生的情绪并做出适当的处理,从而提高教学教育质量;用于辅助临床精神分裂症的诊断和治疗;此外也可以用于刑事侦察中自动的检测犯罪嫌疑人的心理状态,辅助测谎,例如,说谎者常常会企图隐藏其真实的情感,如果能够自动识别其真实情感状态并同时设法发现其隐藏真实情感的企图,就能够判断出他是否在说谎或者在隐瞒某些事实。自动语音情感识别的研究,不但可以推动计算机技术的进一步发展,它也将大大提高人们的工作和学习效率,更高效地帮助人们解决问题,同时也将进一步丰富人类的生活,提高人们的生活质量。
1.2 国内外研究现状
情感是通过语音表达出来的,是因为语音中包含有能够体现情感特征的参数。人类情感的变化是通过情感特征参数的差异而体现出来的[2]。因此从语音信号中提取出这些能够反映情感的特征参数的研究,对于语音情感识别具有极为重要的意义。目前很多文献对如何提取语音中的情感特征参数做了大量的研究,主要在基频构造、对数能量构造、共振峰构造、语速等方面对情感语音加以不同的考虑。
情感信息处理已成为提高人机交互能力的一个重要研究课题,随着信息技术的高速发展,人类对计算机的依赖性的不断增强。多媒体计算机系统情感信息的研究越来越受到研究者的重视,分析情感特征、判断和模拟说话人的喜怒哀乐成为一个意义重大的研究课题之一。
目前,关于语音情感特征参数的研究正处在不断的深入之中,而其中语音的情感特征参数因为涉及到不同语种之间的差异,发展也有所不同[3]。
国外斯坦福大学的Reeves和Nass通过研究发现,在人机交互中需要解决的问题同人和人交流中是一致的,最关键的都是“情感智能”的能力。早在1972年,Williams发现人的情感变化对语音的基音轮廓有很大的影响,这是国外最早的语音情感方面的研究之一;1990年,麻省理工大学多媒体实验室构造了一个“情感编辑器”对外界各种情感信号进行采样,如人体的生理信号、脸部表情信号、语音信号来识别各种情感,并让机器对各种情感做出适当的反应;1996年,日本东京Seikei大学提出情感空间的概念并建立了语音情感模型;2000年,Maribor大学的Vladimir Hozjan研究了基于多种语言的语音情感识别。近两年,采用神经网络与隐马尔可夫模型为语音情感识别建模也取得一定的成功。
而在国内,情感识别发展的比较晚,但是经过了30多年的发展,我国的语音识别技术的研究水平已经基本上与国外同步。而且在汉语语音识别技术上,还有自己的特点与优势,并达到了国际先进水平。目前国内从事语音识别研究的机构包括:清华大学计算机科学与技术系,清华大学电子工程系,南京大学计算机系,上海交通大学,中科院自动化所,中科院声学所,哈尔滨工业大学等。在1998年的863测试评比中,清华大学电子工程系以王作英教授为首的课题组完成的汉语连续语音识别系统的字识别率达到90%以上。同时代表了目前国内的先进水平,在汉语小词表语音识别及应用方面,清华大学电子工程系以刘润生教授为首的课题组,已经推出了基于非特定人汉语数码语音识别的语音拨号电话机,并正在从事语音识别专用芯片的设计研究。2003年,北京科技大学信息工程学院提出基于BDI Agent技术的情感机器人语音识别技术研究方法;微软亚洲研究院,台湾的一些大学和研究所也进行该方面的研究;同时,国家自然科学基金委也立项资助哈工大进行心理紧张等情况下的Robust语音识别研究;2004年,东南大学赵力申请了关于语音信号中情感特征分析与建模的国家自然科学基金;近期,江苏大学计算机学院也启动的语音情感方面的研究。
1.3 研究价值及意义
研究价值:情感是人类进行交流时的最自然最直接的表现方式,是人类内心活动的真实表露。当前人类已经开始进入了信息化时代,用现代手段研究语音情感的识别技术,可以使人们从语音中自动识别说话者的情感状态,这种技术不但可以推动计算机技术的进一步发展,它也将大大提高人们的工作和学习效率,更高效地帮助人们解决问题,同时也将进一步丰富人类的生活,提高人们的生活质量。
研究意义:情感信息识别技术是信息社会朝着智能化和自动化方向发展的关键技术之一,具有重要的研究意义和实用价值。经过三十多年的艰苦探索和研究,情感信息识别技术研究获得了极大的发展,在不就的将
文档评论(0)