基于深度神经网络的语音情感识别模型研究.pdf

基于深度神经网络的语音情感识别模型研究.pdf

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
重庆大学硕士学位论文 中文摘要 摘 要 语音情感识别是音频领域的热点研究内容,尤其是在智能课堂、智能驾驶和 智能医疗等人工智能交互领域中有广泛应用。语音情感识别旨在通过机器感知判 断,使机器能够捕捉人类声音中所传达的情感,进而灵活调整交互方案和实时决 策,达到更高程度的人机交互。 本文对语音情感识别的谱图表示和深度学习的相关方法进行了研究,其中语 音情感特征提取的充分性和情感识别的准确性是本文研究的重点。针对语音情感 特征提取过程繁琐且特征提取不充分的问题,本文采用多态频谱图与深度学习相 结合的方式进行端对端的学习,提高语音情感特征提取的充分性和有效性,实现 自动的特征提取过程。针对传统语音情感误识别率高、辨别度较低等问题,本文 提出语音情感多层次识别框架,该框架首先通过哈希算法计算得到高相似情感类 别,并采用以长短时记忆网络为基础的语音情感模型,生成时序语音情感特征向 量,并增加多采样率数据增强的方法来丰富原始样本,优化语音情感多层次识别 框架,进一步提高识别的精度。 本文的主要贡献包括: ①传统语音情感识别方法需要分别对声学参数进行提取并统计,提取过程繁 琐且提取的特征不充分。针对上述问题本文提出一种语音情感识别模型SMel-CNN, 该模型将语谱图和梅尔频谱图作为初始输入,然后同时提取时频域特征,最后将 时频域特征进行融合以提高语音特征提取的有效性,并实现自动语音情感特征提 取过程。实验证明本文提出的SMel-CNN 模型的有效性。 ②针对传统语音情感识别存在的误识别率高、情感相似性高等问题。本文提 出多层次语音情感识别框架ML-EM ,该框架采用哈希算法对语音情感类别进行相 似度计算,得到高相似度情感集合,并采用本文提出的时序模型SC-LSTM 对高相 似度情感进行识别。SC-LSTM 模型使用SMel-CNN 网络进行前期谱图的特征提取 并使用LSTM 网络进行后期的时序建模。实验证明 ML-EM 框架提高了语音情感 识别整体的辨别度和精确度。 ③本文设计并实现自动语音情感识别系统,提取语音段的语谱图和梅尔频谱 图作为特征提取模型的初始层,通过SMel-CNN 模型和SC-LSTM 模型分别进行特 征提取和识别,最终得到高精度识别结果。 关键词:语音情感识别;卷积神经网络;长短时记忆神经网络;深度学习 I 重庆大学硕士学位论文 英文摘要 Abstract Speech emotion recognition is a hot topic research in the audio field, especially in the field of artificial intelligence interaction. For example, it is widely applied in the fields of smart classroom, intelligent driving and smart healthcare. Speech emotion recognition aims to enable the machine to capture the emotions conveyed in human voice through the machines perceptual judgment, and then flexibly adjust the interaction scheme and real-time decision-making to achieve a higher degree of human-computer interaction. In this thesis, the spectrogram representation of speech

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档