网站大量收购独家精品文档,联系QQ:2885784924

深度学习案例教程 教案1.4 深度学习的应用领域-语音识别.docx

深度学习案例教程 教案1.4 深度学习的应用领域-语音识别.docx

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

1-04深度学习的应用领域-语音识别

(p15)同学们,大家好。接下来我们开始学习第四节,深度学习的应用领域。

深度学习作为一种重要的人工智能技术,在各个领域都有广泛的应用,在计算机视觉领域,可以进行图像识别、目标监测、人脸识别等任务,也可以为自动驾驶、安防监控、医学影像分析提供强大支持。在自然语言处理领域,能够实现机器翻译、文本生成、情感分析。

应用于智能助理、社交媒体分析、智能客服等场景。

(p16)下面我们来介绍一下深度学习的一个重要的领域-语音识别。语音识别是一门交叉学科。它需要用到数字信号处理,模式识别等方法,还涉及到概率论等理论知识,随着深度学习的发展,也让语音识别有了很大幅度的提升。

具体的应用场景有很多,(1)比如说我们打一个10086智能客服,跟他说帮我查一下话费余额,这个时候,模型将会把我们的声音识别成文字,然后提取相关信息了解我们的需求,然后去数据库中查询我们的话费余额。(2)还有常见的行车导航软件,它通过语音合成技术为司机进行道路指引,播报路况信息,甚至可以选择自己喜欢的声音,比如可以选择一个明星的声音来帮我们进行语音播报。(3)还有像我们的智能家居系统。通过语音识别以及合成技术,让我们和智能家具进行交流,通过“嘴”来控制家具的运行。大大提高了我们的生活质量。(4)再比如说,学生也可以通过一些智能语音系统来学习,可以跟着他读单词、读句子,学习语言,大大的提高了学习效果。

(p17)下面我们简单介绍一下深度学习中,如何进行语音识别。

首先,因为声波是一种信号,具体我们可以将其称为音频信号。

原始的音频信号通常由于人类发声器官或者语音采集设备所带来的静音片段、混叠、噪声、高次谐波失真等因素,一定程度上会对语音信号质量产生影响。所以在正式使用声学模型进行语音识别之前,我们必须对音频信号进行预处理和特征提取。

最初始的预处理工作就是静音切除,也叫语音激活检测(VoiceActivityDetection,VAD)或者语音边界检测。目的是从音频信号流里识别和消除长时间的静音片段,在截取出来的有效片段上进行后续处理会很大程度上降低静音片段带来的干扰。除此之外,还有许多其他的音频预处理技术,大家可以找来信号处理相关的资料进行阅读。

然后就是特征提取工作。音频信号中通常包含着非常丰富的特征参数,不同的特征向量表征着不同的声学意义,从音频信号中选择有效的音频表征的过程就是语音特征提取。常用的语音特征包括线性预测倒谱系数(LPCC)和梅尔频率倒谱系数(MFCC),其中LPCC特征是根据声管模型建立的特征参数,是对声道响应的特征表征。而MFCC特征是基于人的听觉特征提取出来的特征参数,是对人耳听觉的特征表征。所以,在对音频信号进行特征提取时通常使用MFCC特征。

以上就是深度学习中语音识别的领域的介绍。

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档