- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第13章_语音识别
实用语音识别研究中存在的几个主要问题: ①语音识别的一种重要应用是自然语言的识别和理解。 ②语音信息的变化很大。 ③语音的模糊性。 ④单个字母及单个词语发音时语音特性受上下文环境的影响,使相同字母有不同的语音特性。 ⑤环境的噪声和干扰对语音识别有严重的影响。 * 两个话筒分别输入语音和噪声相互抵消降噪。(怎么做到的呢?) * 采用欧式距离计算矢量间的距离 * * * * * 两个话筒分别输入语音和噪声相互抵消降噪。(怎么做到的呢?) * 两个话筒分别输入语音和噪声相互抵消降噪。(怎么做到的呢?) * 两个话筒分别输入语音和噪声相互抵消降噪。(怎么做到的呢?) * 两个话筒分别输入语音和噪声相互抵消降噪。(怎么做到的呢?) * 第13章 语音识别 13.1 概述 13.2 语音识别原理 13.3 动态时间规整(DTW) 第13章 语音识别 13.1 概述 语音识别的定义与应用 语音识别系统分类 语音识别方法分类 13.2 语音识别原理 13.3 动态时间规整(DTW) 语音识别的定义与应用 语音识别的定义 语音识别(Speech Recognition):主要指让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容。从而根据其信息,执行人的各种意图。 语音识别的应用 语音识别技术根据其属性,基本功能可归为两大类: 根据人本身的声纹特征来进行身份认证。 另一类是根据人发出特定的语音指令来进行命令控制。 由此引出的应用市场基本可以包括这几个方面:桌面应用、嵌入式应用、电话系统、Web应用以及特殊应用领域等。 语音识别的应用 1. 桌面应用即语音识别技术集成在PC机上的应用,不仅可以用语音识别来进行身份认证和编辑文本,而且可以通过听取和响应用户讲述的命令来运行程序并与操作系统实现交互。例如,Windows XP、Vista及Office 2007等都内嵌了语音识别功能,具有垄断优势。 2. 嵌入式应用嵌入式应用的范畴很广,需根据市场需求考虑不同的嵌入式硬件平台,如手持或移动通讯设备及家用电器的语音控制和内容输入。从目前的市场来看,嵌入式语音识别系统最大的市场主要是针对玩具、手机、车载GPS、MP3/MP4等。 语音识别的应用 3. 电话系统应用语音识别技术应用于企业自动语音服务,可以为企业提供一种智能化的并且相对安全的自动服务方式。主要包括,企业的用户服务中心(Call-Center),电话银行,股票交易,电子商务等应用领域,用户可以在电话中进行身份认证及菜单流程的快捷选择。 4.Web应用Web应用是把语音技术与Web应用结合,例如语音浏览器、语音有哪些信誉好的足球投注网站引擎、网上语音聊天室及语音网等。 5. 行业特殊应用领域语音识别技术可以为有关部门(国家安全、侦破等特殊领域)提供应用方案,帮助它们通过电话采集的语音进行自动的身份辨认,节省大量的人力,并大大提高工作效率和识别的成功率。 语音识别系统分类 1.按识别对象分类 孤立词、连接词、连续语音、语音理解、会话系统 孤立词:单字、单词或短语为发音单位,独立词条。要求输入每个词后要停顿。利用语音进行家电控制语音识别系统,开、关,提高音量等。 连接词: 十个数字连接而成的多位数字或连接词条。要求对每个词都清楚发音,一些连音现象开始出现。在电话、数据库查询和控制系统中用途广泛。 语音识别系统分类 1.按识别对象分类 连续语音:最自然的说话方式,是自然流利的连续语音输入,大量连音和变音出现。比较复杂、成本也高。 语音理解:在识别的基础上,用语言学知识来推断语音的含义。 会话系统:会话语言,不仅利用语法信息、而且要利用谈话话题、上下文文脉等对话环境的信息. 语音识别系统分类 2.按词汇量大小分类 词汇量:小 大 小词汇:1-20个词汇,如利用语音进行电话拨号 中词汇:20-1000个词汇,自动订飞机票 大词汇:1000个以上,把口述的一篇报告转换成文本 语音识别系统分类 3.按说话人的范围分类 说话人范围:小 大 单个特定讲话人:简单、识别率高,商品化的多属此种。 有限多讲话人: 通用性好、应用广、难度大,不易得到 讲话者无关: 高的识别率。 语音识别方法分类 1.模板匹配法 将输入语音的特征与模板参数进行比较,相似度最高者作为识别结果。用于特定人、小词汇和孤立词。 关键技术:动态时间规整算法(DTW) 不同时刻就算同一个人发同一个音的长度与不同,用DTW算法进行模板匹配,保证两模板间存在最大声学相似性。 2.随机模型法:隐马尔可夫模型(HMM) 使用HMM的概率参数来对似然函数进行估计与判决,从而得到结果。 3.概率语法分析法: 将“区别
您可能关注的文档
- 空中课堂修改.ppt
- 端午的鸭蛋优质课.ppt
- 稳占传播高地 打造品牌名片(修改).ppt
- 端午日.ppt,.ppt
- 端午节的由来详解.ppt
- 端午诗词赏析.ppt
- 端午飘粽香.ppt
- 端午节鸭蛋.ppt
- 端午节(许月超-南通纺织职业技术学院).ppt
- 竹韵古诗PPT.ppt
- 护理学相关知识复习测试卷共三套.doc
- 护理学相关知识复习试题含答案(3套).doc
- 2025届高考语文复习:补写句子 课件.pptx
- 气压带和风带对气候的影响(第1课时)(教学设计).docx
- 气压带和风带对气候影响教学设计2024-2025学年高中地理人教版(2019)选择性必修1.docx
- 《故都的秋》课件 2024-2025学年统编版高中语文必修上册.pptx
- 《屈原列传》课件 2024-2025学年统编版高中语文选择性必修中册.pptx
- 《巫溪家乡文化》课件-2024-2025学年高一语文同步备课课件(统编版必修上册).pptx
- 《苏武传》课件 2023-2024学年统编版高中语文选择性必修中册.pptx
- 郑州中控ZKTime8.3 WEB考勤软件培训文档.pptx
文档评论(0)