- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 人机通信-语音识别原理
语音信号处理
7.1 语音识别技术概述
Speech Signal Processing 词汇量:大(500词数)、中(100词数500)、
小(词数小于100)
说话人关系:有关、无关
长春工业大学图像工程研究所
有无噪声:有、无-鲁棒性(Robustness)语音识别
史东承教授
讲话方式:孤立词、连接词和连续语音三种识别方式。
dcshi@mail.ccut.edu.cn
识别任务:内容识别,听写系统,声音检索,声控命令、自
然语言对话系统,身份识别,说话人证实,说话人辨别识。
2010.8
识别目的
• 孤立词(Isolated Word Recogination, IWR) :每
次说一词或一个组词或一条让机器识别的命令。 身份识别需回答
1.讲话人身份证实(Speaker Verification,SV)-
• 连接词(Connected Word Recogination, CWR):一 识别结果为Yes或No。
般指由0-9十个数字连接成的多为连续数字。应用
2.说话人辨识(Speaker Identification,SI)-从N
于通过电话进行数据库查询及操作控制系统。 个对象中确定某个对象。
• 连续语音识别(Continuous Speech Recogination, 语音内容识别-确认声音对应的符号(文字或数字)
CSR):指说话人以日常自然方式讲话. 1.孤立字或词识别(待识别的每个字或词间有停顿)
• 特定人识别(Speaker Dependent,SD):专人使用 2.句子或词组识别(待识别的语音为句子或者词组)
• 非指定人识别(Speaker Independent, SI):针对任 3.连续语音识别(待识别的语音为连续的讲话声音)
何人的系统。 4.语音理解(正确识别讲话者讲话的含义)
1
语音识别技术主要应用
• 信用卡认证:
• 语音识别:口语-文本(文语)转换, 商业机构收到信用卡 电话 向发卡机关
文档评论(0)