- 1、本文档共33页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1CS 35. 040L 71SJ备案号:23323-2008中华人民共和国电子行业标准SJ/T 11380—-2008自动声纹识别(说话人识别)技术规范Technology specification for automatic voiceprint recognition (speakerrecognition)2008-03-10 发布2008-03-10实施中华人民共和国信息产业部发布SJ11200
SJ/T 11380—2008目次前言1 范围.2 规范性引用文件。专量专中营中心心心合#心3 术语与定义4数据交换格式4.1概述..4.2通用操作.4.3语音操作..8量业量门中中中中电中电心eeeeeeop94.4模型与模型集操作.4.5声纹模型训练..9中·中#中中中中中手华中.104.6声纹确认4.7声纹辨认104.8声纹检出..11114.9声纹追踪.#中办中心 (规范性附录)VPR-API v1.0 函数定义...13附录 A
SJ/T 11380—2008言前请注意本标准的某些内容有可能涉及专利。本标准的发布机构不应承担识别这些专利的责任。本标准的附录A是规范性附录。本标准由全国信息技术标准化技术委员会归口。本标准由北京得意音通技术有限责任公司、清华大学智能技术与系统国家重点实验室(语音技术中心)、中国电子技术标准化研究所负责起草。本标准主要起草人:郑方、宋战江、徐明星、吴畏、邓菁、吴志刚。II
SJ/T 11380--2008自动声纹识别(说话人识别)技术规范1范围本标准规定了声纹识别(系统)的术语与定义、数据交换格式与应用编程接口(VPR-API1.0)。本标准适用于各种计算机、网络和智能设备配置的声纹识别系统。2规范性引用文件下列文件中的条款通过本标准的引用而成为标准的察款,凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修还版均不适用手本标难,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的必威体育精装版版本。凡是不注日期的引用文件,其最薪版本适用于本标准。GB12200.1-1990汉语信息处理词汇 01部分:基本术语C语言文字规范=汉语拼音方案的通用键盘表示规范GF 3006-2001店M3 术语与定义.下列术语和定义适用于本标准。3.1声纹识别的基本概念3.1.1声纹voiceprint特征,以及基于这些特征(参数)所建立的语音模对语音中所蕴含的、能表征和标识说话人的语音特B型的总称。3.1.2L声纹特征vaioeprint feature说话人特征 speaker featureGa从说话人的语音中所提取出来的、可以表征该说话人语音的个性特征的参数。注:常用的特征参数包括频谱(spectrum)、倒频谱(cepstrum)、线性预测系数(LpC)鲁高(pitch)、声调(tone)、共振峰(formant)、音质(voice,qality)声韵(prasody)、习语(phoneme/word idiolect)等各种层次的信L息。3.1.3声纹模型voiceprint model说话人模型speaker model对声纹特征进行描述的数学模型。注:常用的数学模型有:高斯混合模型(Gaussian mixture model),基于通用背景模型的高斯混合模型(Gaussianmixture model-universal background model),隐马尔可夫模型(hidden Markov model),人工神经网络(artificial neural network),支持向量机(support vector machine)等。通常,一个声纹模型对应一名说话人,但一名说话人可以有多个声纹模型,以对应各种不同的应用环境或声纹信息层次,如一名说话人可以在不同的信道条件下有不同的声纹模型。3.1.4声纹模型训练 voiceprint model training说话人模型训练speaker model training1
SJ/T 11380—2008说话人注册speaker enrollment从说话人的语音提取声纹特征并根据声纹特征估计其声纹模型的参数的过程。注:说话人一旦经过声纹训练并把其声纹模型的模型参数记录下来,即可在将来用于与未知说话人的语音进行声纹比对,从而辩认或确认该段语音所对应的说话人的身份。在不致混淆的情况下,该术语可简称为“声纹训练”或“说话人训练“3.1.5声纹模型自适应 voiceprint model adaptation说话人模型自适应speaker model adaptation利用新采集到的语音数据对其已有声纹模型的参数进行重新估计的过程。注:对已经建立声纹模型的说话人,当其年龄、情绪、说话环境等发生变化时原声纹模型的参数可能无法很好地
您可能关注的文档
- SY 6602-2004海底电缆地震数据采集系统.pdf
- NY_T 2207-2012轮式拖拉机能效等级评价.pdf
- QB 1040-1991指针式石英钟用转子磁钢.pdf
- YDT 1095-2008通信用不间断电源(UPS).pdf
- SN_T 3701.5-2014进口旧机电产品检验技术要求 第5部分:石料、陶瓷、混凝土、石棉水泥或类似矿物材料的加工机床.pdf
- SJ_T 11487-2015半绝缘半导体晶片电阻率的无接触测量方法.pdf
- SY_T 5835-2011压裂用井口球阀.pdf
- WS 364.12-2011卫生信息数据元值域代码 第12部分:计划与干预.pdf
- TB 2891-1998电气化铁道并联电容器静态型高次谐波过流保护技术条件.pdf
- SJ_T 11421-2010GNSS测量型接收设备通用规范.pdf
- 北京市东城区2023_2024学年七年级上学期期末历史模拟试题(含答案).pdf
- 冀教版六年级上册期末终结性测试数学试卷(含答案解析) .pdf
- 人教版八年级上册数学期末考试卷及答案【全面】 .pdf
- 仁济学院基础医学专业《药理学》科目期末试卷A(有答案) .pdf
- 北师大版六年级数学上册第二单元测试题 .pdf
- 人教版四年级数学下册全册知识点 .pdf
- 人教版数学小学四年级下册重点题型专项练习附完整答案(考点梳理)优质完整版.pdf
- 人教版小学语文1-6年级的古诗词及日积月累 .pdf
- 初三数学北京门头沟区2023~2024学年度第一学期期末检测试题(教师版).pdf
- 初二下册物理试题及参考答案 .pdf
最近下载
- 北京百师联盟信息技术研究院.doc
- 2.6《观察与比较》教学设计-2024-2025学年一年级上册科学教科版.docx VIP
- 人教版道德与法治二年级上册《这些是大家的》课件.pptx
- 中国特色大国外交和推动构建人类命运共同体.pptx
- 《产品质量鉴定程序规范 总则》.doc VIP
- 七年级数学(沪教版)上册课件-【第2课时 添括号】.pptx
- The Catcher int heRye麦田守望者英文版.doc
- 农药登记残留试验待测残留物和植物源性食品膳食风险评估残留物目录(2020版).docx
- 甲醇羰基化法制备醋酸.pptx
- 超星网课尔雅《走近核科学技术》超星尔雅答案2023章节测验答案.pdf
文档评论(0)