- 1、本文档共29页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 源于光通信中锐度的衰减 * * 对于汉语而言,STIPA同样能够反映包括扩声系统在内的语言传输通道上各种干扰因素对语音清晰度的影响。STIPA与语音清晰度之间有着良好的一致性。 * * 语音清晰度的客观评测 中国传媒大学 传播声学研究所 章斯宇 2010.5.21 主要内容 1 语音清晰度评测的发展概况 2 混响作用下STIPA与清晰度的关系 3 噪声环境下STIPA与清晰度的关系 4 总结与展望 1. 语音清晰度的评测 语音的清晰度或可懂度是音质评价的重要指标—反映厅堂或扩声系统的声音传输质量 主观评价: 组织测试队伍实地测试(articulation test) 优点: 直接、真实 缺点: 耗费人力物力 GB-T 15508-1995 《声学 语言清晰度测试方法》 《 语音清晰度的客观评价方法 STI %ALcon AI 主观 测试 尽可能反映真实的清晰度水平 清晰度指数 AI (Articulation Index) French Steinberg(1947),Fletcher(1953), Kryter(1962) 1) 测量或估计语言频谱和听音人处的噪声有效掩蔽谱计算得到各频带的“有效信噪比”; 2) 对各频带信噪比进行线性转化至[0,1]得“贡献值”; 3) 基于不同频带对清晰度的贡献率加权平均得AI; ANSI Std. S3.5-1969\1986\1997 特点:特别适用于评价诸如噪声干扰、有限带通等频域失真引起的语音清晰度恶化程度,不能反映混响、回声或削峰等时域或非线性失真的影响。 辅音损失率 %ALcon (articulation loss of consonants) 能不能根据测量房间内的某些物理量估计语音清晰度? Knudsen(1932), Peutz(1971), Klein(1971) 根据大量的实地测量和清晰度主观评价测试的结果,Peutz发现%ALcon与房间的声学特性相关。 Peutz 公式(经验推导) D—听音处距声源的距离。单位m。 T60—混响时间(1400Hz)。单位s。 V—房间的体积。单位m3。 ɑ—校准值。针对不同水平的听者。1.5%~12.5%。 Dc—临界距离。单位m。 注意:SNR25dB; 单个无指向性的点声源(Q=1); Klein对Peutz公式的补充 当房间声学特性难以改善时,采用电声手段提高语音清晰度。 声源个数n;声源指向性因子Q; 虽然提高扬声器的Q值有助于改善语音清晰度,但Q值与清晰度之间是否成简单的线性关系并没有实际的实验数据支持。Jacob(1985)认为语音清晰度与Q并无直接的关联。 辅音损失率%ALcon的不足 根据实验结果的经验推导,物理基础不够; 对于信噪比低于25dB的情况估计不足,不能充分反映噪声和混响联合作用时的影响; 没有考虑早期反射声,单次回响的作用,且结果仅给出某个频带的清晰度水平,未考虑参数的频率特性的影响; Jacob(1985) Hougast Steeneken (1973\1980\1985) IEC Std. 60268-16 充分反映声传递系统性能质量的优劣 输入端: 说话人发音 语言传输指数STI (speech transmission index) 输出端: 听者耳朵 语言传输系统: 充分考虑传递过程中噪声、混响、回响、系统失真等各种干扰因素的影响 Black Box 调制转移函数MTF (modulation transfer function) 连续的语音可以看成一系列语音碎片(音位)的组合。音位又可以看成是发音器官对某种窄带噪声调制的结果。音位的时域包络中包含了所传递的信息。 传输过程中,噪声、混响、系统失真等会使得包络发生变化,从而导致清晰度恶化,利用MTF描述量化包络波动性能的变化程度。 MTF的计算 函数定义为声信号经传输后接收信号强度包络的调制度相对于原信号强度包络调制度的降低,它随调制频率不同而变化。 STI的计算 14种调制频率;7种倍频带噪声 作为测试信号 计算98个MTF结果 类似AI计算中的加权平均最终得STI [0,1] 根据房间脉冲响应可以直接计算MTF STI与语音清晰度 Steeneken (1980) 不论是噪声、带通限制、削峰、混响等干扰因素,STI与语音清晰度得分之间始终有着良好的一致性。 客观可测的物理参量STI能良好的反映和预测真实的语音清晰度水平。 语言传输指数STI的简化算法 限制条件: 无明显非线性失真;环境噪声无脉冲;混响时间频率特性平滑;宽带语言传输系统; 1)RASTI (Rapid STI or Room acoustic STI) 适用于
文档评论(0)