- 1、本文档共22页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号CN110459235A
(43)申请公布日2019.11.15
(21)申请号CN201910754409.5
(22)申请日2019.08.15
(71)申请人深圳乐信软件技术有限公司
地址518000广东省深圳市南山区粤海街道科苑南路3099号中国储能大厦第24层
(72)发明人雒航通
(74)专利代理机构北京品源专利代理有限公司
代理人孟金喆
(51)Int.CI
权利要求说明书说明书幅图
(54)发明名称
一种混响消除方法、装置、设备及
存储介质
(57)摘要
本发明实施例公开了一种混响消除
方法、装置、设备及存储介质,该方法包
括:获取语音信号;基于所述语音信号进
行时频分解得到听觉谱;基于所述听觉谱
提取第一MRCG特征;将所述第一MRCG
特征输入预先训练好的混响消除模型得到
第二MRCG特征;基于所述第二MRCG
特征通过语音变换得到消除混响后的语音
信号。本发明实施例提供的方法对于各种
混响程度的语音皆可达到良好的去混响效
果。
法律状态
法律状态公告日法律状态信息法律状态
发明专利申请公布后的驳回
IPC(主分类):G10L21/0208专利发明专利申请公布后
2022-12-02
申请号:2019107544095申请公布的驳回
日
权利要求说明书
1.一种混响消除方法,其特征在于,包括:
获取语音信号;
基于所述语音信号进行时频分解得到听觉谱;
基于所述听觉谱提取第一MRCG特征;
将所述第一MRCG特征输入预先训练好的混响消除模型得到第二MRCG特征;
基于所述第二MRCG特征通过语音变换得到消除混响后的语音信号。
2.根据权利要求1所述的混响消除方法,其特征在于,所述基于所述语音信号进行时
频分解得到听觉谱,包括:
选择听觉滤波器对所述语音信号进行滤波,得到滤波输出;
采用交叠分段的方法,以第一预设时间为帧长,第二预设时间为偏移量对每一个频率
通道的所述滤波输出做分帧加窗,得到输入信号的时频域表示,即时频单元;
根据所述时频单元计算听觉滤波器输出能量,得到听觉谱。
3.根据权利要求2所述的混响消除方法,其特征在于,所述听觉滤波器为Gammatone
听觉滤波器,其时域脉冲响应为:
其中,l为滤波器的阶数,b为滤波器的衰减因子,f为滤波器的中心频率。
4.根据权利要求2所述的混响消除方法,其特征在于,所述基于所述听觉谱提取第一
MRCG特征包括:
对输入的语音信号,计算64通道的听觉谱CG1,对每一个时频单元取对数操作;
以第三预设时间为帧长,以第二预设时间为帧移计算得到听觉谱CG2;
用一个长为11时间帧和宽为11频带的方形窗对所述听觉谱CG1进行平滑,得到听
觉谱CG3;
使用23×23的方形窗对所述听觉谱CG1进行平滑,得到听觉谱CG4;
串联听觉谱CG1、CG2、CG3和CG4得到一个64×4的向量,即为第一MRCG特征。
5.根据权利要求1-4所述的混响消除方法,其特征在于,所述预先训练好的混响消除
模型为一个深度置信网络模型,包括2个RBM网络和1个BP网络。
6.根据权利要求5所述的混响消除方法,其特征在于,所述预先训练好的混响消除模
型的训练过程包括
文档评论(0)