ZEGO 即构科技场景化 AI 降噪技术解析.pdf

ZEGO 即构科技场景化 AI 降噪技术解析.pdf

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ZEGO场景化AI降噪 技术解析 QCon 2023全球软件开发北京大会 音频算法处理专家 / 曾爱明 目录 一 、ZEGO 即构科技实时互动 RTI 二 、降噪算法发展经历 QCon 2023全球软件开发北京大会 三 、一般通讯场景下 ,即构 AI 降噪的技术实现 四、音乐场景下 ,即构降噪技术实现 五 、实时语音增强技术展望 一 、ZEGO 即构实时互动RTI QCon 2023全球软件开发北京大会 随着能力的拓新与服务的进步 ,我们意识到即 180P/360P 720P/4K 时通讯RTC已经无法概括所有的线上交流 ,从 最初的VoIP 、RTC1.0 ,到现在的RTC3.0 ,已 能听清的音质 AI降噪/空间音效 QCon 2023全球软件开发北京大会 经有 RT I 的影 子 。随着技 术 与 需求 的共 同推 1v1语聊 万人连麦/元宇宙 进 ,在实时场景下去做到接近现实世界的视听 无状态运营 全球可视化运营 体验 ,更加强调互动 (Interaction) 。 VoIP RTC3.0 实时互动RTI (Real-time Interaction )代表 ZEGO 能力的总和 ,同时也昭示着未来 钻研的方向:相较于RTC ,并非以信息交互为唯一 目标 ,而是通过数字化的方式 ,让 QCon 2023全球软件开发北京大会 人与人共享时空 ,用可视化服务体系保障更好的互动体验 ,在高效准确的基础之上 , 满足精神需求 。 QCon 2023全球软件开发北京大会 二 、降噪算法发展经历 QCon 2023全球软件开发北京大会 办公场景 :键盘鼠标敲击声 、空调声 、远处同事说话声 ,房间混响等 家庭场景 :厨房碗碟碰撞声 、抽油烟机风声 、水流声 、小孩哭声 、电视背景音等 QCon 2023全球软件开发北京大会 户外场景 :风噪 、发动机噪声 、胎噪 、雨滴声 、走路声 、汽笛声等 社交场景 :Babble噪声 、喷麦 、游戏屏幕敲击声 、咳嗽声 、喘气声等 时域法 、频域法 、均方根 奇异值分解和特征值分解 DCCRN、FullSubNet 、 法 、参数法和迭代法 FacebookDenoise 传统降噪算法 AI降噪算法 QCon 2023全球软件开发北京大会 谱减法 维纳滤波法 统计模型法 子空间法 Mask/Mapping 时频域端到端 非线性谱减 、多子带谱 最大似然估计 、最小均方估 Rnnoise 、Percepnet 、 减 、MMSE谱减 、基于 计 、最大后验估计 、Bayes DTLN 掩蔽模型的谱减 估计 传统算法 : AI 算法 : • 环境适应能力差 • 环境适应能力强 • 性能开销小 • 性能开销大 QCon 2023全球软件开发北京大会 • 实时性好

您可能关注的文档

文档评论(0)

优选文档 + 关注
实名认证
内容提供者

专注于发布优质文档,喜欢的可以关注一下哦~

1亿VIP精品文档

相关文档