- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
腾讯游戏知几语音合成大模型
推理加速方案
李正兴/腾讯高级工程师
DataFunSummit#2024
背景介绍
语音合成模型结构分析
语音合成模型推理思路
未来展望
01
背景介绍
背景-产品展示
01、王者荣耀小妲己“游戏知识问答”02、和平第五人的『AI语音助手』
03、天涯明月刀『绝智阿暖』智能NPC
背景-产品展示
ØTTS:更自然、韵律丰富、更实时
AudioDecoder
•采用LM方案--自研知音语音大模型LanguageModel
•10s音频完成声音复刻TextEncoderAudioEncoder
喜欢我在你耳边
•通过加速优化,实时率~0.085说话的感觉吗?
范闲老头云悠悠英语男英语女
原音
CFer你好呀!喜欢姐姐的AK四七吗?
不喜欢的话还有M四A一和AN九四哦.
姐姐的ASMR你受得了吗?Ilove
youmysweetheart~
你在开什么玩笑?我才不会上当
呢。
02
模型结构选型与分析
语音合成大模型结构
传统方案基于语言模型的新方案
输入文本
LM
输入文本1243…9
声学模型Model
SemanticToken|
FastSpeech/Tacotron
文档评论(0)