网站大量收购独家精品文档,联系QQ:2885784924

计算机行业快报:UltraMem架构为推理降本,AI应用全面落地可期.pdfVIP

计算机行业快报:UltraMem架构为推理降本,AI应用全面落地可期.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

计算机行业快报领先大市-A(维持)

UltraMem架构为推理降本,AI应用全面落地可期

2025217/

年月日行业研究行业快报

计算机行业近一年市场表现事件描述:

2月12日,字节豆包大模型团队发布全新的稀疏模型架构UltraMem,

有效解决了当前主流的MoE架构在推理时产生的高额访存问题,推理速度

较MoE架构提升2-6倍,同时推理成本最高可降低83%。

事件点评:

UltraMem在PKM架构的基础上对模型结构、value检索方式、稀疏参

数进行优化,在保证模型性能的同时大幅提升推理效率。UltraMem架构参

资料来源:最闻考PKM(ProductKeyMemory)的设计,即Transformer层中嵌入大内存层

以及推理时以行列路由的方式激活参数,访存效果较MoE架构明显改善。

首选股票评级

同时,UltraMem对PKM架构进行针对性优化以提升模型性能:1)优化模

688111.SH金山办公买入-A

型结构:将PKM的单个内存层拆分成多个内存层均匀嵌入Transformer层中,

688041.SH海光信息买入-A

使模型能够并行执行访存和Transformer层计算操作;2)优化value检索方

式:在推理时以TDQKR的乘法方法替代简单的行列加权方法选出得分最高

的多个value,使模型能够精准检索到与输入相关的value;3)隐式扩展稀疏

参数:引入数倍于physicalmemory的virtualmemory,在不提高模型部署复

杂度的情况下提升模型性能。根据实验结果,训练规模达2000万value的

相关报告:

UltraMem模型,在同等计算资源下可同时实现业界领先的推理速度和模型

【山证计算机】DeepSeek有望推动AI

性能。

应用生态加速繁荣2025.2.6

推理成本持续下降加速应用生态繁荣。根据Semianalysis数据,随着算

【山证计算机】《人工智能扩散框架》发

法持续进步,截至2024年底,以GPT-3质量的输出为标准,模型推理价格

布,AI芯片国产化替代持续加速-行业政

下降了1200倍。进入2025年,在推理技术优化下,DeepSeek模型的使用成

策点评2025.1.20

本不到o1模型的1/25,而字节必威体育精装版发布的UltraMem架构将使主流稀疏模型

的推理成本大幅下降。我们认为,模型调用价格是用户选择模型运行应用的

分析师:重要考量因素,各大模型厂商及科技大厂将持续竞相推动推理成本下降,从

方闻千

您可能关注的文档

文档评论(0)

bookuser001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档