互联网大厂AI战略调研20250326.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

以下为专家观点:

以下为专家观点:

2025年字节跳动在基座模型方面的产品计划和发布时间如何安排?

2025年字节跳动在基座模型方面的产品计划和发布时间如何安排?

2025年字节跳动计划在文本、图像和视频领域发布多款基座模型。2月份已推出一款面向视

2025年字节跳动计划在文本、图像和视频领域发布多款基座模型。2月份已推出一款面向视

频处理的模型,但市场热度较快被DeepSeek应用带走。3月预计发布类似DeepSeekR1的

思维类模型,并于4月初对外提供商业化服务(主要面向B端)。该模型目前已在内部应用

思维类模型,并于4月初对外提供商业化服务(主要面向B端)。该模型目前已在内部应用

平台“豆包”中上线测试。

平台“豆包”中上线测试。

字节跳动新发布的思维类模型与友商相比有哪些特点?

字节跳动新发布的思维类模型与友商相比有哪些特点?

新发布的思维类模型能力接近DeepSeekR1,在情感对话、内容抽取以及文字处理等领域表

新发布的思维类模型能力接近DeepSeekR1,在情感对话、内容抽取以及文字处理等领域表

现略优于竞品,同时也具备内容检索和数据分析功能。然而,该版本在数学代码及逻辑判断

现略优于竞品,同时也具备内容检索和数据分析功能。然而,该版本在数学代码及逻辑判断

方面表现平平。整体来看,该版本属于可用级别的思维类模型。此外,字节跳动采用自研

方面表现平平。整体来看,该版本属于可用级别的思维类模型。此外,字节跳动采用自研

MOE架构进行开发,并探索低精度训练技术,如FP8,总体上以自研为主,同时也会参考友

MOE架构进行开发,并探索低精度训练技术,如FP8,总体上以自研为主,同时也会参考友

商的方案。

商的方案。

字节跳动目前使用的算力配置情况如何?

字节跳动目前使用的算力配置情况如何?

当前线上运行的自研基座模型参数规模为400至500GB,采用FP16精度进行推理,每个

当前线上运行的自研基座模型参数规模为400至500GB,采用FP16精度进行推理,每个

500GB规模的推理模型需要约1000GB显存支持。尽管如此,其推理成本较高,与DeepSeek

论文中描述的数据相比性能弱20?0??未来将逐步引入FP8低精度训练以降低成本,目前

论文中描述的数据相比性能弱20%-30%。未来将逐步引入FP8低精度训练以降低成本,目前

相关工作仍处于推进阶段。

相关工作仍处于推进阶段。

字节跳动为何选择推进低精度训练技术(如FP8),当前进展如何?

字节跳动为何选择推进低精度训练技术(如FP8),当前进展如何?

推进低精度训练技术是为了降低推理成本并提升工程效率。在此前阶段,由于字节更注重科

推进低精度训练技术是为了降低推理成本并提升工程效率。在此前阶段,由于字节更注重科

研成果而非工程优化和降低成本,因此未优先投入资源开发低精度技术。然而随着市场需求

研成果而非工程优化和降低成本,因此未优先投入资源开发低精度技术。然而随着市场需求

变化以及DeepSeek等友商率先实现FP8应用后,字节意识到其重要性。目前已调配更多基

变化以及DeepSeek等友商率先实现FP8应用后,字节意识到其重要性。目前已调配更多基

础工程团队成员参与研发工作,预计1-2个月内可实现低精度训练阶段性成果。

础工程团队成员参与研发工作,预计1-2个月内可实现低精度训练阶段性成果。

字节跳动对于AI商业化方向上的策略是否有所调整?

字节跳动对于AI商业化方向上的策略是否有所调整?

在早期阶段,由于缺乏明确商业化路径且用量有限,字节对于AI项目预算控制相对宽松,

在早期阶段,由于缺乏明确商业化路径且用量有限,字节对于AI项目预算控制相对宽松,

更倾向科研导向。然而进入2025年后,公司发现AI产品存在一定市场需求,用量逐渐增长,

更倾向科研导向。然而进入2025年后,公司发现Al产品存在一定市场需求,用量逐渐增长,

因此开始加强工程能力优化与成本管控,同时加速推动AI商业化落地。这种转变反映了公

因此开始加强工程能力优化与成本管控,同时加速推动AI商业化落地。这种转变反映了公

司从单纯追求科研成果到兼顾实际应用价值的发展策略调整。

司从单纯追求科研成果到兼顾实际应用价值的发展策略调整。

当前阶段字节跳动在工程能力优化方面的主要考量是什么?

当前阶段字节跳动在工程能力优化方面的主要考量是什么?

工程能力优化在此前并未被视为紧急事项,主要原因是业务体量较小。然而,随着市场环境

工程能力优化在此前并未被视为紧急事项,主要原因是业务体量较小。然而,随着市场环境

的变化,例如Dee

文档评论(0)

蓝色星球快生活 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档