- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
RAS引擎:Blackwell支持的GPU包含一个专用引擎,实现可靠性、可用性和服务性。此外,Blackwell架构还增加了芯片级功能,利用基于AI的预防性维护进行诊断和预测可靠性问题。这可以最大限度地延长系统正常运行时间,并提高大部署规模AI的弹性,使其能连续运行数周甚至数月,并降低运营成本。
安全人工智能:先进的机密计算功能可在不影响性能的情况下保护AI模型和客户数据,并支持新的本机接口加密协议,这对于医疗保健和金融服务等隐私敏感行业至关重要。
解压缩引擎:专用解压缩引擎支持必威体育精装版格式,加快数据库查询,提供数据分析和数据科学的最高性能。未来几年,在企业每年花费数百亿美元的数据处理方面,将越来越多地由GPU加速。
此外,英伟达发布了GB200NVL72,把18个Blackwell计算节点(ComputeTray)组合在一起,形成新一代计算单元。
图表2:GB200NVL72
资料来源:英伟达GTC大会
GB200NVL72中一共包含了9个NVLink交换节点(SwitchTray),每个交换节点中配置了2颗NVLinkSwitch芯片,向外提供14.4TB/s的聚合带宽。
图表3:NVLinkSwitchChip 图表4:NVIDIAGB200InternalNVLinkSwitch
资料来源:Servethehome 资料来源:Servethehome
如果要训练一个1.8万亿参数量的GPT模型,需要8000张HopperGPU,消耗15兆瓦的电力,连续跑上90天。但如果使用BlackwellGPU,只需要2000张,同样跑90天只要消耗四分之一的电力。除了训练之外,生成Token的成本也会随之降低。GB200NVL72训练和推理性能相比于等同数量的H100GPU表现提升4倍和30倍。
从NVLINK1.0到NVLINK5.0,英伟达GPU卡间互联快速演进。作为英伟达的核心技术,NVLink在GPU网络通信系统中占据重要地位,其对于提升数据传输效率和处理性能具有显著作用。
NVLink技术实现了GPU与支持该技术的CPU之间以及多个GPU之间的高带宽直接连接,从而大幅提升了整体性能。然而值得注意的是,NVLink技术并未向行业开放,这在一定程度上影响了其他厂商在相关领域的竞争力。
英伟达不仅拥有出色的GPU和软件,还在跨多个GPU和系统横向扩展工作负载方面拥有丰富的技术积累。这些技术包括芯片上和封装上互连、用于服务器或pod中GPU到GPU通信的NVLink、用于超pod扩展的Infiniband以及连接到更庞大基础设施的以太网等。NVLink技术使得CPU与GPU之间能够实现快速数据交换,从而提升了整个计算系统的数据吞吐量,有效克服了加速计算领域的一大瓶颈。
随着英伟达GPU芯片的更新迭代,NVLink技术也在不断进化。从2017年的NVLink2.0到2020年的NVLink3.0,再到2022年的NVLink4.0,每一次更新都带来了更高的性能和更广泛的应用场景。
图表5:NVLink升级过程
资料来源:英伟达,腾讯网
在2024年的GTC大会上,英伟达推出了全新的NVLink5.0技术,并与必威体育精装版一代Blackwell芯片一同亮相。这一技术极大地提升了大型多GPU系统的可扩展性,单个BlackwellTensorCoreGPU支持多达18个NVLink100GB/s连接,总带宽达到1.8TB/s,较上一代产品提升了两倍之多。此外,NVLink5.0技术还支持跨节点扩展,通过NVLinkSwitch以及铜缆互联实现无缝、高带宽、多节点GPU集群的构建,从而满足数据中心级别的大型GPU需求。
利用NVLink技术,多服务器集群能够平衡GPU通信与增加的计算量,从而实现了更高的性能和效率。例如,在GB200NVL72等服务器平台上,NVLink技术的应用使得这些平台能够支持更为复杂的大型模型,并提供了更高的可扩展性。这些优势使得英伟达在GPU网络通信领域继续保持领先地位,并为其在AI、数据中心等领域的广泛应用提供了有力支持。
二、八巨头组建UALink联盟,卡间互联成为竞争焦点
为弥补卡间互联差距,八大巨头组建UALINK联盟。谷歌、Meta、微软、AMD、英特尔、博通、思科、惠普在内的科技巨头联合宣布成立UltraAcceleratorLink
(UALink)联盟,致
您可能关注的文档
- OLED行业深度报告:全行业供需结构逐步优化,中国厂商赢得优势.docx
- OTA行业深度报告:春风起,正归来.docx
- Q2货政报告解读:“稳增长和防风险”再审视.docx
- REITs市场月报,3只REITs上市加速扩容,保租房REITs延续涨势.docx
- 埃森焊接展举行,免示教焊接加速落地.docx
- 艾罗能源(688717)户储赛道具备高成长性,公司加速开拓新市场.docx
- 安宁股份2024年中报点评:钛精矿景气延续,年中股利支付率达46%25.docx
- 八达机电(873882)新三板公司研究报告:轻小型起重设备“小巨人”,轻量化%2b智能化双轮驱动.docx
- 八月可转债量化月报:当前转债市场的赔率与胜率.docx
- 白酒企业二季报业绩稳健,提振白酒投资信心.docx
- GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs).pdf
- 中国国家标准 GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs).pdf
- 《GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs)》.pdf
- GB/T 39560.302-2024电子电气产品中某些物质的测定 第3-2部分:燃烧-离子色谱法(C-IC)筛选聚合物和电子件中的氟、氯和溴.pdf
- 中国国家标准 GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样.pdf
- 中国国家标准 GB/T 39560.302-2024电子电气产品中某些物质的测定 第3-2部分:燃烧-离子色谱法(C-IC)筛选聚合物和电子件中的氟、氯和溴.pdf
- GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样.pdf
- 《GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样》.pdf
- 《GB/T 39560.303-2024电子电气产品中某些物质的测定 第3-3部分:配有热裂解/热脱附的气相色谱-质谱法(Py/TD-GC-MS)筛选聚合物中的多溴联苯、多溴二苯醚和邻苯二甲酸酯》.pdf
- 中国国家标准 GB/T 39560.303-2024电子电气产品中某些物质的测定 第3-3部分:配有热裂解/热脱附的气相色谱-质谱法(Py/TD-GC-MS)筛选聚合物中的多溴联苯、多溴二苯醚和邻苯二甲酸酯.pdf
文档评论(0)