T_CESA《人工智能加速卡管理接口规范》编制说明.pdf

T_CESA《人工智能加速卡管理接口规范》编制说明.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

中国电子工业标准化技术协会

团体标准《人工智能加速卡管理接口规范》(征求意见稿)

编制说明

一、工作简况

1、项目来源和工作单位

按照中国电子工业标准化技术协会2024年第一批团体标准制修订项目的通

知(中电标通〔2024〕001号),中国电子工业标准化技术协会开放计算工作委

员会启动了《人工智能加速卡管理接口规范》(立项号:CESA-2024-006)的制

订工作。任务下发后,由浪潮电子信息产业股份有限公司牵头,参与单位包括上

海壁仞科技股份有限公司、中科寒武纪科技股份有限公司、上海燧原科技股份有

限公司、上海天数智芯半导体有限公司、新华三技术有限公司、中国质量认证中

心、昆仑太科(北京)技术股份有限公司、中国民航信息网络股份有限公司等。

归口单位为中国电子工业标准化技术协会。

2、主要工作过程

(一)标准预研

随着人工智能加速卡算力需求持续提升,人工智能加速卡管理接口不统一导

致的AI算力集群运维难度增加,以及各人工智能加速卡厂商获取信息内容和方式

差异性大,导致加速卡关键管理信息支持不全面,与服务器适配难度增加、适配

周期变长等问题,2023年8月浪潮电子信息产业股份有限公司与上海壁仞科技股

份有限公司、中科寒武纪科技股份有限公司、上海燧原科技股份有限公司、上海

天数智芯半导体有限公司等芯片厂商对管理接口规范需求进行了初步分析,确定

了人工智能加速卡管理接口规范的标准草案结构和主要内容。2023年8月至2023

年10月,标准工作组组织2次标准讨论会,对标准制定的必要性,可行性,目的

意义,拟解决的问题,标准范围进行了充分讨论,最终取得技术共识。

(二)标准立项

2023年10月,浪潮电子信息产业股份有限公司,联合上海壁仞科技股份有限

公司、中科寒武纪科技股份有限公司、上海燧原科技股份有限公司、上海天数智

中国电子工业标准化技术协会

芯半导体有限公司作为共同发起方申请立项,并通过评审,成为协会正式标准制

定项目。

(三)标准编制

2024年4月11日,标准工作组完成了面向工作组内成员单位的标准意见征集,

并组织召开了标准启动会,对标准制定的背景、参编单位构成,标准推动计划进

行了介绍。同时对标准适用性和拟要增加的管理接口进行了讨论。

2024年5月至6月,就编制组内专家所提意见,包含管理接口命令集的完整性

等进行了针对性讨论。

3、主要起草人及其所做的工作

本标准由浪潮电子信息产业股份有限公司牵头组织编制、参与标准编制的单

位有上海壁仞科技股份有限公司、中科寒武纪科技股份有限公司、上海燧原科技

股份有限公司、上海天数智芯半导体有限公司、新华三技术有限公司、中国质量

认证中心、昆仑太科(北京)技术股份有限公司、中国民航信息网络股份有限公

司等。其他成员单位提供了标准所涉及的技术内容的材料,并参与了技术细节的

讨论。

二、标准编制原则和确定主要内容的论据及解决的主要问题

1、编制原则

在标准编制过程中,遵循了以下五方面的原则。

a)符合性。一是遵循国家法律、法规等相关规定,制定过程严格按照

程序执行。

b)先进性。本标准制定过程中充分考虑了管理接口的技术现状,并在

方面保持了一定的前瞻性。

c)适用性。本标准结合实际人工智能加速卡管理接口与服务器实际对

加速卡信息获取的应用需求进行接口定义。

d)中立性。本标准制定过程中编制组成员单位对标准文本进行了充分

讨论。

2、确定主要内容的依据

近年来随着人工智能产业的高速发展,传统芯片的算力和性能越来越无法满

足产业的发展需求,测算数据显示,到2025年,中国人工智能芯片市场规模预计

中国电子工业标准化技术协会

将达到1740亿元,人工智能加速卡的生产与制造已成为行业竞争的关键。当前人

工智能加速卡管理接口面临着多方挑战。首先,随着算力需求提升,AI计算集

群规范急剧扩大,导致AI加速卡的管理运维变得更加困难;其次,当前各厂商对

人工智能加速卡的管理并没有统一的管理协议,采用的是私有化的方式,具体表

现为不同厂商所支持获取的信息内容不一致,以及即使获取同一信息,对应的协

议命令格式也不同,这种管理接口上的多样性要求服务器系统需要针对不同加速

卡进行单独适配,导致服务器系统整个适配难度增加,适配周期延长;再者,由

于AI加速卡缺少

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8135026137000003

1亿VIP精品文档

相关文档