网站大量收购闲置独家精品文档,联系QQ:2885784924

《智算中心算力池化技术要求和功能测试方法》.doc

《智算中心算力池化技术要求和功能测试方法》.doc

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

TAF-WG4AS0001-V1.0.0

PAGEII

团体标准

T/TAFXXX-XXXX

智算中心算力池化技术要求

和功能测试方法

Technicalspecificationandfunctionaltestingmethodforcomputingpowerpoolinginartificialintelligencedatacenter

XXXX-XX-XX发布

XXXX-XX-XX实施

电信终端产业协会发布

ICS33.050

M30

T/TAFXXX-XXXX

PAGEII

智算中心算力池化技术要求和功能测试方法

1范围

本文件规定了人工智能算力资源池的总体架构、总体要求、功能要求、通信网络要求、资源池部署与集成要求、兼容性要求、可靠性要求和安全要求,给出了功能测试方法。

本文件适用于人工智能算力资源池的设计、建设、运维和验证。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

以及下列术语和定义适用于本文件。

3.1

人工智能artificialintelligence

学科人工智能系统相关机制和应用的研究和开发。

[来源:GB/T41867—2022,3.1.2]

3.2

人工智能加速卡artificialintelligenceacceleratingcard

专为人工智能计算设计、符合人工智能服务器硬件接口的扩展加速设备。

[来源:GB/T42018—2022,3.6]

3.3

物理计算资源physicalcomputingresource

为人工智能应用提供信息处理能力(如存储、计算等)的实体设备。

人工智能服务器、人工智能加速卡和人工智能加速模组等。

[来源:GB/T42018—2022,3.3]

3.4

虚拟计算资源virtualcomputingresource

为人工智能应用提供信息处理能力(如存储、计算等)的逻辑设备。

逻辑设备是物理设备的虚拟化形态,它与物理设备间存在映射关系。

[来源:GB/T42018—2022,3.4]

4缩略语

下列缩略语适用于本文件。

AI:人工智能(ArtificialIntelligence)

API:应用程序编程接口(ApplicationProgrammingInterface)

ASIC:专用集成电路(ApplicationSpecificIntegratedCircuit)

CPU:中央处理器(CentralProcessingUnit)

FPGA:现场可编程逻辑门阵列(FieldProgrammableGateArray)

GPU:图形处理单元(GraphicsProcessingUnit)

GUI:图形用户界面(GraphicalUserInterface)

KVM:基于内核的虚拟机(Kernel-basedVirtualMachine)

TCP/IP:传输控制协议/网际协议(TransmissionControlProtocol/InternetProtocol)

5总体架构

人工智能算力资源池化指的是无需关注实际物理计算资源的大小、数量、型号以及安插的物理位置,对物理计算资源进行抽象,软件化后形成一个统一的资源池,按需对计算资源进行有效调用的过程。人工智能算力资源池总体架构见图1。

总体架构

其中:

人工智能算力资源池:通过软件定义的方式将多种异构算力变成可动态管理的资源池;

运行时:一套兼容各类计算资源的API编程环境的运行环境,模拟API编程的运行时接口,实现与上层AI框架的对接和管理;

调度控制服务:资源池的核心管理、调度模块,实现对节点IP地址、物理计算资源信息、虚拟计算资源信息以及AI应用任务信息等的汇总管理;

异构算力池化服务:发现并管理节点上的物理计算资源,将物理计算资源池化,将计算能力提供给集群中各个物理节点,以及各个物理节点上的虚拟机、容器;

异构算力资源:GPU、FPGA、ASIC等多种计算资源;

运维管理:提供图形用户界面,实现资源池全方位管理与监控;

——人工智能应用:基于自然语言处理、计算机视觉、机器学习等技术实现的业务应用。

6总体要求

智算中心算力池化技术总体要求如下:

资源池应采用分布式架构、模块化设计,在架构及功能方面应具备良好的系统可扩展能力,使得系统在为用户提供服务的过程中能实现平滑扩展、持续运行;

资源池应支持各类异构AI算力资源;

AI算力资源包括GPU、FPGA、ASIC等人工智能加速卡设备资源。

资源池采用的软硬件应便于安装、升级,并具有友好的管理界面;

资源池应具备人工智能应用和计算资源

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档