- 1、本文档共85页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
关于SmartX
北京志凌海纳科技股份有限公司(SmartX)成立于2013年,是专业的现代化IT基础设施产品与方案提供商。基于自主研发的分布式块存储,SmartX提供超融合、企业云基础设施、分布式存储、云原生存储等产品和服务,助力客户构建精简、敏捷、可靠、安全的IT基础设施,实现降本增效,服务业务创新,助力数字化转型。SmartX已服务交通银行、泰康保险集团、国泰君安证券、中信建投证券、海尔、京东方、中山一院、韩国SBS电视台、Cafe24等多个金融、制造、医疗行业领导者,并先后获评Gartner亚太区客户之选、IDC创新者。
了解更多有关SmartX的信息,请访问官方网站。
联系销售了解产品与服务,请在工作日9:00–18:00给我们来电。
400-116-5559
发送邮件向我们咨询产品或市场的更多信息。
info@
获取必威体育精装版技术资讯与行业客户实践,扫码关注微信公众号。
2
随着DeepSeek等大模型技术的迅猛发展,AI在企业中的应用已经从概念走向实践,并逐渐成为推动业务创新与发展的重要引擎。然而,AI应用的广泛使用也给企业的IT基础设施带来了前所未有的挑战。如何构建一个灵活、高性能、高资源利用率的AI基础设施,成为企业在数字化转型过程中亟待解决的问题。
基于此,本书通过三大章节,深入分析AI时代企业IT基础设施的建设需求与挑战,解读面向大模型与AI应用的超融合基础设施解决方案,并结合具体案例展示AI基础设施的落地架构与性能评测,旨在为企业IT决策者提供全面的参考与指导。
更新时间:2025年4月
目录
第一章节:趋势与挑战 4
企业级AI应用对IT基础架构有哪些要求 4
生成式AI存储设施3大关键能力与部署方案 5
虚拟化vs.裸金属:AI时代应该在哪里运行容器? 9
如何在企业内部快速部署DeepSeek:模型与软硬件方案评估 13
第二章节:产品与方案 16
SmartXAI基础设施解决方案:支持DeepSeek等多种大模型 16
关键产品组件-SMTXKubernetes服务:支持虚拟化与容器化AI工作负载 20
关键超融合特性-GPU直通vGPU 23
SmartXx趋动科技:可提供AI算力池化的超融合平台联合解决方案 28
第三章节:验证与测评 30
以SmartXAI基础设施支持AI营销助手 30
多家医院实践分享:DeepSeek在医疗行业的变革与机遇 33
某资管用户以超融合承载PostgreSQL和AI系统的性能评测 36
从0构建企业知识库,可能没你想的那么简单 40
更多资源 47
4
第一章节:趋势与挑战
企业级AI应用对IT基础架构有哪些要求
点击链接阅读原文:一文解读面向AI应用的超融合基础设施解决方案
阅读提示
目前,大部分企业用户都选择基于已训练好的行业大模型(在微调后)进行AI应用的开发,或直接在生产环境中使用已开发好的AI应用。虽然这些场景不需要大模型训练级别的算力支持,但仍对IT基础架构
随着越来越多大语言模型(LLM)在行业落地,不少企业已开始进行生成式AI
的性能、资源利用率、容器环境支持、多样化数据存储能力等方面有较高的要求。
应用的试点、开发,或在生产环境中试用AI应用。这些应用场景不仅要求强大的算力,还非常考验IT基础设施对
灵活的计算与存储资源调度
在进行AI应用开发时,不同开发组对GPU资源的需求量不同,一些开发任务也不会完全占用一块GPU
GPU的支持能力、资源调度灵活性、混
卡的资源;在使用AI应用时,不同应用对GPU和存储的资源需求也不尽相同,且需求量可能变化频繁。
合负载支撑能力,以及可满足多样化数
这些都要求IT基础设施能够灵活切分、调度计算与存储资源,同时支持高性能CPU与GPU算力,在提
据的存储能力。
升资源利用率的同时满足不同应用/开发任务的资源需求。
高性能、低时延的存储支持
对行业大模型进行微调时使用的GPU规模较大,要求存储能够为GPU并行计算提供高性能、低时延的数据支持。AI应用的全流程也要面对多个数据源的大量数据读取/写入:源数据通过预处理,可参与到大模型的微调和推理过程,并对推理形成的文本/语音/视频数据进行保存和输出。这些工作都要求存储具备高速写入与读取能力。
文档评论(0)