- 1、本文档共39页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Al大模型开源生态及
大模型平台实践;CONTENTS
01●生态基石:AI大模型开源生态发展洞察分析
02●模型底座:华为AI大模型全景架构及应用案例
03●平台架构:大模型平台技术架构及技术分析;
01
生态基石:
Al大模型开源生态发展
洞察分析;
ChatGPT:
在GPT-3大模型的基础上,通过100人标注1年高质量人工数据,强化学习所训练出的大模型
图像生成:
stablediffusion、DALL·E2、紫东.太初等业界知名的可以进行图像生成的Al模型均是大模型
2022年
ChatGPT;
增大模型方法;
互联网
爬取海量数据
GPT-3
无标注数据
自监督学习
大规模分布式训练;
高素质领域专家参与数据标注和增强工作
可显性化的推理范式与基于人类反馈的迭代更新
GPT-3:海量数据无监督训练,具备很强的上下文学习能力
GPT-3.5:代码微调+指令微调学习,具备可显性化的思维链和推理能力
GPT+RLHF:具备向用户偏好对齐的能力,答案更符合人类预期
50+研究人员
5年探索研究
巨量的通用领域无标注数据
GPT-3:从45TB原始文本语料筛选出570+GB高质量数据(约3000亿单词)
GPT-3.5:训练数据包含5400万个代码库,仅Python语言就有159GB
ChatGPT模型还涉及自建/第三方客户/线上用户等来源的数据;
RLHF带来的威力
·有效的回应:
·用实的回应:默认倾向长答案·公正的回应:特别针对政治事件·拒绝不当问题:
利用RLHF,chatGPT性能领先一众模型:
如左图,chatGPT输出4个结果都对
·对话者更倾向于“业界先进企业一般100天”;
其他回答对于对话者无帮助;
即,RLHF目的是提升chatGPT输出答案有效性;;
模型名;
模型和数据解决方案
ChatGPT模型
基础软件数据
硬件
●智谱AI
●垂类初创等;
下游:应用与分发
内容生产厂商
内容创作应用服务商
内容分发平台
1)协助用户使用模型和算法生成内容,如图像、文本、语音等。
2)将生成的丙容分发到各种渠道,
如社交媒体、娱乐平台、新闻媒体等。;
上下游各赛道百花齐放,商业模式持续探索
以ChatGPT为代表的AIGC行业,上游主要包括数据供给方、算法/模型机构、创作者生态以及底层配合工具等,
中游主要包括文字、图像、音频、视频等数字内容的处理加工方,下游主要是各类数字内容分发平台、消费方及相关服务机构等。;;
模型底座:
华为Al大模型全景架构
及应用案例;
高并发分布式训推框架
·多维混合并行:自动寻优,数据、算子、
pipeline、模型自动切分,大规模并发执行
·多级存储优化:全局内存复用、稀疏特征缓存,
CPU/NVMeoffload
大规模集群算力稳定输出
·芯片内置200G网卡,NPU规模从1K→8K·千卡规模集群线性度55%→80%;
昇腾大模型沙盘,构筑中国大模型创新高地;
业界AI框架均已开始布局大模型技术,探索通用AI能力
主流AI框架开始从并行及存储优化能力探索支持大模型
-2021— ;
IDC
PyTorch:33%飞桨:26%
TensorFlow:22%
具思:8%
其他:7%+;
AI框架持续迭代和升级,大模型、AI4S、动静统一是主流技术趋势;
昇思持续演进,MindSpore2.0全新技术升级
原生支持大模型,从AI框架走向AI+HPC融合;生态足迹走进国内大中城市
京津冀
中西部长三角
成渝
人工计算中心
粤港溃;
·新增Expander微分机制
·新增Trace的GraphCapture机制
·大算子融合
·动态算子下发流水化
动态图执行性能:平均提升50%(vs1.10版本);
开发训练
高模块化,开箱即用
·覆盖CV/NLP/AIGC/Rec等热门领城,10行代码实现模型定义、训练、微调和验证
·实现典型模型开发效率月-周级别
MindFormers
预制预训练模型
GpTVT/MAEBERT
BLOOMLaMA
预制下游任务
文本生成问答
图像分类填词
Min
您可能关注的文档
- 交通事故案例分析课件.pptx
- 放射科个人岗位廉洁风险点课件.pptx
- 大学研究生学科建设发展规划.docx
- 路由器能耗模型与优化.pptx
- 必威体育精装版小儿厌食症的中医治疗11(共28张课件)精品课件.pptx
- 小学年度科研工作总结.docx
- 城市交通监控系统课件.pptx
- 跨境电商数据分析方法与指标.pptx
- 融资担保公司业务代偿和追偿管理办法.doc
- 翻译目的论研究综述.doc
- 2025届衡阳市第八中学高三一诊考试物理试卷含解析.doc
- 2025届湖南省娄底市双峰一中等五校重点中学高三第二次诊断性检测物理试卷含解析.doc
- 天水市第一中学2025届高三第二次联考物理试卷含解析.doc
- 2025届金华市重点中学高三考前热身物理试卷含解析.doc
- 2025届北京市石景山区第九中学高三第四次模拟考试物理试卷含解析.doc
- 江苏扬州市2025届高三第一次模拟考试物理试卷含解析.doc
- 2025届江苏省南通市高级中学高考物理五模试卷含解析.doc
- 广东省清远市华侨中学2025届高三第一次调研测试物理试卷含解析.doc
- 辽宁省凤城市2025届高三第五次模拟考试物理试卷含解析.doc
- 内蒙古巴彦淖尔市重点中学2025届高考仿真卷物理试卷含解析.doc
最近下载
- 中国成人呼吸系统疾病家庭氧疗指南(2024年).pdf
- 2024年山东交通职业学院单招语文考试模拟试题及答案解析.docx
- 初中英语新人教版七年级下册Unit2 词汇整理(2025春).doc
- 上海七年级上学期期末【压轴72题考点专练】-2022-2023学年七年级数学上学期期中期末考点大串讲(沪教版)(解析版).docx VIP
- 某石油公司领导2024年度民主生活会个人检视材料.docx VIP
- 学校后勤部门年度工作总结汇报.pptx
- 产房进修汇报精品课件.pptx VIP
- 科学素养考试参考题库300题(附答案).pdf VIP
- 安宁疗护指南及实践.pptx VIP
- CJJ 99-2017 城市桥梁养护技术标准.docx
文档评论(0)