- 1、本文档共18页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于AWS的机器学习平台架构
技术创新 变革未来
关于 OpenBayes
OpenBayes 采用机器学习技术,助力企业业务发展到自动化新阶段
卫星遥感
医疗影像
港口自动化
数据产业大规模采用 AI 正在成为新常态
成熟的工具,丰富的
学习资料
无需训练,开箱即用的 机器学习API服务
接近甚至超越
人类的模型水准
3.57%
3 : 0
2015 年微软残差网路在
imagenet 数据集中优于人类
5.1% 的错误率
2017 年 谷歌 AlphaGo 战 胜人类最强围棋选手
2018 年 OpenAI Five 在
5v5 对战游戏中战胜人类
准职业玩家
2 : 1
计算认知市场中的「错位问题」
通用服务不能覆盖市场需求
No Free Lunch 同一个模型在不同的数据和不同的场景存 在性能差异
机器学习系统比想象中复杂
通用服务不能覆盖市场需求
人脸识别
文本翻译
通用目标检测
港口集装箱调度
法律文书摘要
国土资源分类
No Free Lunch
模型的泛化能力有限,模型质量随数据变化而变化
同样的数据,由于使用场景的变化,模型需要重新训练
同样的问题,不同的性能要求需要完全不同的模型
机器学习系统比想象中复杂
训练数据
机器学习算法
推断结果
模型
训练数据
训练
部署
机器学习系统比想象中复杂
机器学 习算法
推断结果
模型
训练数据管理
训练平台搭建
监控
实验管理
特征抽取流水线
模型分析与评估
日志收集与检索
计算资源管理
训练
部署
我们的系统架构
我们的系统架构
Node
Node
Node
Node
模型服务
系统日志
数据集 模型库
本地数据缓存
计算资源
核心业务数据
负载均衡
我们的系统架构
EC2
EC2
EC2
EC2
系统日志
数据集 模型库
计算资源
核心业务数据
负载均衡
AWS ELB
AWS RDS
AWS S3
AWS EBS
EC2
AWS
Elasticsearch Service
AWS EBS 保障训练任务的延续性
Node
Node
Node
EBS
训练 任务
pod
pod
pod
pod
训练 任务
S3 管理数据集与训练模型
EBS
S3
EBS
Node
训练 任务
训练 任务
Node
训练 任务
EC2 不同的付费模式组合使用,显著降低成本
按需付费
Spot 付费模式
预留模式
EC2 不同的付费模式组合使用,显著降低成本
EC2 EC2 EC2 EC2
系统日志
数据集 模型库
计算资源
负载均衡
AWS ELB
AWS S3
AWS EBS
EC2
核心业务数据
AWS RDS
AWS
Elastic Search Service
Spot 实例 节省成本约 40%
预留实例
节省成本 50%
遥感卫星数据处理
对遥感影像分类,并对各个类型的土 地按照面积进行汇总,获取包含森林 资源,城市规模,耕地面积等重要国 土资源信息
图像分割问题
图像周期性更新,更新周期较长但每
次更新数据规模巨大(数十TB)
采用 P2 GPU 节点加速每次图像处 理速度,平均每张图片是原有处理速 度的 20 倍
港口自动化调度
大型港口一天内调拨的集装箱量成千 上万,每次调拨都是不小的成本,调 拨效率的高低是港口盈利与否的重要 因素,目前的港口调度系统仍然是基 于自然人以经验远程指挥调控
采用增强学习算法,需要构建独立的 模拟环境模拟港口调拨过程以训练港 口的自动化调度模型,其单个模拟环 境训练速度较慢
采用 AWS 所提供的 CloudFormation 在训练模型时临时扩增集群规模,多 个模拟环境并行训练,提升训练速度
谢 谢!
文档评论(0)