基于AWS的机器学习平台架构.pptx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于AWS的机器学习平台架构 技术创新 变革未来 关于 OpenBayes OpenBayes 采用机器学习技术,助力企业业务发展到自动化新阶段 卫星遥感 医疗影像 港口自动化 数据产业大规模采用 AI 正在成为新常态 成熟的工具,丰富的 学习资料 无需训练,开箱即用的 机器学习API服务 接近甚至超越 人类的模型水准 3.57% 3 : 0 2015 年微软残差网路在 imagenet 数据集中优于人类 5.1% 的错误率 2017 年 谷歌 AlphaGo 战 胜人类最强围棋选手 2018 年 OpenAI Five 在 5v5 对战游戏中战胜人类 准职业玩家 2 : 1 计算认知市场中的「错位问题」 通用服务不能覆盖市场需求 No Free Lunch 同一个模型在不同的数据和不同的场景存 在性能差异 机器学习系统比想象中复杂 通用服务不能覆盖市场需求 人脸识别 文本翻译 通用目标检测 港口集装箱调度 法律文书摘要 国土资源分类 No Free Lunch 模型的泛化能力有限,模型质量随数据变化而变化 同样的数据,由于使用场景的变化,模型需要重新训练 同样的问题,不同的性能要求需要完全不同的模型 机器学习系统比想象中复杂 训练数据 机器学习算法 推断结果 模型 训练数据 训练 部署 机器学习系统比想象中复杂 机器学 习算法 推断结果 模型 训练数据管理 训练平台搭建 监控 实验管理 特征抽取流水线 模型分析与评估 日志收集与检索 计算资源管理 训练 部署 我们的系统架构 我们的系统架构 Node Node Node Node 模型服务 系统日志 数据集 模型库 本地数据缓存 计算资源 核心业务数据 负载均衡 我们的系统架构 EC2 EC2 EC2 EC2 系统日志 数据集 模型库 计算资源 核心业务数据 负载均衡 AWS ELB AWS RDS AWS S3 AWS EBS EC2 AWS Elasticsearch Service AWS EBS 保障训练任务的延续性 Node Node Node EBS 训练 任务 pod pod pod pod 训练 任务 S3 管理数据集与训练模型 EBS S3 EBS Node 训练 任务 训练 任务 Node 训练 任务 EC2 不同的付费模式组合使用,显著降低成本 按需付费 Spot 付费模式 预留模式 EC2 不同的付费模式组合使用,显著降低成本 EC2 EC2 EC2 EC2 系统日志 数据集 模型库 计算资源 负载均衡 AWS ELB AWS S3 AWS EBS EC2 核心业务数据 AWS RDS AWS Elastic Search Service Spot 实例 节省成本约 40% 预留实例 节省成本 50% 遥感卫星数据处理 对遥感影像分类,并对各个类型的土 地按照面积进行汇总,获取包含森林 资源,城市规模,耕地面积等重要国 土资源信息 图像分割问题 图像周期性更新,更新周期较长但每 次更新数据规模巨大(数十TB) 采用 P2 GPU 节点加速每次图像处 理速度,平均每张图片是原有处理速 度的 20 倍 港口自动化调度 大型港口一天内调拨的集装箱量成千 上万,每次调拨都是不小的成本,调 拨效率的高低是港口盈利与否的重要 因素,目前的港口调度系统仍然是基 于自然人以经验远程指挥调控 采用增强学习算法,需要构建独立的 模拟环境模拟港口调拨过程以训练港 口的自动化调度模型,其单个模拟环 境训练速度较慢 采用 AWS 所提供的 CloudFormation 在训练模型时临时扩增集群规模,多 个模拟环境并行训练,提升训练速度 谢 谢!

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

微软售前技术专家持证人

生命在于奋斗,技术在于分享!

领域认证该用户于2023年09月10日上传了微软售前技术专家

1亿VIP精品文档

相关文档