海外TMT行业AI产业前瞻系列报告(三):从OpenAIo1看AI产业趋势,打破AI应用瓶颈,算力需求前景如何?.docx

海外TMT行业AI产业前瞻系列报告(三):从OpenAIo1看AI产业趋势,打破AI应用瓶颈,算力需求前景如何?.docx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

目 录

TOC\o1-2\h\z\u1、OpenAIo1开启复杂推理模型新时代 4

相比GPT-4o,o1在代码和理科能力上提升明显 4

o1具备全局思维能力,复杂推理补足长尾需求,开拓学术教育垂类场景 6

o1在编程上展现出自主规划和主动思考能力,AI+低代码/网络安全领域有望最早受益 8

2、AIAgent是打破AI应用发展瓶颈的关键,o1能否开启通往Agent之路? 11

新的ScalingLaw,RL+CoT对于实现能自主规划的AIAgent至关重要 12

RL范式下推理算力需求大幅上升,但不代表训练算力需求会停止增长 13

3、投资建议 15

4、风险分析 16

图目录

图1:GPT-4o、o1-preview、o1和人类专家在复杂推理任务中的得分差异 4

图2:o1相比于GPT-4o在各项测试集中的得分提升 5

图3:o1-mini、o1等模型AIME得分和推理成本对比 6

图4:o1-mini的Codeforces得分显著优于o1-preview 6

图5:针对复杂数学问题,o1-preview在思维链中不断进行纠错、追问和反思,最终得到完整的解题框架 6

图6:针对规则复杂的纵横填字游戏,GPT-4o因无法理解规则而出错,o1-preview首先理解规则再进行解答.7图7:针对解码问题,o1-preview的思维链采用了类似穷举法的方式寻找答案,思维链较为僵化 7

图8:将o1-preview与GithubCopilot优化编码器运行速度 8

图9:o1-preview与CursorComposer结合,快速开发App 8

图10:o1-preview找到DockerHostAPI并启动了损坏容器的新实例 9

图11:2023年交互式入侵主要针对北美洲地区 9

图12:2021-2023年针对云的入侵案例显著增加 9

图13:o1-preview和o1-mini在越狱学术基准StrongReject上明显领先GPT-4o 10

图14:构建AI应用的五层基石理论 11

图15:AlphaZero随机初始化、self-play、MCTS、策略更新 11

图16:o1在AIEM测试中的准确率与“训练时间计算”和“测试时间计算”呈正比 12

图17:在PaLM2-S*模型修正场景中,计算优化缩放(ComputeOptimal)相比传统的Best-of-N方法效率显著提高 13

图18:主流模型输出速度和输出质量的对比,o1-preview为输出质量牺牲了输出速度 14

图19:主流模型输入和输出的价格对比 14

图20:OpenAI各模型输出和推理tokens消耗对比 14

图21:科技公司资本支出占营运现金流的比例变化趋势 15

图22:科技公司资本支出占GAAP净利润的比例变化趋势 15

表目录

表1:不同测试集和子分类下GPT-4o、o1-preview、o1的得分对比 5

表2:23年以来部分网络安全公司推出的生成式AI产品和功能 10

1、OpenAIo1开启复杂推理模型新时代

美国东部时间2024年9月12日,OpenAI发布必威体育精装版AI模型o1,o代表Orion(猎户座),开启了OpenAI的下一代复杂推理模型。

同时,OpenAI发布了即日可用的预览版o1-preview和性价比更高的轻量级版本o1-mini,可用范围如下:

ChatGPTplus和Teams用户可以直接使用,但存在次数限制。刚发布时o1-preview每周可进行30次问答,o1-mini每周可进行50次问答,9月17日开始,o1-preview和o1-mini的次数限制分别提升至每周50次和每日50次;作为o1的早期版本,o1-preview和o1-mini暂不具备实时浏览网页、上

传文件和图像等功能,计划于后续版本中陆续开放。

APITier5用户可以开始使用o1-preview和o1-mini的API,但速率限制为20RPM,暂不支持函数调用、流式处理、系统消息等功能。

3)9月16日开始,ChatGPTEnterprise和Edu用户可访问这两种模型。4)未来o1-mini计划免费向所有ChatGPT用户开放。

相比GPT-4o,o1在代码和理科能力上提升明显

在编程、理科竞赛等推理密集型任务中,o1的性能明显优于GPT-4o。根据OpenAI官方博客,

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档