海外TMT行业AI产业前瞻系列报告(三)：从OpenAIo1看AI产业趋势，打破AI应用瓶颈，算力需求前景如何？.docx

下载文档

0
0
约1.54万字
约 15页
2024-10-17 发布于境外
举报
版权申诉
保障服务

海外TMT行业AI产业前瞻系列报告(三)：从OpenAIo1看AI产业趋势，打破AI应用瓶颈，算力需求前景如何？.docx

1、本文档共15页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

TOC\o1-2\h\z\u1、OpenAIo1开启复杂推理模型新时代 4

相比GPT-4o，o1在代码和理科能力上提升明显 4

o1具备全局思维能力，复杂推理补足长尾需求，开拓学术教育垂类场景 6

o1在编程上展现出自主规划和主动思考能力，AI+低代码/网络安全领域有望最早受益 8

2、AIAgent是打破AI应用发展瓶颈的关键，o1能否开启通往Agent之路？ 11

新的ScalingLaw，RL+CoT对于实现能自主规划的AIAgent至关重要 12

RL范式下推理算力需求大幅上升，但不代表训练算力需求会停止增长 13

3、投资建议 15

4、风险分析 16

图目录

图1：GPT-4o、o1-preview、o1和人类专家在复杂推理任务中的得分差异 4

图2：o1相比于GPT-4o在各项测试集中的得分提升 5

图3：o1-mini、o1等模型AIME得分和推理成本对比 6

图4：o1-mini的Codeforces得分显著优于o1-preview 6

图5：针对复杂数学问题，o1-preview在思维链中不断进行纠错、追问和反思，最终得到完整的解题框架 6

图6：针对规则复杂的纵横填字游戏，GPT-4o因无法理解规则而出错，o1-preview首先理解规则再进行解答.7图7：针对解码问题，o1-preview的思维链采用了类似穷举法的方式寻找答案，思维链较为僵化 7

图8：将o1-preview与GithubCopilot优化编码器运行速度 8

图9：o1-preview与CursorComposer结合，快速开发App 8

图10：o1-preview找到DockerHostAPI并启动了损坏容器的新实例 9

图11：2023年交互式入侵主要针对北美洲地区 9

图12：2021-2023年针对云的入侵案例显著增加 9

图13：o1-preview和o1-mini在越狱学术基准StrongReject上明显领先GPT-4o 10

图14：构建AI应用的五层基石理论 11

图15：AlphaZero随机初始化、self-play、MCTS、策略更新 11

图16：o1在AIEM测试中的准确率与“训练时间计算”和“测试时间计算”呈正比 12

图17：在PaLM2-S*模型修正场景中，计算优化缩放（ComputeOptimal）相比传统的Best-of-N方法效率显著提高 13

图18：主流模型输出速度和输出质量的对比，o1-preview为输出质量牺牲了输出速度 14

图19：主流模型输入和输出的价格对比 14

图20：OpenAI各模型输出和推理tokens消耗对比 14

图21：科技公司资本支出占营运现金流的比例变化趋势 15

图22：科技公司资本支出占GAAP净利润的比例变化趋势 15

表目录

表1：不同测试集和子分类下GPT-4o、o1-preview、o1的得分对比 5

表2：23年以来部分网络安全公司推出的生成式AI产品和功能 10

1、OpenAIo1开启复杂推理模型新时代

美国东部时间2024年9月12日，OpenAI发布必威体育精装版AI模型o1，o代表Orion（猎户座），开启了OpenAI的下一代复杂推理模型。

同时，OpenAI发布了即日可用的预览版o1-preview和性价比更高的轻量级版本o1-mini，可用范围如下：

ChatGPTplus和Teams用户可以直接使用，但存在次数限制。刚发布时o1-preview每周可进行30次问答，o1-mini每周可进行50次问答，9月17日开始，o1-preview和o1-mini的次数限制分别提升至每周50次和每日50次；作为o1的早期版本，o1-preview和o1-mini暂不具备实时浏览网页、上

传文件和图像等功能，计划于后续版本中陆续开放。

APITier5用户可以开始使用o1-preview和o1-mini的API，但速率限制为20RPM，暂不支持函数调用、流式处理、系统消息等功能。

3）9月16日开始，ChatGPTEnterprise和Edu用户可访问这两种模型。4）未来o1-mini计划免费向所有ChatGPT用户开放。

相比GPT-4o，o1在代码和理科能力上提升明显

在编程、理科竞赛等推理密集型任务中，o1的性能明显优于GPT-4o。根据OpenAI官方博客，

您可能关注的文档

文档评论（0）

535600147 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：6010104234000003

1亿VIP精品文档

更多 >

海外TMT行业AI产业前瞻系列报告(三)：从OpenAIo1看AI产业趋势，打破AI应用瓶颈，算力需求前景如何？.docx