- 1、本文档共32页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要;目录;发布三大基础模型,模型性能跨越式提升
12天的发布会中,OpenAI推出了三款基础模型,分别是增强的ChatGPTo1模型、Sora视频生成模型、o3模型,新的模型在数学和科学领域均有着卓越表现,同时也意味着openai在推理能力方面迈出了重要一步。
o3模型的发布,更是标志着AI在编程、科学推理等领域的巨大进步。o3模型接近通用人工智能(AGI)的标准,为复杂决策和高端问题解决提供了新的技术基础。
Sora的发布将极大降低内容创作的成本和时间。为营销、培训、市场等各领域提供AI生成的高质量视频,有望成为企业未来内容创作的新标准。;发布日期;发布日期;;支持多模态,可处理模糊问题
OpenAI对o1进行了改进,目前支持图像、文本两种输入方式。在演示中,对于一张手绘的太空太阳能驱动的数据中心示意图,o1估计出了其散热器表面积并解答了两个问题:如何处理太阳和深空环??,以及这里如何体现了热力学第一定律,整个推理过程仅需10秒钟。
在示例中,OpenAI故意省略了冷却面板的温度等关键数据,用以测试o1在处理模糊问题时的能力。示例中o1自行识别了关键参数缺失,并选择了合理的温度范围进行后续的推理,输出了合理结果。
OpenAI表示,o1未来还会添加网页浏览、文件上传等功能,以及引入API,具体上线时间未知。;;;什么是强化微调?
强化微调可让开发者使用强化学习针对具体任务对模型进行进一步微调,并根据提供的参考答案对模型的响应进行评分具体来说,强化微调不仅会教模型模仿其输入,更是会让其学会在特定领域以新的方式进行推理。当模型发现问题时,要为它提供思考问题的空间,然后再对模型给出的响应进行打分。之后,利用强化学习的力量,可以强化模型得到正确答案的思维方式并抑制导向错误答案的思维方式。
强化微调的优势?
快速高效:相比于传统技术,强化微调技术更高效,不需要大规模的数据集支持。
使用灵活:用户可根据需求即时调整模型,使模型更加符合特定场景需求。
应用广泛:强化微调技术可以推动客服、教育、创意、研究等各个领域的应用。;强化微调后在特定领域性能明显提升
在官方演示里,OpenAI设置了一个实验:在给定症状列表的情况下,用模型预测可能导致罕见遗传疾病的基因,并让模型解释为什么选这些基因。实验人员使用三种模型进行对比:o1mini、o1完整版、o1mini强化微调版。
对于o1mini强化微调版,实验人员汇集了大约1100个病例报告作为训练和验证的数据集,在使用训练数据集对模型进行训练后,上传验证数据集对模型推理能力进行反复测试和调整,同时保证验证数据集和训练数据集之间的正确基因没有重叠,以防模型作弊。评估结果时,实验人员设置了三项指标:1)模型一次答对的概率;2)模型前五次预测中有正确答案的概率;3)模型预测中有正确答案的概率。
结果显示,经过强化微调的o1mini在一次答对的准确率上跃升180%达到了31%,各方面全面超越了o1。强化微调技术将使开发者能够通过更快、成本更低的o1mini模型获得超越o1的专业性能,将极大促进AI在各领域的应用。;;;;Canvas主要功能
用户编辑文字:在使用Canvas工具后,交互页面将被分为两部分,左侧为与模型的对话,右侧为用户可直接编辑的文档,用户可直接在Canvas工具中删除、添加、修改ChatGPT回复的内容,以及进行加粗等格式调整。不论是写信、写公文还是论文,这种新生成模式都可以大幅提升效率。同时OpenAI在Canvas工具右下角集成了部分快捷工具,用户只需点击即可实现包括询问模型反馈(Suggestedits)、文档长度调整(Adjustthelength)、语言风格转化(Readinglevel)、文档润色(Addfinalpolish)、添加表情(Addemojis)这些用户在处理文档时的常用功能。
审稿:很多人使用ChatGPT帮助写作,但以前一问一答的形式非常繁琐,现在用户只需要把文章复制粘贴到ChatGPT的文本框中,通过文本输入让其给出修改建议,大模型给出的建议会以逐条批注的形式出现。用户可在页面中对应位置看到ChatGPT给出的修改建议,并决定是否根据批注进行润色,之后关闭建议,或者直接选择Apply,让ChatGPT自行对内容进行修改。这使用户可以更直观的使用模型帮助自己审阅文章,并给出建议。
图16:Canvas可快捷实现对模型回复的修改 图17:Canvas可让用户更直观的看到ChatGPT对文章的修改建议;Canvas主要功能
编程:Canvas可以直接识别代码,并转变成为代码编辑模式。用户还可以在Canvas上直接运行测试,以及错误识别和修改错误的建议。用户想要Debug时,可直接代码复制到Chat
您可能关注的文档
- 煤炭行业2025年增量稳、存量优,依然值得把握的价值资产.pptx
- 美国美护行业梳理:零售增速表现较稳定,重点关注大众品牌.pptx
- 美护行业25年年度策略报告:强者恒强,小而美赛道值得期待.pptx
- 美联储降息预期走弱,金属价格整体下行.pptx
- 美联储鹰派降息,国内宏观向好支撑金属价格.pptx
- 美容护理行业2025年度策略:掘金优质资产,把握稀缺性与质价比主线.pptx
- 平安研粹:2025年1月市场观点.pptx
- 苹果创新驱动硬件变革,果链设备迎来机会.pptx
- 汽车行业2025年电动智能与机器人共舞,行业周期加速向上.pptx
- 汽车行业华为汽车产业链深度报告:携手江淮进军超高端,华为车生态圈持续扩容.pptx
文档评论(0)