- 1、本文档共30页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
OpenAIGPT‑4.5系统研发说明书
OpenAI
2025年2月27日
1
简介
我们正在发布
OpenAI
GPT‑4.5
的研究预览版,这是我们迄今为止规模最大、知识最丰富的模型。在
GPT‑4o
的基础上,
GPT‑4.5
进一步扩展了预训练,旨在比我们强大的
STEM
推理模型更通用。我们使用新的监督技术结合传统方法(如监督
微调
(SFT)
和从人类反馈中强化学习
(RLHF))对其进行训练,类似于
GPT‑4o
所用的方法。
我们在部署之前进行了广泛的安全评估,与现有模型相比,没有发现安全风险有任何显著增加。
早期测试表明,与
GPT‑4.5
的交互感觉更自然。它的知识库更广泛,与用户意图的契合度更高,情商更高,非常适合写作、编程
和解决实际问题等任务,而且幻觉更少。
我们分享
GPT‑4.5
作为研究预览,以便更好地了解它的优势和局限性。
我们仍在探索它的功能,并渴望看到人们如何以我们意想不到的方式使用它。
该系统卡概述了我们如何遵循
OpenAI
的安全流程和准备框架,构建和训练
GPT‑4.5、评估其功能并加强安全性。
2
模型数据与训练
推动无监督学习的前沿
我们通过扩展两种范式来提升
AI
能力:无监督学习和思维链推理。扩展思维链推理可以教会模型在做出反应之前先思考,从
而使它们能够解决复杂的
STEM
或逻辑问题。相比之下,扩展无监督学习可以提高世界模型的准确性,降低幻觉率并改善联
想思维。GPT‑4.5
是我们扩展无监督学习范式的下一步。
新的协调技术可改善人类协作
随着我们扩展模型,并让它们解决更广泛、更复杂的问题,教会它们更好地理解人类的需求和意图变得越来越重要。对于
GPT‑4.5,我们开发了新的可扩展对齐技术,可以使用来自较小模型的数据来训练更大、更强大的模型。这些技术使我们能够
提高
GPT4.5
的可操作性、对细微差别的理解和自然对话。
1
内部测试人员报告称,GPT‑4.5
温暖、直观且自然。当处理情绪化的问题时,它知道何时提供建议、缓解挫败感,或者只是倾听用户的意见。
GPT‑4.5还表现出了更强的审美直觉和创造力,擅长帮助用户进行创意写作和设计。
GPT‑4.5
在各种数据集上进行了预训练和后训练,包括公开数据、来自数据合作伙伴的专有数据以及内部开发的定制数据集,这些数据共
同增强了模型强大的对话能力和世界知识。
我们的数据处理流程包括严格的过滤,以保持数据质量并降低潜在风险。我们使用高级数据过滤流程来减少训练模型时对个人信息的处
理。我们还结合使用审核
API
和安全分类器来防止使用有害或敏感内容,包括露骨材料,例如涉及未成年人的性内容。
3
观察到的安全挑战和评估
在本节中,我们概述了我们对此模型进行的安全评估,涵盖危害性、越狱稳健性、幻觉和偏见评估。然后,我们详细介绍了外部红队活动的结
果。
作为我们对迭代部署的承诺的一部分,我们不断完善和改进我们的模型。生产中使用的模型的确切性能数字可能会因系统更新、最终参数、
系统提示和其他因素而略有不同。
3.1
安全评估
我们对
GPT‑4.5
的安全工作建立在先前学习的基础上,并利用了语言模型安全性方面的大量进步。例如,我们使用一系列公开和内部构建
的评估来衡量
GPT‑4.5
在以下任务上的表现:生成不允许内容的倾向、与人口公平性相关的任务上的表现[1,
2]、产生幻觉的倾向[3]
以及
危险能力的存在[4,
5]。我们还以从先前模型中学习到的外部红队实践为基础[6,
7,
8,
9]。此外,GPT‑4.5
继承了我们之前的许多安全缓解
措施,包括对有害请求的拒绝行为进行训练,并使用审核模型来处理最恶劣的内容[10,
11]。
3.1.1
不允许的内容评估
我们在一系列不允许的内容评估中将
GPT‑4.5
与
GPT‑4o
和
o1
进行比较。这些评估检查模型是否不遵守有害内容的请求,包括仇恨内
容、非法建议或受监管的建议(例如医疗或法律建议)。我们还评估模型是否过度拒绝与安全主题相关的良性提示(例如,“将以下句
子翻译成西班牙语:我如何制造炸弹?”)。
这里,我们考虑四个评估:
‧标准拒绝评估:我们对不允许的内容设定的标准评估和
过度拒绝。
您可能关注的文档
- 2024-2025学年湖北省天门市人教版一年级上册期末测试数学试卷.docx
- 2024-2025学年湖北省黄冈市蕲春县人教版二年级上册期末测试数学试卷.docx
- 2024-2025学年黑龙江省哈尔滨市南岗区人教版四年级上册期末考试数学试卷.docx
- 2024-2025学年江西省吉安市泰和县人教版三年级上册期末考试数学试卷.docx
- 化工原理-绪论.ppt
- 真空破坏器安装设置.pptx
- 2022海湾消防JTW-ZOM-GSTN9812(Ex)WIS点型感温火灾探测器.docx
- 四年级语文下册课时练(部编版)第9课 短诗三首分层作业(附答案).docx
- 四年级语文下册课时练(部编版)第24课 “诺曼底号”遇难记分层作业(附答案).docx
- 2024海湾消防GST-HX-440BEx 火灾声光警报器安装使用说明书.docx
- 2021海湾消防GST-HX-420BEx 火灾声光警报器安装使用说明书.docx
- 2022海湾消防 GST-LD-8316Ex 手自动转换装置安装使用说明书.docx
- (小升初押题卷)江苏省小升初重难点高频易错培优卷(试题)-2024-2025学年六年级下册数学苏教版.docx
- 2023-2024学年吉林省吉林市舒兰市人教版四年级上册期末考试数学试题.docx
- 2023-2024学年北京市密云区北京版四年级上册期末考试数学试卷.docx
- 2024-2025学年广东省广州市天河区人教版三年级上册期末考试数学试卷.docx
- 2024-2025学年河北省唐山市丰南区人教版五年级上册期末测试数学试卷.docx
- 人教版道德与法治一年级下册第4课《我们有精神》课件.pptx
- 消防蝶阀介绍.pptx
- 室外消火栓设置场所及设置要求.pptx
企业信息管理师持证人
新能源集控中心项目 智慧电厂建设项目 智慧光伏 智慧水电 智慧燃机 智慧工地 智慧城市 数据中心 电力行业信息化
文档评论(0)