- 1、本文档共61页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
智能体-人类-环境统一对齐原则初探
李鹏
2024年10月13日
大模型智能体迅猛发展
•2023年以来大模型智能体受到广泛关注,研究、框架、应用迅猛发展。
/watch?v=U9mJuUkhUzk;/live/XEzRZ35urlk?t=1485s;Wangetal.2023.ASurveyonLargeLanguageModelbasedAutonomousAgents.arXiv:2308.11432.2
智能体历史沿革
•智能体概念由来以久,是对人工智能问题的重要研究抽象。
Anagentisanythingthatcanbeviewedasperceivingitsenvironmentthrough
sensorsandactinguponthatenvironmentthroughactuators.
——StuartJ.RussellandPeterNorvig
Russell,S.J.Artificialintelligence:Amodernapproach.PearsonEducation,Inc.,2010.3
传统智能体v.s.大模型智能体
•解决开放域问题将是大模型智能体区别于传统智能体的关键特征之一。
AlphaStarAutoGPT
•训练:强化学习+自我对弈•训练:免训练
•数据:专用环境收集的海量数据•数据:无需专门收集数据
•任务:仅能玩星际争霸2•任务:可完成多样化任务
https://deepmind.google/discover/blog/alphastar-mastering-the-real-time-strategy-game-starcraft-ii/;https://auto-gpt.ai/4
大模型智能体现状
•当前大模型智能体虽获取广泛关注,但尚未完成在开放域上的效果阶跃。
潜力初现效果阶跃
GPT-3ChatGPT
•通用性
•自主性
•有效性
大模型智能体
5
典型系统1:OpenAIGPTs
•基础版:使用文字配置智能体,可看作系统提示的产品化。
•进阶版:基础版+工具调用,增加了一定自主性。
通用性
可引入外部API
GPTs自主决定何时使用API
自主性
有效性
图片来源:/tutorial/how-to-make-custom-gpts6
典型系统2:斯坦福小镇
•可以一定程度实现人类行为的模拟,并观察到涌现行为。
•目前尚无法胜任大规模人类行为的模拟,模拟可信性也仍需提
您可能关注的文档
最近下载
- 年会语言类节目搞笑朗诵《我爱上班》表演.pptx
- 《马克思主义基本原理概论》教案12 资本主义的本质及规律.doc VIP
- 55种语言汉译译音表-世界人名翻译大辞典.pdf
- 我们的母亲叫中国:.pptx VIP
- 1.6+隋唐时期的中外文化交流++课件++2024-2025学年统编版七年级历史下册+.pptx VIP
- 水稻绿色高产高效创建服务 投标方案(技术方案).docx
- 医用氧自检检查记录表.pdf
- 2024辽宁沈阳市文体旅产业发展集团有限公司中层岗位招聘5人笔试备考试题及答案解析.docx
- 《国际经济法学》(第二版)课后思考题答案.pdf
- 55个单病种(术种)管理指标质量控制标准(第二部分).xlsx
文档评论(0)