- 1、本文档共61页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
浙江大学DeepSeek系列专题线上公开课(第二季)
从大模型、智能体到复杂AI应用系统的构建
——以产业大脑为例
2025.03杭州;
?大模型推理能力快速提升
?推理模型和思维链(CoT)
?智能体是什么?
?四链融合产业大脑案例;
大模型推理能力快速提升;
快速回望历史——大模型的产生;
OpenAI公司于2022年11月发布ChatGPT,短短三个月内日活跃用户从零增长至超过3000万,标志着对话式AI进入大众应用阶段;
辨别式AI
对现有内容进行分析、分类、判断、预测;
Multi-taskLanguageUnderstandingonMMLU;;
大语言模型易产生幻觉,在数学推理方面表现在推理能力严重不足,体现在简单数值比较错误、多步推理能力弱、推理不一致等;
YannLeCun的批判观点:对纯粹扩大规模方法的根本质疑
MehrdadFarajtabar:LLM本质上是统计模式匹配工具,而非真正的推理系统、下一个词预测框架不足以产生真正的理解;
2023-2024年,推理能力突破性进展:
?OpenAIo1/o3在数学和代码推理任务上的卓越表现
?开源大模型DeepSeek-R1在MATH基准上达到87.2%的准确率;
DeepSeek的“ahamoment”
这种深度推理能力是如何实现的?是单纯的规模扩展结果,还是有其他关键因素?;
1.早期的大模型推理能力不足
2.OpenAI-o系列模型和DeepSeek-R1等胜在推理能力较强;
推理模型和思维链(ChainofThought,CoT);;
o1/o3在回答问题之前先Reasoning,生成一个详细的内部思维链,模拟人类的深思熟虑,逐步分解复杂的问题,提高答案的准确性和深度。;
要知道从玉泉校区到紫金港校区如何最快出行,首先得知道有几种交通路线:
1.89路公交车,共17站,需步行2分钟,共用时50分钟
2.地铁10号线转2号线,这样就是2站+5站,共7站,需步行20分钟,共用时43分钟
3.地铁3号线转7149路公交车,这样就是3站+11站,共14站,需步行11分钟,共用时50分钟
4.还可以……
这样综合看起来,最快的交通方案应该2,共用时43分钟;
桌子上放着50根火柴,丁丁、田田二人轮流每次取走1~3根。规定谁取走最后一根火柴谁输。??果双方采用最佳方法,丁丁先取,那么谁将获胜?;;
s1通过在一个精心构建的小规模数据集上(1000条数据)进行微调,并结合预算强制技术,实现了强大的推理能力和测试时计算扩展性;
LessIsMoreforReasoning
LIMO假说:在预训练阶段已经充分编码领域知识的基础模型中,复杂的推理能力可以通过最少但精确编排的认知过程演示来涌现:
?模型具备丰富预训练知识
?高质量的推理链示范;
1.自动化思维链(CoT)的实现是新一代大模型的精髓之一
2.经过精心设计的少量高质量样本即可实现适用于某个专业领域
的高性能低成本推理模型;
智能体(AIAgent)是什么?;
?大模型除了可以和我聊天、回答问题,到底还能干什么?;;
①用户打开邮箱,手动拷贝邮件内容
②用户将邮件内容拷贝到大模型运行界面的对话框,写提示词:请基于以下邮件内容帮我草拟一封回复
③大模型根据提示词自动生成回复邮件
④用户将大模型生成的回复邮件拷贝至邮箱
⑤用户填写地址、邮件标题,点击发送;
大语言模型(LLM)可以接受输入,可以分析推理、规划任务、输出文字\代码\媒体。然而,其无法像人类一样,拥有运用各种工具与物理世界互动,以及拥有人类的记忆能力。;
第一步:智能体进行任务拆解,首先调用CollectLinks工具从有哪些信誉好的足球投注网站引擎进行有哪些信誉好的足球投注网站并获取Url地址列表
/developer/article/2422923;
?撰写调研报告:调研特斯拉FSD和华为ADS这两个自动驾驶系统;
类
型;;
ThegrowthtrendonthefieldofLLM-basedautonomousagents;
Models,也就是我们熟悉的调用大模型API。
PromptTemplates,在提示词中引入变量以适应用户输入的提示模版。
Chains,对模型的链式调用,以上一个输出为下一个输入的一部分。
Agent,能自主执行链式调用,以及访问外部工具。
Multi-
文档评论(0)