DeepSeek+DeepResearch应用报告清华大学.pptx

下载文档

0
0
约1.4万字
约 59页
2025-02-20 发布于广东
举报
版权申诉
保障服务

DeepSeek+DeepResearch应用报告清华大学.pptx

1、本文档共59页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

DeepSeek+

DeepResearch应用;

1欢迎关注视频号@清华沈少阳系列直播;

壹

DeepResearch应用概述;

1AI大事记(简版);

o概述：推理大模型建立在通用大模型基础之上，在推理框架上线之前，通用大模型直接回答。那现在就让他基于思维链，一步一步做好规划、调整、校对并完成输出。所以通用大模型和推理大模型它不是矛盾的存在。

o简单来看，推理大模型和通用大模型功能不一，如果把AI模型比作工具包，DeepSeek把传统通用大模型比作一把瑞士军刀，功能多但不够锋利；推理大模型则像手术刀，专精切割但用途单一。;

顾客：你好，我想查一下我的订单号为123456789的订单状态。通用客服模型：您好！很高兴为您服务。您的订单号123456789目

前处于“已发货”状态，发货时间是2025年2月9日。根据物流信息，预计将在2月12日送达。您可以通过以下物流单号在快递官网查询详细物流信息：[物流单号]。如果您还有其他问题，欢迎随时咨询。

顾客：好的，谢谢！另外，我收到商品后发现有一件商品损坏了，

我需要申请退换货。

通用客服模型：非常抱歉给您带来不便。关于商品损坏的问题，您

可以选择退货或换货。请先告诉我以下信息：

1.您要申请退换货的商品名称和数量；

2.损坏的具体情况(最好提供照片)；

3.您希望选择退货还是换货。

顾客：是这款智能手表，我需要换货。手表的屏幕碎了，我这就拍

照上传。

通用客服模型：好的，麻烦您上传照片，我会为您核实情况并处理

换货申请。同时，请您确保商品包装完整，配件齐全，以便我们顺利为您处理换货。(顾客上传照片后)

通用客服模型：感谢您提供照片，商品损坏情况已经确认。我们已

为您发起换货申请，预计换货商品将在3-5个工作日内发出。您可以在“我的订单”-“售后服务”中查看换货进度。如果还有其他问题，可以随时联系我们。;;;

PARTONE

壹

DeepResearch应用概述;

(一)

DeepSeek

深??思考R1

概述及主要用途;

帮我画出DeepSeekR1的推理过程流程图，流程图的每个阶段需标注关键技术。以下是推理过程文字描述：

DeepSeekR1的推理过程可以划分为四个主要阶段，每个阶段都运用了特定的AI技术来逐步完善推理链条，最终得出高质量答案。这一流程采用蓝色系流程图设计，结构清晰，便于在PPT中展示和理解。以下是各阶段及其关键技术说明：

1输入阶段(用户问题解析)

用户输入自然语言问题，DeepSeekR1首先对问题进行理解与解析。在这一阶段，模型运用了**自然语言处理(NLP)**技术，将用户的自然语言提问转换为机器可理解的内部表示，提取问题的意图和关键信息。通过对输入的预处理，模型为后续推理做好准备。

2思维链生成(构建初步推理路径)

根据解析后的问题，DeepSeekR1开始“思考”，生成解决问题的初步步骤链条 (即思维链)。这一过程运用了**思维链推理(Chain-of-Thought,CoT)**技术。模型被鼓励像人类一样逐步思考，将复杂问题拆解为一系列连贯的中间推理步骤，并在每个步骤产出过渡结论。这种链式推理能提升模型对复杂任务的准确性和透明度，让观众看到模型解决问题的思路。

3强化学习优化(自我反思与迭代优化)

DeepSeekR1对生成的初步思维链进行自我检查和反思，反复迭代优化推理路径，以提高推理的正确性。在这个阶段，模型引入了强化学习(ReinforcementLearning)思想进行自我优化。具体而言，DeepSeekR1会对先前步骤的推理结果进行评估，自主发现错误或不合理之处，然后通过调整思维链来纠正偏差。这种自我验证与错误校正的过程可被视为一种自监督优化：模型在没有人工标注指导的情况下，基于试错反馈强化正确的推理路线。通过多

您可能关注的文档

文档评论（0）

沧海一粟2020 + 关注: 实名认证

内容提供者

文不能提笔控萝莉，武不能骑马战人妻，入佛门则六根不净，入商道则狼性不足，想想还是做文字民工！

咨询Ta 进入空间

1亿VIP精品文档

更多 >

DeepSeek+DeepResearch应用报告清华大学.pptx