网站大量收购独家精品文档,联系QQ:2885784924

DeepSeek+DeepResearch应用报告 清华大学.pptx

DeepSeek+DeepResearch应用报告 清华大学.pptx

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

DeepSeek+

DeepResearch应用;

1欢迎关注视频号@清华沈少阳系列直播;

DeepResearch应用概述;

1AI大事记(简版);

o概述:推理大模型建立在通用大模型基础之上,在推理框架上线之前,通用大模型直接回答。那现在就让他基于思维链,一步一步做好规划、调整、校对并完成输出。所以通用大模型和推理大模型它不是矛盾的存在。

o简单来看,推理大模型和通用大模型功能不一,如果把AI模型比作工具包,DeepSeek把传统通用大模型比作一把瑞士军刀,功能多但不够锋利;推理大模型则像手术刀,专精切割但用途单一。;

顾客:你好,我想查一下我的订单号为123456789的订单状态。 通用客服模型:您好!很高兴为您服务。您的订单号123456789目

前处于“已发货”状态,发货时间是2025年2月9日。根据物流信息,预计将在2月12日送达。您可以通过以下物流单号在快递官网查询详细物流信息:[物流单号]。如果您还有其他问题,欢迎随时咨询。

顾客:好的,谢谢!另外,我收到商品后发现有一件商品损坏了,

我需要申请退换货。

通用客服模型:非常抱歉给您带来不便。关于商品损坏的问题,您

可以选择退货或换货。请先告诉我以下信息:

1.您要申请退换货的商品名称和数量;

2.损坏的具体情况(最好提供照片);

3.您希望选择退货还是换货。

顾客:是这款智能手表,我需要换货。手表的屏幕碎了,我这就拍

照上传。

通用客服模型:好的,麻烦您上传照片,我会为您核实情况并处理

换货申请。同时,请您确保商品包装完整,配件齐全,以便我们顺利为您处理换货。(顾客上传照片后)

通用客服模型:感谢您提供照片,商品损坏情况已经确认。我们已

为您发起换货申请,预计换货商品将在3-5个工作日内发出。您可以在“我的订单”-“售后服务”中查看换货进度。如果还有其他问题,可以随时联系我们。;;;

PARTONE

DeepResearch应用概述;

(一)

DeepSeek

深??思考R1

概述及主要用途;

帮我画出DeepSeekR1的推理过程流程图,流程图的每个阶段需标注关键技术。以下是推理过程文字描述:

DeepSeekR1的推理过程可以划分为四个主要阶段,每个阶段都运用了特定的AI技术来逐步完善推理链条,最终得出高质量答案。这一流程采用蓝色系流程图设计,结构清晰,便于在PPT中展示和理解。以下是各阶段及其关键技术说明:

1输入阶段(用户问题解析)

用户输入自然语言问题,DeepSeekR1首先对问题进行理解与解析。在这一阶段,模型运用了**自然语言处理(NLP)**技术,将用户的自然语言提问转换为机器可理解的内部表示,提取问题的意图和关键信息。通过对输入的预处理,模型为后续推理做好准备。

2思维链生成(构建初步推理路径)

根据解析后的问题,DeepSeekR1开始“思考”,生成解决问题的初步步骤链条 (即思维链)。这一过程运用了**思维链推理(Chain-of-Thought,CoT)**技术。模型被鼓励像人类一样逐步思考,将复杂问题拆解为一系列连贯的中间推理步骤,并在每个步骤产出过渡结论。这种链式推理能提升模型对复杂任务的准确性和透明度,让观众看到模型解决问题的思路。

3强化学习优化(自我反思与迭代优化)

DeepSeekR1对生成的初步思维链进行自我检查和反思,反复迭代优化推理路径,以提高推理的正确性。在这个阶段,模型引入了强化学习(ReinforcementLearning)思想进行自我优化。具体而言,DeepSeekR1会对先前步骤的推理结果进行评估,自主发现错误或不合理之处,然后通过调整思维链来纠正偏差。这种自我验证与错误校正的过程可被视为一种自监督优化:模型在没有人工标注指导的情况下,基于试错反馈强化正确的推理路线。通过多

文档评论(0)

沧海一粟2020 + 关注
实名认证
内容提供者

文不能提笔控萝莉,武不能骑马战人妻,入佛门则六根不净,入商道则狼性不足,想想还是做文字民工!

1亿VIP精品文档

相关文档