- 1、本文档共121页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Deepseek内部研讨系列
DeepSeek私有化部署和一体机
AI肖睿团队
(韩露、王春辉、顾跃、李娜、谢安明、陈钟)北京
?北大青鸟人工智能研究院
?北大计算机学院元宇宙技术研究所
摘要
1.本次讲座为DeepSeek原理和应用系列研讨的讲座之一,让大家可以决策是否需要自己部署DeepSeek系列模型,并了解自己本地化部署DeepSeek的基本方法,同时了解更专业的企业级部署方法,有助于选择DeepSeek一体机型号,并能理解DeepSeek云服务的工作机制和原理,用好DeepSeek云服务的API调用方法。
2.本讲座的内容分为四个主要部分:
①首先,除了DeepSeek满血版之外,还有各种各样的蒸馏版和量化版,以及DeepSeek的不同专业模型。我们将介绍人工智能大模型的基本概念,以及DeepSeek各个模型的特点与适用场景,对比不同规模模型的性能表现,帮助大家选择最适合自己需求的版本。
②其次,对于普通用户在自己的电脑上部署和体验DeepSeek(蒸馏版)的情况,我们会评估和建议硬件要求,演示如何通过Ollama命令行高效部署DeepSeek模型,解决下载过程中可能遇到的常见问题。为了提升在自己的电脑上安装DeepSeek模型后,大家与DeepSeek模型的交互体验,我们还将介绍OpenWebUI和Chatbox等前端展示工具的配置与使用方法。
③然后,对于专业级的企业部署DeepSeek,或把DeepSeek(蒸馏版和满血版)部署在专业的昂贵的推理机上,本讲座将探讨基于Transformers快速验证和vLLM的高性能部署方案,并提供真实企业基于vLLM的部署DeepSeek-70b的相关数据和经验。
④最后,作为补充内容,针对计算资源受限的场景,我们专门设计了低成本部署环节,详细讲解UnslothR1动态量化部署的三种实现路径:基于llama.cpp、KTransformers以及Ollama框架动态量化部署。
23.在技术学习的道路上,优质学习资源至关重要。推荐大家参考《人工智能通识教程(微课版)》这本系统全面的入门教材,结合B站“思睿观通”栏目的配套视频进行学习。此外,欢迎加入社区,以及“AI肖睿团队”的视频号和微信号,与志同道合的AI爱好者交流经验、分享心得。
2
c
ciNiV
898
目
目录
CONTENTS
02
02个人部署DeepSeek04DeepSeek一体机
人工智能与
人工智能与DeepSeek03企业部署DeepSeek
3
PART01
PEKINGUNIVERSITY
PEKINGUNIVERSITY
人工智能与DeepSeek
4
大模型相关术语
l多模态
文本、图片、音频、视频lAI工具(国内)
DeepSeek、豆包、Kimi、腾讯元宝、智谱清言、通义千问、秘塔有哪些信誉好的足球投注网站、微信有哪些信誉好的足球投注网站...
l通用模型
大语言模型(LLM,LargeLanguageModel)
生成模型
推理模型
视觉模型(图片、视频)
音频模型
多模态模型……
l行业模型(垂直模型、垂类模型)
教育、医疗、金融、办公、安全等
5
大模型的前世今生
?人工智能:让机器具备动物智能,人类智能,非人类智能(超人类智能)
?运算推理:规则核心;自动化
?知识工程:知识核心;知识库+推理机
?机器学习:学习核心;数据智能(统计学习方法,数据建模)
?常规机器学习方法:逻辑回归,决策森林,支持向量机,马尔科夫链,…..
?人工神经网络:与人脑最大的共同点是名字,机制和架构并不一样
?传统神经网络:霍普菲尔德网络,玻尔兹曼机,…..
?深度神经网络:深度学习
?传统网络架构:DBN,CNN,RNN,ResNet,Inception,RWKV,……
?Transformer架构:可以并行矩阵计算(GPU),核心是注意力机制(Attention)
?编码器(BERT):多数embedding模型,Ernie早期版本,…….
?混合网络:T5、GLM
?解码器(GPT):大语言模型(LLM),也是传统的多模态模型的核心
?生成式人工智能(GenAI):AIGC
?DeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、火山、……?OpenAIGPT(ChatGPT)、Claude、Llama、Grok、……
?Diffusion架构:主要用于视觉模型(比如StableDiffusion、DALL.E),现在也开始尝试用于语言模型
?Diffusion+Transformer架构:例如Sora
您可能关注的文档
- 电子行业深度研究报告:AI眼镜洞见未来,SoC智控万物互联.docx
- 餐饮行业产品上新报告(2025年1月)-红餐研究院.docx
- 2024年度中国电商服务商消费投诉数据与典型案例报告-网经社.docx
- 2025面向工程审计行业的DeepSeek大模型应用指南.docx
- 2024年度中国品牌电商消费投诉数据与典型案例报告-网经社.docx
- 2025年deepseek技术全景解析报告-重塑全球AI生态的中国力量.docx
- 2025年防晒市场洞察及趋势前瞻.pptx
- 2024年中国汽车产业出海回顾分析-中汽信科国际化研究团队.pptx
- 连锁超市品牌小红书营销推广方案.docx
- 对标一流-2025年国央企风控合规案例白皮书-启信慧眼.docx
最近下载
- 00401比较学前教育复习提纲(2015年版-修改版).doc
- 肠肿瘤和肠息肉-外科学课件.ppt
- 可视化人力资源分析看板.xlsx VIP
- CB01_012 多头小直径防渗墙施工方案.doc
- 人力资源看板.xlsx VIP
- 第10课 保存信息资源 课件 义务教育版2024信息科技三年级全一册.pptx
- 2024年-人教版PEP小学英语六年级下册人教版pep小学六年级英语下册第一单元测试题Unit 1.docx VIP
- 第6课 隋唐时期的中外文化交流(课件)2024-2025学年 历史同步教学课件.pptx VIP
- 糖尿病患者血脂管理中国专家共识2024版.pptx
- 《建筑节能与可再生能源利用通用规范》GB-55015-2021.pdf VIP
文档评论(0)