网站大量收购闲置独家精品文档,联系QQ:2885784924

利用DeepSeek构建本地知识库.pdf

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

利⽤DeepSeek-R1构建本地知识库

一简介

初期接触LLM即大语言模型,觉得虽然很强大,但是有时候AI会一本正经的

胡说八道,这种大模型的幻觉对于日常使用来说具有很大的误导性,特别是如果我

们要用在生成环境下,由于缺少精确性而无法使用。为什么会造成这种结果那,

简单来说就是模型是为了通用性设计的,缺少相关知识,所以导致回复的结果存在

胡说八道的情况,根据香农理论,减少信息熵,就需要引入更多信息。

从这个角度来说,就有两个途径,一是重新利用相关专业知识再次训练加强模型,

或进行模型微调;模型训练的成本是巨大的,微调也需要重新标记数据和大量的

计算资源,对于个人来说基本不太现实;二是在问LLM问题的时候,增加些知识

背景,让模型可以根据这些知识背景来回复问题;后者即是知识库的构建原理了。

有个专门的概念叫RAG(Retrieval-AugmentedGeneration),即检索增强生成,

是一种结合检索技术和生成模型的技术框架,旨在提升模型生成内容的准确性和相

关性。其核心思想是:在生成答案前,先从外部知识库中检索相关信息,再将检索

结果与用户输入结合,指导生成模型输出更可靠的回答。

二RAG原理

简单概述,利用已有的文档、内部知识生成向量知识库,在提问的时候结合库

的内容一起给大模型,让其回答的更准确,它结合了信息检索和大模型技术;

分步骤来说,首先是检索阶段,当用户输入一个问题时,系统会从外部数据库或文

档中检索相关的信息或文档片段。然后,在生成阶段,这些检索到的信息会和原始

问题一起输入到生成模型中,生成最终的答案。这样,模型不仅依赖于内部知识,

还能利用外部实时或特定的数据。

我们日常简单通过chat交互方式使用大模型如下图:

我们搭建了RAG后,整体架构如下图:

说明:

1.建立索引:需要将日常的业务知识,以文件形式给分成较短的块

(chunk),然后进行编码,向量化存入到向量化的库中;nomic-embed-text-v1

模型就是做这个事情的。

2.检索向量库:根据用户的提问,到向量库中去进行向量匹配,检索出相似

的chunk,作为提问的上下文;

3.生成回复:将用户的提问内容和检索的块结合发送给大模型,大模型结合

两者进行问题的回复;

这样做有什么好处那?

1.由于日常的业务知识是保存到本地的,所以减少信息泄露的风险;

2.由于提问结合了业务知识,所以减少了模型的幻觉,即减少了模型的胡说八

道;

3.模型的回复结合了业务知识和实时知识,所以实时性可以更好;

4.不用重新训练模型,微调模型降低了成本;

三实践

需要安装以下工具:

1.Ollama:用于下载和管理模型,前面文章介绍过;

2.DeepSeek-R1:我们本次要使用的LLM模型,前面文章也介绍过;

3.Nomic-Embed-Text向量模型:用于将文本库进行切分,编码,转换进入向量

库;

4.AnythingLLM:开源AI私有化应用构建平台,即将多个模型搭配起来,共同构

建一个私有化应用;利用强大的内置工具和功能快速运行本地LLM,无需复杂

的设置。Ollama和DeepSeek-R1模型前面已经安装过了,就不再赘述,下面

安装另外两个工具;

3.1Nomic-Embed-Text模型安装

简单介绍下,Nomic-Embed-Text模型是一个强大的嵌入式文本处理工具,将我们

的业务知识(专业点的叫法语料库)转成高纬度的向量空间中的点,以便后续进行

相似度计算、分类、聚类、检索等。听起来这个好像很高级,如果简单来看的

话,其实底层原理也简单,文本相似度可以通过两个高纬度向量的余弦值大小来判

断的,余弦值越大的,两个高纬度向量靠的越近,相关性大,反之亦然,当然也有

复杂的算法。

余弦值计

文档评论(0)

偷得浮生半日闲 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档