- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
利⽤DeepSeek-R1构建本地知识库
一简介
初期接触LLM即大语言模型,觉得虽然很强大,但是有时候AI会一本正经的
胡说八道,这种大模型的幻觉对于日常使用来说具有很大的误导性,特别是如果我
们要用在生成环境下,由于缺少精确性而无法使用。为什么会造成这种结果那,
简单来说就是模型是为了通用性设计的,缺少相关知识,所以导致回复的结果存在
胡说八道的情况,根据香农理论,减少信息熵,就需要引入更多信息。
从这个角度来说,就有两个途径,一是重新利用相关专业知识再次训练加强模型,
或进行模型微调;模型训练的成本是巨大的,微调也需要重新标记数据和大量的
计算资源,对于个人来说基本不太现实;二是在问LLM问题的时候,增加些知识
背景,让模型可以根据这些知识背景来回复问题;后者即是知识库的构建原理了。
有个专门的概念叫RAG(Retrieval-AugmentedGeneration),即检索增强生成,
是一种结合检索技术和生成模型的技术框架,旨在提升模型生成内容的准确性和相
关性。其核心思想是:在生成答案前,先从外部知识库中检索相关信息,再将检索
结果与用户输入结合,指导生成模型输出更可靠的回答。
二RAG原理
简单概述,利用已有的文档、内部知识生成向量知识库,在提问的时候结合库
的内容一起给大模型,让其回答的更准确,它结合了信息检索和大模型技术;
分步骤来说,首先是检索阶段,当用户输入一个问题时,系统会从外部数据库或文
档中检索相关的信息或文档片段。然后,在生成阶段,这些检索到的信息会和原始
问题一起输入到生成模型中,生成最终的答案。这样,模型不仅依赖于内部知识,
还能利用外部实时或特定的数据。
我们日常简单通过chat交互方式使用大模型如下图:
我们搭建了RAG后,整体架构如下图:
说明:
1.建立索引:需要将日常的业务知识,以文件形式给分成较短的块
(chunk),然后进行编码,向量化存入到向量化的库中;nomic-embed-text-v1
模型就是做这个事情的。
2.检索向量库:根据用户的提问,到向量库中去进行向量匹配,检索出相似
的chunk,作为提问的上下文;
3.生成回复:将用户的提问内容和检索的块结合发送给大模型,大模型结合
两者进行问题的回复;
这样做有什么好处那?
1.由于日常的业务知识是保存到本地的,所以减少信息泄露的风险;
2.由于提问结合了业务知识,所以减少了模型的幻觉,即减少了模型的胡说八
道;
3.模型的回复结合了业务知识和实时知识,所以实时性可以更好;
4.不用重新训练模型,微调模型降低了成本;
三实践
需要安装以下工具:
1.Ollama:用于下载和管理模型,前面文章介绍过;
2.DeepSeek-R1:我们本次要使用的LLM模型,前面文章也介绍过;
3.Nomic-Embed-Text向量模型:用于将文本库进行切分,编码,转换进入向量
库;
4.AnythingLLM:开源AI私有化应用构建平台,即将多个模型搭配起来,共同构
建一个私有化应用;利用强大的内置工具和功能快速运行本地LLM,无需复杂
的设置。Ollama和DeepSeek-R1模型前面已经安装过了,就不再赘述,下面
安装另外两个工具;
3.1Nomic-Embed-Text模型安装
简单介绍下,Nomic-Embed-Text模型是一个强大的嵌入式文本处理工具,将我们
的业务知识(专业点的叫法语料库)转成高纬度的向量空间中的点,以便后续进行
相似度计算、分类、聚类、检索等。听起来这个好像很高级,如果简单来看的
话,其实底层原理也简单,文本相似度可以通过两个高纬度向量的余弦值大小来判
断的,余弦值越大的,两个高纬度向量靠的越近,相关性大,反之亦然,当然也有
复杂的算法。
余弦值计
您可能关注的文档
最近下载
- 湖南美术出版社四年级下册书法教案2套(完整版).pdf
- 高考英语写作之句型转换练习(含答案)-2025届高三英语二轮复习.docx VIP
- 定制家具营销方案.docx VIP
- 《柴油机电控系统硬件在环仿真平台开发技术规范》标准文本附编制说明.pdf
- 2025人教版新教材三年级下册英语全册精品教案.docx
- 中国农村给水工程规划C设计手册(目录).doc
- (GBT31710-2015休闲露营地建设与服务规范.docx VIP
- 2025年八省联考地理试卷分析及复习备考策略指导(深度课件).pdf
- 产褥期卫生指导与保健PPT课件.pptx VIP
- 2024年吉林省高考英语试卷(含答案解析)+听力音频.docx
文档评论(0)