- 1、本文档共223页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2024
页码:2/223
页码:2/223
核心技术页码:3/223
核心技术
页码:3/223
RAG+Agent:基于腾讯云ES与混元大模
型构建专属AI助手
01
背景概述
随着数据智能技术的不断发展,以大语言模型(LLM)驱动的AIGC为代表的内容生成技术已经成为企业数据智能能力中不可或缺的一部分,但传统的内容生成技术存在信息更新不及时、垂直领域知识匮乏、模型幻觉等问题,如何推进大模型在各行业、各业务场景落地是各方普遍关注的问题,而检索增强生成(Retrieval-AugmentedGeneration,RAG)技术则为此提供了有效的解决方案,成为数据智能时代的一大趋势。
RAG是一种结合了检索和大语言模型内容生成的技术方案,它通过引用外部知识库,在用户输入Query时检索出知识,然后让模型基于可信的知识进行用户回答。RAG具有较高的可解释性和定制能力,可大幅降低大语言模型的幻觉,适用于问答系统、文档生成、智能助手等多种自然语言处理任务中。本文将通过介绍腾讯云ES一站式RAG方案,演示如何通过结合腾讯云ES与混元大模型,快速构建RAG应用。
02
腾讯云ES一站式RAG方案
腾讯云ES是云端全托管海量数据检索分析服务,拥有高性能自研内核,集成X-Pack,支持通过自治索引、存算分离、集群巡检等特性轻松管理集群,也支持免运维、自动弹性、按需使用的Serverless模式。在自研内核方面,腾讯云ES依托腾讯内外部海量业务的运营经验,针对ES内核进行了成本、性能、稳定性、拓展性等方面的优化,是亚太地区开源贡献第一的团队,使用腾讯云ES您可以高效构建在线有哪些信誉好的足球投注网站、向量检索、日志分析、运维监控、智能问答等服务。
在RAG方面,腾讯云ES支持了一站式向量检索、文本+向量混合有哪些信誉好的足球投注网站、倒数排序融合、与大模型集成、GPU高性能推理、字段级别权限控制等能力,同时针对查询性能做了大量优化,有效的提升了数据检索效率。
当然,作为国内公有云首个从自然语言处理、到向量生成/存储/检索、并与大模型集成的端到端一站式技术平台,腾讯云ES也作为核心参编单位参与了由信通院组织的RAG标准制定,同时成为首个通过RAG权威认证的企业。
03
AI助手构建
购买ES集群
1、登录腾讯云ES控制台:/login?s_url=https%3A%2F%2Fconsole.cloud.t%2Fapi%2Fexplorer%3FProduct%3Dhunyuan%26Version%3D2023-09-01%26Action%3DChatCompletions(复制链接到浏览器打开)
2、点击「新建」
3、产品类型选择为:通用版
4、选择版本:计费模式为按量计费、ES版本为8.13.3、商业特性为白金版
5、ES节点配置,测试环境可选择为ES.S1(2核4G),节点数为2,磁盘为通用型SSD,磁盘容量为20GB
6、其余配置选择默认即可
登录Kibana
访问Kibana,设置公网访问策略
3、点击Kibana公网访问地址访问Kibana
部署embedding模型
集群购买完成后,前往Kibana部署Embedding模型、创建知识库索引与向量化管道
1、开启「节点出站访问」,仅开启数据节点即可,如有专用主节点,仅开启专用主节点即可。(该功能为白名单,请联系工单处理)注:如需上传自定义模型或第三方平台(如Huggingface)模型,可参考文档:/elastic/eland(复制链接到浏览器打开)
2、登录Kibana之后,在左侧导航栏找到「MachineLearning」功能
3、进入模型管理页面,并找到类型为「text_embedding」的模型
4、如为未下载状态,选中模型,并点击「Addtrainedmodel」,本次演示我们使用「.multilingual-e5-small_linux-x86_64」模型
5、下载完成后,点击部署
6、为快速体验,配置使用默认值即可
创建索引与向量化管道
1、点击进入「Devtools」
2、创建知识库索引
index-name为索引名称,实际可按需命名
3、创建推理管道,该管道可用于写入数据时进行数据向量化
上述管道,将字段「content、title」的内容,调用.multilingual-e5-small_linux
-x86_64模型向量化之后存储到新的字段中。
写入知识库数据
通过BulkAPI批量写入数据,可将
您可能关注的文档
- 2024年全球视野下商业长期护理保险发展研究报告.docx
- 2024年住酒店趋势报告.docx
- 2024校园招聘研究报告-企业人才梯队的初阶打造与提升.docx
- 5篇2023年襄阳引资聚才高质量发展大会嘉宾发言材料汇编.docx
- 4篇在枣庄市新旧动能转换项目推进会议上的发言材料汇编.docx
- 5篇“三八”国际妇女节纪念暨表彰大会先进典型代表发言材料汇编.docx
- 在全市文学艺术界联合会代表大会上的讲话.docx
- 广东省广州市番禺区2023-2024学年部编版历史九年级上学期期末试题.doc
- 广东省广州市白云区2022-2023学年九年级上学期期末历史试题.doc
- 广东省广州市越秀区2022-2023学年九年级上学期期末历史试题.doc
- 广东省广州市增城区2023-2024学年九年级上学期期末道德与法治试题(答案).doc
- 广东省广州市2021-2022学年九年级上学期期末模拟历史试题(含答案).docx
- 广东省广州市天河区暨南大学附属实验学校2022-2023学年九年级上学期期末历史试题.doc
- 广州市南沙区2023—2024学年第一学期九年级历史期末教学质量监测模拟试卷.doc
- 广东省广州市天河区暨南大学附属实验学校2022-2023学年九年级上学期期末历史试题(答案).doc
- 在全市县区委书记第五次工作座谈会上的讲话.docx
- 3篇中央政法工作会议发言材料汇编.docx
- 5篇贵州省庆祝第二十个中国记者节座谈会经验交流发言材料汇编.docx
- 在全市人大工作座谈会上的讲话.docx
- 在全市人大系统改革创新工作交流会上的讲话.docx
文档评论(0)