- 1、本文档共81页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
云数据仓库ByteHouse架构下的RAG技术实践与性能优化
演讲人:田昕晖
火山引擎/ByteHouse技术团队
RAG相关技术简介
.
.高性能向量检索技术
目
目录
.
.全文检索混合检索.GraphRAG实践
ConclusionDiscussion
RAG相关技术简介
NaiveRAG
HybridSearch
RRF:(ReciprocalRankFusion)
?基于排名重排
?同时考虑语义及关键字信息
GraphRAG
文本-大模型-图结构检索关联性信息,全局信息
Q:Whichpublicfiguresarerepeatedly
mentionedacrossvariousentertainmentarticles?
AgenticRAG
https://langchain-ai.github.io/langgraph/tutorials/rag/langgraph_agentic_rag
AdaptiveRAG
Jeong,Soyeong,etal.Adaptive-rag:Learningtoadapt
retrieval-augmentedlargelanguagemodelsthroughquestioncomplexity.arXivpreprintarXiv:2403.14403(2024).
Zhao,Siyun,etal.RetrievalAugmentedGeneration(RAG)andBeyond:A
ComprehensiveSurveyonHowtoMakeyourLLMsuseExternalDataMoreWisely.arXivpreprintarXiv:2409.14924(2024).
RAG相关技术需求
要解决的问题:如何让大模型利用外部知识库,回答符合预期的问题?
?MemoryEngineering
?如何获取准确的相关数据
?如何让大模型回答的答案有效利用检索数据?性能
数据层大模型层
高性能检索技术:
?向量检索(DenseSparse)
?全文检索(关键词有哪些信誉好的足球投注网站)?图检索
?结构化信息检索
?其他可以基于问题检索答案的相关技术
融合混合有哪些信誉好的足球投注网站?向量+标量?向量+文本?稠密+稀疏向量
?向量+图
...
数据处理:
?文本切分
?向量提取
?Rerank
...
大模型交互与性能优化:
?PromptEngineering
?Agents
?SFTforRAG
?模型结构Retrieval优化
?其他幻觉消除及推理优化技术
数据管理及操作基础机制:容错、鉴权、可扩展、灵活接口...
高性能向量检索技术
向量检索
向量检索ForNLP
/a-guide-to-word-embeddings-8a23817ab60f
ANN结构:向量索引
?Table-based?LSH
?Tree-based
?KD-Tree,Annoy
?Cluster-based
?IVF,SCANN,SPANN
?Graph-based
?HNSW,NSG,DiskANN
YusukeMatsui.Billion-scaleApproximateNearestNeighborSearch,ACMMultimedia2020
ANN结构:向量索引
Cluster-based:向量基于相似度分簇基于Kmeans训练聚类中心
构建速度快,内存占用量较少
检索时参与计算节点较多,高精度查询性能差
https://www.pinecone.io/learn/series/faiss/vector-indexes/
ANN结构:向量索引
Graph-based(HNSW):向量基于相似度建图
构建时为每个节点维护最近邻信息多层结构加速检索
构建速度慢,内存占用量较多
检索时参与计算节点较少,并发性能好
https://www.pinecone.io/learn/series/faiss/hnsw/
向量压缩
降低向量索引
您可能关注的文档
- 2025年A股投资策略:试玉满三,辨才有期.docx
- Agent技术在小爱同学中的应用-小米+杞坚玮.docx
- AI+Agent在边缘云的探索与实践-火山引擎+谢皓.docx
- AI+产品商业化路径的多角度探索与实践-秘塔科技+王益为.docx
- AI+大数据:打造新一代数据开发治理一体化平台-腾讯云+谭杰轩.docx
- AI大模型浪潮下的行业应用新模式和关键实现路径-北京智源+周华.docx
- AI时代下,数据库技术与智能化应用的协同发展-腾讯+罗云.docx
- GenAI时代,从容应对数据驱动的AI带来的IO挑战-Alluxio+汤文君.docx
- KidsGPT+在母婴领域的应用与创新-孩子王+陈剑.docx
- RAG+基本范式的选择与系统设计-Hugging+Face+尹一峰.docx
文档评论(0)