网站大量收购闲置独家精品文档,联系QQ:2885784924

2025云数据仓库架构下技术实践与性能优化.docx

2025云数据仓库架构下技术实践与性能优化.docx

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

云数据仓库ByteHouse架构下的RAG技术实践与性能优化

RAG相关技术简介

高性能向量检索技术

目录 全文检索混合检索GraphRAG实践

ConclusionDiscussion

RAG相关技术简介

Naive

NaiveRAG

Hybrid

HybridSearch

RRF:(ReciprocalRankFusion)

基于排名重排

同时考虑语义及关键字信息

GraphRAG

GraphRAG

文本-大模型-图结构检索关联性信息,全局信息

Q:Whichpublicfiguresarerepeatedlymentionedacrossvariousentertainmentarticles?

AgenticRAG

https://langchain-ai.github.io/langgraph/tutorials/rag/langgraph_agentic_rag

AdaptiveRAG

Zhao,Siyun,etal.RetrievalAugmentedGeneration(RAG)andBeyond:AComprehensiveSurveyonHowtoMakeyourLLMsuseExternalDataMoreWisely.arXivpreprintarXiv:2409.14924(2024).

Jeong,Soyeong,etal.Adaptive-rag:Learningtoadaptretrieval-augmentedlargelanguagemodelsthroughquestioncomplexity.arXivpreprintarXiv:2403.14403(2024).

RAG相关技术需求

要解决的问题:如何让大模型利用外部知识库,回答符合预期的问题?

MemoryEngineering

如何获取准确的相关数据

如何让大模型回答的答案有效利用检索数据

性能

数据层 大模型层

高性能检索技术:

向量检索(DenseSparse)

全文检索(关键词有哪些信誉好的足球投注网站)

图检索

结构化信息检索

其他可以基于问题检索答案的相关技术

融合混合有哪些信誉好的足球投注网站

向量+标量

向量+文本

稠密+稀疏向量

向量+图

...

数据处理:

大模型交互与性能优化:Prompt

大模型交互与性能优化:

PromptEngineering

Agents

SFTforRAG

模型结构Retrieval优化

其他幻觉消除及推理优化技术

向量提取

Rerank

...

数据管理及操作基础机制:容错、鉴权、可扩展、灵活接口...

高性能向量检索技术

向量检索

向量检索ForNLP

/a-guide-to-word-embeddings-8a23817ab60f

ANN结构:向量索引

ANN结构:向量索引

Table-based

LSH

Tree-based

KD-Tree,Annoy

Cluster-based

IVF,SCANN,SPANN

Graph-based

HNSW,NSG,DiskANN

YusukeMatsui.Billion-scaleApproximateNearestNeighborSearch,ACMMultimedia2020

Cluster-based:向量基于相似度分簇基于Kmeans训练聚类中心

构建速度快,内存占用量较少

检索时参与计算节点较多,高精度查询性能差

https://www.pinecone.io/learn/series/faiss/vector-indexes/

Graph-based(HNSW):向量基于相似度建图

构建时为每个节点维护最近邻信息多层结构加速检索

构建速度慢,内存占用量较多

检索时参与计算节点较少,并发性能好

https://www.pinecone.io/learn/series/faiss/hnsw/

向量压缩

降低向量索引内存用量,以牺牲精度为代价

ProductQuantization

Vector-CentroidIds

ScalarQuantization

Float-Int8

BinaryQuantization

Float-Bit

/product-quantization-a2779ace565

DiskANN

主要图结构存储在磁盘上基于Vamana图结构

图构建时间较长

极大节省索引结构所占内存空间

ByteHouse简介

多年域内业务打磨(字节90%OLAP场景),

您可能关注的文档

文档评论(0)

数字能源 + 关注
实名认证
服务提供商

企业信息管理师持证人

新能源集控中心项目 智慧电厂建设项目 智慧光伏 智慧水电 智慧燃机 智慧工地 智慧城市 数据中心 电力行业信息化

版权声明书
用户编号:6011145050000024
领域认证该用户于2023年02月15日上传了企业信息管理师

1亿VIP精品文档

相关文档