- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
⾯向⽣成式AI的向量数据
库:架构,性能与未来趋势
⾼超/Zilliz⼯程师
DataFunSummit#2024
⾼超
zilliz⼯程师
毕业于上海交通⼤学,在向量数据库和⼤
数据引擎有⼀定经验,⽬前在zilliz主要负
责索引引擎的优化
向量数据库背景介绍
Milvus整体架构设计
性能的关键-索引
⾯向AI持续进化
01
向量数据库背景介绍
什么是向量数据
什么是向量检索
K
•找到离查询向量最近的条向量
(TopK)
•怎么计算距离取决于模型定义使⽤怎
样的Metric,常⻅的有L2,IP和
Cosine等
什么是向量数据库
•向量数据库是⼀种专为存储和查询⾼维度向量数据
⽽优化的数据库系统
为什么需要向量数据库
•AI1.0时代,向量数据库
已经被⼴泛应⽤于机器学
习应⽤中,包括推荐系
统,有哪些信誉好的足球投注网站,⻛控,安防等
系统中。现在仍然是重要
的使⽤场景
为什么需要向量数据库
•RetrievalAugmented
Generation(RAG),向量数
据库作为存储记忆体保存领
域相关的知识,⽤于查找
query相关的数据
•LLM从增强的提示词中获得
为⽤户量身定制的答案,增
强了结果的相关性
什么是⼀个好的向量数据库
•性能
•扩展性
•易⽤性
•功能
•可观测可运维
•⽣态集成
•故障恢复
•安全
•
…
您公司的logo
02
Milvus整体架构设计
云原⽣的分布式向量数据库
•Proxy:接⼊层,负责请求
编译,检查和路由
•Query:负责数据/索引的
加载和查询
•Data:负责数据批流转化
•Index:索引构建
云原⽣的分布式向量数据库
•强⼤的隔离性,建索引不
争抢查询资源
•良好的扩展能⼒,⽀持百
亿级别的向量
•更加灵活的流式数据处理
能⼒和增量更新/删除能⼒
实时性和性能的tradeoff
•Segment是milvus查询的最⼩单位
•growingsegment负责流式数据的查
询,保证数据的实时可⻅,性能差
•sealedsegment负责持久化数据的查
询。数据构建过索引,性能好
•通过indexNode构建索引替换
queryNode上的数据加速查询
异步compaction
•把⼀些⼩segment合成⼤
segment,加速查询
•合并delete数据,做物理删除,对
向量检索更加友好
批量写⼊
•⽀持bulkinsert功能,⽤户提供json/csv/parquet等格式的⽂
件,跳过消息队列,直接插⼊到对象存储
•⽀持Sparkconnector,外部数据源可以通过SparkETL导⼊
到Milvus
全局索引
•根据不同租户做划分数据
•根据标量过滤条件划分数据
•根据向量空间分布划分数据
Zillizcloud:向量数据库即服务
•ZillizCloud是Zilliz基于开源向
量数据库milvus打造的全托管
企业级向量检索云服务
•分为Serverless,SaaS和
BYOC三个版本,⾯向不同需
求和不同部署环境
•⽬前已经登陆AWS,GCP,
Azure,阿⾥云、腾讯云等
您公司的logo
03
性能的关键-索引
主流向量索引
•树索引:维度灾难,性能差
•哈希:精确有限
•量化:精度有限,但⽐哈希更为常⽤
•图索引:占⽤资源⾼,精度和性能优异
树哈希量
文档评论(0)