高超-⾯向⽣成式AI的向量数据 库:架构,性能与未来趋势.pdf

高超-⾯向⽣成式AI的向量数据 库:架构,性能与未来趋势.pdf

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

⾯向⽣成式AI的向量数据

库:架构,性能与未来趋势

⾼超/Zilliz⼯程师

DataFunSummit#2024

⾼超

zilliz⼯程师

毕业于上海交通⼤学,在向量数据库和⼤

数据引擎有⼀定经验,⽬前在zilliz主要负

责索引引擎的优化

向量数据库背景介绍

Milvus整体架构设计

性能的关键-索引

⾯向AI持续进化

01

向量数据库背景介绍

什么是向量数据

什么是向量检索

K

•找到离查询向量最近的条向量

(TopK)

•怎么计算距离取决于模型定义使⽤怎

样的Metric,常⻅的有L2,IP和

Cosine等

什么是向量数据库

•向量数据库是⼀种专为存储和查询⾼维度向量数据

⽽优化的数据库系统

为什么需要向量数据库

•AI1.0时代,向量数据库

已经被⼴泛应⽤于机器学

习应⽤中,包括推荐系

统,有哪些信誉好的足球投注网站,⻛控,安防等

系统中。现在仍然是重要

的使⽤场景

为什么需要向量数据库

•RetrievalAugmented

Generation(RAG),向量数

据库作为存储记忆体保存领

域相关的知识,⽤于查找

query相关的数据

•LLM从增强的提示词中获得

为⽤户量身定制的答案,增

强了结果的相关性

什么是⼀个好的向量数据库

•性能

•扩展性

•易⽤性

•功能

•可观测可运维

•⽣态集成

•故障恢复

•安全

您公司的logo

02

Milvus整体架构设计

云原⽣的分布式向量数据库

•Proxy:接⼊层,负责请求

编译,检查和路由

•Query:负责数据/索引的

加载和查询

•Data:负责数据批流转化

•Index:索引构建

云原⽣的分布式向量数据库

•强⼤的隔离性,建索引不

争抢查询资源

•良好的扩展能⼒,⽀持百

亿级别的向量

•更加灵活的流式数据处理

能⼒和增量更新/删除能⼒

实时性和性能的tradeoff

•Segment是milvus查询的最⼩单位

•growingsegment负责流式数据的查

询,保证数据的实时可⻅,性能差

•sealedsegment负责持久化数据的查

询。数据构建过索引,性能好

•通过indexNode构建索引替换

queryNode上的数据加速查询

异步compaction

•把⼀些⼩segment合成⼤

segment,加速查询

•合并delete数据,做物理删除,对

向量检索更加友好

批量写⼊

•⽀持bulkinsert功能,⽤户提供json/csv/parquet等格式的⽂

件,跳过消息队列,直接插⼊到对象存储

•⽀持Sparkconnector,外部数据源可以通过SparkETL导⼊

到Milvus

全局索引

•根据不同租户做划分数据

•根据标量过滤条件划分数据

•根据向量空间分布划分数据

Zillizcloud:向量数据库即服务

•ZillizCloud是Zilliz基于开源向

量数据库milvus打造的全托管

企业级向量检索云服务

•分为Serverless,SaaS和

BYOC三个版本,⾯向不同需

求和不同部署环境

•⽬前已经登陆AWS,GCP,

Azure,阿⾥云、腾讯云等

您公司的logo

03

性能的关键-索引

主流向量索引

•树索引:维度灾难,性能差

•哈希:精确有限

•量化:精度有限,但⽐哈希更为常⽤

•图索引:占⽤资源⾼,精度和性能优异

树哈希量

文档评论(0)

150****8957 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档