Paimon StarRocks,共话实时湖仓架 -Apache Paimon V0.9 必威体育精装版进展.pdf

Paimon StarRocks,共话实时湖仓架 -Apache Paimon V0.9 必威体育精装版进展.pdf

  1. 1、本文档共120页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

ApachePaimonV0.9

必威体育精装版进展

李劲松(之信)/PaimonPMCChair

StreamingLakehouseMeetup

关于“我”

•电子科大毕业后,入职阿里云近10年

•2015-2017流计算调度、编程API相关(Committer)

•2017-2020Flink流批SQL计算(FlinkPMC成员)

•2020-2022大数据存储与计算结合(Committer)

•2022-现在负责研发

Paimon:飞速发展的2024

2024

阿里集团Alake数据湖战役:

Paimon统一存储:十万+FlinkCores

2023-2024

2023:进入孵化器引发关注2024

2024:正式毕业成为ApacheTLP项目

阿里云OpenLake战役:

计算引擎+Paimon完整对接一流性能

20222024

诞生:阿里、蚂蚁、同程旅行、字

瞄准CDC入湖更新场景节、汽车之家、喜马拉雅、唯

在Flink社区写了第一行代码品会、VIVO、快手、网易、联

Paimon在越来越多公司、越来越多场景,帮助业

务更实时、更开放、成本更低

Paimon:0.9Features

核心挑战是什么?

1.主键表Native化查询,非主键表支

持轻量化DELETEUPDATE

2.兼容Iceberg生态,与AI结合,

PythonAPI

3.优化对象存储文件IO,元数据缓

存,文件格式与压缩

挑战一:更新与查询时合并

MergeOnRead更新数据=查询慢

CopyOnWrite更新数据=写入慢

MergeOnWrite:

写时标记老文件哪些行被删除

Deletionvectors:非主键表

1.INSERT:写新的数据文件

2.DELETE:标记老文件哪些行被删除

3.UPDATE:DELETEINSERT

Deletionvectors:主键表

DVLSM

在LSM结构中融入DV的维护

•LSM点查能力删除数据

•支持异步Compaction

•支持过滤下推到文件

•解放查询的并发限制

•支持查询Native加速

文档评论(0)

186****0576 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5013000222000100

1亿VIP精品文档

相关文档