流式数据湖存储技术，Apache Paimon是什么？

apache 1 年前 0 2

本文介绍: 是一项流式数据湖存储技术，可以为用户提供高吞吐、低延迟的数据摄入、流式订阅以及实时查询能力。Pai m on 采用开放的数据格式和技术理念，可以与 Ap ac he Flink / Sp ar k / Trino 等诸多业界主流计算引擎进行对接，共同推进 St re a m in g La kehouse 架构的普及和发展。

2023年3月12日，Flink Table Store 项目顺利通过投票，正式进入 Ap ac he 软件基金会 (ASF) 的孵化器，改名为 Apache Paimon (incubating)。

Flink 社区希望能够将 Flink 的 St re a ming 实时计算能力和 La kehouse 新架构优势进一步结合，推出新一代的 St re a ming La kehouse 技术，促进数据在数据湖上真正实时流动起来，并为用户提供实时离线一体化的开发体验。

Apache Paimon (incubating) 是一项流式数据湖存储技术，可以为用户提供高吞吐、低延迟的数据摄入、流式订阅以及实时查询能力。

Paimon 采用开放的数据格式和技术理念，可以与 Apac he Flink / Spark / Trino 等诸多业界主流计算引擎进行对接，共同推进 St reaming Lakehouse 架构的普及和发展。

在这里插入图片描述

Paimon 以湖存储的方式基于分布式文件系统管理元数据，并采用开放的 ORC、Parquet、Avro 文件格式，支持各大主流计算引擎，包括 Flink、Spark、Hive、Trino、Presto。未来会对接更多引擎，包括 Doris 和 Starroc ks。

得益于 LSM 数据结构的追加写能力，Paimon 在大规模的更新数据输入的场景中提供了出色的性能。

Paimon 创新的结合了 湖存储 + LSM + 列式格式 (ORC, Parquet)，为湖存储带来大规模实时更新能力，Paimon 的 LSM 的文件组织结构如下：

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

apache paimon 流式

相关文章

【语音合成】中文-多情感领域-16k-多发音人

【语音合成】中文-多情感领域-16k-多发音人

互联网 1 年前 5

PiflowX新增Apache Beam引擎支持

PiflowX新增Apache Beam引擎支持

apache 1 年前 5

Apache&Nginx配置ssl证书

Apache&Nginx配置ssl证书

nginx 1 年前 6

Apache Paimon 文件操作

Apache Paimon 文件操作

apache 1 年前 5

vulhub中Apache APISIX 默认密钥漏洞复现（CVE-2020-13945）

vulhub中Apache APISIX 默认密钥漏洞复现（CVE-2020-13945）

apache 1 年前 2

vulhub中Apache APISIX Dashboard API权限绕过导致RCE（CVE-2021-45232）

vulhub中Apache APISIX Dashboard API权限绕过导致RCE（CVE-2021-45232）

apache 1 年前 2

ubuntu 上安装和配置Apache2+Subversion

ubuntu 上安装和配置Apache2+Subversion

apache 1 年前 8

Apache Paimon 文件布局设计

Apache Paimon 文件布局设计

apache 1 年前 5

发表回复取消回复