本文介绍: Flink 核心概念之一是流 (无界数据) 批 (有界数据) 一体。流批一体极大的降低了流批融合作业的开发复杂度。在过去的几个版本中,Flink 流批一体逐渐成熟,Flink 1.15 版本中流批一体更加完善,后面我们也将继续推动这一方向的进展。目前大数据处理的一个趋势是越来越多的业务和场景采用低代码的方式进行数据分析,而 Flink SQL则是这种低代码方式数据分析的典型代表。越来越多的用户开始采用 Flink SQL 来实现他们的业务,这也是 Flink 用户和生态快速增长的重要原因之一。
Apache Flink 核心概念之一是流 (无界数据) 批 (有界数据) 一体。
流批一体极大的降低了流批融合作业的开发复杂度。在过去的几个版本中,Flink 流批一体逐渐成熟,Flink 1.15 版本中流批一体更加完善,后面我们也将继续推动这一方向的进展。目前大数据处理的一个趋势是越来越多的业务和场景采用低代码的方式进行数据分析,而 Flink SQL则是这种低代码方式数据分析的典型代表。越来越多的用户开始采用 Flink SQL 来实现他们的业务,这也是 Flink 用户和生态快速增长的重要原因之一。Apache Flink 作为数据处理生态中的重要一环,可以与许多其他技术结合在一起支持各类用户场景。在当下云原生的背景下,我们也尽可能将 Flink 与这些系统以及各类云基础设施进行无缝集成。
在 1.15 版本中,Apache Flink 社区在上述这些方面都取得了重大进展:
轻松运维 Apache Flink
长期来看,即使是由最好的工程团队来进行构建和调优,Flink 作业仍然依赖运维操作。Flink 支持多种不同的部署模式、API、调优配置与用例,这意味着运维工作至关重要并且可能十分繁重。
在这个版本中,我们听取了用户的反馈,对 Flink 的运维操作进行了简化,使用户能够更加轻松的进行运维。现在 Flink 明确了 Checkpoint 与 Savepoint 在不同作业之间的所属权;更加无缝支持完整的自动伸缩;通过 Watermark 对齐消除多个数据源产出速率不同带来的问题,并且初步支持了在不丢失状态的情况下升级 SQL 作业的能力。
SQL 版本升级
在最新版本中,我们对流批一体的支持进行了进一步的完善。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。