1. Time(时间机制)
时间概念
2. Window(窗口计算)
收集窗口时间内的数据,对窗口中收集数据进行聚合运算这就是窗口机制
。
窗口的生命周期
创建:属于该窗口的第一个元素到达时
就会创建该窗口,窗口事先定义好就是固定的,但是窗口创建时间不固定【窗口开始时间以水印所携带的时间戳作为标准】
3. State(状态机制)
什么是Flink的状态
状态分类
托管状态(Managed State)和原始状态(Raw State)
算子状态(Operator State)和按键分区状态(Keyed State)
基于状态(KeyedState)计算实现词频统计
代码实现
keyedState状态计算步骤
为什么要进行有状态的计算 ?
广播流、广播状态
编码步骤
状态后端
选择正确的状态后端
4. Checkpoint(容错机制)
什么是Checkpoint(检查点)
Checkpoint和State的区别
Checkpoint分布式快照流程(重点)
Checkpoint如何保证数据的一致性(重点)
至少一次(at-least–once)
精确一次(exactly-once)
Checkpoint Barrier对齐机制
什么是savepoint(保存点)
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。