Flink-状态流与容错_代码007(未授权)

flink 程序选择状态存储实现就是在性能与可拓展性之间的权衡。
HashMapStateBackend由于状态的读写都是在java的heap上操作因此速度快，但状态大小受限于集群中可用内存。
EmbeddedRo c ksDBStateBackend可以根据可用di s k进行空间拓展，并且支持增量状态快照。但由于读写都需要反序列化因此比Has hMapStateBackend慢一个数量级。

StreamExecut ionEn viron ment 可以对每个 Jo b 的 State Backend 进行设置，如下所示

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
env.setStateBackend(new HashMapStateBackend());

在 f link–conf.yaml 可以通过键 state.backend.type 设置默认的 State Backend。

# 用于存储 operator state 快照的 State Backend
state.backend: hashmap
# 存储快照的目录
state.checkpoints.dir: hdfs://namenode:40010/flink/checkpoints

三、容错 机制

f link容错机制就是针对算子和数据流进行持久化快照。当程序发生故障时，f link可以根据快照将应用程序的状态完整的恢复并处理。

快照时f link作业状态一致性景象。快照包括每个数据源的指针以及作业每个状态运算符的状态数据，状态数据是指处理了数据源偏移位置之后的所有事件后生成的状态。
快照分为Che ckPo int和SavePo int两种：

最简单的想法就是同一个时间点所有节点停止处理然后将状态和上游通道中的事件保存下来。但是由于是分布式节点协调同一个时间点比较难，完全停止也影响实时性。
根据批处理经验，可以将实时流处理一段流之后，停止读取，等待所有节点处理完毕之后，这样只需要保存实时流的位置和所有节点的状态即可。这样如果想要重放只需要将所有节点状态恢复，并按照原有位置读取实时流即可。
按照上边思路，上游节点保存完状态后需要等待最后一个节点处理完成才能处理新数据。如果处理流程越长，保存快照的时间就会越长，最后导致计算资源利用率低。其实仔细思考一下如果当前节点保存完快照，完全可以继续处理接下来的事件，因为并不会影响本节点已经生成的状态快照。

Flink采用的就是类似的想法进行快照的处理，首先会在事件流中插入 b arr ier将实时流逻辑上分割成多个有限流。当算子接受到barr ier时需要执行快照生成，然后将barr ier广播给下游算子。当需要恢复时，重新部署服务，从快照中把每个算子的状态恢复，然后从barr ier处重新读取源数据即可。

JobMana ger会告知TaskMana ger需要进行状态快照生成时，TaskMana ger会记录Sources的偏移量，并且将Che ckpoint barr ier插入到事件流中。
在这里插入图片描述
其中状态快照n将包含偏移量以及每个算子的状态，状态是指此算子消费了barr ier n之前所有事件、但是不包含barrier n之后的任何事件生成的状态。