本文简要介绍 python 语言中 pyflink.datastream.RocksDBStateBackend
的用法。
用法:
class pyflink.datastream.RocksDBStateBackend(checkpoint_data_uri=None, enable_incremental_checkpointing=None, checkpoint_stream_backend=None, j_rocks_db_state_backend=None)
基础:
pyflink.datastream.state_backend.StateBackend
IMPORTANT
RocksDBStateBackend
不赞成使用EmbeddedRocksDBStateBackend
和FileSystemCheckpointStorage
.此更改不会影响 Job 的运行时特性,只是一个 API 更改,以帮助更好地传达 Flink 将本地状态存储与容错分离的方式。可以在不丢失状态的情况下升级作业。如果通过StreamExecutionEnvironment
请进行以下更改。>> env.set_state_backend(EmbeddedRocksDBStateBackend()) >> env.get_checkpoint_config().set_checkpoint_storage("hdfs://checkpoints")
如果您通过
flink-conf.yaml
配置您的状态后端,则无需更改。将其状态存储在
RocksDB
中的状态后端。此状态后端可以存储超出内存并溢出到磁盘的非常大的状态。所有的键/值状态(包括窗口)都存储在 RocksDB 的键/值索引中。对于机器丢失的持久性,检查点拍摄RocksDB 数据库的快照,并将该快照保留在文件系统(默认情况下)或另一个可配置的状态后端。
RocksDB 实例的行为可以通过使用方法
set_predefined_options()
和set_options()
设置 RocksDB 选项来参数化。
相关用法
- Python pyflink RocksDBStateBackend.set_predefined_options用法及代码示例
- Python pyflink Row.as_dict用法及代码示例
- Python pyflink Row用法及代码示例
- Python pyflink ReduceFunction用法及代码示例
- Python pyflink Table.intersect_all用法及代码示例
- Python pyflink GroupedTable.select用法及代码示例
- Python pyflink StreamTableEnvironment.from_data_stream用法及代码示例
- Python pyflink Expression.to_date用法及代码示例
- Python pyflink Table.fetch用法及代码示例
- Python pyflink PulsarSourceBuilder用法及代码示例
- Python pyflink TableEnvironment.create_temporary_function用法及代码示例
- Python pyflink Table.right_outer_join用法及代码示例
- Python pyflink Expression.json_value用法及代码示例
- Python pyflink Table.distinct用法及代码示例
- Python pyflink WatermarkStrategy.with_timestamp_assigner用法及代码示例
- Python pyflink TableEnvironment.register_table_source用法及代码示例
- Python pyflink Table.where用法及代码示例
- Python pyflink Expression.end用法及代码示例
- Python pyflink lit用法及代码示例
- Python pyflink TableEnvironment.create_java_temporary_function用法及代码示例
- Python pyflink StreamTableEnvironment.create用法及代码示例
- Python pyflink Table.drop_columns用法及代码示例
- Python pyflink Expression.over用法及代码示例
- Python pyflink Table.execute用法及代码示例
- Python pyflink StreamExecutionEnvironment.set_restart_strategy用法及代码示例
注:本文由纯净天空筛选整理自apache.org大神的英文原创作品 pyflink.datastream.RocksDBStateBackend。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。