跳转到主要内容

bos 2022 apache iceberg

Apache Iceberg是一种用于大型分析表的高性能格式,它将SQL表的可靠性和简单性带到了大数据中,同时使Trino、Spark、Sonar、Presto、Hive、Flink和Impala等引擎能够同时安全地使用相同的表。Iceberg支持灵活的SQL命令来合并新数据、更新现有行和执行有针对性的删除。它可以急切地重写数据文件以获得读取性能,也可以使用删除增量以获得更快的更新。Iceberg支持模式进化、自动分区、时间旅行查询、版本回滚和开箱即用的数据压缩。

——马丁·海勒