在本节中,我们将了解 ClickHouse 对数据湖的支持。ClickHouse 支持许多最流行的表格式和数据目录,包括 Iceberg、Delta Lake、Hudi、AWS Glue、REST Catalog、Unity Catalog 和 Microsoft OneLake。
开放表格式
Iceberg
请参阅 iceberg,它支持从 Amazon S3 和兼容 S3 的服务、HDFS、Azure 和本地文件系统读取数据。 icebergCluster 是 iceberg 函数的分布式变体。
Delta Lake
请参阅 deltaLake,它支持从 Amazon S3 和兼容 S3 的服务、Azure 和本地文件系统读取数据。 deltaLakeCluster 是 deltaLake 函数的分布式变体。
Hudi
请参阅 hudi,它支持从 Amazon S3 和兼容 S3 的服务读取数据。 hudiCluster 是 hudi 函数的分布式变体。
数据目录
AWS Glue
AWS Glue 数据目录可与 Iceberg 表一起使用。您可以使用它与 iceberg 表引擎,或与 DataLakeCatalog 数据库引擎一起使用。
Iceberg REST Catalog
Iceberg REST Catalog 可与 Iceberg 表一起使用。您可以使用它与 iceberg 表引擎,或与 DataLakeCatalog 数据库引擎一起使用。
Unity Catalog
Unity Catalog 可与 Delta Lake 和 Iceberg 表一起使用。您可以使用它与 iceberg 或 deltaLake 表引擎,或与 DataLakeCatalog 数据库引擎一起使用。
Microsoft OneLake
Microsoft OneLake 可与 Delta Lake 和 Iceberg 表一起使用。您可以使用它与 DataLakeCatalog 数据库引擎一起使用。