icebergCluster 表函数

这是 iceberg 表函数的扩展。

允许从指定集群中的多个节点并行处理来自 Apache Iceberg 的文件。在启动器上，它创建与集群中所有节点的连接并动态分派每个文件。在工作节点上，它向启动器询问要处理的下一个任务并处理它。重复此操作直到所有任务完成。

语法

icebergS3Cluster(cluster_name, url [, NOSIGN | access_key_id, secret_access_key, [session_token]] [,format] [,compression_method])
icebergS3Cluster(cluster_name, named_collection[, option=value [,..]])

icebergAzureCluster(cluster_name, connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])
icebergAzureCluster(cluster_name, named_collection[, option=value [,..]])

icebergHDFSCluster(cluster_name, path_to_table, [,format] [,compression_method])
icebergHDFSCluster(cluster_name, named_collection[, option=value [,..]])

参数

cluster_name — 用于构建远程和本地服务器地址和连接参数集的集群名称。
所有其他参数的描述与等效 iceberg 表函数中的参数描述一致。

返回值

一个具有指定结构的表，用于从指定 Iceberg 表中的集群读取数据。

示例

SELECT * FROM icebergS3Cluster('cluster_simple', 'http://test.s3.amazonaws.com/clickhouse-bucket/test_table', 'test', 'test')

另请参阅