icebergCluster 表函数
这是 iceberg 表函数的扩展。
允许从指定集群中的多个节点并行处理来自 Apache Iceberg 的文件。在启动器上,它创建与集群中所有节点的连接并动态分派每个文件。在工作节点上,它向启动器询问要处理的下一个任务并处理它。重复此操作直到所有任务完成。
语法
icebergS3Cluster(cluster_name, url [, NOSIGN | access_key_id, secret_access_key, [session_token]] [,format] [,compression_method])
icebergS3Cluster(cluster_name, named_collection[, option=value [,..]])
icebergAzureCluster(cluster_name, connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])
icebergAzureCluster(cluster_name, named_collection[, option=value [,..]])
icebergHDFSCluster(cluster_name, path_to_table, [,format] [,compression_method])
icebergHDFSCluster(cluster_name, named_collection[, option=value [,..]])
参数
-
cluster_name
— 用于构建远程和本地服务器地址和连接参数集的集群名称。 -
所有其他参数的描述与等效 iceberg 表函数中的参数描述一致。
返回值
一个具有指定结构的表,用于从指定 Iceberg 表中的集群读取数据。
示例
SELECT * FROM icebergS3Cluster('cluster_simple', 'http://test.s3.amazonaws.com/clickhouse-bucket/test_table', 'test', 'test')
另请参阅