跳至主要内容

Delta Lake 表函数

提供对 Amazon S3 中 Delta Lake 表的只读表式接口。

语法

deltaLake(url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression])

参数

  • url — S3 中 Delta Lake 表的存储桶 URL 和路径。
  • aws_access_key_idaws_secret_access_key - AWS 账户用户的长期凭证。您可以使用它们来验证您的请求。这些参数是可选的。如果未指定凭证,则使用 ClickHouse 配置中的凭证。有关更多信息,请参阅 使用 S3 存储数据
  • format — 文件的 格式
  • structure — 表的结构。格式为 'column1_name column1_type, column2_name column2_type, ...'
  • compression — 参数可选。支持的值:nonegzip/gzbrotli/brxz/LZMAzstd/zst。默认情况下,压缩将通过文件扩展名自动检测。

返回值

一个具有指定结构的表,用于读取 S3 中指定 Delta Lake 表中的数据。

示例

从 S3 中的表 https://clickhouse-public-datasets.s3.amazonaws.com/delta_lake/hits/ 中选择行

SELECT
URL,
UserAgent
FROM deltaLake('https://clickhouse-public-datasets.s3.amazonaws.com/delta_lake/hits/')
WHERE URL IS NOT NULL
LIMIT 2
┌─URL───────────────────────────────────────────────────────────────────┬─UserAgent─┐
│ http://auto.ria.ua/search/index.kz/jobinmoscow/detail/55089/hasimages │ 1 │
│ http://auto.ria.ua/search/index.kz/jobinmoscow.ru/gosushi │ 1 │
└───────────────────────────────────────────────────────────────────────┴───────────┘

另请参阅