跳到主要内容
跳到主要内容

Delta Lake 集成

用户可以通过表函数与 Delta Lake 表格式集成。

deltaLake 表函数

为 Amazon S3 中的 Delta Lake 表提供只读的类似表的接口。

语法

deltaLake(url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression])

参数

  • url — 带有指向 S3 中现有 Delta Lake 表路径的 Bucket url。
  • aws_access_key_id, aws_secret_access_key - AWS 账户用户的长期凭证。您可以使用这些凭证来验证您的请求。这些参数是可选的。如果未指定凭证,则从 ClickHouse 配置中使用。有关更多信息,请参阅使用 S3 进行数据存储
  • format — 文件的格式
  • structure — 表的结构。格式 'column1_name column1_type, column2_name column2_type, ...'
  • compression — 参数是可选的。支持的值:none, gzip/gz, brotli/br, xz/LZMA, zstd/zst。默认情况下,压缩将通过文件扩展名自动检测。

返回值

一个具有指定结构的表,用于读取 S3 中指定 Delta Lake 表中的数据。

示例

从 S3 表中选择行 https://clickhouse-public-datasets.s3.amazonaws.com/delta_lake/hits/

SELECT
URL,
UserAgent
FROM deltaLake('https://clickhouse-public-datasets.s3.amazonaws.com/delta_lake/hits/')
WHERE URL IS NOT NULL
LIMIT 2
┌─URL───────────────────────────────────────────────────────────────────┬─UserAgent─┐
│ http://auto.ria.ua/search/index.kz/jobinmoscow/detail/55089/hasimages │ 1 │
│ http://auto.ria.ua/search/index.kz/jobinmoscow.ru/gosushi │ 1 │
└───────────────────────────────────────────────────────────────────────┴───────────┘

另请参阅