Delta Lake 集成
用户可以通过表函数与 Delta Lake 表格式集成。
deltaLake 表函数
为 Amazon S3 中的 Delta Lake 表提供只读的类似表的接口。
语法
deltaLake(url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression])
参数
url
— 带有指向 S3 中现有 Delta Lake 表路径的 Bucket url。aws_access_key_id
,aws_secret_access_key
- AWS 账户用户的长期凭证。您可以使用这些凭证来验证您的请求。这些参数是可选的。如果未指定凭证,则从 ClickHouse 配置中使用。有关更多信息,请参阅使用 S3 进行数据存储。format
— 文件的格式。structure
— 表的结构。格式'column1_name column1_type, column2_name column2_type, ...'
。compression
— 参数是可选的。支持的值:none
,gzip/gz
,brotli/br
,xz/LZMA
,zstd/zst
。默认情况下,压缩将通过文件扩展名自动检测。
返回值
一个具有指定结构的表,用于读取 S3 中指定 Delta Lake 表中的数据。
示例
从 S3 表中选择行 https://clickhouse-public-datasets.s3.amazonaws.com/delta_lake/hits/
SELECT
URL,
UserAgent
FROM deltaLake('https://clickhouse-public-datasets.s3.amazonaws.com/delta_lake/hits/')
WHERE URL IS NOT NULL
LIMIT 2
┌─URL───────────────────────────────────────────────────────────────────┬─UserAgent─┐
│ http://auto.ria.ua/search/index.kz/jobinmoscow/detail/55089/hasimages │ 1 │
│ http://auto.ria.ua/search/index.kz/jobinmoscow.ru/gosushi │ 1 │
└───────────────────────────────────────────────────────────────────────┴───────────┘
另请参阅