跳至主要内容

如何将数据从 ClickHouse 导出到文件?

·阅读时间:2分钟

使用 INTO OUTFILE 子句

在您的查询中添加 INTO OUTFILE 子句。

例如

SELECT * FROM table INTO OUTFILE 'file'

默认情况下,ClickHouse 使用文件名的文件扩展名来确定输出格式和压缩方式。例如,nyc_taxi 中的所有行都将使用 Parquet 格式导出到 nyc_taxi.parquet

SELECT *
FROM nyc_taxi
INTO OUTFILE 'taxi_rides.parquet'

以下文件将是一个压缩的制表符分隔文件

SELECT *
FROM nyc_taxi
INTO OUTFILE 'taxi_rides.tsv.gz'

如果 ClickHouse 无法从文件扩展名确定格式,则输出格式默认为 TabSeparated 用于输出数据。要指定 输出格式,请使用 FORMAT 子句

例如

SELECT *
FROM nyc_taxi
INTO OUTFILE 'taxi_rides.txt'
FORMAT CSV

使用 File 表引擎

另一种选择是使用 File 表引擎,其中 ClickHouse 使用文件来存储数据。您可以直接对文件执行查询和插入操作。

例如

CREATE TABLE my_table (
x UInt32,
y String,
z DateTime
)
ENGINE = File(Parquet)

插入几行

INSERT INTO my_table VALUES
(1, 'Hello', now()),
(2, 'World', now()),
(3, 'Goodbye', now())

该文件存储在 ClickHouse 服务器的 data 文件夹中 - 特别是在 /data/default/my_table 中名为 data.Parquet 的文件中。

注意

使用 File 表引擎对于在文件系统上创建和查询文件非常方便,但请记住,File 表不是 MergeTree 表,因此您无法获得 MergeTree 提供的所有好处。当以方便的格式将数据导出到 ClickHouse 时,出于方便起见,请使用 File

使用命令行重定向

$ clickhouse-client --query "SELECT * from table" --format FormatName > result.txt

请参阅 clickhouse-client