Npy
输入 | 输出 | 别名 |
---|---|---|
✔ | ✔ |
描述
Npy
格式旨在将 NumPy 数组从 .npy
文件加载到 ClickHouse 中。NumPy 文件格式是一种二进制格式,用于高效存储数值数据数组。在导入期间,ClickHouse 将顶层维度视为具有单列的行数组。
下表给出了受支持的 Npy 数据类型及其在 ClickHouse 中的对应类型
数据类型匹配
Npy 数据类型 (INSERT ) | ClickHouse 数据类型 | Npy 数据类型 (SELECT ) |
---|---|---|
i1 | Int8 | i1 |
i2 | Int16 | i2 |
i4 | Int32 | i4 |
i8 | Int64 | i8 |
u1 , b1 | UInt8 | u1 |
u2 | UInt16 | u2 |
u4 | UInt32 | u4 |
u8 | UInt64 | u8 |
f2 , f4 | Float32 | f4 |
f8 | Float64 | f8 |
S , U | String | S |
FixedString | S |
示例用法
使用 Python 以 .npy 格式保存数组
import numpy as np
arr = np.array([[[1],[2],[3]],[[4],[5],[6]]])
np.save('example_array.npy', arr)
在 ClickHouse 中读取 NumPy 文件
查询
SELECT *
FROM file('example_array.npy', Npy)
响应
┌─array─────────┐
│ [[1],[2],[3]] │
│ [[4],[5],[6]] │
└───────────────┘
选择数据
您可以从 ClickHouse 表中选择数据,并使用以下命令通过 clickhouse-client 将其保存到 Npy 格式的文件中
$ clickhouse-client --query="SELECT {column} FROM {some_table} FORMAT Npy" > {filename.npy}