跳到主要内容
跳到主要内容

Npy

输入输出别名

描述

Npy 格式旨在将 NumPy 数组从 .npy 文件加载到 ClickHouse 中。NumPy 文件格式是一种二进制格式,用于高效存储数值数据数组。在导入期间,ClickHouse 将顶层维度视为具有单列的行数组。

下表给出了受支持的 Npy 数据类型及其在 ClickHouse 中的对应类型

数据类型匹配

Npy 数据类型 (INSERT)ClickHouse 数据类型Npy 数据类型 (SELECT)
i1Int8i1
i2Int16i2
i4Int32i4
i8Int64i8
u1, b1UInt8u1
u2UInt16u2
u4UInt32u4
u8UInt64u8
f2, f4Float32f4
f8Float64f8
S, UStringS
FixedStringS

示例用法

使用 Python 以 .npy 格式保存数组

import numpy as np
arr = np.array([[[1],[2],[3]],[[4],[5],[6]]])
np.save('example_array.npy', arr)

在 ClickHouse 中读取 NumPy 文件

查询
SELECT *
FROM file('example_array.npy', Npy)
响应
┌─array─────────┐
│ [[1],[2],[3]] │
│ [[4],[5],[6]] │
└───────────────┘

选择数据

您可以从 ClickHouse 表中选择数据,并使用以下命令通过 clickhouse-client 将其保存到 Npy 格式的文件中

$ clickhouse-client --query="SELECT {column} FROM {some_table} FORMAT Npy" > {filename.npy}

格式设置