在自托管 ClickHouse 和 ClickHouse Cloud 之间迁移

本指南将展示如何从自托管 ClickHouse 服务器迁移到 ClickHouse Cloud,以及如何在 ClickHouse Cloud 服务之间迁移。 remoteSecure
函数在 SELECT
和 INSERT
查询中使用,以允许访问远程 ClickHouse 服务器,这使得迁移表就像编写带有嵌入式 SELECT
的 INSERT INTO
查询一样简单。
从自托管 ClickHouse 迁移到 ClickHouse Cloud

无论您的源表是否分片和/或复制,在 ClickHouse Cloud 上,您只需创建目标表(您可以省略此表的 Engine 参数,它将自动成为 ReplicatedMergeTree 表),ClickHouse Cloud 将自动处理垂直和水平扩展。您无需考虑如何复制和分片表。
在此示例中,自托管 ClickHouse 服务器是源,而 ClickHouse Cloud 服务是目标。
概览
流程如下:
- 在源服务上添加只读用户
- 在目标服务上复制源表结构
- 从源拉取数据到目标,或从源推送数据,具体取决于源的网络可用性
- 从目标上的 IP 访问列表中删除源服务器(如果适用)
- 从源服务中删除只读用户
将表从一个系统迁移到另一个系统:
此示例将一个表从自托管 ClickHouse 服务器迁移到 ClickHouse Cloud。
在源 ClickHouse 系统上(当前托管数据的系统)
- 添加一个只读用户,该用户可以读取源表(本例中为
db.table
)
CREATE USER exporter
IDENTIFIED WITH SHA256_PASSWORD BY 'password-here'
SETTINGS readonly = 1;
GRANT SELECT ON db.table TO exporter;
- 复制表定义
select create_table_query
from system.tables
where database = 'db' and table = 'table'
在目标 ClickHouse Cloud 系统上:
- 创建目标数据库
CREATE DATABASE db
- 使用源中的 CREATE TABLE 语句,创建目标表。
运行 CREATE 语句时,将 ENGINE 更改为不带任何参数的 ReplicatedMergeTree。 ClickHouse Cloud 始终复制表并提供正确的参数。 但请保留 ORDER BY
、PRIMARY KEY
、PARTITION BY
、SAMPLE BY
、TTL
和 SETTINGS
子句。
CREATE TABLE db.table ...
- 使用
remoteSecure
函数从自托管源拉取数据

INSERT INTO db.table SELECT * FROM
remoteSecure('source-hostname', db, table, 'exporter', 'password-here')
如果源系统无法从外部网络访问,则可以推送数据而不是拉取数据,因为 remoteSecure
函数适用于 select 和 insert。 请参阅下一个选项。
- 使用
remoteSecure
函数将数据推送到 ClickHouse Cloud 服务

为了使 remoteSecure
函数连接到您的 ClickHouse Cloud 服务,远程系统的 IP 地址需要被 IP 访问列表允许。 展开此提示下方的管理您的 IP 访问列表以获取更多信息。
管理您的 IP 访问列表
从您的 ClickHouse Cloud 服务列表中选择您将使用的服务,然后切换到安全。 如果 IP 访问列表不包含需要连接到您的 ClickHouse Cloud 服务的远程系统的 IP 地址或范围,那么您可以使用添加条目来解决问题
添加需要连接到您的 ClickHouse Cloud 服务的单个 IP 地址或地址范围。 根据您的需要修改表单,然后单击添加条目和提交条目。
INSERT INTO FUNCTION
remoteSecure('HOSTNAME.clickhouse.cloud:9440', 'db.table',
'default', 'PASS') SELECT * FROM db.table
在 ClickHouse Cloud 服务之间迁移

在 ClickHouse Cloud 服务之间迁移数据的一些示例用例
- 从还原的备份迁移数据
- 将数据从开发服务复制到暂存服务(或从暂存到生产)
在此示例中,有两个 ClickHouse Cloud 服务,它们将分别称为源和目标。 数据将从源拉取到目标。 虽然您可以根据需要推送,但此处显示拉取是因为它使用了只读用户。

迁移中有几个步骤
- 确定一个 ClickHouse Cloud 服务作为源,另一个作为目标
- 在源服务上添加只读用户
- 在目标服务上复制源表结构
- 临时允许 IP 访问源服务
- 将数据从源复制到目标
- 重新建立目标上的 IP 访问列表
- 从源服务中删除只读用户
在源服务上添加只读用户
-
添加一个只读用户,该用户可以读取源表(本例中为
db.table
)CREATE USER exporter
IDENTIFIED WITH SHA256_PASSWORD BY 'password-here'
SETTINGS readonly = 1;GRANT SELECT ON db.table TO exporter;
-
复制表定义
select create_table_query
from system.tables
where database = 'db' and table = 'table'
在目标服务上复制表结构
在目标上创建数据库(如果尚不存在)
-
创建目标数据库
CREATE DATABASE db
-
使用源中的 CREATE TABLE 语句,创建目标表。
在目标上,使用源中的
select create_table_query...
的输出创建表CREATE TABLE db.table ...
允许远程访问源服务
为了从源拉取数据到目标,源服务必须允许连接。 暂时禁用源服务上的“IP 访问列表”功能。
如果您将继续使用源 ClickHouse Cloud 服务,请在切换到允许从任何位置访问之前将现有的 IP 访问列表导出到 JSON 文件; 这将允许您在数据迁移后导入访问列表。
修改允许列表,并临时允许从任何位置访问。 有关详细信息,请参阅 IP 访问列表 文档。
将数据从源复制到目标
-
使用
remoteSecure
函数从源 ClickHouse Cloud 服务拉取数据。 连接到目标。 在目标 ClickHouse Cloud 服务上运行此命令INSERT INTO db.table SELECT * FROM
remoteSecure('source-hostname', db, table, 'exporter', 'password-here') -
验证目标服务中的数据
重新建立源上的 IP 访问列表
如果您之前导出了访问列表,则可以使用共享重新导入它,否则请将您的条目重新添加到访问列表。
删除只读 exporter
用户
DROP USER exporter
- 切换服务 IP 访问列表以限制访问