如何从 PostgreSQL 插入数据
我们建议阅读 本指南 以了解有关将数据插入 ClickHouse 以优化插入性能的最佳实践。
对于从 PostgreSQL 批量加载数据,用户可以使用
- 使用
ClickHouse 的 PeerDB
,这是一种专门为 PostgreSQL 数据库复制到自托管 ClickHouse 和 ClickHouse Cloud 而设计的 ETL 工具。要开始使用,请在 PeerDB 云 上创建一个帐户,并参考 文档 以获取设置说明。 - 使用 Postgres 表函数 直接读取数据。如果基于已知水印(例如时间戳)的批处理复制足够,或者如果这是一次性迁移,则此方法通常适用。此方法可以扩展到数千万行。希望迁移更大数据集的用户应考虑多个请求,每个请求处理一部分数据。在将每个块的分区移动到最终表之前,可以为每个块使用暂存表。这允许重试失败的请求。有关此批量加载策略的更多详细信息,请参见 此处。
- 数据可以从 CSV 格式的 Postgres 中导出。然后可以从 本地文件 或通过使用 表函数 的对象存储将其插入 ClickHouse 中。