数据接入
ClickHouse 与多种数据集成和转换解决方案集成。有关更多信息,请查看以下页面
| 数据接入工具 | 描述 |
|---|---|
| Airbyte | 一个开源的数据集成平台。它允许创建 ELT 数据管道,并自带超过 140 个开箱即用的连接器。 |
| Apache Spark | 一个多语言引擎,用于在单节点机器或集群上执行数据工程、数据科学和机器学习 |
| Apache Flink | 通过 Flink 的 DataStream API 将实时数据接入和处理到 ClickHouse 中,支持批量写入 |
| Amazon Glue | Amazon Web Services (AWS) 提供的完全托管的无服务器数据集成服务,简化了发现、准备和转换数据以进行分析、机器学习和应用程序开发的过程。 |
| Artie | 一个完全托管的实时数据流平台,可将生产数据复制到 ClickHouse 中,从而实现面向客户的分析、运营工作流程和生产中的 Agentic AI。 |
| Azure Synapse | Microsoft Azure 提供的完全托管的云端分析服务,结合大数据和数据仓库,简化了使用 SQL、Apache Spark 和数据管道进行大规模数据集成、转换和分析。 |
| Azure Data Factory | 一个云端数据集成服务,可让你创建、安排和编排大规模数据工作流程。 |
| Apache Beam | 一个开源的统一编程模型,使开发人员能够定义和执行批量和流(连续)数据处理管道。 |
| BladePipe | 一个实时端到端数据集成工具,具有亚秒级延迟,可提升跨平台无缝数据流。 |
| dbt | 使分析工程师能够通过简单地编写 SELECT 语句来转换数据仓库中的数据。 |
| dlt | 一个开源库,你可以将其添加到你的 Python 脚本中,以从各种且通常混乱的数据源加载数据到结构良好、实时的的数据集中。 |
| Estuary | 一个实时数据平台,可实现毫秒级延迟的 ETL 管道,并具有灵活的部署选项。 |
| Fivetran | 一个自动化的数据移动平台,可将数据从你的云数据平台移入和跨越。 |
| NiFi | 一个开源的工作流管理软件,旨在自动化软件系统之间的数据流。 |
| Vector | 一个高性能的可观察性数据管道,使组织能够控制其可观察性数据。 |