"我们聚合用户的历史记录到 ClickHouse 中,并将其用作训练和推理的数据存储。即使在读取数千万行时,性能也非常好,并且不是训练新模型的瓶颈。"
- 用例
- 机器学习和 GenAI
机器学习和 GenAI
ClickHouse 是用于支持机器学习工作负载的终极实时数据库。借助 ClickHouse,在您的分析数据上释放 GenAI 比以往任何时候都更容易。
Agentic Data Stack
在 ClickHouse Cloud 控制台或通过本地远程 MCP 服务器内解锁面向 Agent 的分析,并使用以下工具观察您的 Agent: Langfuse
- AI 助手
- AI Agent
- 远程 MCP 服务器
- Docs AI
了解公司为何使用 ClickHouse 来支持其 AI 工作负载。
一流的摄取速率,旨在处理连续的数据流,因此您可以依赖最最新的信息来提供准确的预测和结果。
无与伦比的规模查询性能。在毫秒内查询数十亿行。通过您的数据减少迭代时间并最大限度地提高效率。
强大的自动扩展,旨在处理不可预测的工作负载。专注于机器学习,而无需担心您的基础设施。
作为 Python 的进程内 OLAP SQL 引擎提供。通过 chDB,直接在您的 Python 代码中利用 ClickHouse 的全部功能。
ClickHouse 用于机器学习和人工智能
ClickHouse 旨在让从复杂数据中提取见解变得毫不费力。无论您正在处理多少数据。无论您是通过聚合提取用于模型训练和评估的有价值信息,通过我们的用户定义函数运行推理,还是执行向量搜索,ClickHouse 都能让您最大限度地提高数据效率,并为任何应用程序释放人工智能的力量。
创建有价值的体验和见解
无论您是构建引人入胜的个性化功能、将语义搜索集成到您的产品中、自动从原始内容生成摘要见解,还是更多,ClickHouse 都会公开您需要使用数据构建人工智能功能的功能。
统一您的数据堆栈
消除对用于特定机器学习任务(如向量搜索)的专用数据存储的需求。借助 ClickHouse,您可以依赖一个统一的数据存储来支持您的分析、运行您的机器学习工作负载以及管理您的临时查询,所有这些都在一个地方。
高效管理数据
ClickHouse 高效的资源管理有助于最大限度地提高成本效益。我们的列式设计提供一流的压缩率,减少存储负担,并确保即使是最密集的 ML 工作负载也能实现闪电般的速度。
使用您喜欢的工具
直接使用您最喜欢的 ML 工具使用 ClickHouse。我们不断增长的集成社区包括流行的机器学习框架、可视化工具、笔记本等。
支持 参考资料
- 使用 ClickHouse 进行向量搜索 - 第 1 部分
- 使用 ClickHouse 进行向量搜索 - 第 2 部分
- 视频:ClickHouse 用于人工智能 - 向量、嵌入、语义搜索等 - Alexey Milovidov,ClickHouse
- 视频:ClickHouse 中的向量搜索 - Dale McDiarmid
- 将 Langchain 与 ClickHouse 结合使用
- 将 Deepnote 与 ClickHouse 结合使用
- 使用 ClickHouse 分析 Hugging Face 数据集
- 使用 ClickHouse UDF 与 OpenAI 模型集成
- 使用 ClickHouse 机器学习函数进行预测
- Helicone 从 Postgres 迁移到 ClickHouse 以进行高级 LLM 监控
- ClickHouse 和机器学习数据层
- 使用 ClickHouse 驱动特征存储