欢迎阅读 3 月份的 ClickHouse 简讯,我们将在此汇总过去一个月中实时数据仓库领域发生的事件。
本月,我们发布了 24.2 版本,其中包含了数据摄取的有用功能、ClickHouse 的 Rill 仪表板,以及使用聚合状态将物化视图速度提升 10 倍的功能。
本期内容
- 社区成员推荐
- 24.2 版本
- ClickHouse 的 Rill 仪表板
- 万亿行挑战赛
- 使用聚合状态将物化视图速度提升 10 倍
- chDB 加入 ClickHouse 家族
- 本月精选文章
- 即将举行的活动
社区成员推荐
本月推荐的社区成员是 Steve Flitcroft,iVendi 的研发副总裁。
Steve 在 ClickHouse 社区 Slack (ClickHouse 社区 Slack) 上更为人知,他的 ID 是 redsquare。他帮助许多用户解决了在使用 ClickHouse 时遇到的问题。
无论是关于可刷新物化视图的问题、如何加速查询,还是了解 ClickHouse 的表引擎,Steve 都能为您提供帮助!
24.2 版本
24.2 版本增加了一些用于数据摄取的有用功能。自适应异步插入使数据批处理更加智能和高效。此外,ClickHouse 现在可以更智能地检测文件格式,即使文件扩展名丢失或错误。我们还对距离函数进行了矢量化,加快了 RAG 应用程序中的矢量搜索速度。
ClickHouse 的 Rill 仪表板
Rill 是一款商业智能工具,可让您构建具有亚秒级性能的快速运营仪表板。本月,他们碰巧在 FOSDEM 上遇到了 ClickHouse 的联合创始人兼 CTO Alexey,并添加了一个 ClickHouse 连接器。Nishant Bangarwa 在一篇博文中解释了该连接器的工作原理,并提供了分步说明,帮助您启动并运行第一个 Rill/ClickHouse 仪表板。
万亿行挑战赛
2 月初,Dask 启动了 万亿行挑战赛,参赛者需要查询存储在 S3 中 100,000 个 Parquet 文件中的 1 万亿行数据。我们的挑战赛专家 Dale McDiarmid 开始着手进行这项工作,并在不到 3 分钟的时间内以 0.56 美元的 AWS Spot 实例费用完成了查询。在博文中,Dale 解释了他是如何优化查询性能的,包括瓶颈检测和确定要使用的 AWS 机器最佳大小。
使用聚合状态将物化视图速度提升 10 倍
Sayed Alesawy 撰写了一篇博文,其中介绍了各种提高可观察性数据查询性能的技术。对 2600 万行数据的初始查询需要 693 秒才能运行,使用物化视图后减少到 11 秒。但需要亚秒级的响应时间,这可以通过存储 聚合状态 而不是标量值来实现。
chDB 加入 ClickHouse 家族
本月最大的新闻是,chDB(一个由 ClickHouse 提供支持的嵌入式 SQL OLAP 引擎)现在已成为 ClickHouse 的一部分。chDB 的创建者兼主要贡献者 Auxten 将与我们联手,专注于 chDB 的发展,并将其与 ClickHouse 生态系统更加紧密地集成。我们非常想知道您希望我们接下来开展哪些工作,您可以通过 chDB GitHub 讨论区 告知我们。
本月精选文章
我本月最喜欢的推文来自 Michael E. Driscoll(Rill Data 创始人),内容是关于 chDB 加入 ClickHouse 的。 请点击此处查看
即将举行的活动
- v24.3 ClickHouse 社区电话会议 - 3月26日
- 免费 ClickHouse 培训 - 3月27日和28日
- 班加罗尔聚会 - 3月23日
- 巴黎 AWS 峰会 - 4月3日
- 阿姆斯特丹 AWS 峰会 - 4月9日
- 苏黎世聚会 - 4月16日
- 哥本哈根聚会 - 4月23日
- v24.4 ClickHouse 社区电话会议 - 4月30日
- 斯德哥尔摩聚会 - 5月22日
- 迪拜聚会 - 5月28日