欢迎来到七月 ClickHouse Newsletter,本期将总结过去一个月实时数据仓库领域的动态。
本月,我们带来了 24.6 版本中的最优表排序、使用 ClickHouse 和 Grafana 追踪船只,以及在运行 ClickHouse 时优化 CPU 使用率的策略。
本期内容
- 社区焦点人物
- 即将到来的活动
- 24.6 版本发布
- 如何使用 Python、ClickHouse 和 Grafana 追踪船只
- ClickHouse MergeTree 引擎
- 优化 ClickHouse:适用于 highlight.io 的策略
- ClickHouse Cloud 更新:2024 年 7 月
- 视频专栏:导入模式
- 本月精选文章
社区焦点人物
本月社区焦点人物是 taiyang-li (李扬)
taiyang-li 是 ClickHouse 数据库的活跃贡献者,经常 贡献 pull requests 来提升 ClickHouse 的性能和字符串处理能力。在过去几个月里,他提交的代码让 -UTF8 函数可以处理仅包含 ASCII 字符的字符串,修复了 concat 函数以接受空参数,并提高了 upper/lowerUTF8 函数的兼容性。如果您注意到 splitByRegexp、coalesce 或 ifNotNull 函数变得更快了,也要感谢 taiyang-li 的贡献!
即将到来的活动
- ClickHouse 基础知识 - 7 月 24 日和 25 日
- ClickHouse 社区电话会议 - 7 月 30 日
- 从 Postgres 迁移到 ClickHouse 工作坊 - 7 月 31 日
- 从 BigQuery 迁移到 ClickHouse 工作坊 - 8 月 7 日
- ClickHouse 基础知识 - 8 月 13 日和 14 日
- ClickHouse 管理员工作坊 - 8 月 21 日
24.6 版本发布
ClickHouse 的最新版本引入了最优表排序。我们可以在创建表时使用此设置,并且在摄取数据时,在按 ORDER BY 键排序后,ClickHouse 将自动对数据进行排序以实现最佳压缩。我们还发布了 chDB 的 Beta 版本,让您可以直接查询 Pandas DataFrames,并添加了用于 Hilbert 曲线的函数。
如何使用 Python、ClickHouse 和 Grafana 追踪船只
Ignacio Van Droogenbroeck 撰写了一篇很棒的博客文章,介绍了如何追踪旧金山和布宜诺斯艾利斯的船只。他展示了如何从 AisStream 的 WebSockets API 获取数据到 ClickHouse,然后使用 Grafana 创建一系列可视化图表。
ClickHouse MergeTree 引擎
Tôi là Duyệt 开始撰写关于在 Kubernetes 中使用 ClickHouse 的博客文章。最近的一篇文章探讨了默认的 MergeTree 表引擎。Tôi 解释了当数据使用此引擎摄取到表中时会发生什么。然后,他介绍了如何使用它,包括插入数据、支持的数据类型和列修饰符。
优化 ClickHouse:适用于 highlight.io 的策略
highlight.io 是一个开源的全栈监控平台。它每月摄取 100 TB 的可观测性数据,其中大部分进入了 ClickHouse。CTO Vadim Korolik 撰写了一篇博客文章,分享了他们优化 ClickHouse 以降低 CPU 负载的经验。
ClickHouse Cloud 更新:2024 年 7 月
您知道我们每两周发布一次 ClickHouse Cloud 更新日志吗?在最新版本中,我们宣布 ClickHouse Cloud 在 Microsoft Azure 上可用,并推出了新的查询日志洞察 UI,以便更轻松地调试您的查询。用于指标的 Prometheus 端点也处于私有预览阶段。
视频专栏:导入模式
Mark Needham 录制了多个视频,演示了 ClickHouse 的导入模式
- “从其他列派生列”展示了如何使用 DEFAULT、ALIAS 和 MATERIALIZED 列修饰符
- 接下来,我们将学习 EPHEMERAL 列修饰符,它在我们不想存储列,而是希望该列被其他列修饰符引用时使用。
- 最后,我们使用 Null Table Engine 根据过滤条件将传入数据路由到不同的目标表。
本月精选文章
本月我们最喜欢的文章是由 anhtho 发布的,他使用 ClickHouse 分析计费数据。