欢迎阅读 7 月份的 ClickHouse 简讯,我们将回顾过去一个月实时数据仓库领域发生的事件。
本月,我们在 24.6 版本中实现了最佳表排序,使用 ClickHouse 和 Grafana 跟踪船舶,以及在运行 ClickHouse 时优化 CPU 使用率的策略。
本期内容
- 社区成员推荐
- 即将举行的活动
- 24.6 版本
- 如何使用 Python、ClickHouse 和 Grafana 跟踪船舶
- ClickHouse MergeTree 引擎
- 优化 ClickHouse:highlight.io 的有效策略
- ClickHouse Cloud 更新:2024年7月
- 视频专栏:导入模式
- 本月最佳帖子
社区成员推荐
本月推荐的社区成员是 taiyang-li (李扬)
taiyang-li 是 ClickHouse 数据库的常客贡献者,经常提交代码请求,以提升 ClickHouse 的性能和字符串处理能力。在过去的几个月里,他提交了让 -UTF8 函数处理仅包含 ASCII 字符的字符串的代码,修复了concat 函数以接受空参数,并提高了upper/lowerUTF8 函数的兼容性。如果您注意到splitByRegexp、coalesce 或ifNotNull 函数速度更快,您也可以感谢 taiyang-li!
即将举行的活动
- ClickHouse 基础知识 - 7月24日至25日
- ClickHouse 社区电话会议 - 7月30日
- 从 Postgres 迁移到 ClickHouse 研讨会 - 7月31日
- BigQuery 到 ClickHouse 研讨会 - 8月7日
- ClickHouse 基础知识 - 8月13日至14日
- ClickHouse 管理员研讨会 - 8月21日
24.6 版本
ClickHouse 的最新版本引入了最佳表排序功能。我们可以在创建表时使用此设置,并在摄取数据时,按照ORDER BY 键排序后,ClickHouse 将自动对数据进行排序以实现最佳压缩。我们还发布了 chDB 的 Beta 版,允许您直接查询 Pandas DataFrame,并添加了希尔伯特曲线的函数。
如何使用 Python、ClickHouse 和 Grafana 跟踪船舶
Ignacio Van Droogenbroeck 撰写了一篇关于跟踪旧金山和布宜诺斯艾利斯船舶的精彩博文。他展示了如何从 AisStream 的 WebSockets API 获取数据到 ClickHouse,然后使用 Grafana 创建一系列可视化效果。
ClickHouse MergeTree 引擎
Tôi là Duyệt 开始撰写关于在 Kubernetes 中使用 ClickHouse 的博文。最近的一篇帖子探讨了默认的 MergeTree 表引擎。Tôi 解释了使用此引擎将数据摄取到表中时发生的情况。然后,他介绍了如何使用它,包括插入数据、支持的数据类型和列修饰符。
优化 ClickHouse:highlight.io 的有效策略
highlight.io 是一个开源的全栈监控平台。它每月摄取 100 TB 的可观察性数据,其中大部分进入 ClickHouse。CTO Vadim Korolik 撰写了一篇博文,分享了他们优化 ClickHouse 以降低 CPU 负载的经验教训。
ClickHouse Cloud 更新:2024年7月
您是否知道我们每两周发布一次 ClickHouse Cloud 变更日志?在最新版本中,我们宣布了 ClickHouse Cloud 在 Microsoft Azure 上可用,以及新的查询日志洞察 UI,以便更轻松地调试您的查询。Prometheus 指标端点也处于私有预览阶段。
视频专栏:导入模式
Mark Needham 录制了一些演示 ClickHouse 导入模式的视频
- 从其他列派生列 演示了如何使用 DEFAULT、ALIAS 和 MATERIALIZED 列修饰符
- 接下来,我们将了解EPHEMERAL 列修饰符,当我们不想存储列但希望其他列修饰符引用该列时使用它。
- 最后,我们使用Null 表引擎 根据筛选条件将传入的数据路由到不同的目标表。
本月最佳帖子
我们这个月最喜欢的帖子来自anhtho,他正在使用 ClickHouse 分析计费数据。