欢迎来到 8 月份的 ClickHouse 通讯,本期通讯将汇总过去一个月实时数据仓库领域发生的事件。
本月,我们带来了 PeerDB 加入 ClickHouse 的激动人心的消息、时间序列数据降采样、24.7 版本中的连接性能改进等等!
ClickHouse 创建者兼首席技术官 Alexey 将开启巡回演讲!
我们很高兴地宣布 **ClickHouse 创建者兼首席技术官 Alexey Milovidov** 将在世界各地进行一系列技术演讲。请亲临这些活动,聆听他的演讲,并有机会向他提问关于 ClickHouse 的任何问题!名额有限,请在下方注册
- 8 月 25 日星期日 - 中国广州聚会 - 注册
- 8 月 27 日星期二 - VLDB 演讲,广州 - 日程安排
- 9 月 5 日星期四 - 旧金山聚会 (Cloudflare) - 注册
- 9 月 9 日星期一 - 莱利聚会 (德意志银行) - 注册
- 9 月 10 日星期二 - 纽约聚会 (Rokt) - 注册
- 9 月 12 日星期四 - 芝加哥炉边谈话 (Jump Capital) - 注册
- 9 月 18 日星期三 - 华沙 AWS 云日 - 注册
本期内容
- 社区成员推荐:Chase Richards
- 即将举行的活动
- ClickHouse 欢迎 PeerDB
- 时间序列数据降采样
- 24.7 版本
- Maxilect 如何在地域上相距遥远的数据中心之间传输 ClickHouse
- Java 客户端… 续集?!
- 快速阅读
- 本月推荐文章
社区成员推荐:Chase Richards
本月社区成员推荐是 Corsearch 的工程副总裁 Chase Richards。
Chase Richards 曾在 Marketly 担任工程主管,带领团队从 2011 年的初创公司一路发展到 2020 年被 Corsearch 收购。
Chase 最近在 贝尔维尤聚会上进行了演讲,介绍了他将 MySQL 替换为 ClickHouse 作为其搜索引擎保护服务的客户面向报表界面的后端数据库的经验。他于 2018 年完成了这一壮举,因此在社区中被誉为先驱。
最近,Chase 和他的团队在 欺诈检测模型中添加了基于向量的分析。他们还在使用 ClickHouse 来监控他们的搜索引擎抓取设置。
即将举行的活动
- ClickHouse 广州聚会 - 8 月 25 日
- ClickHouse + 墨尔本数据工程聚会 - 8 月 27 日
- 贝尔维尤 ClickHouse 聚会 - 8 月 27 日
- ClickHouse 开发人员培训 - 9 月 3 日
- 苏黎世 ClickHouse 聚会 - 9 月 5 日
- ClickHouse + 悉尼数据工程聚会 - 9 月 5 日
- ClickHouse 聚会 @ Cloudflare - 旧金山 - 9 月 5 日
- Kubernetes 社区日 - 悉尼 - 9 月 5-6 日
- 莱利 ClickHouse 聚会 - 9 月 9 日
- ClickHouse 聚会 @ Shopify - 多伦多 - 9 月 10 日
- ClickHouse 管理员研讨会 - 9 月 10 日
- AWS 峰会 - 多伦多 - 9 月 10 日
- ClickHouse 聚会 @ Rokt - 纽约 - 9 月 10 日
- 与 ClickHouse 谈谈 - 阿姆斯特丹 - 9 月 11 日
- ClickHouse 基础知识 - 9 月 11 日
- ClickHouse 聚会 @ Jump Capital - 9 月 12 日
- ClickHouse 聚会 - 奥斯汀 - 9 月 17 日
- 伦敦 ClickHouse 聚会 - 9 月 17 日
- AWS 云日 - 华沙 - 9 月 18 日
- ClickHouse 基础知识线下培训 - 阿姆斯特丹 - 9 月 18-19 日
- 大数据 LDN (伦敦) - 9 月 18-19 日
- ClickHouse Cloud 直播更新 - 9 月 24 日
- DataEngBytes - 悉尼 - 9 月 24 日
- DataEngBytes - 珀斯 - 9 月 27 日
- DataEngBytes - 墨尔本 - 10 月 1 日
- DataEngBytes - 奥克兰 - 10 月 4 日
ClickHouse 欢迎 PeerDB
几周前,我们很高兴地宣布 ClickHouse 与 PeerDB 携手合作,PeerDB 是一家专注于 Postgres 的变更数据捕获 (CDC) 提供商。
现在,用户可以通过简单操作,将数据从排名第一的事务型数据库同步到排名第一的分析型数据库。
时间序列数据降采样
Phare 是一个用于网站监控、事件管理、状态页、分析、安全和警报的平台。他们想要创建一个图表,展示 90 天的监控数据。由于他们每分钟收集一个数据点,这意味着该图表需要呈现 130,000 个数据点,这既耗时又难以解读。
这时,就轮到 largestTriangleThreeBuckets 函数发挥作用了,该函数于 2023 年底添加到 ClickHouse 中。使用此函数,他们可以删除冗余数据点,从而使图表创建速度更快,也更易于解读。
24.7 版本
24.7 版本包含许多性能改进。其中包括用于 ASOF 联接的完整排序合并算法、更快的并行哈希联接算法以及在使用高选择性过滤器运行查询时对“按顺序读取”算法的改进。
我们还增加了物化视图中的重复数据删除、自动命名元组和 percent_rank 窗口函数。
Maxilect 如何在地域上相距遥远的数据中心之间传输 ClickHouse
Maxilect 是一家为广告科技和金融科技行业提供 IT 解决方案的提供商,他们撰写了一份关于将 ClickHouse 集群从迈阿密数据中心迁移到底特律数据中心的经验报告。
在这篇博文中,Igor Ivanov 和 Denis Palaguta 解释了他们如何使用 clickhouse-copier 工具在保持服务正常运行并为用户请求提供服务的同时完成了迁移。
Java 客户端… 续集?!
我们最近开始着手改进 ClickHouse Java 客户端。新版本拥有更直观、自文档化的 API,并且我们在文档中添加了更多使用示例。
它目前仍处于 alpha 阶段,但我们希望您能尝试它并向我们反馈您的想法。
快速阅读
- Vladimir Ivoninskii 分享了他关于 有效运行生产 ClickHouse 集群的最佳技巧。
- Denys Golotiuk 展示了如何 使用 ClickHouse 中的向量嵌入进行图像相似性搜索,并使用 L2Distance 函数。
- Joe Zhou 探讨了 将 ClickHouse 与 Dragonfly 集成,Dragonfly 是一种超高吞吐量、与 Redis 兼容的内存数据存储。
本月推荐文章
我们 本月最喜欢的帖子 是 Y Combinator 关于 PeerDB 加入 ClickHouse 的帖子。