欢迎阅读 8 月份 ClickHouse 新闻通讯,本期通讯将总结过去一个月实时数据仓库领域的动态。
本月,我们有激动人心的消息,包括 PeerDB 加入 ClickHouse、时间序列数据降采样、24.7 版本中的连接性能改进等等!
ClickHouse 创建者兼首席技术官 Alexey 即将巡回演讲!
我们很高兴地宣布,ClickHouse 的创建者兼首席技术官 Alexey Milovidov 将在全球各地进行一系列技术讲座。请亲临现场参加这些活动,聆听他的演讲,并有机会向他提出关于 ClickHouse 的任何问题!名额有限,请在下方注册
- 8 月 25 日,星期日 - 中国见面会,广州 - 注册
- 8 月 27 日,星期二 - VLDB 演讲,广州 - 日程
- 9 月 5 日,星期四 - 旧金山见面会 (Cloudflare) - 注册
- 9 月 9 日,星期一 - 罗利见面会 (德意志银行) - 注册
- 9 月 10 日,星期二 - 纽约见面会 (Rokt) - 注册
- 9 月 12 日,星期四 - 芝加哥炉边谈话 (Jump Capital) - 注册
- 9 月 18 日,星期三 - 华沙 AWS Cloud Day - 注册
本期内容
- 社区焦点成员:Chase Richards
- 即将举行的活动
- ClickHouse 欢迎 PeerDB 加入
- 时间序列数据降采样
- 24.7 版本发布
- Maxilect 如何在地理位置遥远的数据中心之间迁移 ClickHouse
- Java 客户端… SEQUEL?!
- 快速阅读
- 本月最佳帖子
社区焦点成员:Chase Richards
本月焦点社区成员是 Corsearch 工程副总裁 Chase Richards。
Chase Richards 此前领导 Marketly 的工程工作,该公司从 2011 年的初创公司发展到 2020 年被 Corsearch 收购。
Chase 最近在 Bellevue 见面会上 介绍了他的经验,即用 ClickHouse 替换 MySQL 作为其搜索引擎保护服务的面向客户端的报告界面的后端数据库。他在 2018 年完成了这项工作,赢得了社区先驱的地位。
最近,Chase 和他的团队 在其欺诈检测模型中添加了基于向量的分析。他们还使用 ClickHouse 监控其搜索引擎抓取设置。
即将举行的活动
- ClickHouse 广州见面会 - 8 月 25 日
- ClickHouse + 墨尔本数据工程见面会 - 8 月 27 日
- ClickHouse Bellevue 见面会 - 8 月 27 日
- ClickHouse 开发者培训 - 9 月 3 日
- ClickHouse 苏黎世见面会 - 9 月 5 日
- ClickHouse + 悉尼数据工程见面会 - 9 月 5 日
- ClickHouse 见面会 @ Cloudflare - 旧金山 - 9 月 5 日
- Kubernetes 社区日 - 悉尼 - 9 月 5-6 日
- ClickHouse 罗利见面会 - 9 月 9 日
- ClickHouse 见面会 @ Shopify - 多伦多 - 9 月 10 日
- ClickHouse 管理员研讨会 - 9 月 10 日
- AWS 峰会多伦多站 - 9 月 10 日
- ClickHouse 见面会 @ Rokt - 纽约市 - 9 月 10 日
- Coffee with ClickHouse - 阿姆斯特丹 - 9 月 11 日
- ClickHouse 基础知识 - 9 月 11 日
- ClickHouse 见面会 @ Jump Capital - 9 月 12 日
- ClickHouse 奥斯汀见面会 - 9 月 17 日
- ClickHouse 伦敦见面会 - 9 月 17 日
- AWS Cloud Day - 华沙 - 9 月 18 日
- ClickHouse 基础知识线下培训 - 阿姆斯特丹 - 9 月 18-19 日
- Big Data LDN (伦敦) - 9 月 18-19 日
- ClickHouse Cloud Live Update - 9 月 24 日
- DataEngBytes - 悉尼 - 9 月 24 日
- DataEngBytes - 珀斯 - 9 月 27 日
- DataEngBytes - 墨尔本 - 10 月 1 日
- DataEngBytes - 奥克兰 - 10 月 4 日
ClickHouse 欢迎 PeerDB 加入
几周前,我们很高兴地宣布,ClickHouse 今天与专注于 Postgres 的变更数据捕获 (CDC) 提供商 PeerDB 强强联合。
现在,用户可以轻松地将数据从排名第一的事务数据库同步到排名第一的分析数据库。
时间序列数据降采样
Phare 是一个用于网站监控、事件管理、状态页面、分析、安全和警报的平台。他们想要创建一个显示 90 天监控数据的图表。由于他们每分钟收集一个数据点,这意味着该图表需要渲染 130,000 个数据点,这既缓慢又难以解释。
输入 largestTriangleThreeBuckets 函数,该函数于 2023 年底添加到 ClickHouse 中。使用此函数,他们可以删除冗余数据点,使图表创建速度更快,更易于解释。
24.7 版本发布
24.7 版本包含许多性能改进。其中包括 ASOF 连接的完整排序合并算法、更快的并行哈希连接算法以及在高选择性过滤器下运行查询时对“按顺序读取”算法的改进。
我们还提供了物化视图中的重复数据删除、自动命名元组和 percent_rank 窗口函数。
Maxilect 如何在地理位置遥远的数据中心之间迁移 ClickHouse
Maxilect 是一家为广告技术和金融科技行业提供 IT 解决方案的提供商,他们撰写了一份关于将 ClickHouse 集群从迈阿密的数据中心迁移到另一个位于底特律的数据中心的经验报告。
在这篇博文中,Igor Ivanov 和 Denis Palaguta 解释了他们如何在保持服务正常运行并服务用户请求的同时,使用 clickhouse-copier 工具完成此操作。
Java 客户端… SEQUEL?!
我们最近开始着手改进 ClickHouse Java 客户端。新版本具有更直观、自文档化的 API,并且我们在文档中添加了更多使用示例。
它仍处于 alpha 阶段,但我们希望您试用它并向我们发送您的想法。
快速阅读
- Vladimir Ivoninskii 分享了他有效运行生产 ClickHouse 集群的最佳技巧。
- Denys Golotiuk 展示了如何使用 ClickHouse 中的向量嵌入和 L2Distance 函数进行图像相似性搜索。
- Joe Zhou 探讨了将 ClickHouse 与 Dragonfly 集成,Dragonfly 是一种超高吞吐量、与 Redis 兼容的内存数据存储。
本月最佳帖子
本月我们最喜欢的帖子是 Y Combinator 关于 PeerDB 加入 ClickHouse 的帖子。