欢迎阅读 9 月份的 ClickHouse 简报,本期简报将回顾过去一个月实时数据仓库领域发生的重大事件。本月,我们带来了备受期待的 JSON 数据类型、第一篇 ClickHouse 研究论文、BYOC 在 AWS 上的私有预览版、使用 Ibis 提升 PyPI 统计数据,以及更多内容!
本期内容
- 社区成员风采
- 即将举办的活动
- VLDB 2024:首篇 ClickHouse 研究论文
- Reco 如何利用高级分析来检测复杂的 SaaS 威胁
- 24.8 LTS 版本
- 使用 Ibis、ClickHouse 和 Shiny 提升 PyPI 统计数据
- ClickHouse Cloud:BYOC AWS 私有预览版
- 速读
- 本月精选
社区成员风采
beehiiv 是一个电子邮件营销平台,帮助创作者、出版商和企业构建和发展他们的电子邮件受众。他们收集事件,捕捉每一次电子邮件处理、每一次进入收件箱、每一次延迟、每一次退回、每一次打开、每一次点击链接等等。
Eric 在 beehiv 工作了一年多,负责将数据操作从 Postgres 迁移到 ClickHouse Cloud。他们团队的工作有一个用户故事,他还在夏季的纽约聚会上做了演讲。
Eric 之前曾在 Arthur.ai 担任技术主管,负责设计和构建公司的 数据摄取管道、存储以及大部分后端基础设施。
即将举办的活动
全球活动
- ClickHouse Cloud 直播更新 - 9 月 24 日
- 24.9 版本社区电话会议 - 9 月 26 日
免费培训
-
使用 ClickHouse 进行查询优化工作坊 - 9 月 25 日
-
ClickHouse 线下工作坊 - 新加坡 - 10 月 3 日
欧洲、中东和非洲地区的活动
- 特拉维夫聚会 - 9 月 22 日
- 马德里聚会 - 10 月 22 日
- 巴塞罗那聚会 - 10 月 29 日
- 奥斯陆聚会 - 10 月 31 日
- 根特聚会 - 11 月 19 日
- 迪拜聚会 - 11 月 21 日
- 巴黎聚会 - 11 月 26 日
亚太地区的活动
-
DataEngBytes - 悉尼 - 9 月 24 日
-
DataEngBytes - 珀斯 - 9 月 27 日
-
DataEngBytes - 墨尔本 - 10 月 1 日
-
DataEngBytes - 奥克兰 - 10 月 4 日
- 亚洲大数据和人工智能世界 - 10 月 10 日
-
新南威尔士云卓越峰会 - 10 月 17 日
-
维多利亚州数据和人工智能峰会 - 10 月 22 日
VLDB 2024:首篇 ClickHouse 研究论文
我们已经筹备了将近一年时间,终于在 8 月底在 VLDB 2024 上发布了我们的首篇研究论文。
VLDB(国际超大型数据库会议)被广泛认为是数据管理领域的领先会议之一。VLDB 的接受率通常在 20% 左右,而提交的论文数量却高达数百篇。
这篇论文简明扼要地描述了 ClickHouse 最引人注目的架构和系统设计组件,正是这些组件使其速度如此之快。我们在下面的博客文章链接中嵌入了论文的 PDF 版本。
Reco 如何利用高级分析来检测复杂的 SaaS 威胁
Reco 是一个完整的 SaaS 安全解决方案,它将 ClickHouse 作为其高级分析系统的基础。Nir Barak 解释了 ClickHouse 如何为他们提供跨多个层级的整体数据视图,并让他们能够检测异常值和异常情况。
24.8 LTS 版本
24.8 版本现已发布,它包含一个令人兴奋的功能(我以及你们中的许多人一直期盼着它) - 新的 JSON 数据类型!
它处于实验模式,但这并没有阻止我们在探索足球比赛的结构化数据时对它进行测试。
此版本还引入了 TimeSeries 表引擎(可以存储 Prometheus 数据)和一个支持精确一次事件处理的新 Kafka 表引擎。
使用 Ibis、ClickHouse 和 Shiny 提升 PyPI 统计数据
ClickPy 是一款由 ClickHouse 支持的应用程序,它分析了发布在 PyPI 上的 Python 包的下载情况。除了前端应用程序,您还可以查询底层数据,Cody Peterson 正是这么做的。
Cody 展示了如何使用Ibis 连接到 ClickPy,然后按星期几和月份探索 clickhouse-connect 包的下载季节性。结果使用plot.ly 进行可视化,然后 Cody 将所有内容整合到一个Shiny 应用程序中。
ClickHouse Cloud:BYOC AWS 私有预览版
ClickHouse Cloud 已经运行了将近两年,并支持所有主要的云平台,包括 AWS、Azure 和 GCP。到目前为止,它一直是一个完全运行在 ClickHouse 云帐户上的 SaaS 产品,这对于那些对数据驻留和合规性要求严格的用户来说,是不可行的。
因此,我们很高兴宣布在 AWS 上发布自建云 (BYOC) 的私有预览版。BYOC 是一个完全托管的 ClickHouse Cloud 服务,部署到您的 AWS 帐户中。
等待名单现已开放,请务必注册,我们将与您联系以进行设置。
速读
- Heng Ma 演示了如何 构建一个使用 Rising Wave 和 ClickHouse 对购物车事件进行产品详情丰富化的系统。利用 Rising Wave,一个 Kafka 事件数据流与产品目录进行联接,丰富后的事件使用 Rising Wave-ClickHouse 连接器写入 ClickHouse。
- Auxten 发布了 chDB 的新版本,这是 ClickHouse 的进程内嵌入式版本,它可以比初始版本快 87 倍地查询 Pandas DataFrame。
- 我非常喜欢 Jess Archer 在 Laracon US 2024 上的演讲 这个视频。它是对 ClickHouse 的一个很好的介绍,并展示了它比 MySQL 更好的地方。
- Sai Srirampur 分享了他针对 Postgres 用户的 ClickHouse 数据建模技巧。他解释了在使用 ReplacingMergeTree 表引擎时如何处理重复数据,如何处理空值以及排序键的重要性。
本月精选
我们本月最喜欢的帖子是来自 Michael Driscoll 的关于新的 JSON 数据类型的帖子。