欢迎阅读 9 月份的 ClickHouse 新闻资讯,本期将回顾上个月实时数据仓库领域发生的重大事件。本月,我们迎来了期待已久的 JSON 数据类型、我们的首篇 ClickHouse 研究论文、AWS 上 BYOC 的私有预览版、通过 Ibis 改进 PyPi 统计数据,以及更多精彩内容!
本期内容
- 社区焦点成员
- 即将到来的活动
- VLDB 2024:首篇 ClickHouse 研究论文
- Reco 如何利用高级分析来检测复杂的 SaaS 威胁
- 24.8 LTS 版本发布
- 通过 Ibis、ClickHouse 和 Shiny 改进 PyPI 统计数据
- ClickHouse Cloud:BYOC AWS 私有预览
- 快速阅读
- 本月精选文章
社区焦点成员
beehiiv 是一个新闻资讯平台,旨在帮助创作者、发布商和企业构建并扩大其电子邮件受众群体。他们收集事件,记录每次电子邮件被处理、每次邮件进入收件箱、每次被延迟、每次被退回、每次您打开邮件、每次您点击链接等等。
Eric 在 beehiv 工作刚满一年,负责将数据操作从 Postgres 迁移到 ClickHouse Cloud。关于他和他的团队所做的工作,这里有一篇用户案例,他还曾在夏季纽约见面会上进行过演讲。
Eric 之前曾在 Arthur.ai 担任技术主管,负责架构和构建公司的数据摄取管道、存储以及大部分后端基础设施。
即将到来的活动
全球活动
- ClickHouse Cloud 线上更新 - 9 月 24 日
- 24.9 版本社区发布会 - 9 月 26 日
免费培训
-
ClickHouse 查询优化工作坊 - 9 月 25 日
-
ClickHouse 线下工作坊 - 新加坡 - 10 月 3 日
EMEA 地区活动
- 特拉维夫见面会 - 9 月 22 日
- 马德里见面会 - 10 月 22 日
- 巴塞罗那见面会 - 10 月 29 日
- 奥斯陆见面会 - 10 月 31 日
- 根特见面会 - 11 月 19 日
- 迪拜见面会 - 11 月 21 日
- 巴黎见面会 - 11 月 26 日
亚太地区活动
-
DataEngBytes - 悉尼 - 9 月 24 日
-
DataEngBytes - 珀斯 - 9 月 27 日
-
DataEngBytes - 墨尔本 - 10 月 1 日
-
DataEngBytes - 奥克兰 - 10 月 4 日
- 亚洲大数据与人工智能世界 - 10 月 10 日
-
Cloud Excellence Summit NSW - 10 月 17 日
-
Data & AI Summit VIC - 10 月 22 日
VLDB 2024:首篇 ClickHouse 研究论文
历时近一年,在 8 月底,我们在 VLDB 2024 上展示了我们的第一篇研究论文。
VLDB——国际超大型数据库会议——被公认为是数据管理领域的顶尖会议之一。VLDB 的论文接受率通常在数百份投稿中约为 20%。
该论文简洁地描述了 ClickHouse 最有趣的架构和系统设计组件,正是这些组件使其如此快速。我们已将该论文的 PDF 嵌入到下方链接的博客文章中。
Reco 如何利用高级分析来检测复杂的 SaaS 威胁
Reco 是一家提供全生命周期 SaaS 安全解决方案的公司,它使用 ClickHouse 作为其高级分析系统的基础。Nir Barak 解释了 ClickHouse 如何为他们提供跨多层数据的整体视图,并使他们能够检测异常值和异常情况。
24.8 LTS 版本发布
24.8 版本已发布,它具有一个令我和你们许多人兴奋的功能 - 全新的 JSON 数据类型!
它目前处于实验模式,但这并没有阻止我们在探索足球比赛中的结构化事件数据时对其进行全面测试。
此版本还引入了 TimeSeries 表引擎(可以存储 Prometheus 数据)和一个新的 Kafka 表引擎,该引擎支持仅一次事件处理。
通过 Ibis、ClickHouse 和 Shiny 改进 PyPI 统计数据
ClickPy 是一个由 ClickHouse 支持的应用程序,用于分析 PyPI 上发布的 Python 包的下载情况。除了前端应用程序之外,您还可以查询底层数据,这正是 Cody Peterson 所做的。
Cody 展示了如何使用 Ibis 连接到 ClickPy,然后按星期几和月份探索 clickhouse-connect 包下载的季节性。结果使用 plot.ly 进行可视化,然后 Cody 将所有内容整合到一个 Shiny 应用程序中。
ClickHouse Cloud:BYOC AWS 私有预览
ClickHouse Cloud 已经运行了近两年,并支持所有主要的云平台:AWS、Azure 和 GCP。到目前为止,它一直是一个完全在 ClickHouse 云账户上运行的 SaaS 产品,这使得它对于具有严格数据驻留和合规性要求的用户来说是不可接受的。
因此,我们很高兴宣布在 AWS 上推出自带云 (BYOC) 的私有预览版。BYOC 是一项完全托管的 ClickHouse Cloud 服务,部署到您的 AWS 账户中。
候补名单现已开放,请务必注册,我们将与您联系进行设置。
快速阅读
- Heng Ma 展示了如何构建一个使用产品详情来丰富购物车事件的系统。通过使用 Rising Wave,Kafka 事件数据流与产品目录连接,并将丰富的事件使用 Rising Wave-ClickHouse 连接器写入 ClickHouse。
- Auxten 发布了 chDB 的新版本,它是 ClickHouse 的进程内嵌入版本,查询 Pandas DataFrames 的速度比初始版本快 87 倍。
- 我喜欢 Jess Archer 在 Laracon US 2024 上的演讲中的这个视频。它出色地介绍了 ClickHouse,并展示了它在哪些方面优于 MySQL。
- Sai Srirampur 分享了他针对 Postgres 用户提出的 ClickHouse 数据建模技巧。他解释了在使用 ReplacingMergeTree 表引擎时处理重复项的各种策略、如何处理空值以及排序键的重要性。
本月精选文章
本月我们最喜欢的文章是 Michael Driscoll 撰写的关于新的 JSON 数据类型的文章