博客 / 用户案例

速度与规模的结合:ClickHouse 如何帮助 Tydo 提供闪电般快速的客户分析

author avatar
ClickHouse 团队
2024 年 11 月 18 日 - 7 分钟阅读

Tydo 是一个客户智能平台,帮助电商企业将数据转化为智能。该平台提供一流的分析功能,可揭示关于客户和购买模式的可操作见解,并提供一个完整的数据仓库,专为 AI 驱动的客户洞察而构建,且无需工程师参与。

为了使 Tydo 的平台能够跨多个渠道为客户提供闪电般快速、可操作的见解和建议,它需要一个快速、可扩展且能够处理高维数据集的数据库。这种强大的数据基础设施,结合 Tydo 数据科学团队的持续支持,使品牌和合作伙伴能够做出明智的决策,优化其营销策略并推动业务增长。

在 2024 年 8 月于洛杉矶举行的见面会上,Tydo 联合创始人兼首席技术官 Manav Kohli 解释了公司决定采用 ClickHouse 作为其客户细分平台和关键 AI 产品的原因,从他们从 Postgres 和 BigQuery 切换的原因,到切换到 ClickHouse Cloud 后在速度、可扩展性和成本效率方面的改进。

数据库增长的烦恼

Tydo 最初于 2020 年推出,作为 Shopify 商家的标准化分析解决方案。随着公司发展到支持 2000 多家客户,集成更广泛的数据源,并为越来越多的电商大品牌提供服务,其数据需求变得更加复杂。为了满足这些不断变化的需求,Tydo 不断投资于更复杂的数据基础设施,以支持其增长。

最初,该公司依靠 Postgres 来管理其数据。作为一个经济实惠的选择,Postgres 使 Tydo 能够快速起步,并在早期满足了他们的需求。然而,Manav 表示,虽然 Postgres“适用于较小的工作负载”,但随着数据量和查询复杂性的增长,该数据库难以跟上。当处理企业品牌所需的大型柱状数据集时,其基于行的结构被证明效率低下,而高延迟使其难以提供实时见解。

为了解决其中一些问题,Manav 和团队尝试了 BigQuery。但是,虽然 BigQuery 提供了更便宜的存储,并且对数据分析师来说用户友好,但它并非实时分析或应用程序后端的理想选择。正如 Manav 解释的那样,“BigQuery 非常擅长在合理的时间内查询大量数据,但你不会获得像 ClickHouse 那样的亚秒级延迟。” 团队还发现,虽然 BigQuery 比 Postgres 扩展性更好,但频繁查询的高成本使其成为他们需要的实时、高维分析的“昂贵”选择。

更好的数据库解决方案

为了保持扩展并为更大的数据密集型工作负载提供服务,Tydo 团队知道他们需要一个性能更高、可扩展且更具成本效益的数据库解决方案。在评估了他们的选择后,他们选择了 ClickHouse,因为它能够处理高维数据集,同时提供亚秒级的查询性能。

“我们如此兴奋地使用 ClickHouse 的原因之一是它比其他数据库快得多,” Manav 说。

正如 Manav 解释的那样,在管理分析驱动的表(Tydo 客户细分和洞察的关键部分)时,ClickHouse 的性能优于 Postgres 和 BigQuery。ReplacingMergeTree 引擎有望通过简化更新和管理快速变化的数据来优化数据存储,而稀疏索引将允许闪电般快速的查询,尤其是在大规模分析方面。

ClickHouse 的列式存储还意味着 Tydo 可以通过针对每个查询所需的特定列来更有效地存储和处理数据,从而降低存储成本和查询时间。结果是高吞吐量——快速有效地处理大量数据的能力——而没有困扰他们早期数据库的延迟问题。

最终,ClickHouse 的速度、可扩展性和成本效率(由先进的数据压缩驱动)使其成为满足 Tydo 不断增长的数据需求的完美解决方案。

为灵活性和准确性而构建

Tydo 数据基础设施的核心是一个管道,用于从 200 多个来源摄取、处理和分析数据。ClickHouse 位于堆栈的顶部,作为为客户细分和 AI 应用程序提供支持的主要数据库。数据通过提取、加载、转换 (ELT) 流程流动,将原始数据加载到 Tydo 的数据仓库中,然后再应用必要的转换。

Tydo-01.png

Tydo 基础设施的另一个关键部分是构建在 ClickHouse 之上的领域特定语言 (DSL) 层,该层将数据模型暴露给平台上的各种服务。此 DSL 支持通过 API 进行快速、灵活的查询,同时集成了由 LLM 驱动的 AI 驱动的细分和洞察。虽然 LLM 功能强大,但如果未以实际数据为基础,它们有时可能会产生不准确或幻觉。为了应对这种情况,Tydo 的 DSL 确保 AI 仅依赖于来自 ClickHouse 的经过验证的核心数据模型,从而避免任何推测性输出。通过将 LLM 洞察直接链接到结构化数据,Tydo 最大程度地降低了幻觉风险,确保所有 AI 驱动的洞察都是准确且基于数据的。

Tydo-02.png

速度、规模和节省

自采用 ClickHouse 以来,Tydo 在性能和可扩展性方面都取得了巨大进步。得益于 ClickHouse 强大的架构和功能,该平台现在可以提供亚秒级的过滤和聚合,使 Tydo 能够以无与伦比的速度提供闪电般快速的洞察。这意味着客户可以更快地访问数据,这对于需要做出快速、数据驱动决策的大型电商品牌至关重要。

“ClickHouse 使我们能够为客户提供非常快速的分析,这令人兴奋,也是我们早期数据库选项无法实现的,” Manav 说。

借助 ClickHouse 以低于 BigQuery 等解决方案的成本处理大量高维数据的能力,Tydo 的成本效率也得到了提高。新的基础设施的高吞吐量性能使 Tydo 能够快速处理海量数据集,从而减少延迟和运营费用。

ClickHouse 的可扩展性和并行性确保 Tydo 可以继续增长,而无需担心性能瓶颈。正如 Manav 解释的那样,他们的分析师现在可以更轻松地访问数据,从而更轻松地为大型电商品牌查询和生成洞察,而无需承担繁重的技术负担。

最后但同样重要的是,根据 Manav 的说法,在多个产品中公开 ClickHouse 中的数据模型,提高了灵活性。这允许 Tydo 生态系统中的不同工具、产品和服务利用相同的核心数据洞察,从而简化运营并为客户实现更有针对性、更可操作的结果。

ClickHouse 的未来之路

凭借 ClickHouse 作为其客户细分和 AI 应用程序的支柱,Tydo 已准备好继续扩展并为大型电商品牌和合作伙伴交付价值。速度、成本效率和可扩展性的提高使 Manav 和团队能够简化运营并提供以前无法实现的实时洞察。

ClickHouse 的灵活性确保 Tydo 可以通过整合更多 AI 驱动的功能和提供个性化、可操作的建议来保持创新。随着公司客户群的扩大和客户智能变得更加复杂,Tydo 凭借强大的数据基础设施保持领先地位,该基础设施有望支持长期增长,同时为世界各地的品牌提供准确的实时分析。

要了解有关 ClickHouse 如何提高数据运营的速度、可扩展性和成本效率的更多信息,请免费试用 ClickHouse Cloud 30 天

分享此文章

订阅我们的新闻资讯

随时了解功能发布、产品路线图、支持和云服务!
正在加载表单...
关注我们
X imageSlack imageGitHub image
Telegram imageMeetup imageRss image