Tydo 是一个客户智能平台,帮助电商企业将数据转化为智能。该平台提供一流的分析功能,可揭示关于客户和购买模式的可操作见解,并提供一个完整的数据仓库,专为 AI 驱动的客户洞察而构建,且无需工程师参与。
为了使 Tydo 的平台能够跨多个渠道为客户提供闪电般快速、可操作的见解和建议,它需要一个快速、可扩展且能够处理高维数据集的数据库。这种强大的数据基础设施,结合 Tydo 数据科学团队的持续支持,使品牌和合作伙伴能够做出明智的决策,优化其营销策略并推动业务增长。
在 2024 年 8 月于洛杉矶举行的见面会上,Tydo 联合创始人兼首席技术官 Manav Kohli 解释了公司决定采用 ClickHouse 作为其客户细分平台和关键 AI 产品的原因,从他们从 Postgres 和 BigQuery 切换的原因,到切换到 ClickHouse Cloud 后在速度、可扩展性和成本效率方面的改进。
数据库增长的烦恼
Tydo 最初于 2020 年推出,作为 Shopify 商家的标准化分析解决方案。随着公司发展到支持 2000 多家客户,集成更广泛的数据源,并为越来越多的电商大品牌提供服务,其数据需求变得更加复杂。为了满足这些不断变化的需求,Tydo 不断投资于更复杂的数据基础设施,以支持其增长。
最初,该公司依靠 Postgres 来管理其数据。作为一个经济实惠的选择,Postgres 使 Tydo 能够快速起步,并在早期满足了他们的需求。然而,Manav 表示,虽然 Postgres“适用于较小的工作负载”,但随着数据量和查询复杂性的增长,该数据库难以跟上。当处理企业品牌所需的大型柱状数据集时,其基于行的结构被证明效率低下,而高延迟使其难以提供实时见解。
为了解决其中一些问题,Manav 和团队尝试了 BigQuery。但是,虽然 BigQuery 提供了更便宜的存储,并且对数据分析师来说用户友好,但它并非实时分析或应用程序后端的理想选择。正如 Manav 解释的那样,“BigQuery 非常擅长在合理的时间内查询大量数据,但你不会获得像 ClickHouse 那样的亚秒级延迟。” 团队还发现,虽然 BigQuery 比 Postgres 扩展性更好,但频繁查询的高成本使其成为他们需要的实时、高维分析的“昂贵”选择。
更好的数据库解决方案
为了保持扩展并为更大的数据密集型工作负载提供服务,Tydo 团队知道他们需要一个性能更高、可扩展且更具成本效益的数据库解决方案。在评估了他们的选择后,他们选择了 ClickHouse,因为它能够处理高维数据集,同时提供亚秒级的查询性能。
“我们如此兴奋地使用 ClickHouse 的原因之一是它比其他数据库快得多,” Manav 说。
正如 Manav 解释的那样,在管理分析驱动的表(Tydo 客户细分和洞察的关键部分)时,ClickHouse 的性能优于 Postgres 和 BigQuery。ReplacingMergeTree 引擎有望通过简化更新和管理快速变化的数据来优化数据存储,而稀疏索引将允许闪电般快速的查询,尤其是在大规模分析方面。
ClickHouse 的列式存储还意味着 Tydo 可以通过针对每个查询所需的特定列来更有效地存储和处理数据,从而降低存储成本和查询时间。结果是高吞吐量——快速有效地处理大量数据的能力——而没有困扰他们早期数据库的延迟问题。
最终,ClickHouse 的速度、可扩展性和成本效率(由先进的数据压缩驱动)使其成为满足 Tydo 不断增长的数据需求的完美解决方案。
为灵活性和准确性而构建
Tydo 数据基础设施的核心是一个管道,用于从 200 多个来源摄取、处理和分析数据。ClickHouse 位于堆栈的顶部,作为为客户细分和 AI 应用程序提供支持的主要数据库。数据通过提取、加载、转换 (ELT) 流程流动,将原始数据加载到 Tydo 的数据仓库中,然后再应用必要的转换。
Tydo 基础设施的另一个关键部分是构建在 ClickHouse 之上的领域特定语言 (DSL) 层,该层将数据模型暴露给平台上的各种服务。此 DSL 支持通过 API 进行快速、灵活的查询,同时集成了由 LLM 驱动的 AI 驱动的细分和洞察。虽然 LLM 功能强大,但如果未以实际数据为基础,它们有时可能会产生不准确或幻觉。为了应对这种情况,Tydo 的 DSL 确保 AI 仅依赖于来自 ClickHouse 的经过验证的核心数据模型,从而避免任何推测性输出。通过将 LLM 洞察直接链接到结构化数据,Tydo 最大程度地降低了幻觉风险,确保所有 AI 驱动的洞察都是准确且基于数据的。
速度、规模和节省
自采用 ClickHouse 以来,Tydo 在性能和可扩展性方面都取得了巨大进步。得益于 ClickHouse 强大的架构和功能,该平台现在可以提供亚秒级的过滤和聚合,使 Tydo 能够以无与伦比的速度提供闪电般快速的洞察。这意味着客户可以更快地访问数据,这对于需要做出快速、数据驱动决策的大型电商品牌至关重要。
“ClickHouse 使我们能够为客户提供非常快速的分析,这令人兴奋,也是我们早期数据库选项无法实现的,” Manav 说。
借助 ClickHouse 以低于 BigQuery 等解决方案的成本处理大量高维数据的能力,Tydo 的成本效率也得到了提高。新的基础设施的高吞吐量性能使 Tydo 能够快速处理海量数据集,从而减少延迟和运营费用。
ClickHouse 的可扩展性和并行性确保 Tydo 可以继续增长,而无需担心性能瓶颈。正如 Manav 解释的那样,他们的分析师现在可以更轻松地访问数据,从而更轻松地为大型电商品牌查询和生成洞察,而无需承担繁重的技术负担。
最后但同样重要的是,根据 Manav 的说法,在多个产品中公开 ClickHouse 中的数据模型,提高了灵活性。这允许 Tydo 生态系统中的不同工具、产品和服务利用相同的核心数据洞察,从而简化运营并为客户实现更有针对性、更可操作的结果。
ClickHouse 的未来之路
凭借 ClickHouse 作为其客户细分和 AI 应用程序的支柱,Tydo 已准备好继续扩展并为大型电商品牌和合作伙伴交付价值。速度、成本效率和可扩展性的提高使 Manav 和团队能够简化运营并提供以前无法实现的实时洞察。
ClickHouse 的灵活性确保 Tydo 可以通过整合更多 AI 驱动的功能和提供个性化、可操作的建议来保持创新。随着公司客户群的扩大和客户智能变得更加复杂,Tydo 凭借强大的数据基础设施保持领先地位,该基础设施有望支持长期增长,同时为世界各地的品牌提供准确的实时分析。
要了解有关 ClickHouse 如何提高数据运营的速度、可扩展性和成本效率的更多信息,请免费试用 ClickHouse Cloud 30 天。