背景
epilot 是一个 SaaS 平台,专注于能源领域,提供全面的解决方案,帮助公用事业和电网运营商在线建立和管理业务。它是能源转型的 360° 平台。 epilot 允许其用户将其销售、服务和电网流程数字化,从最初的客户咨询到持续的支持,以实现更高效的流程、灵活的市场发布和更满意的客户。
挑战
随着 epilot 的扩展,其现有的数据基础设施面临挑战。 公司最初使用 AWS Redshift 和 S3 进行数据存储和处理。 然而,这些工具在性能和实时分析方面存在局限性,这对于 epilot 为其客户提供无缝且响应迅速的平台的需求至关重要。
一个重要的痛点是缺乏集中的数据平台,这使得 epilot 内部的不同团队难以协调地访问和分析数据。 轻松访问数据以允许所有团队基于数据构建产品是一个关键目标。 此外,与 Redshift 相关的成本正成为一个问题,尤其是在公司预计随着新功能和用例的扩展数据量将增加的情况下。
解决方案
为了应对这些挑战,epilot 探索了替代数据库解决方案,最终选择 ClickHouse 作为其中心数据存储层。 epilot 的首席工程师 Suresh Sivasankaran 从之前的项目中熟悉 ClickHouse,并认识到它满足他们需求的潜力。 AWS 上的 ClickHouse Cloud 特别有吸引力,因为它符合 epilot 对与其现有技术堆栈对齐的无服务器基础设施的偏好。
切换到 ClickHouse 提供了几个优势
- 性能和可扩展性:ClickHouse 处理大量数据且低延迟的能力是一个巨大的变革。 它使 epilot 能够提供实时分析和洞察,这对于能源行业的客户至关重要,他们需要最新的信息来做出明智的决策。
- 成本效益:与其他解决方案(如 Redshift 和 Rockset)相比,ClickHouse 提供了更具成本效益的选择。 这对于旨在平衡性能需求和预算考虑因素的 epilot 尤为重要。
- 灵活性和集成:ClickHouse 对复杂查询的支持以及与 BI 工具的集成能力使 epilot 能够创建更统一的数据环境。 这种集成对于生成仪表板和报告至关重要,公司内部的各个团队可以轻松访问和使用这些仪表板和报告。
实施和影响
epilot 中 ClickHouse 的实施始于概念验证,事实证明这是成功的,从而导致了更广泛的推广。 最初,重点是内部仪表板和指标,但 ClickHouse 的使用迅速扩展到其他领域,包括数据湖功能,该功能允许客户连接其 BI 工具并构建自定义报告。
最直接的好处之一是查询性能的提高以及处理实时分析的能力。 这种改进在新功能中尤其明显,例如面向最终客户的门户,该门户生成了大量数据点。 借助 ClickHouse,epilot 可以高效地管理和分析这些数据集,从而实现更好的服务交付和客户洞察。
Suresh 说
"通过集成 ClickHouse,我们的仪表板现在提供实时指标,而不是依赖缓存数据和按需更新。 此外,我们的客户使用的数据湖产品的数据加载速度显着提高,将数据从 ClickHouse 传输到 BI 工具的时间从 30 多分钟缩短到 3 分钟以内。"
此外,ClickHouse 的功能使 epilot 能够整合来自不同来源的数据,为整个平台提供中心数据基础。 这种整合使团队更容易协作和创新,利用数据来增强产品产品并优化内部流程,并有效地在数据基础上更快地构建产品。
未来方向
展望未来,epilot 计划进一步扩展其 ClickHouse 的使用。 随着他们引入更多客户并开发新功能,公司预计数据量将显着增长。 ClickHouse 的可扩展性和性能对于支持这种增长至关重要,使 epilot 能够继续提供高质量、数据驱动的服务。
一个令人兴奋的开发领域是将 ClickHouse 与 AWS Bedrock 结合使用,用于 AI 和机器学习应用程序。 这种集成将使 epilot 能够根据存储在 ClickHouse 中的数据改进其模型,从而增强自动化摘要和客户互动工具等功能。
Suresh 补充说
“我们在工程堆栈中从 Redshift 和 InfluxDB 过渡到 ClickHouse,以实现更高的可扩展性和性能。 展望未来,我们计划在更广泛的用例中利用 ClickHouse 作为我们数据基础设施的核心,特别是在我们朝着为能源市场构建垂直 AI 解决方案迈进时。”
结论
epilot 与 ClickHouse 的合作历程说明了选择正确数据基础设施的变革性影响。 通过采用 ClickHouse,epilot 不仅提高了性能并降低了成本,而且为未来的增长和创新奠定了坚实的基础。 epilot 和 ClickHouse 之间的合作关系展示了先进的数据技术如何使公司能够满足复杂的行业需求、提高效率并释放新的商机。