CityHash
ClickHouse 使用 之前版本之一 的 Google CityHash。
信息
在我们将其添加到 ClickHouse 后,CityHash 更改了算法。
CityHash 文档特别指出,用户不应依赖特定的哈希值,并且不应将其保存到任何地方或用作分片键。
但是,由于我们将此函数暴露给用户,因此我们不得不修复 CityHash 的版本(到 1.0.2)。现在我们保证 SQL 中可用的 CityHash 函数的行为不会改变。
— Alexey Milovidov
注意
当前版本的 Google CityHash 与 ClickHouse cityHash64
变体不同。
不要使用 farmHash64
来获取 Google 的 CityHash 值!FarmHash 是 CityHash 的后继者,但它们并不完全兼容。
字符串 | ClickHouse64 | CityHash64 | FarmHash64 |
---|---|---|---|
莫斯科 | 12507901496292878638 | 5992710078453357409 | 5992710078453357409 |
没有 C++ 你怎么能编写一个大型系统? -Paul Glick | 6237945311650045625 | 749291162957442504 | 11716470977470720228 |
另请参阅 Introducing CityHash,了解其描述和创建背后的原因。TL;DR 非加密 哈希,比 MurmurHash 更快,但更复杂。
实现
Go
您可以使用 go-faster/city Go 包,它实现了这两种变体。