quantileTDigest
使用 t-digest 算法计算数值数据序列的近似 分位数。
内存消耗为 log(n)
,其中 n
是值的个数。结果取决于运行查询的顺序,是非确定性的。
该函数的性能低于 quantile 或 quantileTiming 的性能。在状态大小与精度的比率方面,该函数比 quantile
好得多。
在查询中使用多个具有不同级别的 quantile*
函数时,内部状态不会组合(即,查询的工作效率低于可能达到的效率)。在这种情况下,请使用 quantiles 函数。
语法
quantileTDigest(level)(expr)
别名:medianTDigest
。
参数
level
— 分位数的级别。可选参数。从 0 到 1 的常量浮点数。我们建议使用[0.01, 0.99]
范围内的level
值。默认值:0.5。当level=0.5
时,该函数计算 中位数。expr
— 对列值进行操作的表达式,得到数值 数据类型、Date 或 DateTime。
返回值
- 指定级别的近似分位数。
类型
示例
查询
SELECT quantileTDigest(number) FROM numbers(10)
结果
┌─quantileTDigest(number)─┐
│ 4.5 │
└─────────────────────────┘
另请参阅