quantileTDigestWeighted
使用 t-digest 算法计算数值数据序列的近似 分位数。此函数考虑了每个序列成员的权重。最大误差为 1%。内存消耗为 log(n)
,其中 n
是值的数量。
此函数的性能低于 quantile 或 quantileTiming 的性能。就状态大小与精度的比率而言,此函数比 quantile
好得多。
结果取决于查询的运行顺序,并且是不确定的。
当在查询中使用具有不同级别的多个 quantile*
函数时,内部状态不会组合(即,查询的效率低于可能的效率)。在这种情况下,请使用 quantiles 函数。
语法
quantileTDigestWeighted(level)(expr, weight)
别名:medianTDigestWeighted
。
参数
level
— 分位数级别。可选参数。从 0 到 1 的常量浮点数。我们建议使用level
值在[0.01, 0.99]
范围内。默认值:0.5。在level=0.5
时,该函数计算 中位数。expr
— 列值的表达式,结果为数值 数据类型、Date 或 DateTime。weight
— 包含序列元素权重的列。权重是值出现的次数。
返回值
- 指定级别的近似分位数。
类型
示例
查询
SELECT quantileTDigestWeighted(number, 1) FROM numbers(10)
结果
┌─quantileTDigestWeighted(number, 1)─┐
│ 4.5 │
└────────────────────────────────────┘
另请参阅