跳到主要内容
跳到主要内容
编辑此页

quantileTDigestWeighted

使用 t-digest 算法计算数值数据序列的近似 分位数。此函数考虑了每个序列成员的权重。最大误差为 1%。内存消耗为 log(n),其中 n 是值的数量。

此函数的性能低于 quantilequantileTiming 的性能。就状态大小与精度的比率而言,此函数比 quantile 好得多。

结果取决于查询的运行顺序,并且是不确定的。

当在查询中使用具有不同级别的多个 quantile* 函数时,内部状态不会组合(即,查询的效率低于可能的效率)。在这种情况下,请使用 quantiles 函数。

注意

不建议对小型数据集使用 quantileTDigestWeighted ,并且可能导致重大错误。在这种情况下,请考虑使用 quantileTDigest

语法

quantileTDigestWeighted(level)(expr, weight)

别名:medianTDigestWeighted

参数

  • level — 分位数级别。可选参数。从 0 到 1 的常量浮点数。我们建议使用 level 值在 [0.01, 0.99] 范围内。默认值:0.5。在 level=0.5 时,该函数计算 中位数
  • expr — 列值的表达式,结果为数值 数据类型DateDateTime
  • weight — 包含序列元素权重的列。权重是值出现的次数。

返回值

  • 指定级别的近似分位数。

类型

  • 数值数据类型输入的 Float64
  • 如果输入值具有 Date 类型,则为 Date
  • 如果输入值具有 DateTime 类型,则为 DateTime

示例

查询

SELECT quantileTDigestWeighted(number, 1) FROM numbers(10)

结果

┌─quantileTDigestWeighted(number, 1)─┐
│ 4.5 │
└────────────────────────────────────┘

另请参阅