跳到主要内容

quantileTDigest

使用 t-digest 算法计算数值数据序列的近似 分位数

内存消耗为 log(n),其中 n 是值的个数。结果取决于运行查询的顺序,是非确定性的。

该函数的性能低于 quantilequantileTiming 的性能。在状态大小与精度的比率方面,该函数比 quantile 好得多。

在查询中使用多个具有不同级别的 quantile* 函数时,内部状态不会组合(即,查询的工作效率低于可能达到的效率)。在这种情况下,请使用 quantiles 函数。

语法

quantileTDigest(level)(expr)

别名:medianTDigest

参数

  • level — 分位数的级别。可选参数。从 0 到 1 的常量浮点数。我们建议使用 [0.01, 0.99] 范围内的 level 值。默认值:0.5。当 level=0.5 时,该函数计算 中位数
  • expr — 对列值进行操作的表达式,得到数值 数据类型DateDateTime

返回值

  • 指定级别的近似分位数。

类型

  • 数值数据类型输入的 Float64
  • 如果输入值为 Date 类型,则为 Date
  • 如果输入值为 DateTime 类型,则为 DateTime

示例

查询

SELECT quantileTDigest(number) FROM numbers(10)

结果

┌─quantileTDigest(number)─┐
│ 4.5 │
└─────────────────────────┘

另请参阅