跳到主要内容
跳到主要内容
编辑此页

quantileExactWeightedInterpolated

计算使用线性插值的数值数据序列的分位数,并考虑每个元素的权重。

为了获得插值,所有传递的值被组合成一个数组,然后根据其相应的权重进行排序。然后使用加权百分位数方法执行分位数插值,通过构建基于权重的累积分布,然后使用权重和值执行线性插值来计算分位数。

当在查询中使用具有不同级别的多个 quantile* 函数时,内部状态不会组合(即,查询的工作效率低于应有的水平)。在这种情况下,请使用 quantiles 函数。

我们强烈建议使用 quantileExactWeightedInterpolated 而不是 quantileInterpolatedWeighted,因为 quantileExactWeightedInterpolatedquantileInterpolatedWeighted 更准确。这是一个例子

SELECT
quantileExactWeightedInterpolated(0.99)(number, 1),
quantile(0.99)(number),
quantileInterpolatedWeighted(0.99)(number, 1)
FROM numbers(9)


┌─quantileExactWeightedInterpolated(0.99)(number, 1)─┬─quantile(0.99)(number)─┬─quantileInterpolatedWeighted(0.99)(number, 1)─┐
7.927.928
└────────────────────────────────────────────────────┴────────────────────────┴───────────────────────────────────────────────┘

语法

quantileExactWeightedInterpolated(level)(expr, weight)

别名:medianExactWeightedInterpolated

参数

  • level — 分位数水平。可选参数。从 0 到 1 的常数浮点数。我们建议使用 [0.01, 0.99] 范围内的 level 值。默认值:0.5。在 level=0.5 时,该函数计算中位数
  • expr — 表达式,作用于列值,结果为数值型数据类型DateDateTime
  • weight — 包含序列成员权重的列。权重是具有无符号整数类型的值出现次数。

返回值

  • 指定级别的分位数。

类型

  • 对于数值数据类型输入,返回 Float64
  • 如果输入值具有 Date 类型,则返回 Date
  • 如果输入值具有 DateTime 类型,则返回 DateTime

示例

输入表

┌─n─┬─val─┐
│ 0 │ 3 │
│ 1 │ 2 │
│ 2 │ 1 │
│ 5 │ 4 │
└───┴─────┘

结果

┌─quantileExactWeightedInterpolated(n, val)─┐
│ 1.5 │
└───────────────────────────────────────────┘

参见