跳至主要内容

quantileTimingWeighted

根据每个序列成员的权重,以确定的精度计算数值数据序列的分位数

结果是确定性的(它不依赖于查询处理顺序)。该函数针对描述分布的序列进行了优化,例如加载网页时间或后端响应时间。

在查询中使用多个具有不同级别的quantile*函数时,内部状态不会合并(也就是说,查询的工作效率低于其可能达到的效率)。在这种情况下,请使用quantiles函数。

语法

quantileTimingWeighted(level)(expr, weight)

别名:medianTimingWeighted

参数

  • level — 分位数的级别。可选参数。0 到 1 之间的常数浮点数。我们建议将level值用于[0.01, 0.99]范围。默认值:0.5。在level=0.5时,该函数计算中位数

  • expr — 返回Float*类型数字的列值的表达式

      - If negative values are passed to the function, the behavior is undefined.
    - If the value is greater than 30,000 (a page loading time of more than 30 seconds), it is assumed to be 30,000.
  • weight — 包含序列元素权重的列。权重是值出现的次数。

精度

如果以下条件满足,则计算结果是准确的:

  • 值的总数不超过 5670。
  • 值的总数超过 5670,但页面加载时间小于 1024 毫秒。

否则,计算结果将四舍五入到最接近的 16 毫秒的倍数。

注意

对于计算页面加载时间分位数,此函数比quantile更有效和准确。

返回值

  • 指定级别的分位数。

类型:Float32

注意

如果未将任何值传递给函数(当使用quantileTimingIf时),则返回NaN。这样做的目的是将这些情况与导致零的情况区分开来。有关排序NaN值的说明,请参阅ORDER BY 子句

示例

输入表

┌─response_time─┬─weight─┐
│ 68 │ 1 │
│ 104 │ 2 │
│ 112 │ 3 │
│ 126 │ 2 │
│ 138 │ 1 │
│ 162 │ 1 │
└───────────────┴────────┘

查询

SELECT quantileTimingWeighted(response_time, weight) FROM t

结果

┌─quantileTimingWeighted(response_time, weight)─┐
│ 112 │
└───────────────────────────────────────────────┘

quantilesTimingWeighted

quantileTimingWeighted相同,但接受多个带分位数级别的参数,并返回一个包含许多分位数值的数组。

示例

输入表

┌─response_time─┬─weight─┐
│ 68 │ 1 │
│ 104 │ 2 │
│ 112 │ 3 │
│ 126 │ 2 │
│ 138 │ 1 │
│ 162 │ 1 │
└───────────────┴────────┘

查询

SELECT quantilesTimingWeighted(0,5, 0.99)(response_time, weight) FROM t

结果

┌─quantilesTimingWeighted(0.5, 0.99)(response_time, weight)─┐
│ [112,162] │
└───────────────────────────────────────────────────────────┘

另请参阅