quantileTimingWeighted
根据每个序列成员的权重,以确定的精度计算数值数据序列的分位数。
结果是确定性的(它不依赖于查询处理顺序)。该函数针对处理描述分布的序列进行了优化,例如网页加载时间或后端响应时间。
当在查询中使用具有不同级别的多个 quantile*
函数时,内部状态不会组合(也就是说,查询的工作效率低于它可能达到的水平)。在这种情况下,请使用 quantiles 函数。
语法
quantileTimingWeighted(level)(expr, weight)
别名:medianTimingWeighted
。
参数
-
level
— 分位数水平。可选参数。从 0 到 1 的常数浮点数。我们建议使用[0.01, 0.99]
范围内的level
值。默认值:0.5。在level=0.5
时,该函数计算中位数。 -
expr
— 表达式,作用于返回 Float* 类型数值的列值。- 如果将负值传递给函数,则行为未定义。
- 如果该值大于 30,000(页面加载时间超过 30 秒),则假定为 30,000。
-
weight
— 包含序列元素权重的列。权重是值出现的次数。
精度
如果满足以下条件,则计算是精确的:
- 值的总数不超过 5670。
- 值的总数超过 5670,但页面加载时间小于 1024 毫秒。
否则,计算结果将四舍五入到最接近的 16 毫秒的倍数。
返回值
- 指定水平的分位数。
类型:Float32
。
注意
如果没有值传递给函数(当使用 quantileTimingIf
时),则返回 NaN。 这样做的目的是将这些情况与导致零的情况区分开来。有关 NaN
值排序的说明,请参阅 ORDER BY 子句。
示例
输入表
┌─response_time─┬─weight─┐
│ 68 │ 1 │
│ 104 │ 2 │
│ 112 │ 3 │
│ 126 │ 2 │
│ 138 │ 1 │
│ 162 │ 1 │
└───────────────┴────────┘
查询
SELECT quantileTimingWeighted(response_time, weight) FROM t
结果
┌─quantileTimingWeighted(response_time, weight)─┐
│ 112 │
└───────────────────────────────────────────────┘
quantilesTimingWeighted
与 quantileTimingWeighted
相同,但接受具有分位数水平的多个参数,并返回一个填充了这些分位数的多个值的数组。
示例
输入表
┌─response_time─┬─weight─┐
│ 68 │ 1 │
│ 104 │ 2 │
│ 112 │ 3 │
│ 126 │ 2 │
│ 138 │ 1 │
│ 162 │ 1 │
└───────────────┴────────┘
查询
SELECT quantilesTimingWeighted(0,5, 0.99)(response_time, weight) FROM t
结果
┌─quantilesTimingWeighted(0.5, 0.99)(response_time, weight)─┐
│ [112,162] │
└───────────────────────────────────────────────────────────┘
参见