contingency
contingency
函数计算列联系数,该值衡量表中两列之间的关联性。该计算类似于cramersV
函数,但在平方根中使用了不同的分母。
语法
contingency(column1, column2)
参数
column1
和column2
是要比较的列
返回值
- 介于 0 和 1 之间的值。结果越大,两列的关联性越紧密。
返回类型始终为 Float64。
示例
下面比较的两列彼此之间的关联性很小。我们还包括了 cramersV
的结果(作为比较)
SELECT
cramersV(a, b),
contingency(a ,b)
FROM
(
SELECT
number % 10 AS a,
number % 4 AS b
FROM
numbers(150)
);
结果
┌──────cramersV(a, b)─┬───contingency(a, b)─┐
│ 0.41171788506213564 │ 0.05812725261759165 │
└─────────────────────┴─────────────────────┘