cramersV
Cramer's V(有时称为 Cramer's phi)是衡量表中两列之间关联程度的一种指标。cramersV
函数的结果范围从 0(对应于变量之间没有关联)到 1,并且只有当每个值都完全由另一个值决定时才能达到 1。它可以被视为两个变量之间的关联,以其最大可能变化的百分比表示。
注意
有关 Cramer's V 的偏差校正版本,请参见:cramersVBiasCorrected
语法
cramersV(column1, column2)
参数
column1
:要比较的第一列。column2
:要比较的第二列。
返回值
- 一个介于 0(对应于列值之间没有关联)到 1(完全关联)之间的值。
类型:始终为 Float64。
示例
下面要比较的两列彼此之间没有关联,因此cramersV
的结果为 0
查询
SELECT
cramersV(a, b)
FROM
(
SELECT
number % 3 AS a,
number % 5 AS b
FROM
numbers(150)
);
结果
┌─cramersV(a, b)─┐
│ 0 │
└────────────────┘
下面要比较的两列之间具有相当密切的关联,因此cramersV
的结果为一个较高的值
SELECT
cramersV(a, b)
FROM
(
SELECT
number % 10 AS a,
number % 5 AS b
FROM
numbers(150)
);
结果
┌─────cramersV(a, b)─┐
│ 0.8944271909999159 │
└────────────────────┘