跳到主要内容
跳到主要内容

cramersV

Cramer's V(有时称为 Cramer's phi)是衡量表中两列之间关联程度的指标。cramersV 函数的结果范围从 0(表示变量之间没有关联)到 1,并且仅当每个值完全由另一个值确定时才能达到 1。它可以被视为两个变量之间关联程度占其最大可能变异的百分比。

注意

有关 Cramer's V 的偏差校正版本,请参阅:cramersVBiasCorrected

语法

cramersV(column1, column2)

参数

  • column1:要比较的第一列。
  • column2:要比较的第二列。

返回值

  • 介于 0(表示列值之间没有关联)到 1(完全关联)之间的值。

类型:始终为 Float64

示例

以下正在比较的两列彼此之间没有关联,因此 cramersV 的结果为 0

查询

SELECT
cramersV(a, b)
FROM
(
SELECT
number % 3 AS a,
number % 5 AS b
FROM
numbers(150)
);

结果

┌─cramersV(a, b)─┐
│ 0 │
└────────────────┘

以下两列具有相当紧密的关联,因此 cramersV 的结果是一个较高的值

SELECT
cramersV(a, b)
FROM
(
SELECT
number % 10 AS a,
number % 5 AS b
FROM
numbers(150)
);

结果

┌─────cramersV(a, b)─┐
│ 0.8944271909999159 │
└────────────────────┘