机器学习数学基础:33.肯德尔和谐系数教程

发布于:2025-02-25 ⋅ 阅读:(12) ⋅ 点赞:(0)

肯德尔和谐系数教程

一、定义与用途

肯德尔和谐系数(Kendall’s W)是一种用于衡量多个评价者对一组对象进行评价时,评价结果一致性程度的统计量。它的取值范围在0到1之间。当W \ = 0时,表示评价者之间的评价完全不一致;当W \ = 1时,表示评价者之间的评价完全一致。常用于心理学、教育学、社会学等领域,比如判断多个评委对选手表现评分的一致性,或多位老师对学生论文评价的一致性等。

二、适用场景

  1. 多个评价者:适用于两个及以上评价者对同一组对象进行评价的情况。例如,3位医生对20位患者的病情严重程度进行等级评定。
  2. 等级数据:评价结果通常为等级形式,如名次、等级分类(优、良、中、差)等。当然,也可以将连续数据转化为等级数据后使用。

三、计算步骤(同一评价者无相同等级评定时)

假设存在K个评价者对N个对象进行评价。

  1. 整理数据:将每个评价者对N个对象的评价结果(等级)整理成表格形式。
  2. 计算每个对象的秩和 R i R_i Ri:对于每个对象,把K个评价者给出的等级相加,得到该对象的秩和 R i R_i Ri i   = 1 , 2 , ⋯   , N i \ = 1,2,\cdots,N i =1,2,,N)。
  3. 计算平均秩和 R ˉ \bar{R} Rˉ R ˉ   = ∑ i   = 1 N R i N \bar{R}\ =\frac{\sum_{i \ = 1}^{N}R_i}{N} Rˉ =Ni =1NRi,即所有对象秩和的平均值。
  4. 计算 S S S S   = ∑ i   = 1 N ( R i − R ˉ ) 2 S\ =\sum_{i \ = 1}^{N}(R_i - \bar{R})^2 S =i =1N(RiRˉ)2,也就是每个对象的秩和与平均秩和差值的平方和。
  5. 计算肯德尔和谐系数 W W W:根据公式 W   = S 1 12 K 2 ( N 3 − N ) W\ =\frac{S}{\frac{1}{12}K^2(N^3 - N)} W =121K2(N3N)S进行计算。

四、计算步骤(存在相同等级评定时)

  1. 前3步与无相同等级评定时相同。
  2. 计算 T j T_j Tj:对于每个评价者,统计其评价中相同等级的组数为 g g g,对于第 j j j组相同等级,设该组等级的个数为 n j n_j nj,则 T j   = ∑ j   = 1 g n j ( n j 2 − 1 ) 12 T_j\ =\sum_{j \ = 1}^{g}\frac{n_j(n_j^2 - 1)}{12} Tj =j =1g12nj(nj21)。然后计算所有评价者的 T   = ∑ k   = 1 K T k T\ =\sum_{k \ = 1}^{K}T_k T =k =1KTk
  3. 计算 S S S的校正值 S ′ S' S S ′   = S − K ( K 2 − 1 ) 12 ∑ k   = 1 K T k S' \ = S-\frac{K(K^2 - 1)}{12}\sum_{k \ = 1}^{K}T_k S =S12K(K21)k =1KTk
  4. 计算肯德尔和谐系数 W W W W   = S ′ 1 12 K 2 ( N 3 − N ) − K ∑ k   = 1 K T k W\ =\frac{S'}{\frac{1}{12}K^2(N^3 - N)-K\sum_{k \ = 1}^{K}T_k} W =121K2(N3N)Kk =1KTkS

五、实例演示(无相同等级评定)

4位评委( K   = 4 K \ = 4 K =4)对6位歌手( N   = 6 N \ = 6 N =6)的演唱表现进行排名,结果如下:

评委 歌手1排名 歌手2排名 歌手3排名 歌手4排名 歌手5排名 歌手6排名
评委1 2 4 1 5 3 6
评委2 3 5 2 6 1 4
评委3 1 3 4 2 5 6
评委4 2 4 3 5 1 6
  1. 计算每个歌手的秩和 R i R_i Ri
    • 歌手1: 2 + 3 + 1 + 2   = 8 2 + 3 + 1 + 2 \ = 8 2+3+1+2 =8
    • 歌手2: 4 + 5 + 3 + 4   = 16 4 + 5 + 3 + 4 \ = 16 4+5+3+4 =16
    • 歌手3: 1 + 2 + 4 + 3   = 10 1 + 2 + 4 + 3 \ = 10 1+2+4+3 =10
    • 歌手4: 5 + 6 + 2 + 5   = 18 5 + 6 + 2 + 5 \ = 18 5+6+2+5 =18
    • 歌手5: 3 + 1 + 5 + 1   = 10 3 + 1 + 5 + 1 \ = 10 3+1+5+1 =10
    • 歌手6: 6 + 4 + 6 + 6   = 22 6 + 4 + 6 + 6 \ = 22 6+4+6+6 =22
  2. 计算平均秩和 R ˉ \bar{R} Rˉ ∑ i   = 1 6 R i   = 8 + 16 + 10 + 18 + 10 + 22   = 84 \sum_{i \ = 1}^{6}R_i \ = 8 + 16 + 10 + 18 + 10 + 22 \ = 84 i =16Ri =8+16+10+18+10+22 =84 R ˉ   = 84 6   = 14 \bar{R}\ =\frac{84}{6} \ = 14 Rˉ =684 =14
  3. 计算 S S S
    - ( 8 − 14 ) 2 + ( 16 − 14 ) 2 + ( 10 − 14 ) 2 + ( 18 − 14 ) 2 + ( 10 − 14 ) 2 + ( 22 − 14 ) 2 (8 - 14)^2+(16 - 14)^2+(10 - 14)^2+(18 - 14)^2+(10 - 14)^2+(22 - 14)^2 (814)2+(1614)2+(1014)2+(1814)2+(1014)2+(2214)2
    -   = ( − 6 ) 2 + 2 2 + ( − 4 ) 2 + 4 2 + ( − 4 ) 2 + 8 2 \ = (-6)^2 + 2^2 + (-4)^2 + 4^2 + (-4)^2 + 8^2  =(6)2+22+(4)2+42+(4)2+82
    -   = 36 + 4 + 16 + 16 + 16 + 64   = 152 \ = 36 + 4 + 16 + 16 + 16 + 64 \ = 152  =36+4+16+16+16+64 =152
  4. 计算肯德尔和谐系数 W W W
    - 1 12 K 2 ( N 3 − N )   = 1 12 × 4 2 × ( 6 3 − 6 )   = 1 12 × 16 × ( 216 − 6 )   = 280 \frac{1}{12}K^2(N^3 - N)\ =\frac{1}{12}\times4^2\times(6^3 - 6)\ =\frac{1}{12}\times16\times(216 - 6)\ =280 121K2(N3N) =121×42×(636) =121×16×(2166) =280
    - W   = 152 280 ≈ 0.54 W\ =\frac{152}{280}\approx0.54 W =2801520.54

说明4位评委对6位歌手演唱表现排名的一致性程度中等。

六、注意事项

  1. 肯德尔和谐系数只衡量评价的一致性,不反映评价的准确性。
  2. 数据转化为等级时,方法要合理,否则可能影响结果。
  3. 当评价者数量或对象数量过少时,结果的可靠性可能降低 。