Kruskal-Wallistoets

De Kruskal-Wallistoets, genoemd naar William Kruskal en Allen Wallis, is een verdelingsvrije toets in de statistiek, waarmee getoetst wordt of er verschil is tussen de verdelingen waaruit twee of meer steekproeven afkomstig zijn. De nulhypothese die getoetst wordt, is eigenlijk dat de steekproeven uit verdelingen (populaties) zijn getrokken met dezelfde "ligging". De toets is gebaseerd op de rangnummers van de data. De Kruskal-Wallistoets is te beschouwen als een eenweg-ANOVA gebaseerd op de rangnummers. De Kruskal-Wallistoets is een uitbreiding van de Mann-Whitney-Wilcoxon rangsomtoets, die enkel geschikt is om twee groepen onderling te vergelijken.

Procedure

Gegeven zijn m onderling onafhankelijke aselecte steekproeven uit continue verdelingen. De $j$ -de waarneming in de $i$ -de steekproef, die omvang $n_{i}$ heeft, is $X_{ij}$ . Het rangnummer hiervan in het totaal van de data is $R_{ij}$ . De toets verloopt verder in principe als een variantie-analyse uitgevoerd op deze rangnummers.

De toetsingsgrootheid $K$ is:

K={\frac {12}{n(n+1)}}\sum _{i=1}^{m}n_{i}\left(R_{i\cdot }-{\frac {n+1}{2}}\right)^{2}={\frac {12}{n(n+1)}}\sum _{i=1}^{m}n_{i}R_{i\cdot }^{2}-3(n+1)

,

waarin

n=\sum _{i=1}^{m}n_{i}

het totaal aantal waarnemingen is en

R_{i\cdot }={\frac {1}{n_{i}}}\sum _{j=1}^{n_{i}}R_{ij}

het gemiddelde rangnummer in de $i$ -de steekproef.

Merk op dat de toetsingsgrootheid ook met kwadratensommen geschreven kan worden als:

K=(n-1){\frac {\sum _{i=1}^{m}n_{i}(R_{i\cdot }-R_{\cdot \cdot })^{2}}{\sum _{i=1}^{m}\sum _{j=1}^{n_{i}}(R_{ij}-R_{\cdot \cdot })^{2}}}

,

waaruit de bovenstaande formule volgt door de substituties:

R_{\cdot \cdot }=(n+1)/2

en

\sum _{i=1}^{m}\sum _{j=1}^{n_{i}}(R_{ij}-R_{\cdot \cdot })^{2}=(n-1)n(n+1)/12

.

Als de steekproeven niet te klein van omvang zijn, is $K$ onder de nulhypothese bij benadering chi-kwadraatverdeeld met $m$ vrijheidsgraden.

Knopen

In principe mogen er geen knopen (gelijke waarnemingen) zijn. Zijn er te veel knopen, dan wordt de toetsingsgrootheid wel gecorrigeerd:

K_{adj}={\frac {K}{1-\sum _{k=1}^{n}(t_{k}^{3}-t_{k}))/(n^{3}-n)}},

waarin $t_{k}$ het aantal data is met rangnummer $k$ .

Zie ook

Wilcoxon

Statistische toetsen
schatten · t-toets · F-toets · chi-kwadraattoets · rangsomtoets · rangtekentoets · verdelingsvrije toets · Kolmogorov-Smirnov · Kruskall-Wallis · kleinste-kwadratenmethode · lineaire regressie

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.