Wilcoxontoets – Wikipedia

De wilcoxontoets voor twee steekproeven is een verdelingsvrije (statistische) toets om na te gaan of twee verdelingen ten opzichte van elkaar verschoven zijn. De toets is genoemd naar de Amerikaanse scheikundige Frank Wilcoxon en equivalent aan de mann-whitneytoets.

Een landmeter heeft een nieuwe theodoliet gekregen omdat de oude aan vervanging toe is. Het instrument is van hetzelfde merk en van dezelfde uitvoering als het oude. Om na te gaan of de nul-instellingen van de instrumenten gelijk zijn, meet hij met beide instrumenten een aantal keren dezelfde hoogte. Hij doet 10 metingen X met het oude instrument en 12 metingen Y met het nieuwe.

We kunnen ervan uitgaan dat de verdelingen van X en van Y op een verschuiving na aan elkaar gelijk zijn.

De nulhypothese is dat de nul-instellingen dezelfde zijn, dus dat de verdelingen exact aan elkaar gelijk zijn, zonder verschuiving.
Als alternatieve hypothese nemen we voor de eenvoud een eenzijdige, namelijk dat het nieuwe instrument systematisch te hoog meet.

Met het oude instrument meet hij achtereenvolgens:

Instrument X: 3,0163 3,0147 3,0175 3,0150 3,0123 3,0169 3,0143 3,0122 3,0154 3,0164

Met het nieuwe instrument meet hij:

Instrument Y: 3,0148 3,0146 3,0162 3,0155 3,0153 3,0190 3,0187 3,0167 3,0152 3,0178 3,0177 3,0158

De uitkomsten rangschikken we naar grootte:

Rangnummer: 1 2 3 4 5 6 7 8 9 10 11 12
Instrument: X X X Y X Y X Y Y X Y Y
Meetwaarde: 3,0122 3,0123 3,0143 3,0146 3,0147 3,0148 3,0150 3,0152 3,0153 3,0154 3,0155 3,0158

Vervolg tabel:

13 14 15 16 17 18 19 20 21 22
Y X X Y X X Y Y Y Y
3,0162 3,0163 3,0164 3,0167 3,0169 3,0175 3,0177 3,0178 3,0187 3,0190

Vervolgens zetten we de instrumentaanduidingen uit de tabel op een rij:

X X X Y X Y X Y Y X Y Y Y X X Y X X Y Y Y Y

Onder de nulhypothese is voor elke plaats in de rij de kans op een X dezelfde, maar onder de alternatieve hypothese zullen aan het begin van de rij met grotere kans X’en te vinden zijn en aan het eind van de rij Y’en. In het extreme geval dat de metingen als volgt waren:

X X X X X X X X X X Y Y Y Y Y Y Y Y Y Y Y Y

is het duidelijk: het nieuwe instrument geeft systematisch hogere waarden dan het oude. Als we vinden:

Y X Y X Y X Y X Y X Y X Y X Y X Y X Y X Y X

is dit weliswaar een heel bijzondere uitkomst, maar er is geen reden om het nieuwe instrument te wantrouwen.

Wat moeten we concluderen uit de gevonden uitkomst? Op het eerste gezicht lijken de X’en meer naar links en de Y’en meer naar rechts te liggen. Dus bewijs tegen de nulhypothese. Maar is dit resultaat significant? Om dat na te gaan berekent de toetsingsgrootheid

W{displaystyle W}

het totaal van de rangnummers van de X’en in de rij. In ons geval dus:

Het zal duidelijk zijn dat hoe kleiner W is hoe meer reden er is om de nulhypothese te verwerpen. Maar is onze uitkomst

W=92{displaystyle W=92}

te klein? Met kansrekening kan de verdeling van

W{displaystyle W}

onder de nulhypothese bepaald worden, gebruikmakend van het feit dat, als de nulhypothese waar is, alle mogelijke rangschikkingen van de X’en en Y’en even waarschijnlijk zijn. We hoeven deze berekening niet steeds zelf uit te voeren, daarvoor zijn er tabellen.

De twee toevalsvariabelen

X{displaystyle X}

en

Y{displaystyle Y}

zijn onderling onafhankelijk en continu verdeeld met verdelingsfuncties

F{displaystyle F}

respectievelijk

G{displaystyle G}

die op een verschuiving na aan elkaar gelijk zijn. Er geldt dus:

Van

X{displaystyle X}

en

Y{displaystyle Y}

zijn aselecte steekproeven

X1,,Xm{displaystyle X_{1},ldots ,X_{m}}

en

Y1,,Yn{displaystyle Y_{1},ldots ,Y_{n}}

gegeven.

De toetsingsgrootheid

Wm,n{displaystyle W_{m,n}}

van de wilcoxontoets voor het toetsen van de nulhypothese

bestaat uit de som van de rangnummers van een van de steekproeven, zeg

X{displaystyle X}

, in het totaal van de waarnemingen:

Daarin is dus

R(Xi){displaystyle R(X_{i})}

het rangnummer van

Xi{displaystyle X_{i}}

in de geordende rij van beide steekproeven. Afhankelijk van de alternatieve hypothese wordt de nulhypothese verworpen voor te kleine, te grote of te kleine en te grote waarden van

Wm,n{displaystyle W_{m,n}}

.

Voor steekproeven met omvang

m{displaystyle m}

en

n{displaystyle n}

, kan de exacte verdeling van de toetsingsgrootheid

Wm,n{displaystyle W_{m,n}}

onder de nulhypothese met behulp van combinatoriek gemakkelijk bepaald worden. Voor grotere steekpoeven neemt echter de hoeveelheid rekenwerk flink toe. De verdeling kan ook bepaald worden met de onderstaande recursieve formule. De formule ontstaat door conditionering op de voorwaarde dat de laatste waarde in de volgorde een X (“…X”) of een Y (“…Y”) is.

Voor grotere waarden van

m{displaystyle m}

en

n{displaystyle n}

kan een normale benadering toegepast worden. De verwachtingswaarde en de variantie van

Wm,n{displaystyle W_{m,n}}

onder de nulhypothese worden gegeven door:

De mann-whitneytoets berekent om de volgorde van de X’en en Y’en te vergelijken een andere grootheid

U{displaystyle U}

, die echter omgerekend kan worden in de wilcoxontoetsingsgrootheid.