Cronbachs alfa

Cronbachs α (alfa) is een maat voor de betrouwbaarheid van psychometrische tests of van vragenlijsten.[1] De waarde van α is een schatting voor de ondergrens van de betrouwbaarheid van de betrokken test. Om een schatting te bepalen van de betrouwbaarheid van een test zijn ten minste twee testafnames nodig. Op basis van één testafname kan Cronbachs α berekend worden om zo een schatting van de ondergrens te verkrijgen. Cronbachs α hangt af van het aantal items of vragen in de test, de gemiddelde covariantie tussen de items en de spreiding van de somscore.[2]

Cronbachs α is ontwikkeld door Lee Cronbach, die hem in 1951 voor het eerst gebruikte. Andere, verwante maten zijn de Kuder-Richardson Formule 20, kortweg KR-20, en lambda-2 van Guttman.

Cronbachs α kan waarden aannemen van minus oneindig tot 1 (waarbij wordt opgemerkt dat alleen positieve waarden zinvol zijn). Als vuistregel wordt vaak gehanteerd dat een test of onderzoeksvragenlijst bruikbaar is bij een van 0,70 of hoger, hoewel de gebruiken verschillen per onderzoeksdiscipline. Intelligentietests hebben vaak een hogere waarde voor α dan tests voor attitude of persoonlijkheid.

In de psychologie en sociologie wordt Cronbachs frequent toegepast, maar ook in andere wetenschappen is het een belangrijke maat.

Om duidelijk te maken dat Cronbachs een schatting is van de betrouwbaarheid die is gebaseerd op louter één testafname, wordt ook wel gezegd dat Cronbachs α een schatting is van de interne consistentie van een instrument. Deze term wordt helaas vaak verkeerd begrepen, namelijk als indicator van constructvaliditeit of dimensionaliteit. Clustering van items is echter niet terug te zien in de waarde van , omdat er bij de berekening van gebruik wordt gemaakt van de gemiddelde covariantie. Mede daarom is het geen goede maat voor dimensionaliteit/factor structuur. Een hoge waarde van impliceert dus niet noodzakelijkerwijs dat de test enkel één construct meet. Daarom raden verschillende auteurs aan om de term interne consistentie te vermijden. Als men een uitspraak wil doen over de dimensionaliteit van een test, is het beter om factoranalyse of item respons theorie[3] te gebruiken.

Definitie

In de klassieke testtheorie wordt de score op een test bepaald als het totaal van de scores op afzonderlijke items:

De score op item wordt daarin opgevat als de som van de true score en een storingsterm, de error score, :

daarin zijn de true score en de error score ongecorreleerd, en ook worden de error scores van de verschillende items als ongecorreleerd beschouwd. Bovendien is de verwachte error score 0:

De variantie van de totale score kan uiteengelegd worden in:

De onbetrouwbaarheid in de testscore vindt z'n oorzaak in de varianties van de true scores en de error scores. Daarom kan de betrouwbaarheid worden afgemeten aan:

Deze parameter is maximaal gelijk aan . Zie ter illustratie Voorbeeld 1. Ter normering wordt de betrouwbaarheid daarom gedefinieerd als:

De waarde van de betrouwbaarheid is maximaal 1 en naar beneden onbegrensd. Het is deze parameter waarvan Cronbachs een schatting geeft.

,

daarin stellen de verschillende respectievelijk de steekproefvarianties voor van de totale score en de scores op de items .

Als de score is van testpersoon op item en er zijn testpersonen, dan zijn de benodigde formules:

waarin

de gemiddelde score op item is, en

waarin

de testscore van testpersoon is.

Voorbeeld

Een eenvoudig getallenvoorbeeld demonstreert de berekeningen. In de tabel staan van 3 items (N=3) de itemscores y van 5 (m=5) testpersonen en als rijsom de testscores x.

item 1 2 3 rijsom
itemscoretestscore
testpersoon y1y2y3x
1 43512
2 2035
3 1124
4 3249
5 4239
variantie10.70
variantie1.71.31.34.30

In de onderste rijen staat de variantie van de 5 testscores en de 3 varianties van de itemscores met hun totaal . Voor α berekenen we dan:

Gestandaardiseerde items

Als de items gestandaardiseerd zijn, dat wil zeggen met variantie 1, kan de betrouwbaarheid geschreven worden als:

Als schatter kan dan gebruikt worden:

Hierin staat voor de gemiddelde onderlinge steekproefcorrelatie tussen de items.

Gebruik

Cronbachs α kan in verschillende fasen van een onderzoek gebruikt worden.

Onderzoeksfase Toepassing
Vooraf Bij de ontwikkeling van psychometrische tests, door de test voor te leggen aan een groot aantal proefrespondenten alvorens hem in de praktijk toe te passen
Bij de ontwikkeling van een onderzoeksvragenlijst, door hem voor te leggen aan een aantal proefrespondenten alvorens het onderzoek met deze vragenlijst uit te voeren
Tijdens Bij de uitvoering van een onderzoek met een onderzoeksvragenlijst, door items alsnog te verwijderen als ze bij deze onderzoeksgroep Cronbachs α nadelig blijken te beïnvloeden
Achteraf Cronbachs α geeft een maat voor de betrouwbaarheid van de data. Als bijvoorbeeld een enquête willekeurig is ingevuld of data verzonnen zijn, kan dit leiden tot een lage waarde van α[4]
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.