Kwartiel

In de statistiek is een kwartiel een van de drie waarden die een geordende set data, de steekproef of populatie, in vier (zo goed mogelijk) gelijke delen opdeelt. Elk deel is in dat geval een kwart van de dataset. Men spreekt van eerste, tweede en derde kwartiel en noteert deze als , en .

In deze systematiek worden de uitersten van de dataset, het minimum en het maximum wel genoteerd als en . Met de zo bepaalde vijf kwartielen kan een dataset kort samengevat worden in wat de vijf-getallensamenvatting heet.

Definitie

Kwartielen van een set data

Voor het eerste kwartiel geldt:

  • ten minste 1/4 van de data is niet groter dan
  • ten minste 3/4 van de data is niet kleiner dan

Voor het tweede kwartiel geldt:

  • ten minste 1/2 van de data is niet groter dan
  • ten minste 1/2 van de data is niet kleiner dan

Voor het derde kwartiel geldt:

  • ten minste 3/4 van de data is niet groter dan
  • ten minste 1/4 van de data is niet kleiner dan

Formeel genoteerd geldt dus voor de kwartielen van de data :

Kwartielen van een kansverdeling

Voor de kwartielen van de kansverdeling van een stochastische variabele geldt:

  • ;
  • .

Bepaling

De bovenstaande definitie bepaalt niet in alle gevallen eenduidig de kwartielen. In het geval van een eindige dataset bijvoorbeeld die bestaat uit 8 data, delen de kwartielen weliswaar de dataset in precies vier gelijke delen, maar zijn de kwartielen niet eenduidig bepaald. Voor het eerste kwartiel komen alle getallen in aanmerking tussen de tweede en derde in grootte. Voor de hand liggend is het gemiddelde van het 2e en het 3e getal als te kiezen, maar men moet zich terdege realiseren dat er daarbij sprake is van een keuze. Is het aantal data geen viervoud, dan is een verdeling van de dataset in vier gelijke delen onmogelijk. Ook in dat geval moet men kiezen voor een specifieke methode voor het bepalen van de kwartielen.

Er zijn meerdere methoden bekend voor het berekenen van de kwartielen. In ieder statistisch softwarepakket is gekozen voor een specifiek algoritme, waardoor verschillende pakketten ook verschillende waarden voor de kwartielen kunnen leveren.

Kwartielen vormen een bijzonder geval van percentielen. In het lemma over percentielen worden tien verschillende methoden voor het berekenen van percentielen, en dus ook van kwartielen, gegeven. Zie ook de website van Mathworld.

Een van de methoden waarmee kwartielen worden berekend

Een veel gebruikte manier om van een geordende set van data de kwartielen te bepalen is als volgt:

,

daarin is de nintfunctie, voor het afronden naar de dichtstbijzijnde gehele waarde.

Interkwartielafstand

Het verschil tussen het eerste en het derde kwartiel wordt interkwartielafstand genoemd, een maat voor de spreiding van de data.

Zie ook

  • kwintielen, die de set in 5 gelijke delen opdelen;
  • decielen die de set in 10 gelijke delen opdelen;
  • percentielen, die de set in 100 gelijke delen opdelen
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.