Ordinatie

Ordinatie, ook wel (multivariate) gradiëntanalyse of multidimensional scaling, is het rangschikken van objecten langs gradiënten op grond van waarnemingen aan meer afhankelijke variabelen. Door middel van afbeeldingen probeert men een idee te krijgen van de structuur van de onderzochte gegevensverzameling.

Het resultaat is een ordinogram, een diagram waar de op elkaar gelijkende objecten dicht bij elkaar staan en de onderling sterk verschillende objecten ver van elkaar af staan. De objecten krijgen hun plaats in een plat vlak of in een ruimte van meer dimensies, in ieder geval in een topologische ruimte. Ordinatiemethoden maken meestal gebruik van distantie-maten, zoals de euclidische afstand of de chi-kwadraatafstand. De ordinaat van een punt in een plat vlak met een cartesisch coördinatenstelsel is de -coördinaat van dat punt.[1]

Ordinatie kan voor de analyse van iedere verzameling multivariate objecten worden gebruikt, zowel bij beschrijvend, exploratief als bij experimenteel onderzoek, bijvoorbeeld ten behoeve van de datareductie. Door ordinatie wordt ruis onderdrukt, de redundantie opgespoord en samengevat, en kunnen uitbijters snel worden herkend. De ordinatietechnieken worden veelal toegepast om de samenhang en onderliggende patronen in grote gegevensverzamelingen op te sporen, te visualiseren en zelfs te verklaren.

Ordinatietechnieken worden daarvoor in de populatiebiologie of gemeenschapsecologie vaak gebruikt.[2] Hoewel het om tientallen tot enkele honderden afhankelijke variabelen gaat, blijkt het dat hier de meeste spreiding in de gegevens gewoonlijk met twee tot vier ordinatieassen kan worden verklaard. Ordinatietechnieken, in combinatie met regressie-analyse[3] en statistische toetsen, bijvoorbeeld de Monte-Carlosimulatie, worden tegenwoordig in experimenteel veldwerk en onderzoek gebruikt.[4]

Ordinatie wordt onder andere veelvuldig toegepast bij gemeenschapsonderzoek in de ecologie.

Begrippen en achtergrond

Indeling van ordinatietechnieken
    • informele technieken
    • indirecte gradiëntanalyse, als er geen onafhankelijke variabelen zijn
      • technieken op basis van distantie en similariteit
        • PO: Polaire ordinatie (Bray-Curtis ordinatie, Wisconsin ordinatie)
        • PCoA: Principal Coordinates Analysis (Metric multidimensional scaling)
        • NMDS: Nonmetric multidimensional scaling
      • technieken op basis van eigenanalyse
    • directe gradiëntanalyse (als er onafhankelijke variabelen gemeten zijn)
  • Ordinatietechnieken als hoofdcomponentenanalyse PCA, correspondentieanalyse CA en de canonische vormen daarvan als redundantieanalyse RDA en canonische correspondentieanalyse CCA, worden evenals clusteranalyse tot de multivariate statistiek of multivariate analyse gerekend. Er kunnen zes typen problemen van data-analyse worden onderscheiden:

    1. Regressie, zoals (meervoudige) lineaire regressie,
    2. Kalibratie, zoals gewogen gemiddelde,
    3. Ordinatie, zoals hoofdcomponentenanalyse en correspondentieanalyse,
    4. Canonische ordinatie of gebonden ordinatie, zoals redundantie-analyse en canonische correspondentieanalyse,
    5. Partiële ordinatie,
    6. Partiële canonische ordinatie.

    Begrippen

    Een definitie van ordinatie is het rangschikken van objecten langs gradiënten op grond van waargenomen responsies voor meer de afhankelijke variabelen, in de ecologie: soorten, in een ordinogram. Onder rangschikken of ordenen wordt het positioneren of het ordenen van objecten verstaan.

    1. Rangschikken of ordenen is het positioneren of het ordenen van objecten in een coördinatenstelsel.
    2. Objecten: entiteiten, stalen of steekproeven, zijn de operationele eenheden (instanties) die in de analyse moeten worden beschreven, geclassificeerd of geordend.
    3. Gradiënten en ordinatieassen zijn:
    4. Een respons of responsie is in dit verband de waargenomen waarden voor de afhankelijke variabele op grond van waarnemingen.
    5. De afhankelijke variabelen of responsvariabelen zijn de variabelen voor de eigenschappen, kwaliteiten of kenmerken van de attributen. Het gaat in de ecologie bijvoorbeeld om de aanwezigheid van soorten en de mate daarvan, de biomassa, de afmetingen.

    Toepassing in de ecologie

    Ordinatie wordt onder andere veelvuldig toegepast bij ecologisch gemeenschapsonderzoek, community ecology. Objecten, de operationele eenheden die in de analyse beschreven of geclassificeerd moeten worden, zijn bijvoorbeeld vegetatieopnamen, vangsten in vallen, steekproefnamen of tellingen van de soorten op een bepaald moment of periode of over een reeks van tijdstippen en op een bepaalde of op meerdere te vergelijken plaatsen.

    De afhankelijke variabelen bij ecologisch onderzoek zijn de waargenomen soorten. De waarde van de afhankelijke variabele per object is de respons, met andere woorden: de mate van aanwezigheid, de abundantie, biomassa of de dichtheid van de soorten per opname of telling. Een gradiënt in het kader van de ordinatie kan zijn:

    1. een gemeenschapsgradiënt, een systematische verloop in soortensamenstelling van de opnamen of tellingen; een hypothetische variabele die indirect wordt afgeleid uit de gegevens betreffende de soortensamenstellingen van de opnames.
      berekende systematische verschillen in soortensamenstelling over een reeks van monsters, "onderliggende variabelen", hypothetische assen, geabstraheerde variabelen, latente variabelen, of
    2. een ecologische gradiënt, een verloop in de waarden van de milieufactoren; deze kunnen worden gemeten of experimenteel worden beïnvloed;
      milieugradienten; over een reeks van veldwaarnemingen aangetroffen geleidelijke veranderingen in de waarden van milieufactoren, bijvoorbeeld waterdiepte, hoogte boven zeeniveau, intensiteit van betreding, beschaduwing, of zelfs
    3. combinaties van een of meer gemeten experimentele variabelen, verklarende variabelen, onafhankelijke variabelen of 'factoren'

    Ordinatie kan zowel worden toegepast op de objecten als op de attributen. Bij een aantal ordinatiemethoden (zoals hoofdcomponentenanalyse en correspondentieanalyse) kan dit gelijktijdig gebeuren en kunnen de resultaten worden weergegeven in een biplot of een triplot.

    De ordinatiescores van de objecten kunnen achteraf vergeleken worden met de waarden van gemeten verklarende variabelen, bijvoorbeeld door berekening van correlatiecoëfficiënten of door meervoudige lineaire regressie van de ordinatie-as op de verklarende variabelen.

    Canonische ordinatie

    "Canonische ordinatie" is een combinatie van ordinatie en multipele regressie. De canonische ordinatie-assen zijn dan een lineaire combinatie van verklarende variabelen en worden daaruit berekend door multipele lineaire regressie. Een voorbeeld is de canonische correspondentieanalyse en redundantieanalyse, een variant van de hoofdcomponentenanalyse.

    Gegevensverzameling

    Multivariate gegevens (data) bestaan uit waarnemingen (observaties) van een aantal afhankelijke variabelen, gemaakt op een verzameling van objecten: responsies. De term 'multivariaat' slaat op het grotere aantal variabelen. Over het algemeen worden ordinatiemethoden gebruikt om te relaties beschrijven tussen de responsies (de waarden voor de afhankelijke variabelen) en de onderliggende variabelen. De onderliggende variabelen zijn de verklarende variabelen en de factoren die de patronen in de responsies beïnvloeden.

    Objecten, indicatorvariabelen, afhankelijke en onafhankelijk variabelen
    variabelen: objecten, monsters of waarnemingen indicatorvariabelen
    typen ↓ namen ↓ Object1Object2Object3Object4...Objectk... Indic_var1Indic_var2...
    afhankelijke
    variabelen

    of
    respons-
    variabelen
    Y1 y11y12y13y14...y1k... z11 z12 ...
    Y2 y21y22y23y24...y2k... z21 z22 ...
    Y3 y31y32y33y34...y3k... z31 z32 ...
    Y4 y41y42y43y44...y4k... z41 z42 ...
    ... ..................... ... ... ...
    Yj yj1yj2yj3yj4...yjk... zj1 zj2 ...
    ... ..................... ... ... ...
    onafhankelijke
    variabelen
    ,
    verklarende
    variabelen

    of factoren
    X1 x11x12x13x14...x1k...
    ... .....................
    Xk xk1xk2xk3xk4...xkk...
    ... .....................

    In sommige gevallen is er bij de ruwe data op voorhand al een duidelijk onderscheid te maken tussen afhankelijke en onafhankelijke variabelen. Deze laatste kunnen dan gebruikt worden voor de statistische verklaring van de gegevensstructuur.

    Een gegevensverzameling dataset bestaat meestal uit een rechthoekige matrix of tabel. Deze tabel bestaat uit:

    Omdat het aantal rijen en kolommen hoog kan zijn (van tientallen tot enkele honderden), wordt visualisatie geholpen door een reductie in dimensies door middel van ordinatie.

    In exploratief onderzoek ontbreken vaak de waarden voor de onafhankelijke variabelen. In bijzondere gevallen zijn uit de literatuur gemiddelde of kenmerkende waarden bekend voor bepaalde variabelen, de zogenaamde indicatorwaarden voor bepaalde indicatorvariabelen. Ook deze kunnen weer gebruikt worden bij de analyse met behulp van multivariate kalibratie. Deze techniek wordt met behulp van indicatorsoorten en Ellenberggetallen veel toegepast in het vegetatiekundig onderzoek.

    Typen variabelen

    De variabelen zijn onder te verdelen in verschillende typen, afhankelijk van de rol die ze hebben in de ordinatie:

    • de afhankelijke variabele of responsvariabele: de gemeten variabele, voorspeld of geobserveerd door de onderzoeker. Van deze variabele wordt aangenomen dat hij wordt beïnvloed door de onafhankelijke variabelen.
    • de onafhankelijke of externe variabele: de variabele waarvan wordt aangenomen dat het een oorzaak weergeeft van de waarden van de responsvariabele:
      • experimentele variabelen: door de onderzoeker gemanipuleerde of ingestelde variabelen,
      • passieve variabelen of factoren: variabelen die invloed hebben op de responsies en kunnen worden vastgesteld of gemeten, maar niet experimenteel worden beïnvloed.
    • In sommige gevallen zijn indicatorvariabelen bekend voor verschillende attributen. In dat geval kunnen door middel van kalibratie waarden worden berekend voor de objecten. In de vegetatiekunde worden daarvoor indicatorsoorten en Ellenbergwaarden gebruikt.
  • Meetschalen

    Er kunnen verschillende meetschalen worden onderscheiden:

  • Transformaties

    Het is bij sommige ordinatietechnieken nodig de variabelen eerst te transformeren, afhankelijk van de gebruikte meetschaal.

      • Nominale en ordinale variabelen worden naar binaire, nieuw gedeclareerde variabelen getransformeerd, zodat ermee kan worden gerekend.
      • Circulaire variabelen moet naar twee nieuwe variabelen worden omgezet.
      • Normalisatie van numerieke variabelen, wat de waarden herschaalt: in het bereik [0, 1] met c=1, of een met andere constante.
      • Het is echter ook mogelijk de gegevensverzameling te standaardiseren naar z-scores, zodat het gemiddelde 0 en de variantie = 1: .

    Voorbeelden:

    1. De nominale variabele "oogkleur" met de mogelijke waarden [bruin, blauw, groen] moet getransformeerd worden naar drie (elkaar uitsluitende) variabelen:
      • "Oogkleur bruin" met de waarden 0 en 1,
      • "Oogkleur blauw" met de waarden 0 en 1,
      • "Oogkleur groen" met de waarden 0 en 1.
    2. De circulaire variabele "windrichting" met de waarden van [0° - 360°] kan getransformeerd worden naar twee variabelen
      • "CosWindrichting" met de waarde cos(windrichting)
      • "SinWindrichting" met de waarde sin(windrichting)

    Distantie en similariteit (verschil en overeenkomst)

    Objecten kunnen overeenkomen of verschillen van elkaar op grond van de waarden van de responsvariabelen. Op grond van de onderlinge verschillen (distanties, dissimilariteit, afstanden) tussen de objecten kunnen deze door ordinatie in een meerdimensionale ruimte worden geplaatst, of worden geclusterd[5][6][7]. De onderlinge afstanden kunnen met verschillende distantiematen worden aangegeven, zoals euclidische afstand, chikwadraat-afstand en verschillende correlatiematen.

    Sommige ordinatietechnieken, zoals Nonmetric multidimensional scaling (NMDS) hebben een maat nodig voor de distantie. Door het berekenen van de distanties tussen de objecten gaat de informatie van de variabelen verloren. Methoden gebaseerd op afstand geven niet simultaan de scores voor de objecten en de attributen, in tegenstelling tot eigenanalysemethoden.

    In bijvoorbeeld de ecologie en de psychologie zijn een zeer groot aantal andere maten voor distantie of voor overeenkomst in omloop. Maten voor overeenkomst kunnen vaak eenvoudig worden omgerekend in maten voor verschil, en omgekeerd. Objecten met overeenkomstige waarden voor de attributen krijgen in een ordinatie waarden op de ordinatie-assen die vlak bij elkaar liggen. Als er echter de verschillen groter zijn komen de objecten verder bij elkaar vandaan te liggen.

    De eigenanalysemethoden kunnen ordinatieassen voor de objecten en de attributen simultaan berekenen zonder de tussenstap van het vooraf berekenen van distanties. Toch blijken deze methoden indirect verband te houden met distanties, zoals de euclidische afstand (bij hoofdcomponentenanalyse) of chi-kwadraatafstand (bij correspondentieanalyse).

    Responsmodellen

    Lineair en gaussisch responsiemodel in de ecologie.
    Lineair responsiemodel, met
    • gradiënt = onafhankelijk variabele
    • respons = afhankelijk variabele
    Gaussisch responsiemodel, met
    • Opt. = optimum, optimale waarde (hier: 3,0)
    • Ampl. = amplitude (hier: 10)
    • Tol. = tolerantie (hier: 0,1)

    Afhankelijk van het toepassingsgebied moet er een verwacht verband worden geformuleerd tussen de ordinatieas en de respons. Niet altijd mag een lineair verband worden verwacht tussen de onafhankelijke variabele en de responsvariabele.

    Het unimodale model stelt dat responsiefuncties van attributen (dat wil zeggen het verband tussen de responsies als functie van positie langs een ordinatiegradiënt) unimodaal of eentoppig is (gaussische functie). Een dergelijk model wordt door drie waarden vastgelegd:

    1. het optimum (Opt.), de ligging van de top, hier bij 3,0
    2. de tolerantie (Tol), de breedte van de curve, soms standaard deviatie (sd) genoemd; hier 0,1
    3. de amplitude (Ampl.), de hoogte van de curve, hier 10

    Eigenanalyse

    Eigenanalyse staat centraal in de wiskundige discipline van lineaire (matrix) algebra. Eigenanalyse is een techniek die leidt tot een lineaire reductie in dimensionaliteit (singulierewaardenontbinding). Eigenanalyse kan worden uitgevoerd op een vierkante, symmetrische distantiematrix, of direct op de gegevensmatrix. Er is een unieke oplossing ongeacht de volgorde van de gegevens. Bij grote matrices vereist eigenanalyse een iteratieve aanpak voor benadering van het antwoord.

    De ordinatie-assen zijn de eigenvectoren, die bestaan uit de scores voor de objecten en voor de attributen. De assen zijn ongecorreleerd door orthogonalisatie.

    De eigenwaarden, die met een eigenvector samenhangen, vormen een maat voor de sterkte van de as. Ze hebben wiskundige betekenis, die kan helpen bij de interpretatie. In de hoofdcomponentenanalyse en redundantie-analyse zijn eigenwaarden de 'verklaarde variantie'; bij correspondentieanalyse en verwante methoden zijn eigenwaarden 'verklaarde inertia'. De eerste as heeft de hoogste eigenwaarde, de volgende assen hebben een steeds lagere eigenwaarde.

    Eigenanalyse-methoden pogen zo getrouw mogelijk attributen langs assen (gradiënten) te plaatsen. Sommige op eigenanalyse gebaseerde ordinatiemethoden zijn bijzondere gevallen van op distanties gebaseerde methoden, waar de distantie is gebaseerd op de euclidische afstand of op de chi-kwadraat afstand.

    Objecten en attributen worden gelijktijdig geordineerd, en kunnen dus zowel worden weergegeven in hetzelfde ordinogram of biplot.

    Indirecte of directe, canonische ordinatie

    Men spreekt van indirecte ordinatie of ongebonden gradiëntanalyse als bij de ordinatie geen verklarende variabelen zijn betrokken. De gradiënten worden berekend uit de gegevensmatrix (tabel) met de onderlinge verschillen tussen de objecten (distantiematrix), of als latente variabelen uit de gegevens van de responsvariabelen. Veel gebruikte indirecte ordinatiemethoden zijn hoofdcomponentenanalyse (PCA), correspondentieanalyse (CA) en detrended correspondence analysis (DCA).

    Men spreek van directe ordinatie, gebonden gradiëntanalyse of van canonische ordinatie, constrained ordination, als de gradiënten bestaan uit combinaties van verklarende variabelen. De gradiënten worden berekend uit de gegevensmatrix van de objecten en responsvariabelen en door regressie uit de verklarende variabelen. Hiervoor is ook een gegevensmatrix van de objecten en de verklarende variabelen nodig. De in de ecologie meest gebruikte directe ordinatiemethoden zijn de redundantieanalyse (RDA) en vooral de canonische correspondentieanalyse (CCA).

    In partiële ordinatie worden de effecten van bepaalde verklarende variabelen, de covariabelen, door middel van partiële regressie geëlimineerd. Partiële ordinatie kan zowel worden toegepast bij de indirecte als bij de directe ordinatie. Een reden kan zijn dat men niet geïnteresseerd is in deze variabele af dat het effect reeds bekend is.

    Overzicht van methoden

    Overzicht van analysemethoden en variabelen
    en de plaats van ordinatiemethoden
    responsvariabelen,
    afhankelijke variabelen
    geen covariabelen ≥ 1 covariabele
    aantal responsiemodel geen verklarende
    variabelen
    ≥ 1 verklarende
    variabele
    geen verklarende
    variabele
    ≥ 1 verklarende
    variabelen
    1 responsvariabele
    (univariaat)
    onbekend samenvatting van de
    verdeling
    regressie partiële regressie
    lineair lineaire regressie,
    GLM, GAM
    unimodaal niet-lineaire regressie,
    GLM, GAM
    veel
    responsvariabelen
    (multivariaat)
    onbekend clusteranalyse, NMDS Discriminantanalyse -
    lineair PCA RDA partiële PCA partiële RDA
    unimodaal CA, DCA WA, CCA, DCCA partiële CA,
    partiële DCA
    partiële CCA
    partiële DCCA
    + indicatorvariabelen WA, Kalibratie,
    Multivariate kalibratie
    -

    De te kiezen analysemethode hangt in de eerste plaats af van de te analyseren afhankelijke variabele: van het aantal, maar ook van het te verwachten verband met de onderliggende, verklarende variabelen. Dat kan onbekend zijn, er kan een lineair (monotoon) verband verwacht worden of een optimimcurve (Gaussische kromme).

    Samenhangend met de onderzoeksopzet is daarnaast de aanwezigheid van verklarende variabelen van grote invloed op de te gebruiken analysemethode. De verklarende factoren, waarvan men weet dat ze invloed hebben op de onderzoeksresultaten, maar waarin men verder niet geïnteresseerd is moeten constant gehouden worden, of als covariabele behandeld worden waardoor hun effect kan worden weggerekend.

    Eigenschappen van de technieken

    Eigenschappen van ordinatiemethoden
    Acroniem Naam Methode Distantiemaat Onderliggend
    model
    Ordinatie-
    assen
    Vervorming
    2de as
    Opmerking
    PO Polaire ordinatie,
    Bray-Curtis Ordination,
    Wisconsin Ordination
    distantie expliciet onbekend indirect onbekend bijzonder geval:
    → PCO
    PCoA Principal Coordinates Analysis
    "Metric Multidimensional Scaling"
    distantie expliciet onbekend indirect onbekend
    NMDS Nonmetric Multidimensional Scaling
    "Multidimensional Scaling"
    distantie expliciet onbekend indirect onbekend
    PCA Principal Component Analysis
    hoofdcomponentenanalyse
    eigenwaarde impliciet,
    euclidische afstand  
    lineair indirect hoefijzer
    CA Correspondence Analysis
    Reciprocal Averaging
    Correspondentieanalyse
    eigenwaarde impliciet,
    chi-kwadraat afstand
    unimodaal indirect boog
    DCA Detrended correspondence analysis eigenwaarde impliciet,
    chi-kwadraat afstand
    unimodaal direct,
    canonisch
    detrending
    RDA Redundancy Analysis
    Redundantieanalyse
    eigenwaarde impliciet,
    euclidische afstand
    lineair direct,
    canonisch
    onbekend
    CCA Canonical Correspondence Analysis
    Canonische correspondentieanalyse
    eigenwaarde impliciet,
    chi-kwadraat afstand
    unimodaal direct,
    canonisch
    onbekend
    DCCA Detrended Canonical Correspondence Analysis eigenwaarde impliciet,
    chi-kwadraat afstand
    unimodaal direct,
    canonisch
    detrending

    Gewogen gemiddelden, WA

    Het ordenen of rangschikken van objecten volgens de waarden van gemeten onafhankelijke (verklarende) variabelen valt onder de informele methoden. Voor de attributen kunnen gewogen gemiddelden worden berekend aan de hand van:

    • de waarden van een verklarende variabele voor de objecten
    • de waarden van de afhankelijk variabelen voor de objecten, die daarbij als gewicht dienen (deze mogen niet negatief zijn)

    Deze methode is in de ecologie bekend geworden onder de naam Weighted Averaging (WA). Door deze eenvoudige methode kan in de ecologie op snelle wijze goed communiceerbare resultaten worden verkregen.

    Op distanties gebaseerde methoden

    Een aantal ordinatietechnieken gebruiken een vooraf berekende matrix met distanties.[8]

    Polaire ordinatie, PO

    Polaire ordinatie, Bray-Curtis ordinatie of Wisconsin ordinatie is een eenvoudigste techniek om de ordinatie te visualiseren, en kan eventueel met de hand worden uitgevoerd. PO wordt uitgevoerd op grond van een matrix met distanties tussen de objecten. De ordinatie begint met de keuze van twee objecten met een grote onderlinge distantie voor de eerste ordinatie-as. De plaats van de overige objecten op deze as wordt berekend met de distanties ten opzichte van beide eindpunten. Op deze as worden twee bij elkaar liggende objecten met desondanks grote distantie gezocht voor de volgende as.

    Principal coordinates analysis, PCoA

    Principal coordinates analysis, acroniem PCoA, vroeger ook metric multidimensional scaling, maximaliseert de lineaire correlatie tussen afstandsmaten en afstand tussen de punten in de ordinatie. Als men alleen beschikt over een distantiematrix of een similariteitsmatrix is dit een geschikte methode. Het onderliggende is dat er een vast aantal gradiënten is. Meestal worden er 2 of 3 assen geselecteerd. De methode maximaliseert de lineaire correlatie tussen de afstanden in de distantie matrix en de afstanden in een ruimte met een lage dimensie. Als de euclidische afstand als distantie wordt gekozen, dan is PCoA gelijk aan PCA.

    Nonmetric multidimensional scaling, NMDS

    Nonmetric multidimensional scaling (NMDS) heet soms multidimensional scaling (MDS), hoewel deze term eigenlijk gebruikt wordt voor PCoA. Als men alleen beschikt over een distantiematrix of een similariteitsmatrix is dit een geschikte methode. Het onderliggende model is dat er een vast aantal van gradiënten is. NMDS maximaliseert rangordecorrelatie tussen afstandsmaten en afstand in de ordinatieruimte. Punten worden zodanig verplaatst dat de "stress" geminimaliseerd wordt. Stress is een maat voor de discrepantie tussen de twee attributen (soorten) afstand. Vooraf wordt het aantal dimensies opgeven. Dit kan op grond van een grafiek van de stress als functie van het aantal assen.

    Indirecte gradiëntanalyse op basis van eigenanalyse

    De belangrijkste methoden voor indirecte gradiëntanalyse op basis van eigenanalyse zijn: hoofdcomponentenanalyse en correspondentieanalyse.[9]

    Hoofdcomponentenanalyse, PCA

    Tabel met geïdealiseerde ecologische gradiënt
    één verklarende variabele en equidistante monsterpunten
    soort nr.
     monsterpunt nr. 
    01020304050607080910
    Spec 01 531.......
    Spec 02 3531......
    Spec 03 13531.....
    Spec 04 .13531....
    Spec 05 ..13531...
    Spec 06 ...13531..
    Spec 07 ....13531.
    Spec 08 .....13531
    Spec 09 ......1353
    Spec 10 .......135
    milieufactor
    Var 01 20191817161514131211

    Hoofdcomponentenanalyse met hoefijzereffect van ecologische gradiënt.

    Hoofdcomponentenanalyse is relatief objectief en biedt een redelijke, maar grove indicatie van relaties. Het is de eenvoudigste en oudste eigenanalyse-gebaseerde methode. Het is voor veel doeleinden gebruikt, ook als een ordinatie-methode. Hoofdcomponentenanalyse was een van de eerste op ecologische gegevens toegepast ordinatiemethoden.[10]

    Wiskundig is hoofdcomponentenanalyse een eigenanalyse. Meetkundig is PCA een starre rotatie van de oorspronkelijke gegevensmatrix, en kan gedefinieerd worden als een projectie van de objecten (monsters) op een nieuwe set van assen, zodanig dat de maximale variantie wordt "geëxtraheerd", dat wil zeggen: geprojecteerd of langs de eerste as; het maximale verschil met niet-gecorreleerde as 1 is geprojecteerd op de tweede as; de maximale variatie ongecorreleerd met de eerste en tweede as is geprojecteerd op de derde as, en zo verder. Zo wordt er een hoog-dimensionale ruimte geproduceerd, waarbij de afstanden tussen de objecten hun euclidische afstand wordt.

    De eerste ordinatieas kan men zich voorstellen als een regressielijn in de n-dimensionale ruimte van attributen (soorten) en/of monsterpunten, waarbij de afstand tussen elk der punten en de lijn zo klein mogelijk is (kleinste kwadraten methode, lineaire regressie). De tweede en volgende PCA-assen worden op dezelfde wijze berekend als de eerste, waarbij echter een stap is ingebouwd waardoor de as ongecorreleerd wordt gemaakt aan de voor-gaande as(sen): zodat de loodrechte afstand van elk object naar de ordinatie assen tot een minimum wordt beperkt. De assen zijn lineaire combinaties van variabelen (attributen). De gewichten staan bekend als 'coëfficiënten' of 'lading'.

    De eigenvalues vertegenwoordigen de door elke as "geëxtraheerde variantie" of verklaarde variantie. De som van de eigenvalues zal de som van de variantie van alle variabelen.

    In de meeste toepassingen van hoofdcomponentenanalyse worden variabelen vaak gemeten in verschillende eenheden. De gegevens worden dan gestandaardiseerd, met gemiddelde van nul en variantie-eenheid (hoofdcomponentenanalyse met een correlatiematrix). De variabelen kunnen negatieve waarden aannemen. Indien uitgevoerd op een correlatiematrix is de som van de eigenvalues gelijk aan het aantal variabelen. Indien uitgevoerd op een covariantiematrix zal de som van de eigenvalues gelijk aan de som van de varianties van alle attributen.

    Hoofdcomponentenanalyse is een methode die gebaseerd is op een lineair responsie model van de attributen. In de ecologie werkt deze benadering alleen als een beperkt traject van de milieugradiënten (de verklarende variabele) wordt bekeken. Als hoofdcomponentenanalyse wordt toegepast op gegevens van uiteenlopende milieus (dus lange milieugradiënten), treedt het hoefijzereffect op. Dit komt doordat hoofdcomponentenanalyse is gebaseerd op een lineair responsmodel. Voor de analyse van vegetatiegegevens is dit een serieus probleem. Dit wordt veroorzaakt door de curvilineariteit (kromlijnig verband) van attributen (soorten) langs gradiënten, vooral bij lange milieugradiënten (dat wil zeggen: een matig tot hoge beta-diversiteit). In dergelijke gevallen is correspondentieanalyse een betere benadering.

    Correspondentieanalyse, CA, RA

    Tabel met geïdealiseerde ecologische gradiënt
    één verklarende variabele en equidistante monsterpunten
    soort nr.
     monsterpunt nr. 
    01020304050607080910
    Spec 01 531.......
    Spec 02 3531......
    Spec 03 13531.....
    Spec 04 .13531....
    Spec 05 ..13531...
    Spec 06 ...13531..
    Spec 07 ....13531.
    Spec 08 .....13531
    Spec 09 ......1353
    Spec 10 .......135
    milieufactor
    Var 01 20191817161514131211

    Correspondentieanalyse met boogvorming van ecologische gradiënt
    en compressie aan de uiteinden van de eerste as.

    Correspondentieanalyse is een methode voor ordinatie en kwantitatieve analyse van de gegevens van levensgemeenschappen. Correspondentieanalyse (acroniem CA, ook wel Reciprocal Averaging, acronym RA of Two-way weighted averaging) kan worden beschreven in termen van chi-kwadraat afstanden, op dezelfde manier waarop hoofdcomponentenanalyse kan worden beschreven in termen van euclidische afstanden.[11]

    Reciprocal Averaging (wederzijdse middeling) betekent dat scores van de objecten worden berekend als een gewogen gemiddelde van de scores van de responsvariabelen (attributen) en van de scores van de responsvariabelen worden berekend als een gewogen gemiddelde van de (gestandaardiseerde) scores van de objecten. De iteraties worden voortgezet totdat er geen verandering meer optreedt. De methode is een heuristische benadering van een ordinatie die op een eentoppig (Gaussisch) responsmodel is gebaseerd (ter Braak 1985). Er zijn een aantal verschillende algoritmen voor CA. De eigenwaarde van een as is gelijk de correlatiecoëfficiënt tussen scores van de attributen en de scores voor de steekproeven.

    Correspondentieanalyse heeft twee problemen bij analyse van gegevens van ecologische gradiënten (zie tabel):

    1. Als eerste probleem is er het "boogeffect": de tweede ordinatie-as kan een kwadratische vervorming zijn van de eerste as. Het boogeffect wordt ook veroorzaakt door unimodale verdeling langs gradiënten. Omdat de uiteinden van de gradiënt niet zijn ingebogen is het boogeffect niet zo ernstig als het "hoefijzereffect" bij de hoofdcomponentenanalyse.
    2. Het tweede probleem bij de correspondentieanalyse is dat aan de uiteinden van de ordinatie-assen (meestal de eerste as) de objecten te dicht op elkaar liggen en daardoor samengedrukt lijken. Dit heeft te maken met het feit dat de responsvariabelen (attributen) die voorkomen in de objecten (monsterpunten) die aan het einde van de gradiënt liggen in het gegevensmateriaal niet meer een unimodale respons vertonen, maar monotoon of dalend of stijgend zijn. Door middel van niet-lineaire herschaling ('nonlinear rescaling') worden de uiteinden van de ordinatie-assen opgerekt. Dat is onder andere toegepast in detrended correspondence analysis (DCA).

    Detrended correspondence analysis, DCA

    Bij detrended correspondence analysis (acroniem: DCA) worden twee tekortkomingen van correspondentieanalyse op kunstmatige verholpen.[12]

    1. De tweede ordinatieas is vaak een kwadratische vervorming van de eerste ordinatieas (Jongman et al. 1995). Door middel van 'detrending' wordt het kwadratische verband verwijderd.
    2. Daarnaast treedt het verschijnsel da de uiteinden van de ordinatieassen gecomprimeerd zijn waardoor de objecten of attributen daar te dicht op elkaar liggen. Dit heeft te maken met het feit dat de attributen die voorkomen in de objecten (monsterpunten) die aan het einde van de gradiënt liggen in het gegevensmateriaal niet meer een unimodale respons vertonen, maar monotoon of dalend of stijgend zijn. Door middel van 'nonlinear rescaling' worden de uiteinden van de ordinatieassen opgerekt.

    In de ecologie wordt deze techniek veelvuldig toegepast, omdat de lengte van de ordinatieas een schatting is voor de beta-diversiteit. Bij korte ordinatieassen kan dan gekozen worden voor hoofdcomponentenanalyse, omdat het dan blijkbaar niet nodig is van een unimodaal model uit te gaan.

    Directe gradiëntanalyse op basis van eigenanalyse

    Redundantieanalyse, RDA

    Redundantieanalyse is de canonische uitvoering van hoofdcomponentenanalyse. De (canonische) ordinatieassen zijn lineaire combinaties van de verklarende variabelen. RDA is nuttig wanneer er korte gradiënten zijn. Redundantieanalyse is een geschikte methode bij korte termijn experimentele studie. De behandelingen (treatments) vormen de verklarende variabelen en moeten meestal apart worden gedeclareerd.

    De keuze van de verklarende (milieu)variabelen is van grote invloed op de uitkomst van gebonden ordinaties zoals RDA.

    Canonische correspondentieanalyse, CCA

    Canonische correspondentieanalyse is de gebonden (canonische) uitvoering van correspondentieanalyse. De canonische ordinatieassen zijn lineaire combinaties van de verklarende variabelen. CCA is nuttig wanneer er korte gradiënten zijn. Evenals RDA is canonische correspondentieanalyse een geschikte methode bij kortetermijn experimentele studies. De behandelingen (treatments) vormen de verklarende variabelen en moeten meestal apart worden gedeclareerd. CCA is ook toepasbaar onder een lineair model, zolang men geïnteresseerd is in attributen-presenties in plaats van absolute waarden voor de attributen (ter Braak en Šmilauer).

    De keuze van de verklarende (milieu)variabelen is van grote invloed op de uitkomst van gebonden ordinaties zoals CCA.

    Detrended canonical correspondence analysis, DCCA

    Detrended canonical correspondence analysis is de gebonden (canonische) uitvoering van detrended correspondence analysis (DCA). De canonische ordinatieassen zijn lineaire combinaties van de verklarende variabelen.

    Toepassingen

    In de toepassing van ordinatietechnieken zijn voorbeelden van objecten: kwadraten, relevés of vegetatieopnamen, archeologische sites, locaties, monsters, geografische locaties, stroomsedimenten, sedimentmonsters, pollenvallen; de variabelen of kenmerken zijn abundanties, dichtheid, biomassa, frequentie, voorkomen, aan-en afwezigheid van plantensoorten, artefacten, deeltjesgrootte klassen, morfometrische kenmerken, sporenelementen, pollentypen, diatomeeën typen, fossiele taxa e.a.

    Toepassingen in de ecologie

    Geschiedenis

    Ramensky begon in 1930 voor vegetatieonderzoek informele ordinatietechnieken te gebruiken. Deze informele en grotendeels subjectieve methoden werd bekend in de vroege jaren 1950 door Whittaker. Naar aanleiding van deze onderzoeken kwam men tot een beter beeld van de responsiecurven van planten en van ecologische gradiënten. Curtis en McIntosh (1951) ontwikkelden de continuüm-index, die later leidden tot conceptuele verbanden tussen soortresponsies op de gradiënten en multivariate methoden. Kort daarna introduceerde Goodall (1954) de naam ordinatie in een ecologische context voor de hoofdcomponentenanalyse. Bray en Curtis (1957) ontwikkelden de polaire ordinatie, die de eerste veel gebruikte ordinatietechniek werd in de ecologie. Austin (1968) gebruikt canonische correlatie om de relaties tussen plant en milieu te beoordelen in wat misschien het eerste voorbeeld van een multivariate analyse van de directe gradiënt in ecologie.

    Een grote doorbraak kwam met de correspondentieanalyse, die door Hill in 1973 met een computerprogramma is geïmplementeerd. Hill introduceerde bij de ecologen de correspondentieanalyse, die een techniek is uit de jaren 1930. Correspondentieanalyse heeft geleidelijk de polaire ordinatie verdrongen, die vandaag de dag nog maar weinig beoefenaars heeft.

    Fasham (1977) en Prentice (1977) ontdekten en toonden onafhankelijk het nut aan van Kruskal's (1964) metric multidimensional scaling voor de gemeenschapsecologie. Metric multidimensional scaling was oorspronkelijk bedoeld als een psychometrische techniek.

    Hill (1979) corrigeerde een aantal van de gebreken van correspondentieanalyse. Daardoor ontstond de "detrended correspondence analysis", tegenwoordig de meest gebruikte techniek voor indirecte gradiëntanalyse. Het programma van Hill, DECORANA, voert DEtrended COrrespondence ANAlysis uit en is het voorbeeld voor volgende programma's geworden.

    Gauch's boek "Multivariate Analysis in Community Ecology" (1982)[13] beschreef ordinatie in niet-technische termen voor de gemiddelde beoefenaar, waardoor verdere toepassing van ordinatiemethoden werd sterk bevorderd.

    De fuzzy set theory, door Roberts (1986) ingevoerd bij de ecologen, is een veelbelovende aanpak die samenhangt met polaire ordinatie, maar moet nog veel aanhangers winnen.

    In 1986 luidde Ter Braak (1986)[14] het begin in van de grootste revolutie in de moderne ordinatiemethoden met canonische correspondentieanalyse. Deze techniek koppelde correspondentie-analyse aan regressiemethoden, en voorziet in het testen van hypothesen. De canonische correspondentieanalyse is een hybride van correspondentieanalyse en regressie-analyse. Deze werd door Ter Braak ontwikkeld en geïmplementeerd, 1986.[15] Daarin werd tevens de bruikbaarheid van de redundantieanalyse, een hybride van hoofdcomponentenanalyse en regressie-analyse, aangetoond. Ook was het mogelijk de relatie tussen een externe variabele (verklarende variabele) en de responsies van soorten (afhankelijke variabele) te testen door middel van Monte Carlo tests. Tevens ontstond de mogelijk tot calibratie: het inschatten van de waarden van de verklarende variabelen op grond van de waarden voor de afhankelijke variabelen. Ordinatiemethoden werden nu bruikbaar voor de analyse van multivariate gegevens van (veld-)experimenten.

    Ter Braak en Prentice (1988)[16] ontwikkelden een theoretisch basis van de ordinatietechnieken door een unificerende theorie en wiskundige onderbouwing van een familie de ordinatiemethoden. Zo voorzagen ze met de laatste, revolutionaire stap de gradiëntanalyse van een stevige theoretische fundering.

    Organismen en milieu

    In de ecologie is het bekend dat ieder organismen een beperkte tolerantie met betrekking tot de milieufactoren: er is een minimumwaarde waaronder het organisme niet kunnen voorkomen (de respons = 0) en een maximumwaarde waarboven het niet meer kan voorkomen. Tussen het minimum en het maximum ligt een optimum, waar de mate van voorkomen (respons, bijvoorbeeld gemeten als talrijkheid of frequentie) maximaal is. In het ideale geval heeft de responsecurve een symmetrische vorm en is eentoppig, maar in de praktijk komen andere vormen ook voor, zoals een bimodale respons. Veel ordinatiemethoden blijken in de ecologie goed te werken met het optimum-model als er voldoende spreiding is voor de waarden van de verklarende milieuvariabelen en door de aanwezigheid van een groot aantal soorten. Op de ordinatieas is er voor elke soort een unieke set van optimale waarden, waarbij de soort maximale respons bereikt.

    Organismen hebben zo een beperkte tolerantie voor de milieufactoren. Zij vertonen gewoonlijk geen lineair maar een unimodaal verband tussen de milieugradiënt en de mate van voorkomen (bijvoorbeeld abundantieof frequentie). Tolerantie wordt soms standaard deviatie genoemd, en op vergelijkbare manier berekend. In andere gevallen wordt het verschil tussen maximum en minimum als tolerantie genomen. Tolerantiegrenzen bepalen verspreidingsgebied (areaal, het gebied waar van nature soort voorkomt) van een soort. Soorten met een kleine tolerantie (gevoelige soorten) kunnen als indicatorsoort gebruikt worden.

    De beperkende factor is de abiotische factor waarvan de waarde het verst weg ligt van de optimumwaarde. Bepaalt de levenskansen en de groei. Als de beperkende factor het optimum meer nadert, zal dat een toename geven is de respons (mate van voorkomen).

    Relaties tussen soorten, zoals concurrentie, predatie, parasitisme, kunnen invloed hebben op het effect van de milieufactoren, dus op de vorm van de optimimcurve. De curve kan daardoor een andere vorm krijgen, bijvoorbeeld afgeplat, scheef of tweetoppig.

    Plantkunde en deelgebieden
    Bijzondere plantkunde:algologie · bryologie · dendrologie · fycologie · lichenologie · mycologie · pteridologie
    Paleobotanie:archeobotanie · dendrochronologie · fossiele planten · gyttja · palynologie · pollenzone · varens · veen
    Plantenmorfologie & -anatomie:beschrijvende plantkunde · adventief · apoplast · blad · bladgroenkorrel · bladstand · bloeiwijze · bloem · bloemkroon · boomkruin · celwand · chloroplast · collenchym · cortex · cuticula · eicel · epidermis · felleem · fellogeen · felloderm · fenologie · floëem · fytografie · gameet · gametofyt · groeivorm · haar · houtvat · huidmondje · hypodermis · intercellulair · intercellulaire ruimte · kelk · kroonblad · kurk · kurkcambium · kurkschors · levensduur · levensvorm · merg · meristeem · middenlamel · palissadeparenchym · parenchym · periderm · plantaardige cel · plastide · schors · sclereïde · sclerenchym · spermatozoïde · sponsparenchym · sporofyt · stam · steencel · stengel · stippel · symplast · tak · thallus · topmeristeem · trachee · tracheïde · tylose · vaatbundel · vacuole · vrucht · wortel · xyleem · zaad · zaadcel · zeefvat · zygote
    Plantenfysiologie:ademhaling · bladzuigkracht · evapotranspiratie · fotoperiodiciteit · fotosynthese · fototropie · fytochemie · gaswisseling · geotropie · heliotropisme · nastie · plantenfysiologie · plantenhormoon · rubisco · stikstoffixatie · stratificatie · transpiratie · turgordruk · vernalisatie · winterhard · worteldruk
    Plantengeografie:adventief · areaal · beschermingsstatus · bioom · endemisme · exoot · flora · floradistrict · floristiek · hoogtezonering · invasieve soort · Plantengeografie · status · stinsenplant · uitsterven · verspreidingsgebied
    Plantensystematiek:taxonomie · botanische nomenclatuur · APG I-systeem · APG II-systeem · APG III-systeem · APG IV-systeem · algen · botanische naam · cladistiek · Cormophyta · cryptogamen · classificatie · embryophyta · endosymbiontentheorie · endosymbiose · evolutie · fanerogamen · fylogenie · generatiewisseling · groenwieren · hauwmossen · kernfasewisseling · korstmossen · kranswieren · landplanten · levenscyclus · levermossen · mossen · roodalgen · varens · zaadplanten · zeewier
    Vegetatiekunde & plantenoecologie:abundantie · associatie · bedekking · biodiversiteit · biotoop · boomlaag · bos · Braun-Blanquet (methode) · broekbos · climaxvegetatie · clusteranalyse · concurrentie · constante soort · differentiërende soort · ecologische gradiënt · ecologische groep · Ellenberggetal · gemeenschapsgradiënt · grasland · heide · kensoort · kruidlaag · kwelder · minimumareaal · moeras · moslaag · ordinatie · pioniersoort · plantengemeenschap · potentieel natuurlijke vegetatie · presentie · regenwoud · relevé · ruigte · savanne · schor · steppe · struiklaag · struweel · successie · syntaxon · syntaxonomie · Tansley (methode) · toendra · tropisch regenwoud · trouw · veen · vegetatie · vegetatielaag · vegetatieopname · vegetatiestructuur · vegetatietype · vergrassing · verlanding
    This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.