Alfabetische volgorde

Alfabetische ordening, alfabetische rangschikking (of soms: alfabetisering) is in ruime zin het ordenen van tekens - meestal letters - in de volgorde van het bijbehorende alfabet, en de op basis van het principe van de lexicografische volgorde daaruit afgeleide volgorde van woorden en frasen. In andere talen met van het Latijn afgeleid alfabet bestaan ook andere conventies voor de alfabetische volgorde.

Geschiedenis

Over het ontstaan van de alfabetische volgorde is weinig bekend. Er is een onmiskenbare overeenkomst in de volgorde van verschillende alfabetten, zoals in de volgorde van het Latijnse, Griekse en Hebreeuwse alfabet.

Sommige letters die thans als volwaardige letters gelden zijn recent toegevoegd door modificatie van bestaande letters. Ze komen in de volgorde vlak vóór of na de oorspronkelijke letter. Deze letters zijn J, U en W. Ook de Y is een recente toevoeging. De K is al eerder uit het Grieks overgenomen. In teksten van enkele eeuwen geleden treft men deze letters dan ook niet aan.

Nederlands

In het Latijnse alfabet zoals dat ook voor de Nederlandse taal wordt gebruikt, zijn er 26 letters die een vaste volgorde kennen. Doordat lemma's in alfabetische volgorde worden opgeslagen, zoals in een archief, woordenboek of encyclopedie, wordt het terugzoeken ervan vergemakkelijkt.

Werkwijze

Te alfabetiseren teksten staan tegenwoordig meestal al op een computer, die ze ook kan sorteren. De tekens van de tekenset hebben dan door nummering en/of interne representatie al een volgorde waarop gesorteerd kan worden. Deze methode werkt prima als de gegevens ook weer door een computer opgezocht moeten worden, maar voor gebruik door mensen stelt men vaak andere eisen:

  • Soms wil men op een afwijkende manier omgaan met spaties en leestekens.
  • Meestal wil men geen onderscheid maken tussen hoofdletters en kleine letters.
  • In veel talen wordt bij de alfabetisering geen onderscheid gemaakt tussen letters met en zonder diakritische tekens. Hierop zijn echter uitzonderingen: in het Spaans komt de Ñ na de N en in Scandinavische talen komen Ä en Ö na de Z. Men moet zich dus ook afvragen of men een vreemde naam wil alfabetiseren volgens de regels in de oorspronkelijke taal of volgens de eigen taal.
  • In sommige talen kent men combinaties van letters die voor de alfabetische volgorde als een enkele letter gelden. In oudere Spaanse woordenboeken zijn dat CH (na de C) en LL (na de L), in het Nederlands (volgens sommigen) IJ. Hierbij geldt weer hetzelfde probleem als met diakritische tekens, waarbij men bijvoorbeeld moet bedenken dat in de plaatsnaam Dijon geen IJ voorkomt, maar wel een I en een J.
  • Personen worden meestal gesorteerd op achternaam en pas daarna op voornaam. (Eerst Jansen, Alfred; daarna komt Jansen, Bob). Het voorvoegsel (van, de) wordt in Nederland bij het sorteren meestal achteraan gezet, zoals: Vries, Jan de.
  • Ook lidwoorden worden meestal genegeerd. Dus: Volkskrant, de.
  • Afkortingen, vooral aan het begin, worden liever vermeden. Men sorteert dus op Laan van Meerdervoort of Meerdervoort, laan van, maar niet op Ln v Meerdervoort.
  • In genealogische lijsten kiest men vaak voor een standaardspelling, omdat namen, vóór de invoering van de Burgerlijke stand nogal willekeurig gespeld werden. Namen als Cleyn, Cleijn, Klein, worden door elkaar gesorteerd alsof er Klein stond.
  • Iets dergelijks geldt ook voor de namen van instellingen. Men maakt bij de sortering geen onderscheid tussen Nederlandse, Neederlandsche en Nederlandsche, aangezien de gebruiker vaak niet weet wat de juiste spelling is.
  • Getallen worden op numerieke volgorde gesorteerd, dus 3 komt eerder dan 13. Voor mensen is dat vanzelfsprekend, maar voor computers is een ingreep nodig om dat te bereiken. Soms bereikt men het door in de invoer voorloopnullen of -spaties te schrijven.

Volgorde

Er worden twee vormen van sorteren onderscheiden:[1]

  • Woord voor woord (vooral in registers)
    De primaire sorteersleutel is het eerste woord, de secundaire het tweede, enz. (bijvoorbeeld: 1) te moede; 2) te rade gaan; 3) ten aanhoren van). Dit komt overeen met gewone lexicografische ordening, mits de spatie gewoon als teken meetelt, en aan het begin van de sorteervolgorde staat, en de woorden door een spatie en niet iets anders worden gescheiden.
  • Letter voor letter (vooral in woordenboeken)
    Spaties worden genegeerd (bijvoorbeeld:
    1. te moede;
    2. ten aanhoren van;
    3. te rade gaan).

De volgorde van de 26 letters is standaard (in kapitalen): A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z. Deze volgorde houdt misschien verband met het feit dat de letters vroeger ook wel als cijfers werden gebruikt. Er is een duidelijke overeenkomst aan te wijzen met de volgorde van andere alfabetten, zoals het Grieks, Hebreeuws en Fenicisch.

Achternamen

Alfabetische volgorde bij namen volgens Taaladvies.net (van de Taalunie) in 2006:

"Voor een gewone lijst met namen (bijvoorbeeld klanten of personeelsleden) adviseren wij om de familienaam in zijn geheel vooraan te laten staan en de spaties te negeren. Wij raden af om rekening te houden met spaties (en eventuele apostrofs) in de familienaam, want dit zou tot gevolg hebben dat een naam als Van den daele vóór Vande Kerckhove komt te staan.

  • Toelichting:
    • bij het alfabetisch ordenen is er in grote trekken keuze tussen letter-voor-letter-ordening of woord-voor-woord-ordening.
      • Bij letter-voor-letter-ordening worden de spaties en apostrofs genegeerd. Daarbij geldt ook dat "niets komt voor iets", dus Vandevel komt voor Vandevelde. Deze ordening komt vooral in woordenboeken voor.
      • Bij woord-voor-woord-ordening staan alle termen die met hetzelfde woord beginnen bij elkaar, en wordt op het tweede woord gealfabetiseerd. Deze ordening is gebruikelijk in registers. Hier wordt het koppelteken genegeerd.
    • In Vlaanderen worden voorvoegsels als de, van, ter, van de, als vaste onderdelen van de naam gezien, zoals onveranderlijk vastgelegd in de burgerlijke stand. Namen met zulke voorvoegsels worden onder de letter van het voorvoegsel geïndexeerd. Luc De Vos staat bij de D, net als Luc Devos.
    • In Nederland worden de voorvoegsels achter de voornaam gezet en klein gespeld. Er wordt dan op het kernwoord geïndexeerd, behalve natuurlijk als het voorvoegsel aan de naam vastzit. Luc De Vos komt hier bij de V, terwijl Luc Devos bij de D komt.
    • Volgens de conventies die gelden voor literatuurlijsten, komen los geschreven voorzetsels en lidwoorden (van, de,..) die deel uitmaken van de familienaam, achteraan te staan.
    • Er is een tendens om de letter-voor-letter-ordening steeds meer voorrang te laten geven, mede omdat computerprogramma's daarop sorteren."

Andere talen

In andere talen met van het Latijn afgeleid alfabet bestaan vaak andere conventies voor de alfabetische volgorde.

Als voorbeeld wordt hier het Hongaars genomen. Hongaars wordt geschreven met een vrijwel fonetisch alfabet van 44 grafemen ("letters").

Om de in het Latijnse alfabet ontbrekende medeklinkers van het Hongaars weer te geven zijn digrafen en trigrafen in gebruik, zoals de digrafen "cs", "dz", "sz", en de trigraaf "dzs". Lange medeklinkers worden dubbel geschreven. De di- en trigrafen krijgen elk een eigen afdeling in het woordenboek, tussen de andere letters. Verdubbelde di- en trigrafen in woorden worden bij het sorteren gerekend als twee "letters". Daarnaast worden lange klinkers onderscheiden van de korte met boven de letter geplaatste diakritische tekens (puntjes of streepjes). Bij het alfabetiseren van woorden in een woordenboek worden korte en lange klinkers bij elkaar gesorteerd.

De alfabetische volgorde (inclusief de letters uit leenwoorden) is:

  • A, Á, a, á
  • B, b
  • C, c
  • Cs, cs (bij verdubbeling: ccs)
  • D, d
  • Dz, dz (bij verdubbeling: ddz)
  • Dzs, dzs (bij verdubbeling: dzzs)
  • E, É, e, é
  • F, f
  • G, g
  • Gy, gy (bij verdubbeling: ggy)
  • H, h
  • I, Í, i, í
  • J, j
  • K, k
  • L, l
  • Ly, ly (bij verdubbeling: lly)
  • M, m
  • N, n
  • Ny, ny (bij verdubbeling: nny)
  • O, Ó, o, ó
  • Ö, Ő, ö, ő
  • P, p
  • Q, q
  • R, r
  • S, s
  • Sz, sz (bij verdubbeling: ssz)
  • T, t
  • Ty, ty (bij verdubbeling: tty)
  • U, Ú, u, ú
  • Ü, Ű, ü, ű
  • V, v
  • W, w
  • X, x
  • Y, y
  • Z, z
  • Zs, zs (bij verdubbeling: zzs)
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.