APL (programmeertaal)

APL is een programmeertaal. De taal is ontstaan uit een boek dat in 1962 werd geschreven door Kenneth E. Iverson en waarin een wiskundige notatiewijze werd geïntroduceerd. Met enkele aanpassingen werd uit dit voorstel de programmeertaal ontworpen. De naam APL is ontleend aan de titel van het boek: A Programming Language.

APL
Paradigmafunctioneel, multi-paradigma
Verschenen1962-1964
Ontworpen doorKenneth Eugene Iverson
Ontwikkeld doorKenneth Eugene Iverson
Typesysteemdynamisch
ImplementatiesIBM APL2, Dyalog APL, APL2000, Sharp APL
DialectenA+ en anderen
Beïnvloed doorwiskundige notatie
Invloed opJ, K
Portaal    Informatica

Korte geschiedenis

Ontwikkelingen in de tijd

Zoals gezegd, de taal is ontstaan naar aanleiding van de publicatie van Kenneth E. Iverson. Hoewel zijn boek in 1962 uitkwam, ontdekte en ontwikkelde hij de taal al in 1957. Als programmeertaal werd APL al snel populair in vooral de wetenschappelijke en financiële wereld vanwege de krachtige mogelijkheden die de taal biedt om om te gaan met meer-dimensionale arrays met data. Oorspronkelijk draaide APL op (IBM)-mainframes en over de loop van jaren ontstonden er verschillende dialecten van de taal. Na de opkomst van de pc begin jaren 80 van de twintigste eeuw, en de afname van de populariteit van mainframes kwam er een versie van APL uit voor de pc onder de naam APL*Plus/PC van ontwikkelaar STSC (zie eventueel: STSC (Engels)). De eerste versie voor de pc kwam in 1982 op de markt en in het midden van de jaren 80 kwam er ook een 32-bit versie voor de Unix systemen op de markt als APL*Plus/Unix). Tot 1995 bleef STSC APL*Plus verder ontwikkelen, maar verkocht de rechten in dat jaar aan LEX2000 Inc. wat vervolgens in 1999 weer in handen kwam van Cognos. De belangstelling voor en het gebruik van APL zijn de laatste jaren erg teruggelopen, natuurlijk mede onder invloed van de komst van nieuwe ontwikkelomgevingen als C (en de opvolgers C+ / C++) en later Java). Er bestaat nog wel een groep die-hards die APL en varianten/dialecten als A+[1] gebruiken en ontwikkelen.

Van mainframe naar pc

De overgang naar de nieuwe pc-omgeving vereiste natuurlijk wel wat toevoegingen om op een nieuwe manier om te gaan met -vooral- de uitvoer van gegevens en andere specifieke eigenaardigheden van de pc. De eerste versies draaiden (uiteraard) onder MS-DOS en dat waren specifiek single-user- en single-taskomgevingen. Dit vraagt een heel andere benadering van geheugengebruik, en commando's die verband houden met je rechten hoeveel gebruik jouw programma mag maken van de CPU hebben weinig nut. Om portering van bestaande programma's van mainframeomgevingen naar de pc te vereenvoudigen bleven in de pc-versie commando's en functies bestaan die feitelijk niets deden, maar wel de compabiliteit van workspaces verhoogden. (Na de overstap van MS-DOS naar Windows kwam je weer terug in een multi-user- en multi-taskingomgeving; maar wel op een andere wijze dan bij mainframesystemen.)

Huidige situatie

Hoewel het gebruik sterk is teruggelopen, blijft er een enthousiaste groep gebruikers die via internet nieuwe ontwikkelingen gebaseerd op APL ontwikkelt.

  • Vanaf 2001 bestaat het project Aplus of A+ dat vrij verkrijgbaar is onder de GNU General Public License. Het is in 1998 ontwikkeld door Arthur Whitney[2] werkzaam bij de bank Morgan Stanley. Dit bedrijf had over de jaren - zoals veel vergelijkbare bedrijven - veel programmatuur ontwikkeld in APL. Omdat de banken afscheid namen van hun mainframes en gebruik gingen maken van systemen onder SunOS/Solaris zocht men een geschikte APL-omgeving daarvoor, maar die was niet beschikbaar. Omdat het bedrijf de bestaande tools in APL liever niet zou moeten afschaffen dan wel geheel opnieuw zouden moeten schrijven in een andere taal faciliteerden zij de ontwikkeling van A+ door Arthur Whitney en is de bank nog steeds sponsor van het project.[3]
  • VisualAPL en APLNext: nieuwe versies van APL speciaal geschikt voor .NET omgevingen.[4]
  • DialogAPL, een moderne versie van APL voor verschillende Windows en Linux/Unix platformen.[5]
  • IBM APL2: een interpreter voor IBM systemen.[6]
  • MVT4APL: gebruikt een emulator om APL\360 op de pc te kunnen draaien. Hiervoor is de broncode van APL\360 nodig, die gedownload mag worden als men met de voorwaarden akkoord gaat.[7]

Verschillen

De programmeertaal verschilt in veel opzichten van andere talen.

  • Alle ingebouwde functies worden voorgesteld door een teken. De gebruikelijke tekens + en - voor optellen en aftrekken zijn normaal aanwezig, maar ook voor andere functies, zoals faculteit, logaritme en sinus, worden tekens gebruikt. Een APL-programma kan dan ook niet in ASCII gecodeerd worden, maar wel in UNICODE (vanaf 2336h).
  • Er zijn geen sleutelwoorden zoals if en for. Alle voorwaardelijke instructies worden uitgedrukt met de sprongopdracht (voorgesteld door het teken ) met daarachter een expressie die geëvalueerd wordt naar een regelnummer.
  • Letters worden alleen gebruikt om identifiers te maken. De enige uitzondering is de letter E, die ook wordt gebruikt in een getal met drijvende komma. Verder worden letters gebruikt voor systeemopdrachten, zoals LOAD en SAVE, maar die maken geen deel uit van de taal.
  • Er is een apart minteken ¯ voor negatieve getallen, terwijl voor aftrekken en negatie het gewone minteken - wordt gebruikt. Wellicht is APL de enige programmeertaal waarin een negatief getal niet als expressie wordt ingevoerd. Er is verschil tussen ¯5+8 en -5+8, het eerste is 3, het tweede ¯13.
  • In expressies wordt er geen gebruik gemaakt van de gebruikelijke bewerkingsvolgorde van operatoren. Een expressie wordt strikt van rechts naar links uitgevoerd (tenzij er haakjes zijn gebruikt). Vermenigvuldigen heeft dus geen voorrang boven optellen en aftrekken. De expressie 2x6+3 levert daarom in APL 18 op en geen 15, zoals dat in andere programmeertalen en de wiskunde het geval is.
  • Er zijn geen expliciete declaraties. Door een hele array toe te kennen aan een identifier, wordt er geheugenruimte voor die identifier gereserveerd, voldoende ruimte voor de hele array.
  • Hele arrays worden ineens verwerkt. Er zijn functies die een hele array kunnen maken of kopiëren, of die een bewerking kunnen uitvoeren op een array als geheel.
  • De taal is niet gestructureerd. Dat wordt tegenwoordig als een nadeel gezien. De beginselen van het gestructureerd programmeren waren nog niet gebruikelijk in de tijd dat de taal ontworpen werd. Evenwel, doordat de taal hele arrays ineens verwerkt, is het zelden nodig een for- of while-statement te gebruiken.

Een groot voordeel van APL is dus dat er heel compact en snel gecodeerd kan worden. Tegelijkertijd is dat een nadeel. Een APL-source is vaak lastig te lezen vanwege de vele vreemde tekens.

Invoer

Het toetsenbord van een IBM 2741, met APL-tekens. Daaronder de combinaties die kunnen worden gemaakt met behulp van de BS-toets.

Voor het invoeren van APL-symbolen is een speciaal toetsenbord nodig. Het getoonde toetsenbord heeft geen aparte hoofd- en kleine letters: de lettertoetsen geven in combinatie met Shift een symbool.

En nog heeft het toetsenbord te weinig toetsen. Daarom kunnen er ook combinaties (overstrikes) worden gemaakt. Wenst men bijvoorbeeld een uitroepteken om de functie faculteit uit te voeren, dan typt men een aanhalingsteken (shift K), een backspace en een punt. Op dezelfde wijze kunnen ook de letters (andere tekens niet) onderstreept worden.

Er zijn verder diverse APL-editors. Om invoer te vergemakkelijken kan men van veel symbolen de naam invoeren.

Gegevens

Gegevens kunnen, zoals bij elke programmeertaal, uit arrays bestaan. Maar bij APL wordt een array als eenheid beschouwd. Een array kan een willekeurig aantal dimensies hebben. Een array van twee dimensies heet 'matrix', een array van een dimensie heet 'vector'. Een array van nul dimensies bestaat ook, dat is een scalar.

De dimensie van een array kan desnoods de lengte nul of één hebben. Dat lijkt niet erg zinvol, maar een array met een dergelijke dimensie kan door een programma uitgebreid worden.

Een vector (2 of langer) kan als constante worden ingevoerd als een reeks getallen met spaties ertussen, bijvoorbeeld 1 4 9 16 25. Geeft men een enkel getal op, dan is dat een scalar. Wil men een andere array, dan zal men een functie moeten gebruiken.

De bekendste functie om een array te maken is reshape . Bijvoorbeeld, de expressie 2 4⍴9 8 1 12 16 25 14 14 maakt een matrix van 2 bij 4, met de daarachter opgegeven getallen als waarden.

Een andere veel gebruikte functie is de indexgenerator die een vector van natuurlijke getallen maakt. ⍳5 levert dus de vector 1 2 3 4 5. Het ziet er niet erg zinvol uit, maar deze functie is vaak heel handig.

De meeste functies zijn erg vergevingsgezind als een argument de verkeerde vorm heeft. Bijvoorbeeld, de hierboven genoemde functie heeft als linkerargument in principe een vector nodig, maar een scalar is ook goed.

Een array kan, zoals in elke programmeertaal, geïndiceerd worden: A[I]. Zijn er twee of meer indices, dan worden ze gescheiden door ;. Het is beslist niet nodig dat op deze wijze een enkele waarde uit een array wordt gehaald: door een array als index te gebruiken of een index weg te laten is het mogelijk een deel uit een array te selecteren: de expressie R[;3 4] heeft als resultaat een matrix bestaande uit de derde en de vierde kolom van de matrix R - de hele kolommen omdat de eerste index, tussen [ en ; is weggelaten.

Het is zelfs mogelijk een constante vector te indiceren, bijvoorbeeld 1 3 8 5[I].

Voorbeeld

Onderstaande regel is een programma dat alle priemgetallen van 1 tot R vindt:

(∼RεR∘.×R)/R←1↓⍳R

en de beschrijving van rechts naar links:

  1. R maakt een vector met gehele getallen van 1 t/m R, dus 1 2 3 4 5 als R=5
  2. 1↓ 'drop' laat eerste getal weg: 2 3 4 5
  3. assignment operator: dus R is nu 2 3 4 5
  4. ∘.× uitproduct van R en R: dit resulteert in de matrix:
    04 06 08 10
    06 09 12 15
    08 12 16 20
    10 15 20 25
  5. ε onderzoekt van elk getal in de linker parameter 2 3 4 5 of het in de rechter parameter (de matrix) voorkomt. Alleen de 4 komt voor, dus het resultaat is: false false true false (in werkelijkheid 0 0 1 0)
  6. , negatie: dus 1 1 0 1
  7. /: selecteer: aan de hand van de vector 1 1 0 1 worden getallen geselecteerd uit de vector R, dus 2 3 4 5. Het resultaat is de vector 2 3 5. Daarmee is het probleem opgelost.

Functies

Er zijn monadische functies met één argument en dyadische functies met twee argumenten. De syntaxis is zoals gebruikelijk bij de klassieke wiskundige functies, bijvoorbeeld A+B en -B. Deze syntaxis is consequent doorgevoerd voor alle functies, ook voor faculteit (uitroepteken links van de operand, niet rechts) en absolute waarde (verticale streep links van de operand, niet aan weerszijden).

Verder worden de functies onderscheiden in scalaire functies en gemengde functies. De laatste zijn in het bijzonder bedoeld voor het werken met arrays.

Scalaire functies

Worden scalaire functies op een array toegepast, dan werken ze op ieder element van de array apart. Men kan bijvoorbeeld twee arrays bij elkaar optellen, mits beide arrays dezelfde vorm hebben, dus arrays van evenveel dimensies met dezelfde waarden. Het resultaat heeft weer dezelfde vorm. Bijvoorbeeld: 3 5 4 + 2 4 6 geeft 5 9 10. Hierop geldt een uitzondering: men kan een scalaire dyadische functie uitvoeren op twee arrays waarvan een enkel getal is. Bijvoorbeeld: 3 + 2 4 6 geeft 5 7 9.

TekenMathUnicode (hex) Dyadisch Monadisch
+PlusOptellingPlusonveranderd
-MinAftrekkingMinNegatie
×\timesMaalVermenigvuldigingTeken1 als argument positief is, ¯1 als argument negatief is, 0 als argument nul is
÷\divDelenDelingOmgekeerdeOmgekeerde
2308MaximumHet grootste der twee argumentenCeilingHet kleinste gehele getal dat niet kleiner is dan het argument
230aMinimumHet kleinste der twee argumentenFloorHet grootste gehele getal dat niet groter is dan het argument
*2217MachtsverheffenA in de macht Be-machtMacht van e
\circledastLogaritmeLogaritme van B met grondtal ANatuurlijke logaritme
|RestRest bij deling van B door AAbsolute waarde
!Binomiaalcoëfficiënt FaculteitFaculteit (of gammafunctie van B+1)
?zie gemengde functiesWillekeurigWillekeurig getal uit B
ο\circle2394trigonometrische functieshet linker argument (tussen ¯7 en 7) bepaalt welke functie wordt uitgevoerd pi maalproduct van pi
Logische functies: enige toegestane argumenten zijn 1 (true) en 0 (false)
\land22c0 En 
\lor22c1Of
2372Niet en
2371Niet of
\simNietVerandert 1 in 0 en 0 in 1
Vergelijkingen: het resultaat is 1 (true) of 0 (false)
< kleinerKan alleen op getallen worden toegepast 
\le2264kleiner of gelijk
>groter
\ge2265groter of gelijk
=gelijkKan op getallen en tekens worden toegepast
\ne2260ongelijk

Gemengde functies

Gemengde functies zijn speciaal voor het bewerken van arrays. Sommige functies kunnen zelfs van een index worden voorzien. Bijvoorbeeld A↑[I]B. In dit geval wordt de functie AB langs de index I uitgevoerd. De index is dus een geheel getal, behalve bij de functie Lamination. Wordt er geen index opgegeven, dan wordt de functie langs de laatste dimensie uitgevoerd.

TekenMathUnicode (hex) Dyadisch Monadisch
2374ReshapeMaak een array. het linkerargument bepaalt de vorm van de array, de waarden van de array komen uit het rechterargument. DimensieMaakt een vector met de vorm van het rechterargument.
2373ZoekenZoekt de waarden van het rechterargument in het linkerargument en geeft terug op welke positie de waarden voorkomen. Het linker argument moet een vector zijn. IndexMaakt een vector met de natuurlijke getallen van 1 tot n.
,Catenation (indiceerbaar)Een komma koppelt twee arrays aan elkaar tot een nieuwe array. Alle dimensies van de twee arrays moeten identiek zijn, behalve de dimensie waarlangs de functie wordt uitgevoerd. RavelEen monadische komma maakt een vector van het argument.
,Lamination (de index is verplicht en moet een gebroken getal zijn, uitzondering: als beide argumenten scalair zijn is geen index nodig)Koppelt twee arrays aan elkaar tot een nieuwe array. Alle dimensies van de twee arrays moeten identiek zijn, en de nieuwe array heeft een dimensie meer, met de waarde 2. Voor deze functie is een gebroken index nodig. Bijvoorbeeld A,[3.5]B koppelt de arrays tussen de 3e en 4e dimensie aan elkaar.
\uparrow2191Take (indiceerbaar)Neemt een deel uit het tweede argument, namelijk zo veel elementen als door het tweede argument is aangegeven. Is het eerste argument positief, dan worden de eerste N elementen genomen, is het negatief, dan worden de laatste -N elementen genomen.
\downarrow2193Drop (indiceerbaar)Verwijdert een deel uit het tweede argument, namelijk zo veel elementen als door het tweede argument is aangegeven. Is het eerste argument positief, dan worden de eerste N elementen verwijderd, is het negatief, dan worden de laatste -N elementen verwijderd.
/Compressie (indiceerbaar)Het linker argument is een logische vector. De waarden die met een nul corresponderen worden uit het rechter argument verwijderd. Bijvoorbeeld 1 0 1 0 / 2 3 5 4 resulteert in 2 5. Compressie geschiedt langs de laatste dimensie, tenzij een index is opgegeven. Het teken / kan niet monadisch worden gebruikt, maar vormt dan met het voorafgaande teken een gecombineerde functie. Zie volgende tabel.
233fCompressieHetzelfde als /[1]
\Expansie (indiceerbaar)Het linker argument is een logische vector. In het rechterargument worden waarden tussengevoegd op de plaatsen die corresponderen met een nul in het linkerargument. Bijvoorbeeld 1 0 1 0 \ 2 5 resulteert in 2 0 5 0. Expansie geschiedt langs de laatste dimensie, tenzij een index is opgegeven.
2340ExpansieHetzelfde als \[1].
23c3Grade upVector, zodanig dat V[⍋V] gesorteerd is.
Grade downVector, zodanig dat V[⍒V] omgekeerd gesorteerd is.
23c0, 233dRoteren (indiceerbaar)De volgorde van de elementen van het rechterargument wordt opgeschovenOmkerenHet rechterargument wordt andersom gezet
RoterenHetzelfde als ⌽[1]Omkeren
2339MatrixdelingOmgekeerde van inwendig matrixproductInverse van matrix
?DealA getallen, willekeurig gekozen uit Bzie scalaire functies
2336I beamDiverse systeeminformatie, zoals datum, tijd, geheugenruimte, aantal aangemelde gebruikers. Voor de systeembeheerder zijn er nog meer mogelijkheden. I beamDiverse functies, alleen voor de systeembeheerder, sommige met neveneffecten. Onder andere "peek" en "poke" in het geheugen, systeem afsluiten.

Gecombineerde functies

Verder zijn er gecombineerde functies. Hierbij wordt uit een scalaire dyadische functie (of twee scalaire dyadische functies) een nieuwe gemengde functie gemaakt. In de voorbeelden hieronder kan worden vervangen door een willekeurige scalaire dyadische functie.

TekenMathUnicode (hex) Dyadisch Monadisch
⎕/BReductieDe dyadische functie wordt toegepast op de hele vector, bijvoorbeeld +/3 5 8 komt overeen met 3+5+8
⎕⌿B233fHetzelfde als ⎕/[1]B
A∘.⎕B2218Uitwendig productUitwendig product van twee arrays. Elke dyadische scalaire functie kan als worden gebruikt.
A⎕.⎕BInwendig productHet gewone matrixproduct is A+.×B

Oneigenlijke functies

TekenMathUnicode (hex) Dyadisch Monadisch
\gets2190toekenningHet linker argument is een variabele die de waarde krijgt van het rechter argument
\to2192sprongopdrachtDe uitvoering van het programma gaat verder op het aangegeven regelnummer. Is het argument een array, dan geldt het eerste element van de array. Is het argument een lege array, dan gaat de uitvoering verder met de volgende regel. Door expressies te gebruiken zijn voorwaardelijke sprongen mogelijk. Wordt naar regel nul gesprongen, dan wordt de uitvoering van de routine beëindigd.

In- en uitvoer

De laatste bewerking die op een regel wordt uitgevoerd, is vrijwel steeds (sprongopdracht) of (toekenning).

Bijvoorbeeld:
→3+5 spring naar regel 8
A←3+5 A krijgt de waarde 8

Staat er iets anders, bijvoorbeeld 3+5, dan wordt de optelling uitgerekend, maar er staat niet wat er met het resultaat moet gebeuren. In dat geval wordt het resultaat geprint.

Het is ook mogelijk tussenresultaten van een expressie te printen, en wel met de combinatie ⎕←. Bijvoorbeeld: A←3+⎕←5 De waarde 5 wordt geprint en A krijgt de waarde 8.

Wil men in de loop van het programma invoer vragen, dan gebruikt men het teken , maar niet links van een pijltje. Bijvoorbeeld 2.20371×⎕: er wordt om invoer gevraagd en het resultaat wordt met 2.20371 vermenigvuldigd.

Zelfgedefinieerde functies

Het is natuurlijk mogelijk zelf een functie te definiëren. Een zelfgedefinieerde functie kan dyadisch, monadisch en ook niladisch zijn, dat wil zeggen dat er 2, 1, of 0 argumenten zijn.

Een zelfgedefinieerde functie wordt niet aangeduid met een teken maar met een naam, een identifier dus. De syntaxis is echter niet anders: een dyadische functie wordt aangeroepen met de naam en aan weerszijden de beide argumenten en een monadische functie met de naam en daarachter het argument. Deze wijze van aanroepen is heel anders dan in andere programmeertalen.

Als voorbeeld geven we de volgende functie. Het teken duidt de header van de functie aan. Daaronder staat de body, in dit geval slechts een regel, met daarvoor tussen haken het regelnummer.

SOMU VREL V
[1] SOM←(U+V)÷1+(U×V)÷9E16

In de kopregel staat links van het pijltje de variabele die als terugkeerwaarde dient. Rechts daarvan staan drie namen, het is dus een dyadische functie. De middelste daarvan is de naam van de functie en de twee andere zijn de argumenten.

Opslag van data en programma's

APL gaat op een bijzondere manier om met opslag van zowel de gegevens alsook de programmasource zelf in vergelijking met veel andere talen. Je kunt drie soorten bestanden onderscheiden:

  • Workspacefiles: hierin sla je de programmacode op. Standaard is APL een interpretertaal, dus de commando's worden pas op het moment van uitvoering omgezet in machinecode. In de pc-versies van APL hebben deze files de extensie .AWS.
  • APL-datafiles: als je data zoals variabelen wilt opslaan op disk (dan wel wilt lezen vanaf harddisk) gebruik je normaliter de eigen filestructuur van APL, herkenbaar aan de extensie .ASF. Als je data wilt opvragen uit een dergelijk bestand dan alloceer (in APL "TIE" genoemd) je zo'n bestand en koppel je dat aan een nummer. De gegevens zelf zijn vervolgens geïndexeerd opgeslagen. Als je data toevoegt wordt een nieuw indexnummer of segment toegevoegd. Later kun je verwijzen naar die data met het TIE-nummer en het indexnummer. Je kunt die data dan lezen, herschrijven/vervangen of verwijderen.
Elk segment kan één variabele bevatten, maar dat kan van alles zijn. Bijvoorbeeld een alfanumerieke string of een driedimensionale matrix met alleen integers enz. In één file kun je per segment elk type data opslaan.
  • Native-files: dit zijn alle andere bestanden, maar meestal ASCII- of tekst-files. De extensie is irrelevant - daar wordt niets mee gedaan. Net als ASF-files krijgen ze TIE-en en een (negatief) nummer. Het lezen van gegevens doe je met een leescommando waarbij je als argumenten het TIE-nummer geeft gevolgd door type data, het startpunt en de hoeveelheid te lezen gegevens. Via het type argument geef je aan of je de gegevens moet interpreteren als alfanumerieke karakters, integers, reële getallen enz. In de praktijk wordt de eerste soort gebruikt en werk je met leesbare tekst. Het startpunt en de lengte druk je uit in bytes. Als voorbeeld kun je dus van een tekstbestand expliciet 100 tekens inlezen vanaf het 80e karakter. Schrijven naar native-bestanden kan of door toevoeging van data aan het einde van het bestaande bestand of door - net al bij lezen - expliciet op te geven vanaf welk karakter/byte de gegevens herschreven moeten worden.
Als je in een APL-programma gegevens op harddisk wilt opslaan die alleen door (andere) APL-programma's gebruikt zullen worden kies je voor de eigen ASF-files, maar als je gegevens wilt kunnen uitwisselen met andere programma's gebruik je de native-files: je kunt bijvoorbeeld uitkomsten van APL-procedures wegschrijven naar een native-bestand in de vorm van een comma separated file zodat je die data later weer kunt inlezen in een Excel-spreadsheet.

Zie ook

Zie de categorie APL van Wikimedia Commons voor mediabestanden over dit onderwerp.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.