Computervertaling

Een computervertaling is een vertaling die met een computerprogramma gemaakt is. Dit programma kan gebruikt worden voor losse woorden of hele teksten. Met de huidige stand van de vertaalsoftware vergt het laatste doorgaans echter nog veel nabewerking. Er is al veel onderzoek verricht naar de mogelijkheid om vertalingen helemaal door een computer te laten maken, bijvoorbeeld met behulp van het programma SYSTRAN. Tot dusver heeft een dergelijke computervertaling echter nog geen goede vertaalde tekst opgeleverd. Wel kan een computervertaling soms een basis vormen voor de vertaler om zelf een goede tekst te redigeren. Dit is onder meer het geval bij teksten met veel vakspecifieke termen zoals bij (ontwerpen van) EU-richtlijnen.

Als voorbeeld is hieronder een computervertaling naar het Nederlands weergegeven, van het Engelstalige Wikipedia-artikel Daisuke Matsuzaka (een Japans sporter).

De oorspronkelijke Engelse tekst:

Daisuke Matsuzaka(松坂大輔,born in September 13, 1980) is a right-handed pitcher who plays in Seibu Lions since 1999.
Moreover, the thing of those who will be born by his wonderful activity in the 1980 fiscal year (from April 1, 1980 to following March 31, 1981) may be called Matsusaka generation(松坂世代:Matsuzaka sedai).
He was a great pitcher when he was in Yokohama High School, including a no-hitter in national high school baseball championship. When he graduated high school, he joined the Seibu Lions.
In his first season(1999), he had 16 wins and 5 losses, making him the rookie of the year. At the same time, he became the ace of Seibu Lions.
Last season(2003), he had 16 wins and 7 loss, and got the Pacific League ERA title(2.83). He also was chosen for Japan National Baseball Team, and pitched against South Korea.

De computervertaling:

Daisuke Matsuzaka (松坂大辅, geboren op 13 september 1980) is een recht handen werper die speelt in Seibu Lions sinds 1999.
Bovendien is de zaak van degenen die worden geboren op door zijn prachtige activiteit in het fiscale jaar 1980 (vanaf 1 april 1980 tot na 31 maart 1981) kan een beroep worden Matsusaka generatie (松坂世代: Matsuzaka sedai).
Hij was een groot werper als hij was in Yokohama High School, met inbegrip van een no-hitter in de nationale high school baseball kampioenschap. Toen hij afgestudeerd middelbare school ging hij naar het Seibu Lions.
In zijn eerste seizoen (1999) had hij 16 overwinningen en 5 verliezen, waardoor hij de rookie van het jaar. Tegelijkertijd heeft hij het aas van de Seibu Lions.
Vorig seizoen (2003) had hij 16 overwinningen en 7 verlies, en kreeg de Pacific League ERA title (2.83). Hij werd ook gekozen voor Japan honkbalteam, en hellende tegen Zuid-Korea.

Geschiedenis en technieken

De geschiedenis van automatisch vertalen gaat terug tot de jaren 40, toen het een van de eerste gedroomde toepassingen van de elektronische computer was. In de jaren 50 werden enkele demonstratieprogramma's gebouwd, maar met de destijds gebruikte technieken lukte het niet een robuust systeem te bouwen. Aanvankelijk gebruikte men eenvoudige vertaalwoordenboeken en met de hand opgestelde regels om woorden te ordenen. Latere pogingen tot vertaalsystemen omvatten volledige syntactische analyses en regels om deze om te zetten. Sommige vertaalsystemen maakten daarbij gebruik van een formele tussentaal of interlingua, zodat in principe talen in elkaar omgezet konden worden door regelstelsels, in plaats van . Deze pogingen strandden echter vaak op de complexiteit van de interlingua.

De meeste vertaalsystemen werken tegenwoordig op basis van statistieken van alignments tussen zinnen in meertalige corpora. Hiermee worden woorden en korte frases in de brontaal gekoppeld aan de frases die zij 'oproepen' in de doeltaal. Pas in de jaren 90 kwamen de eerste vertaalsystemen op de markt die op basis van deze statistische methoden fatsoenlijke prestaties leverden.

Beschikbare software

Met de volgende softwarepakketten (en de nodige taalkundige en programmeerkennis) kan men zelf vertaalsystemen bouwen.

Zie ook

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.