23.01.20 Analyse 8-11 min

Zometeen gooi ik dit artikel door een vertaalmachine. Is dat wel oké?

Correspondent Ouderschap

De beelden bij dit stuk komen uit het project Panta Rhei van kunstenaar Daan Paans. Paans fotografeerde het Gouden Idool – een rekwisiet uit een Indiana Jones-film – en stuurde de foto (die slechts één kant van het beeldje laat zien) naar een beeldhouwer. Die maakte op basis van de foto een replica, waarna Paans een foto van die nieuwe versie naar weer een andere maker stuurde, enzovoort. Meer over Paans' werk onderaan het stuk. Deze foto: Artefact #7: Polyresin with fake golden finish (Guangzhou, China), 2018

Vertaalmachines zoals Google Translate worden beter en beter. Ook ik gebruik kunstmatige intelligentie om mijn werk te vertalen. Wat betekent dit voor vertalers en voor ons lezers?

Dit is wat ik zometeen doe als ik dit artikel af heb.

Eerst gooi ik het door DeepL, een vertaalmachine waar we met De Correspondent sinds kort een abonnement op hebben. Omdat alles wat ik schrijf ook in het Engels verschijnt, ben ik de laatste tijd grootverbruiker.

Vervolgens check ik de vertaling – ik spreek wel een klein woordje over de grens – en pas ik wat dingetjes aan. Ik zeg bijvoorbeeld niet ‘zometeen gooi ik het door een vertaalmachine’, maar ‘ik heb het net door een vertaalmachine gegooid’.

Als ik daarmee klaar ben, stuur ik het door naar mijn collega Shaun, de eindredacteur van The Correspondent. Hij poetst wat zinnen op, bedenkt een gevatte kop en – voilà – we kunnen het ook publiceren op ons Engelstalige zusje.

Maar wie er ontbreekt in deze keten? De vertaler.

En door wie kan zo’n vertaalcomputer bestaan? Jawel, de vertaler.

Vertaalmachines hebben het werk namelijk ‘geleerd’ van echte vertalers. Dus, ironisch genoeg, komt het door vertalers dat ik straks geen vertaler inschakel voor dit stuk.

*Artefact #1: Polyresin (USA/China), 1981*

Dat is niet alleen erg voor hen, maar potentieel ook voor ons. Een vertaler filtert informatie en beïnvloedt daarmee ons begrip van de wereld. Maakt een vertaalmachine een fout – of dat nu in een handleiding, een contract of een literair werk is – dan heeft dat gevolgen.

Is wat ik doe, mijn teksten door kunstmatige intelligentie laten vertalen, dan eigenlijk wel oké?

Translation machines have taken off

Vertaalmachines hebben de laatste jaren een grote vlucht gemaakt. Kon je in het verleden nog hard lachen om de klunzige teksten van Google Translate en collega’s, tegenwoordig zijn de vertalingen vaak indrukwekkend.

Als ik bijvoorbeeld de vorige passage met DeepL vertaal naar het Engels, krijg ik: Translation machines have taken off in recent years. In the past, you could laugh a lot at the clumsy texts from Google Translate and colleagues; nowadays, the translations are often impressive.

Niet slecht, toch?

*Artefact #2: Ceramics (Guadalajara, Mexico), 2017*

*Artefact #3: Ugandan hardwood (Kampala, Uganda), 2017*

Die vooruitgang is niet alleen gevoelsmatig, maar is ook te kwantificeren. Toen Google in 2016 een nieuwe vertaalmethode introduceerde – Google Neural Machine Translation (GNMT) – liet het bedrijf zien dat de nieuwe vertalingen alweer een stuk dichter bij menselijke vertalingen kropen. Tweetalige testpersonen gaven het nieuwe model steevast een betere score dan het oude.

Deze data zullen er inmiddels weer anders uitzien, want vertaalcomputers veranderen alsmaar door, maar feit is: ze worden beter en beter. Hoe zijn de programma’s zo goed geworden? En vormen ze een bedreiging voor vertalers?

Waarom woord voor woord niet werkt

Om die vraag te beantwoorden, moeten we een kijkje nemen onder de motorkap. Hoe werkt een vertaalprogramma?

Laten we bij de eenvoudigste versie beginnen. Je zou de computer voor elk woord het woordenboek kunnen laten pakken en de vertaling van dat ene woord laten opschrijven. Zelfs bij een eenvoudige zin gaat dat al mis.

Het gaat verkeerd omdat de vertaalcomputer geen grammatica begrijpt. Allereerst moet ‘in’ als ‘at’ vertaald worden als het om een restaurant gaat. Maar, erger nog, ‘eten’ is in deze context geen zelfstandig naamwoord (‘food’), maar een werkwoord (‘to eat’).

*Artefact #4: Polylactide (Utrecht, The Netherlands), 2017*

*Artefact #5: Bronze (Athens, Greece), 2017*

Het liefst zou je dus het programma een idee meegeven van hoe taal in elkaar zit. Daar kun je specifieke regels voor opschrijven: dat als een mogelijk werkwoord na ‘gingen’ komt, bijvoorbeeld, het inderdaad een werkwoord is.

Alleen is dat niet altijd het geval: in ‘we gingen eten halen’ is ‘eten’ juist weer een zelfstandig naamwoord. Misschien is een goede extra regel dan dat het woord een werkwoord is als er óók nog een voorzetsel na komt (‘in’).

Je merkt het, het wordt al snel ingewikkeld. Het is lastig – zo niet onmogelijk – om al die grammaticale regels op te schrijven.

En dan is taal ook nog eens onderhevig aan verandering. Regels veranderen en nieuwe woorden als ‘verthuizen’, ‘boomer’ en ‘quantumsuperioriteit’ gooien roet in het eten. Heb je dus net je regelboek af, dan zijn dingen waarschijnlijk alweer anders.

Dan maar zelf leren

Enter: machine learning. In plaats van alles uit te spellen, voer je de computer sets vertalingen, zoals:

‘We gingen eten in het restaurant.’ & ‘We went to eat at the restaurant.’
‘De portier is een invalide.’ & ‘The doorman is disabled.’
‘Oeroeg was mijn vriend.’ & ‘Oeroeg was my friend.’

En zo kun je nog miljoenen voorbeelden meegeven. Van al die combinaties leert een machine-learningprogramma hoe de taal in elkaar zit en geeft het – hoop je – bij een nieuwe zin een kloppende vertaling.

Hoe zo’n programma er precies uitziet? Allereerst is er een ‘neuraal netwerk’, een complex en zelflerend rekensysteem, dat een zin omzet in getallen zodat de computer het kan lezen. Dit netwerk wordt de ‘encoder’ genoemd, omdat het de woorden codeert. Een ander neuraal netwerk – de ‘decoder’ – zet die code om in woorden van een andere taal.

Zo’n encoder-decoderprogramma was tot voor kort je van het (‘you of it’?). Toch werkte het niet vlekkeloos. Als een zin te lang was, bijvoorbeeld, raakte het programma de draad kwijt.

Lijngrafiek die laat zien dat bij langere zinnen, de decoder-encoder minder goed werkt. — *De BLEU-score is een standaard manier om een vertaling te beoordelen. Hoe hoger de score, is het idee, hoe beter de vertaling.*

Een van de redenen: het programma leest maar één kant op, van voren naar achteren. Dus bij het vertalen kijkt het programma terug naar de woorden die zijn geweest en bedenkt op basis daarvan wat de beste vertaling is van het volgende woord.

Alleen, zoals we al zagen bij Herman Kochs ‘gingen eten in’, kan de vertaling van ‘eten’ ook afhangen van het woord dat erna komt. Daarom was de eerste verbetering dat een programma zowel voor- als achteruit kijkt — een neuraal netwerk dat ‘bidirectionaal’ is.

Maar dan is er nog een probleem: het is niet altijd duidelijk welke andere woorden uit een zin belangrijk zijn voor de vertaling van een woord. Wil je ‘restaurant’ vertalen, dan lijkt het niet zo belangrijk wat de andere woorden in de zin zijn. Een restaurant is een restaurant, onafhankelijk van of je er gaat eten of iemand vermoorden, of je er eentje in Waddinxveen of Wichita beschrijft.

Maar de betekenis van ‘eten’, zoals we al zagen, hangt sterk af van ‘gingen’ en ‘in’. Daarom wil je tussen de encoder en de decoder een zogenaamd attention mechanism plaatsen. Dat is wederom een neuraal netwerk, dat ditmaal wordt getraind op het herkennen van woorden die óók belangrijk zijn bij de vertaling van een bepaald woord. Zodat het programma zelf weet dat het ook op ‘gingen’ en ‘in’ moet letten.

En daar heb je, grofweg, een systeem zoals Google Translate. Met een encoder, een decoder, en daartussenin een attention mechanism.

*Dit fijne filmpje van CS Dojo Community legt goed uit hoe Google Translate werkt. Ik heb er dankbaar gebruik van gemaakt voor dit artikel.*

Waar komen de data vandaan?

Maar nu komt de catch (hoe vertaal je dat nu weer?). Zo’n model is prachtig, maar werkt alleen als je data hebt. Bérgen data. De machine moet immers ergens van leren.

Officiële teksten van internationale organisaties lenen zich hier uitstekend voor. Bij de Europese Commissie, bijvoorbeeld, worden teksten door professionele vertalers vertaald in de 24 officiële talen van de EU. En bij de Verenigde Naties verschijnen documenten standaard in het Arabisch, Chinees, Engels, Frans, Russisch en Spaans.

En zo zijn er meer ‘parallelle corpora’, grote verzamelingen van dezelfde zinnen in twee talen. Er is een Bijbelcorpus, een nieuwscorpus, een Wikipediacorpus. En Google, het zal je niet verrassen, gebruikt ook data die het bedrijf zelf heeft verzameld.

Om je een idee te geven van hoe groot zulke datasets zijn: een Engels-Duitse dataset die Google gebruikte in 2016 voor het trainen van het systeem telde 5 miljoen paren zinnen. Voor Engels-Frans was dat zelfs 36 miljoen. Daarmee kun je bijna 5.500 boeken vullen, als je uitgaat van de eerste Harry Potter met 6.619 zinnen.

Maar achter elk van die miljoenen zinnen zit een mens, de vertaler. Iemand die saaie overheidsdocumenten heeft doorgeploeterd, die zich op zijn hoofd heeft gekrabd bij die lastige zin uit de Bijbel, die vakliteratuur erbij heeft gepakt om te weten of je ‘gemiddelde’ nu als ‘average’ of ‘mean’ moet vertalen.

En die vertalers zouden nu hun baan kunnen kwijtraken.

*Artefact #6: Carrara marble (Carrara, Italy), 2018*

*Artefact #7: Polyresin with fake golden finish (Guangzhou, China), 2018*

*Artefact #8: Chihuahua Crystal (Tula, Mexico), 2018*

Van Privet naar Liguster

Hoe bedreigend zijn vertaalmachines voor vertalers? Laten we eens kijken naar het eerste Harry Potterboek, dat vertaald is in tachtig talen, waaronder Schots (Harry Potter and the Philosopher’s Stane) en Latijn (Harrius Potter et Philosophi Lapis).

De eerste zin in het origineel leest: ‘Mr and Mrs Dursley, of number four, Privet Drive, were proud to say that they were perfectly normal, thank you very much.’

Vertaal je dit naar het Nederlands met Google Translate, dan krijg je: ‘De heer en mevrouw Dursley, van nummer vier, Privet Drive, waren trots om te zeggen dat ze volkomen normaal waren, heel erg bedankt.’

DeepL heeft slechts wat kleine verschillen: ‘De heer en mevrouw Dursley, van nummer vier, Privet Drive, waren er trots op te kunnen zeggen dat ze volkomen normaal waren, dank u wel.’

Grammaticaal klopt het, maar dat betekent nog niet dat de vertaling goed is. Neem het ‘thank you very much’ aan het eind van de zin. Dat is niet zozeer het standaard ‘dank u wel’, maar eerder een manier om de toon te zetten. Je voelt direct een wat afgemeten, ietwat vijandige sfeer. En, als je de boeken kent, weet je dat dat goed past bij de Dursleys.

Speaking of, de vertaalcomputer vertaalt Dursley simpelweg als Dursley. Schrijfster J.K. Rowling vernoemde de familie naar een plaatsje in Gloucestershire, in de buurt van waar ze opgroeide. Alleen een Nederlandse lezer zegt het niet zoveel. Net als ‘Privet Drive’.

Kijk eens wat de vertaler Wiebe Buddingh ervan maakt: ‘In de Ligusterlaan, op nummer 4, woonden meneer en mevrouw Duffeling. Ze waren er trots op dat ze doodnormaal waren…’

De Ligusterlaan (want Privet is de Engelse naam voor de Ligusterplant), Duffeling (dat qua klank op Dursley lijkt en tegelijk het duffige karakter van het gezin overbrengt), één zin in tweeën opknippen… Hier is een mens aan het werk, dat zie je meteen.

En hoe zit het met ‘thank you very much’? Buddingh vertaalt het niet, maar plakt de volgende zin – dat in het origineel los staat – eraan vast: ‘...en als er ooit mensen waren geweest van wie je zou denken dat ze nooit bij iets vreemds of geheimzinnigs betrokken zouden raken waren zij het wel, want voor dat soort onzin hadden ze geen tijd.’

Door de woorden ‘dat soort onzin’, in combinatie met de lange zin, heb je alsnog de stijve, hooghartige en onvriendelijke toon te pakken.

*Meer weten over de vertalingen van Harry Potter? Dan is dit filmpje een aanrader.*

Wel verwerken, niet begrijpen

Als je het woord ‘kunstmatige intelligentie’ hoort, denk je we al snel dat de programma’s ook echt kunnen denken. Maar niets is minder waar. Het zijn modellen die uitrekenen welke zin het beste zal zijn. Niet meer en niet minder.

Het verwerkt, maar begrijpt niet. Het begrijpt niet wat ritme is, wat de lezer weet, wat sarcasme is. Voor iets standaards als een weerbericht of een overheidsdocument kan dit nog best goed werken, maar daarna gaat het al snel mis.

De programma’s zijn geweldig om een grove versie te maken van een tekst. Vertalers, de menselijke variant, gebruiken daarom zelf ook zulke software. Ze produceren een tekst en gaan dan aan de slag met de finesse.

Dit is precies wat ik zometeen doe met dit stuk. Het is niet alsof ik het naar het Chinees vertaal en ongecheckt online zet. Ik lees het zelf door en laat het vervolgens door een Engelstalige collega met veel taalgevoel controleren. En we gaan ons samen op ons hoofd krabben hoe we dat stuk over de Ligusterlaan toch moeten vertalen.

Kortom: voor het min of meer mechanische deel van vertalen, vormen AI-programma’s wel degelijk een bedreiging voor de beroepsgroep. Maar voor het andere, creatievere, deel, kunnen we vertalers niet missen, thank you very much.

Meer lezen?

Dit verhaal heb je gratis gelezen, maar het maken van dit verhaal kost tijd en geld. Steun ons en maak meer verhalen mogelijk voorbij de waan van de dag.

Al vanaf het begin worden we gefinancierd door onze leden en zijn we volledig advertentievrij en onafhankelijk. We maken diepgravende, verbindende en optimistische verhalen die inzicht geven in hoe de wereld werkt. Zodat je niet alleen begrijpt wat er gebeurt, maar ook waarom het gebeurt.

Juist nu in tijden van toenemende onzekerheid en wantrouwen is er grote behoefte aan verhalen die voorbij de waan van de dag gaan. Verhalen die verdieping en verbinding brengen. Verhalen niet gericht op het sensationele, maar op het fundamentele. Dankzij onze leden kunnen wij verhalen blijven maken voor zoveel mogelijk mensen. Word ook lid!