Google Translate is geen knullige vertaalmachine meer. Zijn naar het Engels vertaalde teksten naderen het niveau dat studenten moeten hebben om te slagen voor hun toelatingsexamen Engels op de universiteit. Studenten zullen er clandestien hele teksten mee gaan vertalen, denken onderzoekers van de Universiteit van Nottingham. Daarom moeten we nu vooruitblikken: willen we vertaalmachines in het onderwijs verbieden of omarmen?
Je bent er niet trots op maar oké, je gooit wel eens een woord of tekst in Google Translate. Soms voor de grap, om wat steenkolenitaliaans of -spaans te leren. Maar vaak om te kijken hoe je iets zegt in het Engels. Hoe vaker we dit doen, zeggen Michael Groves en Klaus Mundt van de Universiteit van Nottingham, hoe beter deze techniek wordt. Ze ontdekten dat de vertalingen van Google Translate al bijna het niveau halen dat studenten moeten hebben om te slagen voor hun toelatingsexamen Engels op een Britse universiteit.
Studenten zullen deze ontwikkeling oppikken, voorspellen de onderzoekers. Ze gebruiken al online woordenboeken, en het lijkt onvermijdelijk dat als vertaalmachines goed genoeg zijn, ze deze clandestien gaan inzetten om grote stukken tekst van hun moedertaal naar het Engels te vertalen. Voor vakken als Academic Writing bijvoorbeeld, waarvan het doel is om volgens strikte en universele regels academisch te leren schrijven in het Engels. Daarom moeten we nu gaan nadenken: willen we vertaalmachines in het onderwijs verbieden of juist omarmen?
De onderzoekers publiceerden hun verzoek tot reflectie vorige week in English for Specific Purposes. Antal van den Bosch, taaltechnoloog aan de Radboud Universiteit Nijmegen, legt uit hoe Google Translate werkt en welke fouten de machine nu nog maakt. Vindt hij dat Google Translate het taalonderwijs zal verarmen? En aan welke vertaalmachine sleutelt hij zelf?
Pure kansberekening
Nu maakt Google Translate nog allerlei kleine foutjes. Vaak klopt de grammatica niet, ook kiest hij soms het verkeerde woord en leest de tekst niet lekker. “Dat is niet gek,” zegt Van den Bosch. “Veel technologie die iets met natuurlijke taal doet zit nog ruim onder het niveau van ervaren menselijke taalgebruikers. Dat zie je aan vertaalmachines, maar ook aan spraakherkenning en ook aan spellingscorrecties.” Dat komt omdat ons taalgebruik zo gevarieerd is. “Geen enkele zin is hetzelfde – tenzij je plagiaat pleegt – dus een vertaalmachine moet op basis van wat hij wél weet een statistische inschatting maken van hoe hij dénkt dat de zin er in een andere taal uitziet. Veel vertaaltechnieken werken dus puur op kansberekening.”
Google Translate vertaalt niet woord voor woord, zegt Van den Bosch, maar heeft een grote hoeveelheid aan teksten tot zijn beschikking die elkaars vertaling zijn. “Stel je wil een Maleise tekst naar een Engelse vertalen. Op grond van wat hij al heeft, gaat hij op zoek naar woordreeksen die elkaars vertaling zijn. Welke reeks heb ik al eerder gezien, en welke waarschijnlijke vertaling hangt daar aan?” Hoe meer teksten worden ingevoerd, hoe preciezer hij kan vertalen, zegt Van den Bosch. “Meestal zijn er zelfs meerdere vertalingen voor een woordreeks en kan hij er op basis van statistieken een kiezen.” Ook is Google Translate interactief: je kan de machine niet alleen beter maken door teksten in te voeren, maar ook door zijn vertaling zelf te corrigeren.
Al die naamvallen
De fouten die de taalmachine maakt zijn vaak contextgerelateerd. Van den Bosch geeft drie voorbeelden. “Hij vertaalt vaak verkeerd als de grammatica of de woordvorming van de twee talen verschillend is. Als hij van het Engels naar het Duits vertaalt, moet hij opeens rekening houden met vier mogelijke naamvallen. Als er in het Engels the staat, wordt dat in het Duits der, die, das, des, dem, of den. Om de goede keuze te maken moet hij de zinscontext meenemen. Welke functie heeft het woord in de zin? Is het het onderwerp of lijdend voorwerp?” Je hoopt dat hij dit op en duur statistisch oppakt, vervolgt Van den Bosch, maar dat is moeilijk. “Van het Duits naar het Engels vertalen is dus veel makkelijker.”
Ook vindt Google Translate het moeilijk om homoniemen te duiden. “Als je het hebt over een bank, bedoel je dan een zitmeubel of een financiële instelling?“ Maar dat gaat tegenwoordig al best goed, zegt Van den Bosch. “Er staat vaak een ander woord in de buurt dat duidelijk maakt welke vertaling op zijn plaats is. Probeer het maar. Kopieer maar eens een tekst uit de Ikea-catalogus en een brochure van een bank, en kijk of Google Translate de eerste bank als sofa of couch, en de tweede als bank vertaalt.”
Aantrekkelijke teksten fabriceren vindt de vertaalmachine ook lastig. “Academisch taalgebruik, vooral het Engels, zit vol met nuancerende woorden die het ‘geloof’ in iets aangeven: we argue, however, yet, possibly. Omdat deze duiding in elke cultuur en taal anders is, zal een al te letterlijke vertaling leiden tot een lastig leesbare tekst, met bijvoorbeeld een te formele toon.” Ook daar komt verandering in, zegt Van den Bosch. “We ontwikkelen parafraseermachines die bijvoorbeeld moeilijk Engels in eenvoudig Engels omzetten, door die machines te trainen op artikelen uit de Engelse Wikipedia en de vereenvoudigde variant Simple English Wikipedia .”
Nieuwe vertaalmachine
Willen we vertaalmachines überhaupt toelaten in het taalonderwijs? Verarmt dat het leerproces niet? “Niet per se. Het ligt aan de doelen die je voor ogen hebt. Docenten willen de diepte in, zodat studenten de doeltaal echt leren begrijpen. Maar studenten vinden het vaak prima om trucjes leren.” Een leuke vergelijking is de invoer van de rekenmachine, zegt Van den Bosch. “Daar was veel verzet tegen. Maar aan de kern van het vak – het leren van de wiskundige principes – doet de rekenmachine niets af.”
Hijzelf is samen met computerprogrammeur Maarten van Gompel aan het sleutelen aan een nieuwe vertaalmachine die het schrijven in een tweede taal juist ondersteunt. Deze vertaalt slechts kleine fragmenten en met behulp van de tekst die je al hebt. “Als je een verhaal in het Engels aan het schrijven bent, lukt dat vaak aardig. Maar op een gegeven moment loop je vast. Hoe heet zoiets in het Engels? Welk voorzetsel hoort bij dit werkwoord, en hoe gebruik ik deze combinatie in een zin?”
“Wij maken een vertaalmachine waarbij je een tekst in doeltaal kan opschrijven, en alleen dat ene fragment hoeft te vertalen, in de context van de doeltaal. Deze bestaat gek genoeg nog niet. Eigenlijk is het een gewone vertaalmachine – maar we richten het kanon gewoon een andere kant op.”