Hoe vertalen computers menselijke taal?

Marguerite Arnold
M
Machinevertaling (MT in het Engels) is een gebied dat zich bevindt tussen taalkunde en technologie. Met andere woorden: het is software die computers helpt bij het vertalen en interpreteren van menselijke taal. Hoewel het niet perfect is, zijn er in de wereld van machinevertalingen recent enorme vorderingen gemaakt.

In de grenzeloze ondernemerswereld en culturele omgevingen, zijn vertalingen steeds vaker een dringende, permanente noodzaak, zelfs voor kleine bedrijven. Niet alleen de globalisering stimuleert deze industrie, maar ook de digitalisering. De internationale markt voor vertalingen is enorm. In 2017 is er grofweg 34 miljard dollar mee gemoeid. Vertalingen zijn echter tijdrovend. Als mensen vertalen, zijn de resultaten nooit exact gelijk. Waarom niet? Omdat er culturele nuances zijn. En er is vaak geen “juiste” manier om iets te vertalen. Interpretaties zijn enorm subjectief en contextueel.
 

 
Computers kunnen taal niet op dezelfde manier interpreteren als mensen, wat machinevertalingen een lastige kwestie maakt. Computer “talen” zijn in principe commando-codes die uiteindelijk neerkomen op één ding: een binair ja/nee; een gaan/niet-gaan begrip van de wereld. Met andere woorden: computertaal is niet subjectief. Kunstmatige intelligentie, of KI, is een studiegebied waarin wordt onderzocht hoe deze functionaliteit kan worden uitgebreid. Machinevertalingen, of MT in het Engels, maken onderdeel uit van deze discussie. Het basisprobleem in een notendop: computers kunnen context niet begrijpen. Ze zijn letterlijk. Dat leidt tot een groot aantal problemen, vooral als het gaat om vertalingen en lokalisering. Het gat wordt echter langzaam gedicht door nieuwe vooruitgang in computer algoritmen en kunstmatige intelligentie. Wat is er nieuw in de wereld van machinevertalingen?
 

 

WAT IS MACHINEVERTALING?

Machinevertaling is een veld van taalkunde, waarin software wordt gebruikt om talen te interpreten en te vertalen. Aan de ene kant zijn vertalingen eigenlijk heel simpel. Een hond is een hond in elke taal. Maar wat de hond doet, of hoe de hond reageert, is een heel andere kwestie. MT kan niet per se het onderscheid maken tussen culturele of lokale context van taal. Als een gevolg hiervan is de interpretatie van bijvoorbeeld uitdrukkingen en gezegden in het beste geval twijfelachtig. Het is al lastig genoeg als mensen elkaars talen moeten interpreteren. Als computers hetzelfde gaan doen, ontstaat er een nog complexere digitale conversatie.
Professionele software voor machinevertalingen biedt meestal maatwerk per beroepsgroep. Ook wordt de output vaak verbeterd door de invoer te beperken. Als de formule-achtige invoer dus hoger is, werkt de machinevertaler beter. Er is minder onduidelijkheid. Daarnaast zijn machinevertalingen sinds de jaren ’50, toen dit voor het eerst een onderwerp van discussie werd waar wetenschappelijke interesse voor bestond, aanzienlijk verbeterd. Er zijn nog steeds personen die beweren dat kunstmatige intelligentie nooit overeenkomt met het menselijke brein. En dat, als een gevolg hiervan, een MT nooit kan rivaliseren met “echte mensen” als het gaat om het herkennen van betekenissen. Recente ontwikkelingen lijken een koers te varen die nog ergens in het midden ligt.
 
Recente ontwikkelingen lijken een koers te varen die nog ergens in het midden ligt.
 

NIEUWE TAALKUNDIGE ALGORITMEN VERANDEREN DE SPELREGELS

Voor alle critici: het veld wordt continu uitgebreid en nieuwe hulpmiddelen worden nog steeds ontwikkeld. Onderzoekers van de University of Liverpool hebben vorig jaar bijvoorbeeld nog een baanbrekende nieuwe tool geïntroduceerd. De onderzoekers ontwikkelden een set algoritmen waarmee computers spraak in de juiste context kunnen plaatsen. Kortom, de algoritmen stellen de computers in staat te reageren zoals een mens dat zou doen. De algoritmen zoeken het woord op en helpen de computer raden wat er naast het woord zou moeten verschijnen. Vervolgens zijn de onderzoekers in staat de werking van de algoritmen bij te houden en te vergelijken. Tot dusver zijn de resultaten extreem interessant en bemoedigend.
 

DE GEVOLGEN

In de toekomst raken computers meer bedreven in het vertalen, opsommen en het in de juiste context plaatsen van taal. Hoewel de technologie duidelijk nog incompleet is, worden er voortdurend vorderingen gemaakt. Het valt echter te betwijfelen of het ooit zover komt dat de technologie overeenkomt met het menselijke inzicht.