Door: Dagblad De Pers/Emiel van Dongen
Gepubliceerd: vrijdag 19 maart 2010 08:43
Update: vrijdag 19 maart 2010 08:44
Al rammelen ze soms nog wel, vertaalcomputers worden steeds
beter. Een nieuwe stap naar de wereldheerschappij van Google.
‘De gesneden rauwe vis schoenen wenst het. Google groene uien ding.’
Deze rammelende vertaling van een mailtje, afkomstig van een Koreaanse
Google-fan, werd in 2004 uitgespuwd door een automatische vertaaldienst.
Google zag het met lede ogen aan en besloot dat dit beter moest kunnen.
Google Translate kan inmiddels 52 talen aan en wordt honderden
miljoenen keren per week gebruikt. Het is veruit de beste
vertaalcomputer die er is, meent Antal van den Bosch, hoogleraar
Geheugen, taal en betekenis aan de Universiteit van Tilburg en expert op
het gebied van vertaalcomputers. Zo goed als een menselijke vertaling
is het niet, maar voor teksten met vast stramien en woordkeuze, zoals
weerberichten en wetteksten, komt het wel in de buurt.
Vertalen is enorm complex. Decennialang probeerden wetenschappers om
computers de taal te leren, inclusief grammatica en vocabulaire. Tot de
jaren negentig. Toen begon men te snappen dat een statistische aanpak
veel beter werkt. Google sprong daar handig op in en wist zo de absolute
heer en meester van de vertaalcomputer te worden.
Googles straatje
Een statistisch systeem is net een kind: het leert door ervaring.
Voer je zo’n machine steeds meer door mensen vertaalde teksten, dan zal
die met alsmaar betere vertalingen komen. Om zich te kunnen blijven
verbeteren, heeft hij naast een berg vertaalde teksten ook veel
rekencapaciteit nodig. En dat is precies het straatje van Google, aldus
Van den Bosch. ‘Google beschikt over een gigantisch computernetwerk én
ze hebben overal op internet de vingers in.’
Niet ondenkbaar: over een tijdje zullen vertaalcomputers geïntegreerd
zijn in webbrowsers. Tijdens het surfen wordt het internet dan ‘live’
vertaald. Een échte informatiemaatschappij ontstaat, waarin alle
informatie voor iedereen met internet beschikbaar wordt. Het zal een
enorme boost zijn voor de globalisering van de markt. En koren op de
molen van Google, dat definitief onverslaanbaar zal worden.
Het ‘droomprobleem’ voor makers is nu de vertaling van gesproken
tekst. Maar spraakherkenning functioneert nog verre van vlekkeloos. En
dan moet daar ook nog eens de vertaling overheen. Tien jaar geleden
eindigde het onderzoeksproject Verb-mobil met een gesprek tussen Duitse
en Japanse zakenmensen, in hun eigen taal. Via een vertaalcomputer
wisten ze zich redelijk verstaanbaar te maken. Van den Bosch verwacht
dat fatsoenlijke vertaalcomputers voor gesproken taal over twintig jaar
gemeengoed zullen zijn.
Het zal nog wel even duren voordat vertaalcomputers feilloos een
geschreven tekst kunnen vertalen. Van den Bosch: ‘Ze worden in rap tempo
beter. Nu zitten ze nog op het niveau van een menselijke
amateur-vertaler, maar bijvoorbeeld voor weerberichten of handleidingen
is het al semi-professioneel.'