En mindre revolution er begyndte i sprogteknologiens verden. Standford Universitetet har færdiggjort afgørende forskning i sprogteknoloiske algoritmer, og i sidste uge kunne universitetet offentligøre det nye maskinoversættelsessystem Phrasal.
Hvis – eller rettere: når – det nye system implementeres af Google, vil oversatte tekster give internetbrugere over hele verden en langt mere læseværdig oplevelse – og formentlig langt færre grin over computerens ufrivilligt morsomme sproglige forviklinger.
Det er den danske sprogforsker Anders Søgaard, der har banet vej for universitetets forskning, skriver Politiken i dag.
Søgaard, der er adjunkt ved Københavns Universitet, har stået i spidsen for den forskning, der har dokumenteret og identificeret de mest fundamentale oversættelesesmønstre, som de nuværende systemer ikke kan klare, skriver avisen.
Et af de store problemer for de gænge maskinoversættere er ordbilleder, der brydes op.
Anders Søgaard giver i Politiken et eksempel på problemet: Ordbilledet ”slå til lyd for” kan de fleste maskinoversættere klare ved at kigge på et stort antal tidligere oversættelser og se, at det ofte oversættes med det engelske ”advocate”. Men brydes ordbilledet op, duer den fremgangsmåde ikke. Og opbrydging sker ofte på dansk, eksempelvis hvis man skriver ”Poul slår nu til lyd for”.
”Og det er lige præcist det nye ved Phrasal, at det kan arbejde med ordbilleder, der er brudt op,” forklarer Anders Søgaard til Politiken.
Han forventer ifølge avisen, at Google vil implementere det nye system inden årets udgang.