Microsoft melder nu om et stort gennembrud inden for maskinoversættelse. Nu har man integreret forskellige opgaver som talegenkendelse, oversættelse og talesyntese i ét system, og det er lykkes at reducere fejlprocenten markant.
Det færdige resultat blev præsenteret af Microsofts forskningschef Rick Rashid forleden i Kina. Han stillede sig op på scenen og talte på engelsk, hvorefter det blev oversat med det samme til kinesisk - i hans egen stemme. Pludselig kan man altså holde en tale på et sprog, som man slet ikke forstår.
Det er Microsoft Research, der har udviklet teknologien bag. Den første opgave er at genkende det talte ord. Hidtil har selv de bedste systemer haft en fejlmargen på 20-25 procent på tilfældig tale. Men Microsoft har sammen med forskere fra universitetet i Toronto halveret denne fejlprocent. Ifølge Microsofts egen blog er der tale om det største gennembrud i talegenkendelse siden 1979.
Men det hjælper selvfølgelig også, at computerne er blevet meget hurtigere, og mange har efterhånden digitale assistenter som Siri i lommen, der også klarer talegenkendelse forbløffende godt.
Det næste skridt er selve maskinoversættelsen af teksten. Det er noget, man har arbejdet på i de sidste 60 år, og der er også opnået store fremskridt i den seneste tid. I dag kan søgemaskiner som Google og Bing tilbyde at oversætte websider på mange forskellige sprog.
I Microsofts demonstration har man oversat engelsk til kinesisk i to trin. Den første opgave er at finde den kinesiske genpart til hvert engelsk ord. Det er ikke så svært for en computer. Den anden er at bytte rundt på ordene, så der kommer en fornuftig kinesisk sætning ud af det. Denne opgave er langt sværere.
Det sidste element er så talesyntese - altså at læse teksten op. Her har man fodret systemer med flere timers lydoptagelser med den engelsksprogede taler - i dette tilfælde Rick Rashid - og kombineret det med optagelser af kinesisk tale. Det færdige resultat er, at det lyder, som om det er Rashid selv, der taler kinesisk.
Samtidig understreger Rashid, at systemet ikke er perfekt endnu. Der kan stadig opstå fejl, og nogle af dem kan være ret morsomme. Men han forventer, at man allerede om nogle få år vil være klar med et system, som helt vil fjerne alle sprogbarrierer.
Det ser ud til, at publikum giver ham ret. Der var stort bifald fra de 2.000 fortrinsvis kinesiske studerende efter hans maskinoversatte tale på Microsoft Research Asia's 21st Century Computing konference.