Computerworld News Service: Talegenkendelsessoftware fra IBM kan fremover også omdanne tale på hindi – en af Indiens hovedsprog – til tekst.
Den indiske regering og lokale myndighedskontorer har længe opfordret til at bruge de lokale sprog i computerteknologien, men udviklingen af hardwareenheder som eksempelvis tastaturer til indiske sprog har vist sig vanskeligt.
Devnagri-alfabetet, som bruges i hindi, har over 40 grundkarakterer samt yderligere tolv tegn til at modificere bogstaverne.
Slag og bevægelser
"Der findes allerede en række tastaturer beregnet til devnagri. Men for at skrive et enkelt bogstav skal brugeren anvende en hel kombination af taster," forklarer Ashish Verma, ledende forsker ved projektet.
Hewlett-Packards indiske laboratorium har allerede designet en touch-pad, som bruger en kombination af slag og bevægelser til hindi-skrift. For at kunne skrive specifikke tegn, der lægger sig op ad grundkaraktererne, skal man anvende særlige bevægelser med et pen-lignende apparat.
Men til forskel fra Hewlett-Packard har IBM baseret sin teknologi på talegenkendelse, fordi det dels er mere enkelt og dels mere anvendeligt for den store andel af indere, som enten er halvanalfabeter eller ikke er vant til computertastaturer.
Send e-mails med stemmen
Ordbogen, som IBM har udviklet særligt til dette system, indeholder mere end 75.000 ord på hindi med muligheden for at føje nye ord til.
Kerneteknologien kan anvendes i applikationer såsom inddatering, tekstbehandling, e-mailafsendelse og hæveautomater. Softwaren kan også bruges til afgive ordrer til computeren og til interaktiv stemmerespons inden for telefoni.
Stor nøjagtighed
Og fordi softwaren understøtter Unicode, kan den integreres i de fleste applikationer fra blandt andre Microsoft.
Ifølge IBM kan programmet genkende mellem 80 og 95 procent af alle ord, mens nøjagtigheden er næsten hundrede procent ved for eksempel hæveautomater, da det nødvendige ordforråd ved de disse transaktioner er begrænset.
Oversat af Pola Rojan