Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 21. april 2005.
Både bogstaver og tal kan gennemtrævles og analyseres på kryds og tværs, men det kniber med talen.
I dagens Google-verden ved de fleste, at computeren kan finde det ønskede blandt millioner af sider fyldt med bogstaver, lige som computeren kan opdage enestående sammenhænge ved at analysere på kryds og tværs af myriader af tal. Men overblikket svigter, når man kommer til talen.
Det problem arbejder to amerikanske firmaer, CallMiner og Nexidia, på at tackle, skriver nyhedstjenesten IDG News Service. De støtter sig til taleteknologifirmaerne ScanSoft og Wittness Systems, hvis software gør det muligt for computeren at genkende de talte ord.
Der er tale om såkaldt Call Mining - en slags minedrift efter værdifulde sammenhænge i bjerge af talte ord.
En løsning kan for eksempel gennemtrævle opkaldene til en help desk eller et call center for udtryk som "tale med en chef". Ringer mange og kræver at tale med chefen om et givent produkt brugt i en given situation, bør det pr. automatik give anledning til, at der kigges nærmere på problemstillingen.
I dag kan sådanne sammenhænge blive overset, hvis ikke call centrets ansatte afkræves en meget detaljeret, tidskrævende registrering. Og at forestille sig, at nogen "manuelt" skulle gennemlytte tusindevis af samtaler for at afdække sammenhæng er nærmest galimatias.
En af CallMiners kunder er et fængsel, der har helt andre problemer end kundeklager på dagsordenen. Her "lytter" softwaren efter usædvanlige ord i en sammenhæng. Hvis et sådant ord begynder at poppe op hyppigt er der en vis sandsynlighed for, at det er et nyt kodeord for kontrabande - for stoffer og andre varer, der ikke bør kunne indføres til landet.
Continental Airlines bruger teknologien til at skabe daglige rapporter om, hvilket mix der er i opkaldene. Continental, der opererer med 50 forskellige kategorier lige fra booking af flyrejse til ændring af placering i flyet, måtte tidligere nøjes med månedlige rapporter.
Talen har altid kostet dyrt at bruge som datakilde, idet der stilles store krav til computerens centrale databehandlingsenhed. På et tidspunkt tog det op mod en time at håndtere blot en times tale. Nu siger visse leverandører, at de kan klare op mod 40 timers tale på en time.
Herhjemme er det begrænset, hvor meget en help desk kan få ud af at bruge talegenkendelse, og Call Mining ses så vidt vides slet ikke. Udbudet af professionel dansk talegenkendelse af almindeligt talt sprog ekstremt begrænset, hvorfor danske løsninger til call centre typisk går på at identificere brug af enkelte, forud fastlagte ord.