Maskinel intelligens er et af tidens hotte områder og selvfølgelig også på teknologiuniversitetet Massachusetts Institute of Technology (MIT), der ligger i Boston.
Her har forskerne udviklet en algoritme, der (næsten) kan forudsige, hvad der sker i den næste scene i en film eller tv-serier.
Læs også: Microsofts it-systemer ikke i tvivl efter data-analyse: Dette land vinder EM i fodbold
Maskinen har set The Office og Desperate Housewives
Løsningen fungerer på to forskellige områder.
Denne ene løsning går ud på at spå om, hvilken handling to mennesker på skærmen vil foretage, eksempelvis om de vil give hånd, kysse eller uddele en high five.
Den anden spådom handler om hvilke objekter, der vil dukke op på skærmen.
Forskerne på Computer Science and Artificial Intelligence Laboratory (CSAIL), der star bag projektet, understreger dog, at forsøget langt fra fungerer perfekt endnu.
Den mest træfsikre del er den, der forudsiger handlinger mellem mennesker, men selv hvor det går bedst, er træfsikkerheden kun på 43 procent.
I videoen nederst, der præsenterer løsningen, går det eksempelvis godt i to ud af tre tilfælde.
Når det handler om forudsigelser af objekter, som dukker frem i den næste scene, er træfsikkerheden væsentlig lavere, Her er det kun 11 procent af gangene, der gættes rigtigt. Det skulle dog stadig være et stort spring frem i forhold til andre løsninger af denne type - et fremskridt på 30 procent.
Det dårligere træf-resultat med objekter forklares med, at der er væsentlig flere muligheder end, når det handler om menneskelige handlinger, der groft sagt kan brydes ned til ganske få forskellige handlemønstre.
Du kan læse mere om projektet på MIT's webside.
Sammenlignet med den menneskelige evne til at forudsige, hvad der sker i næste scene, når mennesker mødes, er maskineriet stadig noget efter. Mennesket kan faktisk forudsige med 71 procents sikkerhed, skriver universitetet.
Det er blandt andet tv-serier som The Office og Desperate Housewives, der har været gennem maskineriet, hvor algoritmen har gennemset 600 timers video for at kunne danne et grundlag for forudsigelserne.
Kram, kys eller kaffe
I første omgang kan det lyde lidt uinteressant - ja faktisk irriterende - at teknologien skal ødelægge handlingen i en tv-serie.
Det er dog heller ikke det primære formål med projektet. Et eksempel på en mere praktisk anvendelse er forudsigelser i forbindelse med overvågningskameraer.
Optræder et bestemt handlingsmønster, kan man eksempelvis forestille sig, at der tilkaldes en politibil eller ambulance automatisk.
Indenfor robot-teknologien kan man ligeledes se en mulighed for anvendelse af teknologien, hvor en robot kan komme på forkant med den udvikling, der sker i den analoge verden.
Projektet fra MIT anvender den såkaldte deep learning og neurale netværk, der er teknikker, som forsøger at efterligne den menneskelige hjerne.
Det er således ikke de enkelte pixels i billedet, der danner grundlag for forudsigelsen men i stedet et forsøg på at danne sig et digitalt overblik over de enkelte elementer i billederne som ansigter, kropssprog eller kaffekopper.
På baggrund af de datamængder, der allerede er tygget igennem, forsøger algoritmerne så at identificere et mønster baseret på objekter og handlinger.
Flere samtidige dele af softwaren forsøger så at spå om hvad, der sker baseret på, hvad den allerede ved om tv-serien. Den handling med størst sandsynlighed bliver konklusionen.