Det er efterhånden næsten umuligt at færdes i det offentlige rum uden at blive filmet af skjulte elektroniske øjne. Det Kriminalpræventive Råd har anslået at der er mere end 200.000 overvågningskameraer i operation i Danmark. Dette tal blegner dog i forhold til England, hvor man regner med at der i dag er opsat mere end 4.200.000 overvågningskameraer - og man i gennemsnit bliver filmet 300 gange pr. dag.
Men spørgsmålet er, hvad de mange kameraer egentlig bruges til. Langt de fleste er opsat for at opnå en præventiv virkning. Mange af disse kameraer er enten slet ikke tændt, eller også ses det videomateriale de genererer ganske sjældent af nogen. En anden stor gruppe af overvågningskameraer optager video og gemmer det på en disk, hvor det kan hives frem senere hvis der er sket en forbrydelse.
En meget lille del af alle overvågningskameraer bruges aktivt i den forstand, at der hele tiden sidder personer og kigger på de videosignaler der genereres. Typiske eksempler er sikkerhedsområder, som eksempelvis lufthavne, eller trafikknudepunkter, såsom banegårde og metrostationer. Det er en meget resursekrævende opgave og der foregår derfor meget forskning indenfor automatisk analyse af video. Altså at få en computer og et kamera til automatisk at se og forstå hvad der foregår i et område.
En af de danske forskere der arbejder med forskningsområdet ”Looking at People” er Thomas Moeslund, der er lektor på Institut for Medieteknologi og Ingeniørvidenskab på Aalborg Universitet. Han forsker i, hvordan man kan få computeren til analysere den menneskelige adfærd. Denne teknologi kan bruges til mange formål – herunder at udvikle bedre interaktion mellem menneske og maskine – men det aktuelle projekt fokuserer på analyse af billeder fra overvågningskameraer.
Hvor man tidligere frygtede et Big Brother-samfund, så er der sket et skred i offentlighedens holdning til overvågning, hvor flere er begyndt at omformulere det gamle begreb til:”Big Mother is taking care of you”.
”Hvad end man vælger at kalde det, så er det et faktum, at der i dag bliver opsat flere og flere overvågningskameraer. Et hurtigt kig på lovgivningen de sidste otte år efter 9/11 angrebene viser også tydeligt et skred i holdningen til overvågningskameraer idet det flere og flere steder bliver tilladt at opsætte disse kameraer. Balancegangen mellem den personlige frihed og ideen om tryghed gennem overvågning er i bevægelse,” siger Thomas Moeslund.
Før et automatisk system kan tage stilling til hvad folk i et givet område laver, skal systemet først finde ud af om der overhovedet er mennesker tilstede. En effektiv metode til dette er i princippet den samme, som den metode der bruges i forbindelse med vejrudsigten, hvor studieværten står foran en grøn skærm og vifter med sine arme. Princippet er, at et video kamera tager et billede af personen foran den grønne skærm. Forudsat at personen ikke har grønt tøj på, så kan systemet finde alle grønne pixels og erstatte dem med grafik (et vejrkort).
Tilsvarende gøres når et system skal vurdere, om der er personer i et billede. Først tages et billede af baggrunden uden personer. Når der så efterfølgende tages et billede med personer, så sammenlignes dette med billedet af baggrunden og forskellen (personerne) findes. Dette virker dog kun så længe baggrundsfarverne er forskellige fra personernes tøj, men en række forskellige metoder og billedebehandlingsteknikker kan bruges til delvist at komme uden om denne begrænsning.
Men én er at bestemme, at der er personer i et billede. Noget andet er at afgøre, hvad disse personer foretager sig.
”At finde ud af hvad folk laver er svært – selv for mennesker. Hvis fx lysforholdene er dårlige eller kroppen skjuler en persons aktivitet for kameraet. Derfor er forskningsaktiviteten indenfor automatisk vurdering af hvad folk laver, opbygget omkring et antal antagelser. Fx antages det typisk at der kun er een person til stede, og at personen har front mod kameraet. Et af de store problemer er, at en aktivitet typisk udføres i 3D mens et kamera optager billeder i 2D. Her har en ny teknologi gjort det muligt at optage billeder i 3D, hvilket har åbnet helt nye muligheder,” siger Thomas Moeslund.
Mange af de mennesker der observeres står enten stille eller bevæger sig. Når de bevæger sig kan det være interessant at vide hvordan de bevæger sig, altså deres gangart; går de, jogger de eller løber de? På sigt skal denne information bruges til at vurdere hvad der sker i et område. For eksempel hvis flere personer løber væk fra eller hen imod samme område, så kan det måske indikere at ”noget er sket”. Eller hvis en person går hurtigt igennem et område (måske kombineret med, at personen ofte ser sig tilbage) kan det måske indikere at ”noget er sket”.
Forskningsområdet Looking at People er ikke kun begrænset til overvågning af gader og stræder. Der forskes også indenfor hvordan teknologierne kan bruges i private hjem til f.eks. at detektere hvor personer befinder sig (til fx at styre lyset i et hus) og hvad de laver (er de fx faldet om og har brug for hjælp). I bilindustrien foregår også en del forskning/udvikling indenfor dette område.
Af eksempler kan nævnes automatisk genkendelse af en bilists handlinger (er han/hun ved at falde i søvn, eller er han/hun ved at overhale - selvom der ikke er plads) og genkendelse af hvordan en person sidder i et sæde, således at en evt. aktivering af en airbag sker i forholdt den specifikke person.
Et andet område hvor disse teknologier får stor betydning er indenfor interaktionen mellem mennesker og robotter. I fremtiden vil robotten måske ikke bare være i stand til at genkende dig, men også forstå hvad du foretager dig.
”Selvom disse teknologier og mange flere så småt er på vej ud på markedet, så går der nogle år inden man kan få maskiner, der kan se og forstå lige så godt som vi mennesker kan. Altså er de fleste science fiction film stadig urealistiske om 10-20år, men herefter…,” slutter Thomas Moeslund.