Computervision er et meget bredt forskningsfelt.
Det spænder fra billedanalyse over effektive søgemodeller, der anvendes til at finde billeder i billeddatabaser til intelligente algoritmer, som kan forstå biledstrømmen fra overvågningskameraer.
Specialiseret i fortolkning af videostrømme
James Ferryman, leder af computervision-afdelingen på Reading University, er en af de ledende forskere indenfor den såkaldte tracking og surveillance; sporing og overvågning.
Her anvendes computervision til at skelne mellem mennekser, biler og andre objekter i en billedstrøm og følge interessante objekter.
Netop hjemkommen fra den 11. internationale konference om Computervision, løfter James Ferryman sløret for, hvad der er muligt i dag med avanceret analyse af realtids-video.
"Mennesker kan identificeres og følges i en realtidsbilledstrøm på en række måder. En simpel metode er, at estimere et objekts dimensioner ud fra billedstrømmen, så man efterfølgende kan identificere og følge objektet. Det kunne eksempelvis være at anvende anslået højde for en person, som sporingskarakteristika. Det kan også være mere avanceret. Gangarten - måden folk bevæger sig på - kan anvendes til at følge en person," forklarer Jim Ferryman.
Ansigtsgenkendelse ikke nødvendig
Det er således ikke nødvendigt at identificere en konkret person ved hjælp af eksempelvis ansigtsgenkendelse for at følge en person i en menneskemængde.
"Her på Reading Universitet forsker vi ikke så meget i biometriske metoder som ansigtsgenkendelse, men vi gør mere ud af detektering og sporing af objekter, eksempelvis mennesker og biler," siger James Ferryman.
Han tilføjer, at sikkerhedssystemer ofte vil anvende en kombination af biometri og sporingssystemer som Reading University arbejder med.
Hvis blot et objekt i en billedstrøm kan adskilles fra andre objekter ved nogle foruddefinerede kriterier, så er der mulighed for at følge det pågældende objekt.
Det kan bruges til at følge personer, der på den ene eller anden måde opfører sig mistænkeligt.
"Typisk har man en kontekst for overvågningen. Man ved hvilket område, der er tale om og hvordan det typiske bevægelsesmønter er. På en togstation eller i et butikscenter vil den meste bevægelse skyldes mennesker. Jo mere kontekstviden man har, jo mere viden kan man indkode i systemet om de mest sandsynlige bevægelsesmønstre.
På en parkeringsplads vil en bil køre ind og en person vil stige ud og gå mod udgangen. Hvis en person kommer til parkeringspladsen og går fra bil til bil, er det nok en parkeringsvagt eller en der måske vil bryde ind i bilen," siger James Ferryman.
Systemer lærer selv bevægelsesmønstre
"Ved at anvende kameranetværk kan man spore objekter. Det kan anvendes i eksempelvis lufthavne og metro-stationer. Der kan man spore og følge personers handlinger på de områder," siger James Ferryman.
Systemerne behøves ikke at have foruddefinerede kriterier for bevægelsesmønsteret. Det kan de mere intelligente systemer selv udlede.
"Man behøver ikke at give systemet viden om forventet opførsel. Systemet kan automatisk lære hvordan bevægelsesmønsteret og opførslen er et givent sted. Ved at analysere billedstrømmen over en given tidsperiode, kan systemet definere en model for opførsel," siger James Ferryman.
Robust teknologi
Gennem de sidste fem år er der sket en stor udviklingsmæssig fremgang inden for computervision.
"Teknologien bliver stadig mere moden og robust. Det er nemmere at opfylde systemkravene og kameraerne er bedre nu. For fem år siden ville det have svært at bygge systemerne.
Genkendelse af adfærd og detektering af bevægelse er ganske god. I den kommende tid ligger udfordringen i intentioner og forudsigelighed. Når en person træder ind i et område, skal vi prøve at finde ud af hvad hans intentioner er og forudsige hans opførsel," siger James Ferryman.
I dag anvendes typisk standard Linux-pc'er med 2.8 – 3 GHZ processorer til at håndtere 2-4 kameraer i realtid.
"Der er selvfølgelig en del lavkvalitets-overvågningskameraer, der er i brug. Her må man prøve at korrigere for de ikke så gode billeder i algoritmerne. Det er blevet mere realistisk, hvad vi kan opnå i dag end for nogle år siden," siger James Ferryman.
Kameraer forbundet i netværk kan også være med til at forbedre resultaterne, da et dårligt billede fra et kamera kan korrigeres med billeder fra de andre kameraer.
Standardisering af performance-målinger
James Ferryman har også været involveret i det nyligt overståede EU-projektet Integrated Surveillance of Crowded Areas for Public Safety (ISCAPS).
" I ISCAPS var det meget specifikke sikkerhedsscenarier, vi arbejdede med. Det kunne være at holde øje med efterladt bagage eller røgudvikling, der kunne indikere et terrorangreb," siger James Feryman.
ISCAPS-projektet havde deltagelse af 10 europæiske forskningsinstitutioner og virksomheder.
James Ferryman arbejder for tiden på, at få udviklet en standard til at evaluere de forskellige algoritmers performance.
"Vi ønsker at evaluere performance for tracking systemerne. Der er ingen standard i øjeblikket, og algoritmerne har selvfølgelig varierende performance. En algoritme er måske god til at opsamle karakteristika om en person, mens en anden er bedre til at følge personen gennem længere tid," siger James Ferryman.
Han har derfor gennem et stykke tid arbejdet med Performance Evaluation of Tracking and Surveillance (PETS), i et forsøg på at få defineret evalueringsstandarder for området.
Både akademikere og virksomheder bidrager til evalueringen.
"Vi gør fremskridt. Der er en stor interesse og et stort engagement inden for området," siger James Ferryman, som især finder interesse og engagement hos sikkerhedsfirmaer og regeringer.