Artikel top billede

Sådan kan Microsoft censurere dine filer i skyen

Pornofiltre er på hårdt arbejde i Microsofts gratis sky. Selskabet vil dog ikke selv fortælle om teknikken, der for nylig lukkede en brugers konto på grund af et par kravlenisser med blottede baller. ComON forsøger alligevel at gøre status på dagens filter-teknologi.

Ifølge en opgørelse fra slutningen af sidste år er der 17 millioner brugere, der regelmæssigt uploader materiale til deres gratis cloud-tjenste fra Micrsosft, Skydrive.

Tjenesten giver mulighed for at lægge op til 25 GB filer op i skyen, men man må hverken gemme frække fotos, lumre tekster eller noget andet, der kunne tænkes at være stødende for en åbenbart temmelig sart omverden.

At selskabet rent faktisk håndhæver de skrappe bestemmelser, og i nogle tilfælde endda gør det med nidkærhed - kom bag på mange, viste den seneste tids debat på her på sitet.

ComON har derfor forsøgt at finde ud af, hvordan Microsoft sorterer i brugernes data og finder de frække billeder, som er fy-fy. Er det udelukkende et computersystem, der scanner fotos og tegninger, eller har Microsoft ansat mennesker, der sidder og vurderer billedernes lødighed? Og er det de samme mennesker, eller særlige eksperter, der bestemmer, om billederne skal godkendes eller føre til lukningen af ophavsmandens Skydrive-konto?

Spørg en ven

Desværre har Microsoft ikke ønsket at deltage i denne artikel. Hvordan selskabet forvalter kontrollen i med Skydrive er foreløbigt en hemmelighed, meddeler selskabet.

For at få et overblik over, hvordan filter-teknologien i dagens it-univers fungerer, har vi i stedet sprurgt os for hos DTU's Center for billedanalyse, og hos den førende danske udbyder af blokeringssoftware, firmaet Access Innovation, der laver AccessProxy.

Svarene giver et fingerpeg om, hvor effektive de fleste filtre er i dag. Men hvilke computer-kræfter - og hvilke menneskelige ressourcer - Microsoft tager i anvendelse for at spotte en lidt for vovet kravlenisse, kan vi desværre kun gisne om.

"Billedgenkendelse er en udfordring, man gerne har ville løse i mange år, og der er gået mange karrierer i at løse det problem. Derfor er der en myriade af forskellige metoder i spil," siger Henrik Aanæs, lektor på DTU Informatics.

Han er tilknyttet afdelingen for Billedanalyse og Computergrafik, hvor de ansatte for eksempel har brugt kunstig intelligens og billedgenkendelse til at finde atomkraftværker og mulige guldkilder på Grønland ud fra luftfotografier.

Han kender ikke til Microsofts metoder til at filtrere billeder, men ifølge ham bygger meget billedgenkendelse stadig på godt gammeldags computer-knofedt.

"Computere er jo dybest set snotdumme. Men de kan lave rigtig, rigtig, rigtig mange beregninger. Så basalt set tager man nogle billeder, man godt kan lide og nogle man ikke kan lide, så forsøger man at skabe noget statistik ved at køre nogle mere eller mindre intelligente filtre, som man kan lave en klassifikation," siger lektor Henrik Aanæs.

Vi kigger efter pixels og kanter

Hans kollega Anders Lindbjerg Dahl ved DTU Informatics uddyber.

"Den mest simple måde er at kigge efter fordelingen af pixel-intensiteter. Der vil billeder med meget hud blive sorteret fra - og billeder med meget hud vil typisk være karakterisk for pornografi, men andre billeder vil selvfølgelig også risikere at blive sorteret fra," siger Anders Lindbjerg Dahl.

Pixelintensiteten er groft sagt koncentrationens af pixels med den samme farver i et område af billedet. Det er tydeligt at se i billedets histogram, der er en grafisk fremvisning af filens datasæt.  

Et andet basalt element i billedgenkendelse er kantdetektion. Altså at finde de omrids og kanter i billedet, der udgør motiverne.

Firmaet Paraben laver usb-nøglen PornDetectionStick, der kan finde porno på en computer ved at tilkoble usb-porten.
Firmaet forklarer sin teknologi på følgende måde. Skin Detection finder hudfarve og -tekstur i billederne. Background Elimination fjerner baggrundsbilleder, så de vigtigste motiver og symboler er lettere at analysere. Edge Detection stiller skarpt på motivet. Face Detection spotter ansigter. Body Part Layout Decision finder og beslutter, om der er tale om en krop der er upassende.

Vi bruger kontekst

Danske Access Innovation ApS leverer pornofiltre til landets skoler og biblioteker. Firmaets filter AccessProxy har den fordel, at man både kan analysere på selve billedet og teksten, der omgiver det.
Det minimerer fejlmargen, siger direktør Per Kristensen.

Firmaets filter består altså af selve billedfilteret og et kontekstfilter, der for eksempel kan skelne mellem nøgne billeder på sexsider og nøgnebilleder på anatomistudiet på Københavns Universitet. De billeder, som systemet er usikker på, bliver godkendt men sendt til manuel menneskelig behandling. Når menneskelige øjne har vurderet, om det er et accepteret billeder eller ej, sendes det tilbage i det neurale netværk, så systemet hele tiden bliver klogere.

"Men jeg kan forestille mig, at Microsoft er overladt til kun at lave billedanalyse, men der er sket store matematiske fremskridt de seneste år, så i dag kan man dedektere upassende billeder med 99 procent sikkerhed - udelukkende ved at kigge på et billede. Det er faktisk en markant stigning, for vi har lavet det her i 10 år og har i lang tid ligget på en sikkerhed på 90 procent," siger Per Kristensen.

Han vil også mene, at et forholdsvist uskyldigt billede af en kravlenise ville blive opsnappet i firmaets filter, men at det nok kun ville blive udeladt i børneudgaven af filteret og ikke på biblioteker blandt voksne mennesker.

Kulturbetinget-problem

Når den tekniske sikkerhed begynder at blive så stor, så begynder filtreringen at blive et spørgsmål om øjnene, der ser.

"Det bliver jo til et spørgsmål om moral og etik på tværs af landegrænser. I USA er de jo dybt hysteriske og alt skal fjernes. Deres teenagere skal ikke have et sexliv, så de vil gerne lukke alt ude. Men der gør vi altså ind og siger, at her er der tale om uskyldig seksualundervisning, der er ok efter vores normer," siger Per Kristensen.

Af samme grund har Access Innovation ApS historisk ikke mange kunder i USA religiøse områder.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Højer og Lauritzen ApS
Distributør af pc- og printertilbehør.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Sådan bruger du aktivt AI til at styrke din cybersikkerhedsindsats

Kan AI styrke din cybersikkerhed og forebygge f.eks. ransomwareangreb? Ja – og endda særdeles effektivt! På denne konference kan du blive klogere på, hvordan du i praksis anvender AI til at styrke dit sikkerhedsniveau – og gøre cyberbeskyttelsen mere fleksibel.

27. november 2024 | Læs mere


Styrk din virksomhed med relevant, pålidelig og ansvarlig AI integration med SAP

Kom og få indsigt i, hvordan du bruger AI til at transformere og effektivisere dine arbejdsgange. Vi kigger nærmere på AI-assistenten Joule, der vil revolutionere måden, brugerne interagere med SAP’s forretningssystemer. Og så får du konkret viden om, hvordan du kommer i gang med at bruge AI til at booste din forretningsudvikling.

03. december 2024 | Læs mere


Fyr op under vækst med dataanalyse, AI og innovation

Hvor langt er den datadrevne virksomhed nået i praksis? Det kan du høre om fra virksomheder, som har foretaget transformationen. Du kommer også til at høre, hvordan de anvender AI i processen, hvilke mål de har nået, hvordan de har høstet gevinsterne og hvilke nyskabelser, der er på vej i horisonten.

04. december 2024 | Læs mere