Artikel top billede

Sådan kan Microsoft censurere dine filer i skyen

Pornofiltre er på hårdt arbejde i Microsofts gratis sky. Selskabet vil dog ikke selv fortælle om teknikken, der for nylig lukkede en brugers konto på grund af et par kravlenisser med blottede baller. ComON forsøger alligevel at gøre status på dagens filter-teknologi.

Ifølge en opgørelse fra slutningen af sidste år er der 17 millioner brugere, der regelmæssigt uploader materiale til deres gratis cloud-tjenste fra Micrsosft, Skydrive.

Tjenesten giver mulighed for at lægge op til 25 GB filer op i skyen, men man må hverken gemme frække fotos, lumre tekster eller noget andet, der kunne tænkes at være stødende for en åbenbart temmelig sart omverden.

At selskabet rent faktisk håndhæver de skrappe bestemmelser, og i nogle tilfælde endda gør det med nidkærhed - kom bag på mange, viste den seneste tids debat på her på sitet.

ComON har derfor forsøgt at finde ud af, hvordan Microsoft sorterer i brugernes data og finder de frække billeder, som er fy-fy. Er det udelukkende et computersystem, der scanner fotos og tegninger, eller har Microsoft ansat mennesker, der sidder og vurderer billedernes lødighed? Og er det de samme mennesker, eller særlige eksperter, der bestemmer, om billederne skal godkendes eller føre til lukningen af ophavsmandens Skydrive-konto?

Spørg en ven

Desværre har Microsoft ikke ønsket at deltage i denne artikel. Hvordan selskabet forvalter kontrollen i med Skydrive er foreløbigt en hemmelighed, meddeler selskabet.

For at få et overblik over, hvordan filter-teknologien i dagens it-univers fungerer, har vi i stedet sprurgt os for hos DTU's Center for billedanalyse, og hos den førende danske udbyder af blokeringssoftware, firmaet Access Innovation, der laver AccessProxy.

Svarene giver et fingerpeg om, hvor effektive de fleste filtre er i dag. Men hvilke computer-kræfter - og hvilke menneskelige ressourcer - Microsoft tager i anvendelse for at spotte en lidt for vovet kravlenisse, kan vi desværre kun gisne om.

"Billedgenkendelse er en udfordring, man gerne har ville løse i mange år, og der er gået mange karrierer i at løse det problem. Derfor er der en myriade af forskellige metoder i spil," siger Henrik Aanæs, lektor på DTU Informatics.

Han er tilknyttet afdelingen for Billedanalyse og Computergrafik, hvor de ansatte for eksempel har brugt kunstig intelligens og billedgenkendelse til at finde atomkraftværker og mulige guldkilder på Grønland ud fra luftfotografier.

Han kender ikke til Microsofts metoder til at filtrere billeder, men ifølge ham bygger meget billedgenkendelse stadig på godt gammeldags computer-knofedt.

"Computere er jo dybest set snotdumme. Men de kan lave rigtig, rigtig, rigtig mange beregninger. Så basalt set tager man nogle billeder, man godt kan lide og nogle man ikke kan lide, så forsøger man at skabe noget statistik ved at køre nogle mere eller mindre intelligente filtre, som man kan lave en klassifikation," siger lektor Henrik Aanæs.

Vi kigger efter pixels og kanter

Hans kollega Anders Lindbjerg Dahl ved DTU Informatics uddyber.

"Den mest simple måde er at kigge efter fordelingen af pixel-intensiteter. Der vil billeder med meget hud blive sorteret fra - og billeder med meget hud vil typisk være karakterisk for pornografi, men andre billeder vil selvfølgelig også risikere at blive sorteret fra," siger Anders Lindbjerg Dahl.

Pixelintensiteten er groft sagt koncentrationens af pixels med den samme farver i et område af billedet. Det er tydeligt at se i billedets histogram, der er en grafisk fremvisning af filens datasæt.  

Et andet basalt element i billedgenkendelse er kantdetektion. Altså at finde de omrids og kanter i billedet, der udgør motiverne.

Firmaet Paraben laver usb-nøglen PornDetectionStick, der kan finde porno på en computer ved at tilkoble usb-porten.
Firmaet forklarer sin teknologi på følgende måde. Skin Detection finder hudfarve og -tekstur i billederne. Background Elimination fjerner baggrundsbilleder, så de vigtigste motiver og symboler er lettere at analysere. Edge Detection stiller skarpt på motivet. Face Detection spotter ansigter. Body Part Layout Decision finder og beslutter, om der er tale om en krop der er upassende.

Vi bruger kontekst

Danske Access Innovation ApS leverer pornofiltre til landets skoler og biblioteker. Firmaets filter AccessProxy har den fordel, at man både kan analysere på selve billedet og teksten, der omgiver det.
Det minimerer fejlmargen, siger direktør Per Kristensen.

Firmaets filter består altså af selve billedfilteret og et kontekstfilter, der for eksempel kan skelne mellem nøgne billeder på sexsider og nøgnebilleder på anatomistudiet på Københavns Universitet. De billeder, som systemet er usikker på, bliver godkendt men sendt til manuel menneskelig behandling. Når menneskelige øjne har vurderet, om det er et accepteret billeder eller ej, sendes det tilbage i det neurale netværk, så systemet hele tiden bliver klogere.

"Men jeg kan forestille mig, at Microsoft er overladt til kun at lave billedanalyse, men der er sket store matematiske fremskridt de seneste år, så i dag kan man dedektere upassende billeder med 99 procent sikkerhed - udelukkende ved at kigge på et billede. Det er faktisk en markant stigning, for vi har lavet det her i 10 år og har i lang tid ligget på en sikkerhed på 90 procent," siger Per Kristensen.

Han vil også mene, at et forholdsvist uskyldigt billede af en kravlenise ville blive opsnappet i firmaets filter, men at det nok kun ville blive udeladt i børneudgaven af filteret og ikke på biblioteker blandt voksne mennesker.

Kulturbetinget-problem

Når den tekniske sikkerhed begynder at blive så stor, så begynder filtreringen at blive et spørgsmål om øjnene, der ser.

"Det bliver jo til et spørgsmål om moral og etik på tværs af landegrænser. I USA er de jo dybt hysteriske og alt skal fjernes. Deres teenagere skal ikke have et sexliv, så de vil gerne lukke alt ude. Men der gør vi altså ind og siger, at her er der tale om uskyldig seksualundervisning, der er ok efter vores normer," siger Per Kristensen.

Af samme grund har Access Innovation ApS historisk ikke mange kunder i USA religiøse områder.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
JN Data A/S
Driver og udvikler it-systemer for finanssektoren.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Compliance og strategisk it-sikkerhed efter DORA

Finansielle koncerner har i snit 85 sikkerhedsløsninger i drift – men er i snit op til 100 dage om at opdage et igangværende cyberangreb. Ydermere viser øvelser, at det typisk tager 4-6 uger at rense og genetablere sikker drift af centrale systemer efter et stort angreb. Fokus for dagen vil derfor være på henholdsvis governance samt om, hvordan du som it-leder i den finansielle sektor skal kunne håndtere fremtidens cybertrusler og arbejde effektivt med sikkerhed på et strategisk niveau.

04. april 2024 | Læs mere


EA Excellence Day

Hvad er det, der gør it-arkitektens rolle så vigtig? Og hvad er det for udfordringer inden for områder som cloud, netværk og datacentre, som fylder hos nogle af landets bedste it-arkitekter lige nu? Det kan du her høre mere om og blive inspireret af på denne konference, hvor du også får lejlighed til at drøfte dette med ligesindede.

16. april 2024 | Læs mere


IAM - din genvej til højere sikkerhed uden uautoriseret adgang og datatab

På denne dag udforsker vi de nyeste strategier, værktøjer og bedste praksis inden for IAM, med det formål at styrke virksomheders sikkerhedsposition og effektiviteten af deres adgangsstyringssystemer og dermed minimere risikoen for uautoriseret adgang og datatab. Og hvordan man kommer fra at overbevise ledelsen til rent faktisk at implementere IAM?

18. april 2024 | Læs mere