Artikel top billede

Sådan kan Microsoft censurere dine filer i skyen

Pornofiltre er på hårdt arbejde i Microsofts gratis sky. Selskabet vil dog ikke selv fortælle om teknikken, der for nylig lukkede en brugers konto på grund af et par kravlenisser med blottede baller. ComON forsøger alligevel at gøre status på dagens filter-teknologi.

Ifølge en opgørelse fra slutningen af sidste år er der 17 millioner brugere, der regelmæssigt uploader materiale til deres gratis cloud-tjenste fra Micrsosft, Skydrive.

Tjenesten giver mulighed for at lægge op til 25 GB filer op i skyen, men man må hverken gemme frække fotos, lumre tekster eller noget andet, der kunne tænkes at være stødende for en åbenbart temmelig sart omverden.

At selskabet rent faktisk håndhæver de skrappe bestemmelser, og i nogle tilfælde endda gør det med nidkærhed - kom bag på mange, viste den seneste tids debat på her på sitet.

ComON har derfor forsøgt at finde ud af, hvordan Microsoft sorterer i brugernes data og finder de frække billeder, som er fy-fy. Er det udelukkende et computersystem, der scanner fotos og tegninger, eller har Microsoft ansat mennesker, der sidder og vurderer billedernes lødighed? Og er det de samme mennesker, eller særlige eksperter, der bestemmer, om billederne skal godkendes eller føre til lukningen af ophavsmandens Skydrive-konto?

Spørg en ven

Desværre har Microsoft ikke ønsket at deltage i denne artikel. Hvordan selskabet forvalter kontrollen i med Skydrive er foreløbigt en hemmelighed, meddeler selskabet.

For at få et overblik over, hvordan filter-teknologien i dagens it-univers fungerer, har vi i stedet sprurgt os for hos DTU's Center for billedanalyse, og hos den førende danske udbyder af blokeringssoftware, firmaet Access Innovation, der laver AccessProxy.

Svarene giver et fingerpeg om, hvor effektive de fleste filtre er i dag. Men hvilke computer-kræfter - og hvilke menneskelige ressourcer - Microsoft tager i anvendelse for at spotte en lidt for vovet kravlenisse, kan vi desværre kun gisne om.

"Billedgenkendelse er en udfordring, man gerne har ville løse i mange år, og der er gået mange karrierer i at løse det problem. Derfor er der en myriade af forskellige metoder i spil," siger Henrik Aanæs, lektor på DTU Informatics.

Han er tilknyttet afdelingen for Billedanalyse og Computergrafik, hvor de ansatte for eksempel har brugt kunstig intelligens og billedgenkendelse til at finde atomkraftværker og mulige guldkilder på Grønland ud fra luftfotografier.

Han kender ikke til Microsofts metoder til at filtrere billeder, men ifølge ham bygger meget billedgenkendelse stadig på godt gammeldags computer-knofedt.

"Computere er jo dybest set snotdumme. Men de kan lave rigtig, rigtig, rigtig mange beregninger. Så basalt set tager man nogle billeder, man godt kan lide og nogle man ikke kan lide, så forsøger man at skabe noget statistik ved at køre nogle mere eller mindre intelligente filtre, som man kan lave en klassifikation," siger lektor Henrik Aanæs.

Vi kigger efter pixels og kanter

Hans kollega Anders Lindbjerg Dahl ved DTU Informatics uddyber.

"Den mest simple måde er at kigge efter fordelingen af pixel-intensiteter. Der vil billeder med meget hud blive sorteret fra - og billeder med meget hud vil typisk være karakterisk for pornografi, men andre billeder vil selvfølgelig også risikere at blive sorteret fra," siger Anders Lindbjerg Dahl.

Pixelintensiteten er groft sagt koncentrationens af pixels med den samme farver i et område af billedet. Det er tydeligt at se i billedets histogram, der er en grafisk fremvisning af filens datasæt.  

Et andet basalt element i billedgenkendelse er kantdetektion. Altså at finde de omrids og kanter i billedet, der udgør motiverne.

Firmaet Paraben laver usb-nøglen PornDetectionStick, der kan finde porno på en computer ved at tilkoble usb-porten.
Firmaet forklarer sin teknologi på følgende måde. Skin Detection finder hudfarve og -tekstur i billederne. Background Elimination fjerner baggrundsbilleder, så de vigtigste motiver og symboler er lettere at analysere. Edge Detection stiller skarpt på motivet. Face Detection spotter ansigter. Body Part Layout Decision finder og beslutter, om der er tale om en krop der er upassende.

Vi bruger kontekst

Danske Access Innovation ApS leverer pornofiltre til landets skoler og biblioteker. Firmaets filter AccessProxy har den fordel, at man både kan analysere på selve billedet og teksten, der omgiver det.
Det minimerer fejlmargen, siger direktør Per Kristensen.

Firmaets filter består altså af selve billedfilteret og et kontekstfilter, der for eksempel kan skelne mellem nøgne billeder på sexsider og nøgnebilleder på anatomistudiet på Københavns Universitet. De billeder, som systemet er usikker på, bliver godkendt men sendt til manuel menneskelig behandling. Når menneskelige øjne har vurderet, om det er et accepteret billeder eller ej, sendes det tilbage i det neurale netværk, så systemet hele tiden bliver klogere.

"Men jeg kan forestille mig, at Microsoft er overladt til kun at lave billedanalyse, men der er sket store matematiske fremskridt de seneste år, så i dag kan man dedektere upassende billeder med 99 procent sikkerhed - udelukkende ved at kigge på et billede. Det er faktisk en markant stigning, for vi har lavet det her i 10 år og har i lang tid ligget på en sikkerhed på 90 procent," siger Per Kristensen.

Han vil også mene, at et forholdsvist uskyldigt billede af en kravlenise ville blive opsnappet i firmaets filter, men at det nok kun ville blive udeladt i børneudgaven af filteret og ikke på biblioteker blandt voksne mennesker.

Kulturbetinget-problem

Når den tekniske sikkerhed begynder at blive så stor, så begynder filtreringen at blive et spørgsmål om øjnene, der ser.

"Det bliver jo til et spørgsmål om moral og etik på tværs af landegrænser. I USA er de jo dybt hysteriske og alt skal fjernes. Deres teenagere skal ikke have et sexliv, så de vil gerne lukke alt ude. Men der gør vi altså ind og siger, at her er der tale om uskyldig seksualundervisning, der er ok efter vores normer," siger Per Kristensen.

Af samme grund har Access Innovation ApS historisk ikke mange kunder i USA religiøse områder.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Daxiomatic ApS
Salg, udvikling, implementering og servicering af software til ERP

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Computerworld Summit 2021

En moderne digital vindervirksomhed bringer nye teknologier i spil, skaber digital innovation, udnytter data som styringsværktøj og ser verden som én stor markedsplads. Men succes kræver, at du ved, hvor den dyre teknologi kan gøre den største forskel i forretningen. Den kræver, at du ved i hvilken retning den øgede politiske regulering af teknologi og data bevæger sig hen. Og den succes kræver, at du kan udnytte teknologien til at automatisere og skalere til gavn for bundlinjen og budgettet.

26. oktober 2021 | Læs mere


CIO Trends 2021: Sådan ser teknologiradaren ud hos Danmarks bedste CIOs

Teknologien i virksomheder spiller i den grad en større og større rolle, hvor vi er nødt til at stille endnu større krav til, hvordan vi udnytter den, og hvilke muligheder den giver. Spørgsmålet er dog, hvordan man formår at lede en virksomhed, der konstant skal forholde sig til teknologiens forandringer.

16. november 2021 | Læs mere


How to Sikkerhed: Awareness, email fraud og phishing

Man kan aldrig vide sig sikker, for uanset hvor godt man sikrer sig mod hackerangreb og anden svindel, vil hacker næsten altid være et skridt foran. De går efter organisationernes svageste led i håbet om at kunne snyde sig til data, penge eller andet værdifuldt. Få derfor konkrete bud på, hvordan du kan gribe opgaven an og understøtte et effektivt awareness-niveau i din organisation med enkel, men velfungerende, teknologi.

17. november 2021 | Læs mere






White paper
En opskrift på succes: Automatisér, byg videre på den eksisterende infrastruktur – og sæt kurs mod skyen