Artikel top billede

Nørgaard: En stor lyserød militær hemmelighed...eller hvorfor big data og algoritmer får dig før eller siden - hvis de vil finde dig

Klumme: Denne klumme indeholder lidt tanker om de-anonymisering og en dyb, militær hemmelighed. Måske to. Ja, OK, også en it-hemmelighed, som jeg har lovet at holde for mig selv.

Denne klumme er et debatindlæg og er alene udtryk for skribentens synspunkter.

Lad os begynde med den militære hemmelighed: Camouflage-tøj er lig med modetøj i udendørs- og militær-kredse.

Der fås Mossy Oak-tøj, der er supergodt til at gemme sig i egetræsskove med mos på træerne.

Der findes den superseje, patenterede finske camouflage (som kan vendes, så man har snecamo på i stedet) - som russiske specialstyrker i øvrigt har piratkopieret. Der findes alt muligt.

I slutningen af 1970'erne blev det besluttet, at danske soldater ikke mere kunne gemme sig i den olivengrønne uniform kaldet M/58, og man satte en dygtig mand på opgaven.

Jeg vil lave en tv-serie om den slags beslutninger

Den store plan dengang var, at hovedslagstyrken, kaldet Jyske Division, skulle forskyde ned til Nordtyskland og der møde de fremstormende styrker fra øst på Lüneburger Heide og den slags steder.

Så manden brugte nogen tid på at fotografere og analysere det nordtyske område og skrev så en vederhæftig rapport, hvori han anbefalede et camouflagemønster bestående af lysegrønt, mørkegrønt, sort og brunt.

Efter en grundig sagsbehandling i FKO (Forsvarskommandoen) fik han følgende besked (jeg har forkortet den): "Vi har ikke råd til fire-farvetryk. Du må fjerne en af farverne."

Jeg har en drøm om at lave en TV-serie om den slags beslutninger, og et fast indslag skal være fagkundskabens ansigtsudtryk, når de bliver mødt af den slags logik fra bureaukrater.

Han fravalgte brun. Han lever stadig, så man burde måske spørge ham, hvordan det føltes efter alt forarbejdet.

Derfor blev den danske camouflageuniform M/84 trefarvet. Alle blev glade, fordi den så sejere ud end den monokrome M/58. Pludselig kunne man ikke mere gemme sig i M/58'eren.

Så gik der mode i den

Nogle år senere gik der så mode i den i Tyskland, og de var så kloge, at de genbrugte den danske research - og de havde råd til fire farver.

De valgte så pletter fremfor plamager. Hvorefter nogle behjertede mennesker påpegede ligheden med den camouflage, som Waffen SS anvendte fra 1942 på Østfronten.

Det tog vist toppen af begejstringen i den tyske armé.

Så blev det moderne tider, og i første omgang fik de danske soldater udleveret forskellige ørkencamo-uniformer mv. før man overgav sig til ... er i klar?... MULTICAM!

Multicam var og er en herlig ting. Den skal kunne sløre soldater i hele Verden. I al slags terræn. Og det er en ordre. Så det kan den naturligvis. Basta.

For kritiske øjne kan den forekomme ret lys i en dansk skov, men det er bare fordi vi altid skal kritisere, ja det er så.

Den er indført overalt i det danske forsvar. Den vil derfor blive afløst af noget nyt i de kommende år i det danske forsvar - mest fordi man ikke gider betale royalties til den amerikaner, der fik fem millioner dollas for at tegne Multicam-mønstret og tegne patent på det.

Så man kan sige, at anskaffelsen af M/84-systemet var et udtryk for, at man prøvede at spare nogle penge i Forsvaret idet man reducerede antal farver med 25 prcent.

Nu kommer hemmeligheden:

Da man så tillige skulle anskaffe en toilettaske til soldaterne henvendte man sig til det firma, der lavede alt, hvad danske soldater bar ting i og med, og de var ærlige nok til at spørge: "Hvorfor går I ikke bare ned i en billigbutik og køber en syg stak billige toilettasker i et eller anden farve? De behøver vel strengt taget ikke være i camouflage?

Jo!

Lyserød toilettaske

Nuvel. Så gik de to indehavere af biksen ned i billigbutikken Booth og købte en - og dét er hemmeligheden der aldrig må røbes - LYSERØD toilettaske til, siger og skriver, 1.99 pund.

Den kopierede de så i det kraftige M/84-materiale og solgte til det danske forsvar i stort tal og til mange penge.

De søde mennesker, jeg har omtalt ovenfor, skal forblive anonyme. De mente det alle godt. Men ud fra det, jeg har skrevet ovenfor, kan de garanteret nemt findes af ihærdige sjæle.

Og det er en af pointerne ved det moderne begreb de-anonymisering: Det kan være en rigtig god intention, der ligger bag anonymisering. Den kan være foretaget af mennesker, der er gode mod dyr og varmt klædt på - men mange gange er der ikke tale om reel anonymisering.

De-anonymisering er kunsten af identificere folk ud fra et eller flere anonymiserede datasæt.

Vi havde blandt andet et kæmpe hul via Virk.dk og hvad det nu hedder, idet mennesker med hemmelig adresse kunne findes derinde, hvis de havde et personligt selskab.

Det benyttede rockere og andre kriminelle i stor stil til at finde folk, de ville have has på. Det er forhåbentligt lukket nu.

Nemt at identificere en person

Det sidste nye er, at sikkerhedsforskere har vist, at ud fra blot tre eller fire datapunkter i forskellige anonymiserede datasæt kan man identificere en person. Google og Facebook bruger kun pseudoanonymisering, for ellers kan de ikke sælge dine data til dine konkurrenter og tjene kassen på det (Facebook har i øvrigt den korrekte overskudsgrad, nemlig 42).

I vores rejse gennem det nye kontinent jeg kalder datAmerika er GDPR den første, rå lov, der skal sikre bare et minimum af lov og orden i den vilde verden, og noget af det næste vi skal have set på er problemerne omkring anonymisering og de-anonymisering.

Lad det være sagt: Justitsministeriet og mange andre offenlige instanser lyver direkte, når de påstår, at de har anonymiseret datasæt af forskellig art.

Det har de overhovedet ikke. De har pseudoanonymiseret, har de. De har taget et datasæt og ud fra dette lavet et anonymiseret - eller som oftest pseudoanonymiseret - datasæt de stiller til rådighed.

Så det oprindelige datasæt - det kunne være hvad elever har registreret til en prøve eller lignende - består og kan anvendes og hackes og stjæles og misbruges og samkøres.

Privacy by design er vejen frem

Privacy By Design er det vi skal lære at kræve alle steder.

Det begreb bliver stort og meget moderne i de kommende år.

GDPR har taget de første, fremragende spadestik til det, idet de for eksempel kræver, at man ALTID skal minimere datamængden til den mindst mulige, der kræves for at løse en opgave. Altid. Uden undtagelser.

Se, dét er et godt eksempel på lovgivning, der tilsigter at hjælpe borgerne og ikke magthaverne. Det løser ikke hele problemet, men det mindsker det.

Der er skrevet en masse om privacy by design og hvordan man gør det. Læs det. PROSA og andre gode it-kræfter taler det op, og det er godt.

Er det nemt og enkelt? Næh. Men det er jo godt, for så stiger BNP og masser af velbetalte jobs med nye, underlige titler vil skyde op.

MEN:

Min fantastiske ven Keld Norman hævder, at der ikke findes måder at undgå de-anonymisering på. For at citere ham alt andet end ordret:

"Big data og algoritmer får dig før eller siden, hvis de vil finde dig. Og hvis du prøver at skjule dig ved ikke at anvende for eksempel smartphone, Google eller Facebook vækker du opsigt og kan så findes, fordi du skiller dig ud..."

Jeg elsker Keld. Han er så dejlig datadrevet. Han var inspirationen til karakteren Data i Star Trek, tror jeg.

Det ER reelt muligt

Jeg har så til gengæld fundet ud af via en anden ven, at ÆGTE anonymisering af data faktisk er reelt muligt.

Ægte anonymisering betyder, at man ikke kan de-anonymisere - heller ikke ved anvendelse af supplerende datasæt.

Med andre ord: Ægte one-way. Teknikken er simpel, hvis man kender den, og er beskrevet i litteraturen, men jeg har (og det er ikke for at virke kostbar) lovet ikke at skrive om det offentligt.

Så det må forblive en hemmelighed. Undskyld. Men vid, at det kan gøres, og at det kan godkendes af myndighederne.

Så vi skal alle sammen lære en masse nyt for at kunne færdes i datAmerika, og vi skal lære at stille krav til myndigheder og virksomheder om ægte anonymisering.

Blandt andet har vi et reelt problem med det landsdækkende DNA-register, som de i mere eller mindre hemmelighed bygger op i disse år.

Alle nyfødte er indblandet

Jeg kan til almindelig information oplyse, at alle nyfødte får taget en blodprøve, som sendes til en biks, som vi solgte til en saudiarabisk halvbandit for en slik for et par år siden - og han sælger i øvrigt den info til de store, amerikanske DNA-database-firmaer...

Og den info er ikke anonymiseret.

Det betyder, at der er tale om det, som Stephan Engberg og andre korrekt kalder "The Genocide Database", fordi man med den ved hånden kan identificere alle, der ikke kan tåle alkohol og køre dem ud af landet i togvogne (fair nok, synes jeg).

Eller alle, der ikke har den biologiske far, som mor påstår, at de har (det er vistnok cirka 12 procent af befolkningen i Danmark, 20 procent i Manchester og 50 procent blandt chimpanser).

Eller alle, der er adopterede.

Eller alle dem, som Jakob Paludannet ikke kan lide.

Eller alle de, der bliver ekstra gamle og derfor skal betale mere i skat fra starten.

(Skulle I ligge inde med oplysninger og supplerende information, som kunne være interessant i denne sammenhæng (dvs. noget, der vedrører camouflage eller de-anonymisering), hører jeg gerne fra jer - evt. via mail på mogens.langballe.noergaard@gmail.com.)

'Klummer er læsernes platform på Computerworld til at fortælle de bedste historier, og samtidig er det vores meget populære og meget læste forum for videndeling.

Har du en god historie eller har du specialviden, som du synes trænger til at blive delt?

Læs vores klumme-guidelines og send os noget tekst, så kontakter vi dig - måske bliver du en del af vores hurtigt voksende korps af klummeskribenter.