Den amerikanske efterretnings-tjeneste NSA har udgivet en vejledning der beskriver hvordan Word- og PDF-dokumenter kan renses for overflødige metadata inden de sendes ud til offentligheden. De skjulte data i elektroniske dokumenter er et ofte overset problem; de fleste dokumenter indeholder langt flere informationer end det, der umiddelbart er synligt.
Det kan f.eks. være tidligere versioner af teksten, kommentarer, slettede tekstafsnit eller oplysninger om, hvem der oprindelig har oprettet dokumentet.
»Det grundlæggende princip er, at informationer der er skjult eller dækket i et elektronisk dokument næsten altid kan genskabes. Følsomme informationer skal derfor ikke bare skjules visuelt eller gøres ulæselige, men rent faktisk fjernes,« skriver NSA i dokumentet.
En af de mest omtalte sager i Danmark var lækagen i forbindelse med statsministerens nytårstale i 2004. Nytårsdag blev statsministerens tale sendt elektronisk til en række journalister, men ministeriets sekretariat havde undladt at fjerne information om dokumentets tilblivelse. Modtagerne kunne således se, at dokumentet var oprettet af Christopher Arzouni.
NSA's vejledning beskriver på 13 sider hvordan man kan beskytte sig mod denne form for datalækage. Den indeholder en detaljeret beskrivelse af, hvordan et Word-dokument kan renses for fortrolige data og derefter konverteres til PDF-format.
En af de hyppigste fejl er at dække tekst med en sort boks; det fungerer måske på papir, men ikke i et elektronisk dokumentet. Det er heller ikke en god ide at skjule grafiske elementer ved at dække dem med kasser eller anden grafik; i mange tilfælde kan det oprindelige billede nemt genskabes.
Det understreges samtidig at det ikke er nok bare at konvertere dokumentet fra Word til PDF-format; dokumentet skal først renses grundigt for alle metadata.
Klik på linket i højre spalte for at hente NSA's vejledning.