Foto: Kaare Danielsen

Her opbevarer Rigsarkivet alle dokumenter og hele vores historie: Men alle data skal konverteres hvert 5-10 år

Reportage: Hvordan gemmer man digitale data i 1.000 år? Og hvor mange terabyte går der på en hyldekilometer? Computerworld har været på besøg i Rigsarkivet, hvor højlageret rummer 250 kilometer hylder med mapper.

De fleste kender Rigsarkivet fra julekalenderen med Pyrus som arkivnisse og Jesper Klein som rigsarkivar.

Virkelighedens rigsarkiv er en høj bygning på Kalvebod Brygge 34 i København med vinduer i den ene side og ikke i den anden.

Den rummer alle de dokumenter, som statsadministrationen har produceret gennem tiderne. Det ældste dokument er et pavebrev fra 1100-tallet.

Derefter kommer alle kirkebøgerne og folketællingerne. Og senere alle de sager, som statsadministrationen har produceret. De ligger i det så kaldte højlager, der er en 12 meter høj tempereret lagerbygning.

Rummer alle danskernes historie
Sagsmapperne rummer alle danskernes historie. Fra fødsler, bryllupper og dødsfald, til selvangivelser og tinglysninger. De bliver gemt til evig tid i tilfælde af, at en forsker eller en anden skulle få lyst til at kigge i dem.

Det sker cirka 100 gange om dagen, at man skal finde et dokument frem. Det foregår med et særligt køretøj, der kan løfte en op, så man kan hive den rette mappe ned fra hylderne.

Alt i alt rummer højlageret 250 kilometer hylder med mapper.

De senere år er lageret dog begyndt at blive digitalt. Og det giver særlige udfordringer.

For hvordan kan man gemme data i et format, som man kan læse igen om 100 eller måske 1.000 år, ligesom man kan med pavebrevet?

For de fleste it-folk af en vis alder har sikkert oplevet at have 3” eller 5” tommer-disketter eller sågar hulkort eller hulbånd, som man ikke længere kan læse nogen steder.

Første udfordring er at få gemt data i et arkiverbart standardformat. De fleste data faktisk bliver gemt som billedfiler, hvilket naturligvis betyder, at det vil blive svært for eftertiden at lave statistikker eller søge efter data på tværs af dokumenter.

Næste udfordring er at gemme data på et fysisk format.

Men i modsætning til pavebrevet og grundloven, som man stadig kan læse, så er der ikke nogen der forventer, at man kan læse et dataformat efter 100 år. Det er derfor nødvendigt at konvertere data hvert femte eller 10. år.

Man har allerede konverteret alle data to gange, fra tape til CD-ROM, og senest fra CD-ROM til DVD.

Bluray-kopi sendes til Aarhus
I dag gemmes alle data i tre eksemplarer, et eksemplar på tape og to på Blu-ray, så man har både et optisk og et magnetisk medie.

Den ene Blu-raykopi bliver sendt til Det Kgl. Bibiliotek i Aarhus.

Denne kopi er krypteret, da man ikke helt stoler på aarhusianerne.

Koden bliver opbevaret i et pengeskab et hemmeligt sted i Danmark, så man vil kunne gendanne dokumenterne, hvis København bliver ramt at en atombombe eller erobret af fjenden.

Man ved jo aldrig hvad der kan ske, når man skal tænke 1.000 år frem.

Alle de digitale data, der er kommet til siden det digitale arkiv blev etableret i 1973, fylder i alt 190 terabyte, hvilket ikke lyder af så meget.

I Norge har man bygget et datacenter, der rummer hele Norges kulturarv inde i et atomsikkert bjerg. De ligger i enorme, mørke rum med harddiske, der står stille det meste af tiden, indtil der er nogen, der læser fra dem.

I Danmark har man ikke prioriteret at lægge data på harddiske, fordi der har endnu ikke været et særligt stort behov fra at læse fra de digitale arkiver.

Uden særlig tilladelse kan man nemlig tidligst få adgang til de almindelige dokumenter efter 20 år, dokumenter med personoplysninger efter 75 år.

Der er dog særlig interesse for kirkebøgerne, der bruges til slægtsforskning, så Rigsarkivet er i gang med at indscanne de gamle kirkebøger og folketællinger og lægge dem på internettet.

Og hvor mange terabyte går der så på en hyldekilometer?

Hvis vi antager at 100 ark papir fylder 1 cm og der er skrevet på begge sider og en indscannet side fylder cirka 50Kb, så svarer en hyldekilometer cirka til en terabyte.

Med 190 terabyte og 250 hyldekilometer vil det digitale arkiv overgå det fysiske omkring 2020.

Læs også:Rigsarkivet har lagt folketællingen fra 1940 online: Se hvem der boede i dit hus for 76 år siden




Ytringer på debatten er afsenders eget ansvar - læs debatreglerne
Indlæser debat...

Premium
Afsløring: KMD kalder det "ny viden" - men selskabet har kendt til problematisk udflytning af persondata siden 2014
KMD har hidtil fastholdt, at det har været "ny viden" for selskabet, at følsomme persondata fra landets jobcentre ikke må sendes ud af landet. En SKI-aftale viser dog, at KMD har kendt til reglerne siden 2014. "Selv i det omfang, at KMD ikke har haft de fornødne juridiske kompetencer, burde alle advarselslamper da have blinket i forhold til teksten i SKI-aftalen," lyder det fra juridisk ekspert.
Computerworld
Google indfører Android-gebyr efter kæmpe EU-bøde: Android-producenter skal nu betale for brug af Google-tjenester
Efter sommerens kæmpe EU-bøde indfører Google licensbetaling for Android-producenters brug af blandt andet Play Store. Men "Android vil forblive gratis og open source," lyder det fra selskabet.
CIO
Forleden reparerede en mekaniker min bil: Det kostede 4.200 kroner, som min hjerne snød mig til at betale med et smil
De rationelle it-beslutninger du træffer er måske en illusion. Det lærte jeg da min bil gik i stykker og min hjerne snød mig til at tro, at alt var fint. Til gengæld fandt jeg tre fælder dine it-beslutninger kan falde i.
Job & Karriere
Her er syv job-annoncer der overrasker med helt usædvanlige overskrifter
Der er mange ledige it-job i øjeblikket. It-jobbank har her fundet syv spændende stillinger, der har det til fælles, at annoncen har en utraditionel overskrift.
White paper
Test jeres it-sikkerhed gratis i 14 dage med Cisco AMP - og få rapport med resultaterne direkte i din indbakke
Du kan nu - kvit og frit - teste banebrydende it-sikkerhedsløsninger fra Cisco. Cisco AMP er en Advanced Malware Protection-løsning, som sikrer dig kontrol med alle jeres endepunkter. Mens klassisk antivirus-software reagerer på filer, som umiddelbart genkendes som farlige, bliver AMP ved med at analysere potentielt farlige filer i hele netværket. Helt automatisk og 24 timer i døgnet. Efter 14 dage modtager du en rapport direkte i din indbakke med identificeret, blokeret og fjernet malware samt en vurdering af sikkerhedsniveauet i jeres endepunkter Når du booker en trial, registrerer vi dig i vores system og retter henvendelse til dig via en af vores partnere inden for ganske få dage. Trialløsningen er enkel at installere og kræver ingen ny hardware.