Foto: Kaare Danielsen

Her opbevarer Rigsarkivet alle dokumenter og hele vores historie: Men alle data skal konverteres hvert 5-10 år

Reportage: Hvordan gemmer man digitale data i 1.000 år? Og hvor mange terabyte går der på en hyldekilometer? Computerworld har været på besøg i Rigsarkivet, hvor højlageret rummer 250 kilometer hylder med mapper.

De fleste kender Rigsarkivet fra julekalenderen med Pyrus som arkivnisse og Jesper Klein som rigsarkivar.

Virkelighedens rigsarkiv er en høj bygning på Kalvebod Brygge 34 i København med vinduer i den ene side og ikke i den anden.

Den rummer alle de dokumenter, som statsadministrationen har produceret gennem tiderne. Det ældste dokument er et pavebrev fra 1100-tallet.

Derefter kommer alle kirkebøgerne og folketællingerne. Og senere alle de sager, som statsadministrationen har produceret. De ligger i det så kaldte højlager, der er en 12 meter høj tempereret lagerbygning.

Rummer alle danskernes historie
Sagsmapperne rummer alle danskernes historie. Fra fødsler, bryllupper og dødsfald, til selvangivelser og tinglysninger. De bliver gemt til evig tid i tilfælde af, at en forsker eller en anden skulle få lyst til at kigge i dem.

Det sker cirka 100 gange om dagen, at man skal finde et dokument frem. Det foregår med et særligt køretøj, der kan løfte en op, så man kan hive den rette mappe ned fra hylderne.

Alt i alt rummer højlageret 250 kilometer hylder med mapper.

De senere år er lageret dog begyndt at blive digitalt. Og det giver særlige udfordringer.

For hvordan kan man gemme data i et format, som man kan læse igen om 100 eller måske 1.000 år, ligesom man kan med pavebrevet?

For de fleste it-folk af en vis alder har sikkert oplevet at have 3” eller 5” tommer-disketter eller sågar hulkort eller hulbånd, som man ikke længere kan læse nogen steder.

Første udfordring er at få gemt data i et arkiverbart standardformat. De fleste data faktisk bliver gemt som billedfiler, hvilket naturligvis betyder, at det vil blive svært for eftertiden at lave statistikker eller søge efter data på tværs af dokumenter.

Næste udfordring er at gemme data på et fysisk format.

Men i modsætning til pavebrevet og grundloven, som man stadig kan læse, så er der ikke nogen der forventer, at man kan læse et dataformat efter 100 år. Det er derfor nødvendigt at konvertere data hvert femte eller 10. år.

Man har allerede konverteret alle data to gange, fra tape til CD-ROM, og senest fra CD-ROM til DVD.

Bluray-kopi sendes til Aarhus
I dag gemmes alle data i tre eksemplarer, et eksemplar på tape og to på Blu-ray, så man har både et optisk og et magnetisk medie.

Den ene Blu-raykopi bliver sendt til Det Kgl. Bibiliotek i Aarhus.

Denne kopi er krypteret, da man ikke helt stoler på aarhusianerne.

Koden bliver opbevaret i et pengeskab et hemmeligt sted i Danmark, så man vil kunne gendanne dokumenterne, hvis København bliver ramt at en atombombe eller erobret af fjenden.

Man ved jo aldrig hvad der kan ske, når man skal tænke 1.000 år frem.

Alle de digitale data, der er kommet til siden det digitale arkiv blev etableret i 1973, fylder i alt 190 terabyte, hvilket ikke lyder af så meget.

I Norge har man bygget et datacenter, der rummer hele Norges kulturarv inde i et atomsikkert bjerg. De ligger i enorme, mørke rum med harddiske, der står stille det meste af tiden, indtil der er nogen, der læser fra dem.

I Danmark har man ikke prioriteret at lægge data på harddiske, fordi der har endnu ikke været et særligt stort behov fra at læse fra de digitale arkiver.

Uden særlig tilladelse kan man nemlig tidligst få adgang til de almindelige dokumenter efter 20 år, dokumenter med personoplysninger efter 75 år.

Der er dog særlig interesse for kirkebøgerne, der bruges til slægtsforskning, så Rigsarkivet er i gang med at indscanne de gamle kirkebøger og folketællinger og lægge dem på internettet.

Og hvor mange terabyte går der så på en hyldekilometer?

Hvis vi antager at 100 ark papir fylder 1 cm og der er skrevet på begge sider og en indscannet side fylder cirka 50Kb, så svarer en hyldekilometer cirka til en terabyte.

Med 190 terabyte og 250 hyldekilometer vil det digitale arkiv overgå det fysiske omkring 2020.

Læs også:Rigsarkivet har lagt folketællingen fra 1940 online: Se hvem der boede i dit hus for 76 år siden




Ytringer på debatten er afsenders eget ansvar - læs debatreglerne
Indlæser debat...

Premium
Computerfans' paradis kæmper for livet: Nye nørder har indtaget Tokyos elektriske kvarter
Reportage: Tag med til Akihabara, der har været kendt som Tokyos elektriske bydel. Kvarterets gamle omdømme er under pres. De gamle boder med komponenter til selvbyggerne er kommet kraftigt i undertal, mens de nye nørder er rykket ind.
Computerworld
SSD står overfor et stort teknologisk spring: Nu kommer næste generation - og den er stærkt forbedret
SSD-diske står overfor et af de store teknologiske spring med udviklingen af næste generations teknologi.
CIO
Allersidste opdatering på vej: Om en uge er det slut med stor-version af Windows 10 - skynd dig at opdatere
Om en uge er det slut for altid med den første store udgave af Windows 10, som Microsoft efter 29 måneder ikke længere vil supportere.
Job & Karriere
Vil strejkende it-folk kunne lægge hele Statens It ned? "Det har vi ingen kommentarer til," lyder den kryptiske melding fra Statens It
50 it-medarbejdere hos Statens It truer med at nedlægge arbejdet i sympatistrejke. Vil det betyde, at Statens It går ned?
Statens It nægter at svare.
White paper
11 skridt, der sikrer dig det bedste udbytte af dit CRM-projekt
Dette whitepaper identificerer 11 skridt, som enhver organisation bør gennemgå i forbindelse med CRM-implementering.