Artikel top billede

Foto: Kaare Danielsen

Her opbevarer Rigsarkivet alle dokumenter og hele vores historie: Men alle data skal konverteres hvert 5-10 år

Reportage: Hvordan gemmer man digitale data i 1.000 år? Og hvor mange terabyte går der på en hyldekilometer? Computerworld har været på besøg i Rigsarkivet, hvor højlageret rummer 250 kilometer hylder med mapper.

De fleste kender Rigsarkivet fra julekalenderen med Pyrus som arkivnisse og Jesper Klein som rigsarkivar.

Virkelighedens rigsarkiv er en høj bygning på Kalvebod Brygge 34 i København med vinduer i den ene side og ikke i den anden.

Den rummer alle de dokumenter, som statsadministrationen har produceret gennem tiderne. Det ældste dokument er et pavebrev fra 1100-tallet.

Derefter kommer alle kirkebøgerne og folketællingerne. Og senere alle de sager, som statsadministrationen har produceret. De ligger i det så kaldte højlager, der er en 12 meter høj tempereret lagerbygning.

Rummer alle danskernes historie

Sagsmapperne rummer alle danskernes historie. Fra fødsler, bryllupper og dødsfald, til selvangivelser og tinglysninger. De bliver gemt til evig tid i tilfælde af, at en forsker eller en anden skulle få lyst til at kigge i dem.

Det sker cirka 100 gange om dagen, at man skal finde et dokument frem. Det foregår med et særligt køretøj, der kan løfte en op, så man kan hive den rette mappe ned fra hylderne.

Alt i alt rummer højlageret 250 kilometer hylder med mapper.

De senere år er lageret dog begyndt at blive digitalt. Og det giver særlige udfordringer.

For hvordan kan man gemme data i et format, som man kan læse igen om 100 eller måske 1.000 år, ligesom man kan med pavebrevet?

For de fleste it-folk af en vis alder har sikkert oplevet at have 3” eller 5” tommer-disketter eller sågar hulkort eller hulbånd, som man ikke længere kan læse nogen steder.

Første udfordring er at få gemt data i et arkiverbart standardformat. De fleste data faktisk bliver gemt som billedfiler, hvilket naturligvis betyder, at det vil blive svært for eftertiden at lave statistikker eller søge efter data på tværs af dokumenter.

Næste udfordring er at gemme data på et fysisk format.

Men i modsætning til pavebrevet og grundloven, som man stadig kan læse, så er der ikke nogen der forventer, at man kan læse et dataformat efter 100 år. Det er derfor nødvendigt at konvertere data hvert femte eller 10. år.

Man har allerede konverteret alle data to gange, fra tape til CD-ROM, og senest fra CD-ROM til DVD.

Bluray-kopi sendes til Aarhus

I dag gemmes alle data i tre eksemplarer, et eksemplar på tape og to på Blu-ray, så man har både et optisk og et magnetisk medie.

Den ene Blu-raykopi bliver sendt til Det Kgl. Bibiliotek i Aarhus.

Denne kopi er krypteret, da man ikke helt stoler på aarhusianerne.

Koden bliver opbevaret i et pengeskab et hemmeligt sted i Danmark, så man vil kunne gendanne dokumenterne, hvis København bliver ramt at en atombombe eller erobret af fjenden.

Man ved jo aldrig hvad der kan ske, når man skal tænke 1.000 år frem.

Alle de digitale data, der er kommet til siden det digitale arkiv blev etableret i 1973, fylder i alt 190 terabyte, hvilket ikke lyder af så meget.

I Norge har man bygget et datacenter, der rummer hele Norges kulturarv inde i et atomsikkert bjerg. De ligger i enorme, mørke rum med harddiske, der står stille det meste af tiden, indtil der er nogen, der læser fra dem.

I Danmark har man ikke prioriteret at lægge data på harddiske, fordi der har endnu ikke været et særligt stort behov fra at læse fra de digitale arkiver.

Uden særlig tilladelse kan man nemlig tidligst få adgang til de almindelige dokumenter efter 20 år, dokumenter med personoplysninger efter 75 år.

Der er dog særlig interesse for kirkebøgerne, der bruges til slægtsforskning, så Rigsarkivet er i gang med at indscanne de gamle kirkebøger og folketællinger og lægge dem på internettet.

Og hvor mange terabyte går der så på en hyldekilometer?

Hvis vi antager at 100 ark papir fylder 1 cm og der er skrevet på begge sider og en indscannet side fylder cirka 50Kb, så svarer en hyldekilometer cirka til en terabyte.

Med 190 terabyte og 250 hyldekilometer vil det digitale arkiv overgå det fysiske omkring 2020.

Læs også:Rigsarkivet har lagt folketællingen fra 1940 online: Se hvem der boede i dit hus for 76 år siden