Sådan indsamles alle data om valget

Netarkivet trykkede på knappen før statsministeren. Robotter startede jagten på valgdata en time før valg-budskabet.

Artikel top billede

Foto: Netarkivet.dk

Omkring klokken 10 fredag morgen kunne personalet hos Netarkivet.dk endelig trykke på den knap, der startede specialhøstningen af indhold om Folketingsvalget på den danske del af internettet.   
 
Det fortæller Ditte Laursen, der er netarkiv-kurator hos Statsbiblioteket.
 
"Jeg har lige talt med mine kolleger for en halv time siden, og da trykkede vi på knappen," siger hun. 
 
Dermed gik arkivets robotter i gang med at eftersøge hele det danske internet for information om valget og gemme data for eftertiden godt en times tid før, statsminister Lars Løkke Rasmussen (V) faktisk udskrev valget.
 
Personalet, der ligesom resten af Danmark ventet på valget i uge- eller månedsvis, har erfaring med at høste data fra alle valg tilbage til 2005, da det digitale indhold på nettet blev omfattet af pligtaflevering.
 
Ved sidste folketingsvalg i 2007 indsamlede Netarkivet, der drives af Statsbiblioteket og det Kongelige Bibliotek i fællesskab, 2,2 terabyte data om valget.
 
Men Ditte Laursen forventer, at materialet denne gang vil fylde langt mere.
 
"Ja, vi kan se gennem hele netarkivets historie, at der kommer mere og mere. Vi så allerede i 2007, at det virkelig boomede," siger Ditte Laursen.
 
Hun peger især på net-tv og indhold fra sociale medier som årsager til, at datamængderne vokser.
 
"Alene at der er kommet tv på internettet betyder, at vi rent bits- and bytes-mæssigt kan forvente meget, meget større mængder data," siger hun. 
  
Kun for forskere
Ifølge Ditte Laursen har personalet allerede fodret netrobotterne med en lang række især nyhedssider, som skal besøges i jagten på valg-data. Men folkene vil løbende skrue på, hvor robotterne skal sendes hen. Eksempelvis skal Facebook og andre sociale sites også besøges, siger hun.
 
"Rygterne har jo lydt i lang tid, og vi vidste, at det er en af de store begivenheder, vi selvfølgelig skal dække," siger hun.  
 
Netarkivet.dk rummer totalt 222 terabyte data, som indsamles rutinemæssigt på de omkring 1,1 millioner domæner.

Arkivet har en tilgang på omkring 80 terabyte om året. Hertil kommer så de særlige begivenheds-høstninger, som altså eksempelvis ved folketingsvalg.

Materialet er kun tilgængeligt for forskere.

Læses lige nu

    Navnenyt fra it-Danmark

    Adeno K/S har pr. 2. februar 2026 ansat Casper Barner Kristensen som ServiceNow Expert. Han kommer fra en stilling som Senior Automation Architect. Nyt job
    Christian Pedersen,  emagine Consulting A/S, er pr. 1. februar 2026 udnævnt som Chief AI Officer. Han beskæftiger sig med opkvalificere emagines ansatte, udvikle interne AI-værktøjer og levere AI-projekter for kunderne. Som leder af et nye AI-team skal han også udvikle og lancere AI-produkter til markedet. Udnævnelse

    Christian Pedersen

    emagine Consulting A/S

    Idura har pr. 1. januar 2026 ansat Joshua Pratt, 32 år,  som software engineer. Han skal især beskæftige sig med at bruge sin tekniske knowhow og erfaring i teamet for extensions og integrationer. Han kommer fra en stilling som Tech Director hos NoA Ignite Denmark. Han har tidligere beskæftiget sig med komplekse webprojekter, senest udviklingen af det nye website og e-commerce-platform for tivoli.dk. Nyt job

    Joshua Pratt

    Idura