Sådan indsamles alle data om valget

Netarkivet trykkede på knappen før statsministeren. Robotter startede jagten på valgdata en time før valg-budskabet.

Artikel top billede

Foto: Netarkivet.dk

Omkring klokken 10 fredag morgen kunne personalet hos Netarkivet.dk endelig trykke på den knap, der startede specialhøstningen af indhold om Folketingsvalget på den danske del af internettet.   
 
Det fortæller Ditte Laursen, der er netarkiv-kurator hos Statsbiblioteket.
 
"Jeg har lige talt med mine kolleger for en halv time siden, og da trykkede vi på knappen," siger hun. 
 
Dermed gik arkivets robotter i gang med at eftersøge hele det danske internet for information om valget og gemme data for eftertiden godt en times tid før, statsminister Lars Løkke Rasmussen (V) faktisk udskrev valget.
 
Personalet, der ligesom resten af Danmark ventet på valget i uge- eller månedsvis, har erfaring med at høste data fra alle valg tilbage til 2005, da det digitale indhold på nettet blev omfattet af pligtaflevering.
 
Ved sidste folketingsvalg i 2007 indsamlede Netarkivet, der drives af Statsbiblioteket og det Kongelige Bibliotek i fællesskab, 2,2 terabyte data om valget.
 
Men Ditte Laursen forventer, at materialet denne gang vil fylde langt mere.
 
"Ja, vi kan se gennem hele netarkivets historie, at der kommer mere og mere. Vi så allerede i 2007, at det virkelig boomede," siger Ditte Laursen.
 
Hun peger især på net-tv og indhold fra sociale medier som årsager til, at datamængderne vokser.
 
"Alene at der er kommet tv på internettet betyder, at vi rent bits- and bytes-mæssigt kan forvente meget, meget større mængder data," siger hun. 
  
Kun for forskere
Ifølge Ditte Laursen har personalet allerede fodret netrobotterne med en lang række især nyhedssider, som skal besøges i jagten på valg-data. Men folkene vil løbende skrue på, hvor robotterne skal sendes hen. Eksempelvis skal Facebook og andre sociale sites også besøges, siger hun.
 
"Rygterne har jo lydt i lang tid, og vi vidste, at det er en af de store begivenheder, vi selvfølgelig skal dække," siger hun.  
 
Netarkivet.dk rummer totalt 222 terabyte data, som indsamles rutinemæssigt på de omkring 1,1 millioner domæner.

Arkivet har en tilgang på omkring 80 terabyte om året. Hertil kommer så de særlige begivenheds-høstninger, som altså eksempelvis ved folketingsvalg.

Materialet er kun tilgængeligt for forskere.

Læses lige nu

    Navnenyt fra it-Danmark

    IT Confidence A/S har pr. 1. oktober 2025 ansat Henrik Thøgersen som it-konsulent med fokus på salg. Han skal især beskæftige sig med rådgivende salg, account management og udvikling af kundeporteføljer på tværs af it-drift, sikkerhed og cloud-løsninger. Han kommer fra en stilling som freelancer i eget firma og client manager hos IT Relation og IT-Afdelingen A/S. Han er uddannet elektromekaniker. Han har tidligere beskæftiget sig med salg af it-løsninger, account management, it-drift og rådgivning samt undervisning og ledelse. Nyt job

    Henrik Thøgersen

    IT Confidence A/S

    Sebastian Rübner-Petersen, 32 år, Juniorkonsulent hos Gammelbys, er pr. 1. september 2025 forfremmet til Kommunikationskonsulent. Han skal fremover især beskæftige sig med Projektledelse, kommunikationsstrategier og implementering af AI. Forfremmelse
    Norriq Danmark A/S har pr. 1. september 2025 ansat Ahmed Yasin Mohammed Hassan som Data & AI Consultant. Han kommer fra en stilling som selvstændig gennem de seneste 3 år. Han er uddannet cand. merc. i Business Intelligence fra Aarhus Universitet. Nyt job

    Ahmed Yasin Mohammed Hassan

    Norriq Danmark A/S