Foto: Netarkivet.dk

Sådan indsamles alle data om valget

Netarkivet trykkede på knappen før statsministeren. Robotter startede jagten på valgdata en time før valg-budskabet.

Omkring klokken 10 fredag morgen kunne personalet hos Netarkivet.dk endelig trykke på den knap, der startede specialhøstningen af indhold om Folketingsvalget på den danske del af internettet.   
 
Det fortæller Ditte Laursen, der er netarkiv-kurator hos Statsbiblioteket.
 
"Jeg har lige talt med mine kolleger for en halv time siden, og da trykkede vi på knappen," siger hun. 
 
Dermed gik arkivets robotter i gang med at eftersøge hele det danske internet for information om valget og gemme data for eftertiden godt en times tid før, statsminister Lars Løkke Rasmussen (V) faktisk udskrev valget.
 
Personalet, der ligesom resten af Danmark ventet på valget i uge- eller månedsvis, har erfaring med at høste data fra alle valg tilbage til 2005, da det digitale indhold på nettet blev omfattet af pligtaflevering.
 
Ved sidste folketingsvalg i 2007 indsamlede Netarkivet, der drives af Statsbiblioteket og det Kongelige Bibliotek i fællesskab, 2,2 terabyte data om valget.
 
Men Ditte Laursen forventer, at materialet denne gang vil fylde langt mere.
 
"Ja, vi kan se gennem hele netarkivets historie, at der kommer mere og mere. Vi så allerede i 2007, at det virkelig boomede," siger Ditte Laursen.
 
Hun peger især på net-tv og indhold fra sociale medier som årsager til, at datamængderne vokser.
 
"Alene at der er kommet tv på internettet betyder, at vi rent bits- and bytes-mæssigt kan forvente meget, meget større mængder data," siger hun. 
  
Kun for forskere
Ifølge Ditte Laursen har personalet allerede fodret netrobotterne med en lang række især nyhedssider, som skal besøges i jagten på valg-data. Men folkene vil løbende skrue på, hvor robotterne skal sendes hen. Eksempelvis skal Facebook og andre sociale sites også besøges, siger hun.
 
"Rygterne har jo lydt i lang tid, og vi vidste, at det er en af de store begivenheder, vi selvfølgelig skal dække," siger hun.  
 
Netarkivet.dk rummer totalt 222 terabyte data, som indsamles rutinemæssigt på de omkring 1,1 millioner domæner.

Arkivet har en tilgang på omkring 80 terabyte om året. Hertil kommer så de særlige begivenheds-høstninger, som altså eksempelvis ved folketingsvalg.

Materialet er kun tilgængeligt for forskere.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
JN Data A/S
Driver og udvikler it-systemer for finanssektoren.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Digital How To: Data og AI er fremtiden – men kan man overhovedet lykkes i det nye data-univers uden den rette dataplatform?

Det er svært at spå om fremtiden, men vi kan være sikre på, at den indeholder meget mere data og en langt større anvendelse af kunstig intelligens. På dette webinar sætter vi derfor fokus på, hvordan du som organisation får styr på alle data, og bliver klar til fremtiden.

30. oktober 2020 | Læs mere


Dell Talk: Cybersikkerhed skal gentænkes for at kunne imødegå fremtidige avancerede cybertrusler

Danske virksomheder er nødt til at gentænke cybersikkerheden for at kunne imødegå fremtidige cybertrusler, som vi hele tiden gøres opmærksomme på. I denne talk får du et indspark i, hvordan du som virksomhed kan gentænke cybersikkerheden ud fra både et operationelt og sikkerhedsmæssigt perspektiv.

30. oktober 2020 | Læs mere


IT Security 2020

Strategic IT Security 2020 will focus on the never-ending story about security and cyber-defense, and how you can defend your business and your customer’s data and information. Together with several leading experts and digital executives from all over the Nordic countries, this conference seeks to give you the best input to focus even more on cyber security in the future.

03. november 2020 | Læs mere





mest debatterede artikler

Premium
Lars Engbork klar til at komme i gang som ny topchef for Visma E-conomic: "Vi har allerede lagt en plan for fremtiden"
Interview: Den nye direktør for Visma e-conomic havde for få måneder siden ikke regnet med, at han skulle overtage posten som CEO efter Mads Rebsdorf, der efter 10 år hos Visma er skiftet til en toppost hos norske Kahoot.
Computerworld
TDC ruller gratis fiber ud til 5.100 danske husstande - se adresserne her
TDC går i gang med at udruller fiber til tusindvis af danske husstande i Odens, Nordsjælland og Storkøbenhavn. Se hvor TDC’s gravemaskiner kommer forbi med tilbud om gratis fiber-opkobling.
CIO
Podcast: Hos Viking Life-Saving Equipment er it gået fra at være backend til at være noget, som kunderne spørger aktivt efter
Podcast, The Digital Edge: Viking leverer en stadig større del af deres produkt som en tjeneste. Som en del af tjenesten tager Viking ansvar for sikkerheden ved at levere, dokumentere og vedligeholde det nødvendige sikkerhedsudstyr. Hør hvordan Henrik Balslev senior digital director hos Viking har løftet den opgave.
Job & Karriere
Regner din ferie væk? Brug tiden på at søge en af disse otte stillinger, der er ledige netop nu
Det sjasker ned over hele Danmark. Du kan bruge de våde sommerdage på at søge et af disse otte job, der er ledige lige nu.
White paper
Sådan: Beskyt virksomheden effektivt mod mailbårne angreb
Mailserveren er rykket i skyen, typisk i form af Office 365, men det er truslerne også. For trods højt sikkerhedsniveau hos Microsoft er virksomhederne mindst lige så udsat for mailbårne cyberangreb som førhen. Enten i form af social engineering – hvor angriberne prøver at lokke adgangsgivende informationer ud af medarbejderne, i form af phishing eller gennem deciderede malwareangreb. Dertil kommer forsøg på svindel i form af eksempelvis CEO-fraud, falske fakturaer og meget andet. Denne hvidbog giver et opdateret overblik over angrebsformerne og konkrete bud på, hvordan du bedst forebygger, at din virksomhed rammes.