Foto: Netarkivet.dk

Sådan indsamles alle data om valget

Netarkivet trykkede på knappen før statsministeren. Robotter startede jagten på valgdata en time før valg-budskabet.

Omkring klokken 10 fredag morgen kunne personalet hos Netarkivet.dk endelig trykke på den knap, der startede specialhøstningen af indhold om Folketingsvalget på den danske del af internettet.   
 
Det fortæller Ditte Laursen, der er netarkiv-kurator hos Statsbiblioteket.
 
"Jeg har lige talt med mine kolleger for en halv time siden, og da trykkede vi på knappen," siger hun. 
 
Dermed gik arkivets robotter i gang med at eftersøge hele det danske internet for information om valget og gemme data for eftertiden godt en times tid før, statsminister Lars Løkke Rasmussen (V) faktisk udskrev valget.
 
Personalet, der ligesom resten af Danmark ventet på valget i uge- eller månedsvis, har erfaring med at høste data fra alle valg tilbage til 2005, da det digitale indhold på nettet blev omfattet af pligtaflevering.
 
Ved sidste folketingsvalg i 2007 indsamlede Netarkivet, der drives af Statsbiblioteket og det Kongelige Bibliotek i fællesskab, 2,2 terabyte data om valget.
 
Men Ditte Laursen forventer, at materialet denne gang vil fylde langt mere.
 
"Ja, vi kan se gennem hele netarkivets historie, at der kommer mere og mere. Vi så allerede i 2007, at det virkelig boomede," siger Ditte Laursen.
 
Hun peger især på net-tv og indhold fra sociale medier som årsager til, at datamængderne vokser.
 
"Alene at der er kommet tv på internettet betyder, at vi rent bits- and bytes-mæssigt kan forvente meget, meget større mængder data," siger hun. 
  
Kun for forskere
Ifølge Ditte Laursen har personalet allerede fodret netrobotterne med en lang række især nyhedssider, som skal besøges i jagten på valg-data. Men folkene vil løbende skrue på, hvor robotterne skal sendes hen. Eksempelvis skal Facebook og andre sociale sites også besøges, siger hun.
 
"Rygterne har jo lydt i lang tid, og vi vidste, at det er en af de store begivenheder, vi selvfølgelig skal dække," siger hun.  
 
Netarkivet.dk rummer totalt 222 terabyte data, som indsamles rutinemæssigt på de omkring 1,1 millioner domæner.

Arkivet har en tilgang på omkring 80 terabyte om året. Hertil kommer så de særlige begivenheds-høstninger, som altså eksempelvis ved folketingsvalg.

Materialet er kun tilgængeligt for forskere.


Ytringer på debatten er afsenders eget ansvar - læs debatreglerne
Indlæser debat...


Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Despec Denmark A/S
Distributør af forbrugsstoffer, printere, it-tilbehør, mobility-tilbehør, ergonomiske produkter, kontor-maskiner og -tilbehør.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
GDPR - De sidste skridt frem mod fuld compliance

På denne konference vil du høre danske virksomheder fortælle om deres GDPR-projekter og deres udvikling, faldgruber og gevinster. Du vil også få præsenteret en række værktøjer - både proces- og it-værktøjer - der hjælpe dig med at nå det sidste stykke frem mod målet: At blive fuld compliant med de nye GDPR-regler inden 25. maj 2018.

07. december 2017 | Læs mere


Office 365 og Windows 10: Sådan udnytter du de nyeste værktøjer og funktioner

Office 365 har over de senere fem år vundet indpas i utallige danske virksomheder. Mange af disse er nu også i gang med at opgradere til Microsofts Windows 10. På dette event bliver du klogere på mulighederne og udfordringerne med Office 365 og Windows.

12. december 2017 | Læs mere


Cloud og it-infrastruktur: Udnyt de nye teknologier og platforme til at optimere performance

Cloud computing rummer store muligheder for mange i en tid, hvor agilitet, fleksibilitet og sammenhæng mellem systemerne spiller en større og større rolle i jagten på at skabe og høste værdi og udklække viden via data. Kom og hør om mulighederne.

14. december 2017 | Læs mere





mest debaterede artikler

Computerworld
Så nemt er det at fuppe sig til 80.000 kroner: Her er læren af den seneste MobilePay-svindel
ComputerViews:En tidligere chefredaktør på Computerworld blev for nylig svindlet for 80.000 kroner via MobilePay. Men det betyder ikke, at systemet er usikkert.
CIO
Dansk it-afdeling med 140 ansatte vil væk fra 'brændende platform'
Landbrugsstyrelsens it-afdeling, der nærmer sig 140 medarbejdere, har en klar mission: “Jeg håber, at vi hurtigst muligt er ude af den brændende platform, hvor it er den begrænsende faktor,” lyder det fra underdirektør.
Comon
Ugens tip: Find ud af hvem der ringer til dig med Facebook og MobilePay
Hvis du bliver ringet op af et nummer, du ikke kender, kan du lynhurtigt bruge en af to smarte tricks til at finde ud af, hvem de er - også selv om nummeret er beskyttet
Job & Karriere
Dansk it-virksomhed indførte fire-dages arbejdsuge: I dag er sygefraværet rekord-lavt og direktøren har tabt sig 13 kilo
Interview: Great Place To Work kategori-vinderen IIH Nordic har indført en fire-dages arbejdsuge og taget et opgør med forstyrrende storrums-kontorer og en frustrerende mailkultur. I dag er medarbejderne gladere end nogensinde før.
White paper
Er din virksomhed (måske) på vej ud i skyen? … her er tre mulige strategier og alle de vigtigste overvejelser
For langt de fleste virksomheder er cloud en uundgåelig del af fremtiden. Men hvordan skal man gribe det projekt an? Dette whitepaper fra EG fyldt med værdifulde input til de virksomheder, som står på tærsklen til at tage beslutningen - analyser, refleksioner, opmærksomhedspunkter og anbefalinger, som kan være en støtte i overvejelserne og undersøgelsen forud for beslutningen.