Foto: Netarkivet.dk

Sådan indsamles alle data om valget

Netarkivet trykkede på knappen før statsministeren. Robotter startede jagten på valgdata en time før valg-budskabet.

Omkring klokken 10 fredag morgen kunne personalet hos Netarkivet.dk endelig trykke på den knap, der startede specialhøstningen af indhold om Folketingsvalget på den danske del af internettet.   
 
Det fortæller Ditte Laursen, der er netarkiv-kurator hos Statsbiblioteket.
 
"Jeg har lige talt med mine kolleger for en halv time siden, og da trykkede vi på knappen," siger hun. 
 
Dermed gik arkivets robotter i gang med at eftersøge hele det danske internet for information om valget og gemme data for eftertiden godt en times tid før, statsminister Lars Løkke Rasmussen (V) faktisk udskrev valget.
 
Personalet, der ligesom resten af Danmark ventet på valget i uge- eller månedsvis, har erfaring med at høste data fra alle valg tilbage til 2005, da det digitale indhold på nettet blev omfattet af pligtaflevering.
 
Ved sidste folketingsvalg i 2007 indsamlede Netarkivet, der drives af Statsbiblioteket og det Kongelige Bibliotek i fællesskab, 2,2 terabyte data om valget.
 
Men Ditte Laursen forventer, at materialet denne gang vil fylde langt mere.
 
"Ja, vi kan se gennem hele netarkivets historie, at der kommer mere og mere. Vi så allerede i 2007, at det virkelig boomede," siger Ditte Laursen.
 
Hun peger især på net-tv og indhold fra sociale medier som årsager til, at datamængderne vokser.
 
"Alene at der er kommet tv på internettet betyder, at vi rent bits- and bytes-mæssigt kan forvente meget, meget større mængder data," siger hun. 
  
Kun for forskere
Ifølge Ditte Laursen har personalet allerede fodret netrobotterne med en lang række især nyhedssider, som skal besøges i jagten på valg-data. Men folkene vil løbende skrue på, hvor robotterne skal sendes hen. Eksempelvis skal Facebook og andre sociale sites også besøges, siger hun.
 
"Rygterne har jo lydt i lang tid, og vi vidste, at det er en af de store begivenheder, vi selvfølgelig skal dække," siger hun.  
 
Netarkivet.dk rummer totalt 222 terabyte data, som indsamles rutinemæssigt på de omkring 1,1 millioner domæner.

Arkivet har en tilgang på omkring 80 terabyte om året. Hertil kommer så de særlige begivenheds-høstninger, som altså eksempelvis ved folketingsvalg.

Materialet er kun tilgængeligt for forskere.


Ytringer på debatten er afsenders eget ansvar - læs debatreglerne
Indlæser debat...


Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
TDCH A/S
Skal din virksomhed med i Guiden? Klik her

Kommende events
Cloud 2018 - outsourcing eller on premise?

Cloud handler ikke længere om billige servere eller storage. Det handler om at ruste sig til at kunne gøre idéer til digital innovation til virkelighed. På denne konference kan du blive klogere på, hvordan man kan satse strategisk på cloud-modellen. Mød eksperter, leverandører og andre cloud-brugere og bliv inspireret til nye satsninger i din egen virksomhed.

20. september 2018 | Læs mere


The New World of Data

Få styr på de nye muligheder og de nyeste tendenser inden for næste generations IT-infrastruktur. Bliv inspireret af de ledende teknologiaktører og hør hvordan TopDanmark og Rambøll har draget fordel af de nye muligheder både i relation til de tekniske og økonomiske aspekter samt en optimeret brugeroplevelse.

25. september 2018 | Læs mere


Kunstig intelligens: Bring din virksomhed ind i fremtiden

På denne konference ser vi nærmere på gode, bæredygtige business cases med kunstig intelligens. Vi zoomer ind på de konkrete teknologier, og eksperterne giver dig gode råd til, hvordan man kan arbejde innovativt og agilt med kunstig intelligens-løsninger.

26. september 2018 | Læs mere






Premium
Mangel på arbejdskraft kan tvinge Universal Robots væk fra Danmark: "Vores ejere er ikke religiøse med, hvor vi skal ligge henne"
Interview: Universal Robots' ekstreme vækst har også en bagside. Selskabet har store udfordringer med at få kompetente folk og må derfor kigge til udlandet, men det er svært at få den udenlandske arbejdskraft til Danmark. Robotfirmaet fra Odense prøver nu at råbe de danske politikere op. "Vi er født i Danmark, men købt af en amerikansk virksomhed, og vores ejere er ikke religiøse med, hvor vi skal ligge henne," lyder det.
Computerworld
Her er de tre nye iPhones: Apple har netop præsenteret to frække topmodeller samt en helt ny "folketelefon"
Apple har netop løftet sløret for tre nye iPhones. Den ene af dem er måske det tætteste Apple kommer på en folketelefon
CIO
Machine learning og kunstig intelligens med Jesper Steen Møller "Der er rigtigt meget teknik som for nogen ser nærmest magisk ud"
Tech fra Toppen: Hvornår det giver mening at bruge machine learning - og hvordan du kommer bedst muligt i gang? Få svaret i den seneste udgave af Computerworlds podcast "Tech fra toppen" med datalog Jesper Steen Møller.
Job & Karriere
Her er syv job-annoncer der overrasker med helt usædvanlige overskrifter
Der er mange ledige it-job i øjeblikket. It-jobbank har her fundet syv spændende stillinger, der har det til fælles, at annoncen har en utraditionel overskrift.
White paper
Står din infrastruktur i vejen for virksomhedens udvikling? … her er de 10 vigtigste overvejelser
Oplever du, at din virksomheds it-infrastruktur er en stopklods for udviklingen af forretningen, digitalisering og konkurrencekraft? Måske er svaret hyperkonvergeret infrastruktur, hvor software og hardware smelter sammen i én konkurrencedygtig enhed, som er nem at administrere. Men der er 10 meget vigtige overvejelser at gøre sig, før man vælger en løsning. Læs dette whitepaper fra Lenovo og bliv klædt bedre på til at vælge rigtigt. 10 Key Considerations for Selecting Hyper-Converged Infrastructure - What to Know Before You Choose a Solution, Lenovo, 18 sider på engelsk.