Foto: Netarkivet.dk

Sådan indsamles alle data om valget

Netarkivet trykkede på knappen før statsministeren. Robotter startede jagten på valgdata en time før valg-budskabet.

Omkring klokken 10 fredag morgen kunne personalet hos Netarkivet.dk endelig trykke på den knap, der startede specialhøstningen af indhold om Folketingsvalget på den danske del af internettet.   
 
Det fortæller Ditte Laursen, der er netarkiv-kurator hos Statsbiblioteket.
 
"Jeg har lige talt med mine kolleger for en halv time siden, og da trykkede vi på knappen," siger hun. 
 
Dermed gik arkivets robotter i gang med at eftersøge hele det danske internet for information om valget og gemme data for eftertiden godt en times tid før, statsminister Lars Løkke Rasmussen (V) faktisk udskrev valget.
 
Personalet, der ligesom resten af Danmark ventet på valget i uge- eller månedsvis, har erfaring med at høste data fra alle valg tilbage til 2005, da det digitale indhold på nettet blev omfattet af pligtaflevering.
 
Ved sidste folketingsvalg i 2007 indsamlede Netarkivet, der drives af Statsbiblioteket og det Kongelige Bibliotek i fællesskab, 2,2 terabyte data om valget.
 
Men Ditte Laursen forventer, at materialet denne gang vil fylde langt mere.
 
"Ja, vi kan se gennem hele netarkivets historie, at der kommer mere og mere. Vi så allerede i 2007, at det virkelig boomede," siger Ditte Laursen.
 
Hun peger især på net-tv og indhold fra sociale medier som årsager til, at datamængderne vokser.
 
"Alene at der er kommet tv på internettet betyder, at vi rent bits- and bytes-mæssigt kan forvente meget, meget større mængder data," siger hun. 
  
Kun for forskere
Ifølge Ditte Laursen har personalet allerede fodret netrobotterne med en lang række især nyhedssider, som skal besøges i jagten på valg-data. Men folkene vil løbende skrue på, hvor robotterne skal sendes hen. Eksempelvis skal Facebook og andre sociale sites også besøges, siger hun.
 
"Rygterne har jo lydt i lang tid, og vi vidste, at det er en af de store begivenheder, vi selvfølgelig skal dække," siger hun.  
 
Netarkivet.dk rummer totalt 222 terabyte data, som indsamles rutinemæssigt på de omkring 1,1 millioner domæner.

Arkivet har en tilgang på omkring 80 terabyte om året. Hertil kommer så de særlige begivenheds-høstninger, som altså eksempelvis ved folketingsvalg.

Materialet er kun tilgængeligt for forskere.


Ytringer på debatten er afsenders eget ansvar - læs debatreglerne
Indlæser debat...


Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Højer & Lauritzen ApS
Distributør af pc- og printertilbehør.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
GDPR: Drift og dagligdag - effektive it-værktøjer

Du har nu (forhåbentligt) styr på virksomhedens dataflow i forhold til GDPR. På dette seminar bliver du præsenteret for en række af de mest effektive it-værktøjer til håndtering af persondata, så I lever op til GDPR: Inklusive varsling, samtykke, lagring, overblik, dokumentation og sletning.

21. februar 2019 | Læs mere


Få styr på det rigtige setup: Skal du vælge on prem eller cloud? Eller en kombination?

Mange virksomheder har i årevis opbevaret og håndteret deres data i egne datacentre, men med cloud computing er tingene for alvor i opbrud. På dette event bliver du klogere på de muligheder, som du har for at designe en hybrid cloud-infrastruktur, der kombinerer on-premise og forskellige cloud-former på bedst mulig måde for netop din forretning.

26. februar 2019 | Læs mere


Predictive business analytics - Brug AI og Machine learning til at forstå og forudsige dine kunders adfærd

Machine Learning og kunstig intelligens er ikke længere bare hype. Det er et værktøj, der for eksempel kan hjælpe dig med at give dine kunder individualiserede og relevante tilbud – og dermed øge både salg og kundetilfredshed. Data om dine kunder og deres adfærd er en uundværlig ressource i salgsarbejdet. Uden indsigt og kendskab til kunderne, er det en hovedløs jagt at skabe mersalg og styrke kundeloyaliteten. Machine Learning hjælper dig og dit salgspersonale med at bruge alle disse data og med meget stor sikkerhed at forudsige kundens næste køb.

27. februar 2019 | Læs mere





Flere dybdegående Computerworld artikler

"Det er skide sjovt, at vi nu også kan følge med i en masse data under kampene. Men det betyder også, at dårlige tabere kan henvise til vores bordfodbold-data"

Alle de indsamlede data bliver bearbejdet via machine-learning, der giver os en masse statistik på vores bordfodboldkampe. Vi kan eksempelvis se hvilket hold, der har haft bolden mest, og hvem der har flest skud på mål. Vi har også installeret en optisk sensor i målet, der registrerer, når der bliver scoret og holder styr på stillingen.

Erik Kaae stopper som topchef i EG efter salg til DXC Technology - forlader nu helt it-branchen
Morgen-briefing: Lars Seier henter dansk erhvervsprofil til krypto-virksomhed / Amazon investerer milliarder i Tesla-rival / Google køber grunde op via mystiske skuffeselskaber / Apple henter tidligere Microsoft-chef til ny smart home-satsning
Ugen i tech: Stort Samsung læk: Her er selskabets forårskollektion af wearables / Canon-prisbombe – halverer nærmest prisen på spritnyt fullframe kamera / Salg på prisstærkt Nvidia GTX1660 er tyvstartet.
2 Test af Microsoft Surface Laptop 2: En genial laptop - hvor Microsoft begår nogle sløje svipsere
Årets største mobil-messe åbner snart portene: Her er de fem nyheder, vi glæder os mest til
Netcompanys bestyrelsesformand trækker sig: Fravælger selskabet til fordel for andre bestyrelsesposter
11 Her er Googles svar på nye EU-regler, der 'kan ødelægge internettet for altid': "Detaljerne er vigtige"


Premium
Regeringens Disruptionsråd blev udskammet og latterliggjort – men nu får vi indblik i de reelle resultater
Regeringens Disruptionsråd blev udskammet og latterliggjort, da skuespilleren Helle Joof gjorde sig klog på indianerstammer og disruption. Men nu kan vi efter knap to år gøre status over rådets arbejde.
CIO
Tech fra Toppen: Det har CIO Mads Madsbjerg Hansen fra FLSmidth lært af flere års global it-konsolidering
Tech fra Toppen: Flere års arbejde har betydet en reduktion i antallet af it-systemer hos FLSmidth. Men processen har ikke været uden overraskelser. Hør hvad CIO Mads Madsbjerg Hansen har lært af den omfattende og globale proces.
Job & Karriere
Toke Kruse: Jeg spår, at humankapital i 2019 erstattes af it-kapital
I 2019 vil vi se en kæmpe udskiftning af ressourcer, hvorunder de menneskelige processer overtages af software, der gør os mennesker hurtigere og mere effektive. Betyder det store fyringsrunder? Måske.
White paper
Sådan gør du din forretning agil uden at komplicere netværkssikkerheden
Mange virksomheder er i gang med en form for digital transformation, i forhold til hvordan produkter og services bringes til markedet og i sidste ende levere værdi til kunderne. Men digital transformation bringer også kompleksitet med sig i forhold til dem der opererer netværket. I dette white paper kigger vi nærmere på, hvordan du laver en succesfuld transformation og gør dit netværk sikkert.