Nørd crawler politikernes hjemmesider

Er internettet det nye forsamlingshus, spørger studerende?

Artikel top billede

Hvordan bruger politikerne internettet under valgkampen i 2010?

Dét svar skal forskere for fremtiden kunne besvare, mener den 24-årige politilogistuderende Bertel Torp. Han har sat en server op som scanner politikernes websider, facebook-profiler og lignenede hver uge frem til valget, så man kan følge udviklingen uge for uge.

Hvorfor lagrer du politikernes hjemmesider?

"Fordi jeg er en nørd. Det, tror jeg, er det rigtige svar. Der er så mange, der snakker om, hvordan sociale medier bliver det nye i valgkampen. Men jeg synes ikke, at der er nogle eksempler. Det hele sker intensivt over de tre uger, hvor der er valg, og jeg syntes jeg ville dokumentere det op til," siger Bertel Torp.

Hans interesse er både professionel og personlig. Han har nogle år studeret samfundsvidenskab ved Aalborg Universitet og er på vej til Copenhagen Business School, hvor han vil færdiggøre sin uddannelse. Desuden er han frivillig kampagnemedarbejder for den radikale Sofie Carsten Nielsen.

Dataene overvejer han selv at bruge til en videnskabelig artikel til sit studie, men han vil også lade andre få del i dataene, hvis det er til forskning eller undervisning. De lægges dog ikke ud til frit skue på nettet, eftersom han er usikker på ophavsret og lignende. Bertel Torp har dog allerede stillet sit datasæt over eksempelvis Facebook-sider frit til rådighed på sin hjemmeside i en kommasepareret fil.

 

Bruger Heritrix til crawle

Bertel Torp, der efter en uges indsamling har skrabet politikernes sider for 3,1 GB data, har undervejs måtte ændre i sin crawler-opsætning.

"Jeg startede med at lave mit eget script, og det gik fuldstændig galt. I løbet af en halv time, begyndte den at downloade hele Facebook. Den fulgte links på siderne og begyndte så at hente, og jeg er ikke sikker på, at det er i tråd med Facebooks politik," forklarer Bertel Torp.

Han overvejede derefter blot at bruge et script, der tager screenshots af siderne, men valgte til sidst, hvad han så som den bedste og letteste løsning: Open source-crawleren Heritrix, som det kendte net-arkiv web.archieve.org bruger. Programmet kopierer kildekoden på siderne, men ulempen er, at mediefiler, eksempelvis indlejrede Youtube-videoer, senere kan være svære at genskabe. Programmet fungerer desuden langsomt ved Flash-sider.

Bertel Torp overvejer som det første at bruge dataene til en ord-sky (tagcloud), så man kan se, hvad de forskellige partiers kandidater bruger mange ord på. Derudover er han en anelse usikker på, hvad han skal bruge dataene til.

"Data er ikke noget værd, hvis man ikke ved, hvordan man skal behandle dem, og det er lidt dér, jeg strander," siger Bertel Torp.

Dog mener han, at der er masser af spørgsmål at tage fat på.

 

Det nye forsamlingshus?

"Sociale medier er det nye vælgermøde. Det er spået, at det skal være det nye forsamlingshus. Det er dér, man møder vælgerne og har en dialog med dem, og det er dét, jeg gerne vil fange. Jeg synes dog ikke, politikerne er specielt gode til at udnytte mulighederne. Jeg har nogle få eksempler på, hvor der er dialog. Nogle bruger Facebook til at snakke med folk, men ellers synes jeg ikke, at den store brede gruppe masse af politikere bruger det. De bruger det som valgplakater og kronikker - altså til at skubbe information ud," mener Bertel Torp, der altså endnu ikke ser de sociale medier som det nye forsamlingshus.

Serveren er sat op til at respektere robots.txt, så man kan blokere crawleren ved at indsætte følgende kode:

User-agent: eValg11
Disallow: /

Bertel Torp oplyser, at han allerede er stødt på syv folketingskandidater, der har "no-follow" på deres hjemmesider, så Google ikke indekserer siderne. Disse hjemmesider crawler Bertel Torp ligeledes ikke.

Læses lige nu

    IT-Forsyningen I/S

    Leder af serverteam

    Københavnsområdet

    Forsvarsministeriets Materiel- og Indkøbsstyrelse

    Machine Learning Operations Engineer til opbygning af Forsvarets nye IT-platform

    Nordjylland

    Netcompany A/S

    IT Manager

    Midtjylland

    Computerworld Events

    Vi samler hvert år mere end 6.000 deltagere på mere end 70 events for it-professionelle.

    Ekspertindsigt – Lyt til førende specialister og virksomheder, der deler viden om den nyeste teknologi og de bedste løsninger.
    Netværk – Mød beslutningstagere, kolleger og samarbejdspartnere på tværs af brancher.
    Praktisk viden – Få konkrete cases, værktøjer og inspiration, som du kan tage direkte med hjem i organisationen.
    Aktuelle tendenser – Bliv opdateret på de vigtigste dagsordener inden for cloud, sikkerhed, data, AI og digital forretning.

    Sikkerhed | København

    Strategisk It-sikkerhedsdag 2026 - København

    Få overblik over cybersikkerhedens vigtigste teknologier, trusler og strategiske valg. Hør skarpe oplæg om AI-risici, forsvar, compliance og governance. Vælg mellem to spor og styrk både indsigt og netværk. Deltag i København 20. januar.

    Andre events | København

    Executive Conversations: Fra hype til afkast – her er vinderne af AI-ræset

    Få et klart overblik over AI’s reelle effekt i danske virksomheder. Arrangementet giver unge talenter og ambitiøse medarbejdere viden, der løfter karrieren, skærper beslutninger og gør dig klar til at præge den digitale udvikling. Læs mere og...

    Sikkerhed | Aarhus C

    Strategisk It-sikkerhedsdag 2026 - Aarhus

    Få overblik over cybersikkerhedens vigtigste teknologier, trusler og strategiske valg. Hør skarpe oplæg om AI-risici, forsvar, compliance og governance. Vælg mellem tre spor og styrk både indsigt og netværk. Deltag i Aarhus 22. januar.

    Se alle vores events inden for it

    Navnenyt fra it-Danmark

    Norriq Danmark A/S har pr. 1. oktober 2025 ansat Huy Duc Nguyen som Developer ERP. Han skal især beskæftige sig med at bidrage til at udvikle, bygge og skræddersy IT-løsninger, der skaber vækst og succes i vores kunders forretninger. Han kommer fra en stilling som Software Developer hos Navtilus. Han er uddannet i bioteknologi på Aalborg University. Nyt job

    Huy Duc Nguyen

    Norriq Danmark A/S

    Norriq Danmark A/S har pr. 1. september 2025 ansat Søren Vindfelt Røn som Data & AI Consultant. Han skal især beskæftige sig med at effektivisere, planlægge og implementere innovative, digitale løsninger for Norriqs kunder. Han kommer fra en stilling som Co-founder & CMO hos DrinkSaver. Han er uddannet Masters of science på Københavns IT-Universitet. Nyt job

    Søren Vindfelt Røn

    Norriq Danmark A/S

    IT Confidence A/S har pr. 1. oktober 2025 ansat Henrik Thøgersen som it-konsulent med fokus på salg. Han skal især beskæftige sig med rådgivende salg, account management og udvikling af kundeporteføljer på tværs af it-drift, sikkerhed og cloud-løsninger. Han kommer fra en stilling som freelancer i eget firma og client manager hos IT Relation og IT-Afdelingen A/S. Han er uddannet elektromekaniker. Han har tidligere beskæftiget sig med salg af it-løsninger, account management, it-drift og rådgivning samt undervisning og ledelse. Nyt job

    Henrik Thøgersen

    IT Confidence A/S