Nørd crawler politikernes hjemmesider

Er internettet det nye forsamlingshus, spørger studerende?

Artikel top billede

Hvordan bruger politikerne internettet under valgkampen i 2010?

Dét svar skal forskere for fremtiden kunne besvare, mener den 24-årige politilogistuderende Bertel Torp. Han har sat en server op som scanner politikernes websider, facebook-profiler og lignenede hver uge frem til valget, så man kan følge udviklingen uge for uge.

Hvorfor lagrer du politikernes hjemmesider?

"Fordi jeg er en nørd. Det, tror jeg, er det rigtige svar. Der er så mange, der snakker om, hvordan sociale medier bliver det nye i valgkampen. Men jeg synes ikke, at der er nogle eksempler. Det hele sker intensivt over de tre uger, hvor der er valg, og jeg syntes jeg ville dokumentere det op til," siger Bertel Torp.

Hans interesse er både professionel og personlig. Han har nogle år studeret samfundsvidenskab ved Aalborg Universitet og er på vej til Copenhagen Business School, hvor han vil færdiggøre sin uddannelse. Desuden er han frivillig kampagnemedarbejder for den radikale Sofie Carsten Nielsen.

Dataene overvejer han selv at bruge til en videnskabelig artikel til sit studie, men han vil også lade andre få del i dataene, hvis det er til forskning eller undervisning. De lægges dog ikke ud til frit skue på nettet, eftersom han er usikker på ophavsret og lignende. Bertel Torp har dog allerede stillet sit datasæt over eksempelvis Facebook-sider frit til rådighed på sin hjemmeside i en kommasepareret fil.

 

Bruger Heritrix til crawle

Bertel Torp, der efter en uges indsamling har skrabet politikernes sider for 3,1 GB data, har undervejs måtte ændre i sin crawler-opsætning.

"Jeg startede med at lave mit eget script, og det gik fuldstændig galt. I løbet af en halv time, begyndte den at downloade hele Facebook. Den fulgte links på siderne og begyndte så at hente, og jeg er ikke sikker på, at det er i tråd med Facebooks politik," forklarer Bertel Torp.

Han overvejede derefter blot at bruge et script, der tager screenshots af siderne, men valgte til sidst, hvad han så som den bedste og letteste løsning: Open source-crawleren Heritrix, som det kendte net-arkiv web.archieve.org bruger. Programmet kopierer kildekoden på siderne, men ulempen er, at mediefiler, eksempelvis indlejrede Youtube-videoer, senere kan være svære at genskabe. Programmet fungerer desuden langsomt ved Flash-sider.

Bertel Torp overvejer som det første at bruge dataene til en ord-sky (tagcloud), så man kan se, hvad de forskellige partiers kandidater bruger mange ord på. Derudover er han en anelse usikker på, hvad han skal bruge dataene til.

"Data er ikke noget værd, hvis man ikke ved, hvordan man skal behandle dem, og det er lidt dér, jeg strander," siger Bertel Torp.

Dog mener han, at der er masser af spørgsmål at tage fat på.

 

Det nye forsamlingshus?

"Sociale medier er det nye vælgermøde. Det er spået, at det skal være det nye forsamlingshus. Det er dér, man møder vælgerne og har en dialog med dem, og det er dét, jeg gerne vil fange. Jeg synes dog ikke, politikerne er specielt gode til at udnytte mulighederne. Jeg har nogle få eksempler på, hvor der er dialog. Nogle bruger Facebook til at snakke med folk, men ellers synes jeg ikke, at den store brede gruppe masse af politikere bruger det. De bruger det som valgplakater og kronikker - altså til at skubbe information ud," mener Bertel Torp, der altså endnu ikke ser de sociale medier som det nye forsamlingshus.

Serveren er sat op til at respektere robots.txt, så man kan blokere crawleren ved at indsætte følgende kode:

User-agent: eValg11
Disallow: /

Bertel Torp oplyser, at han allerede er stødt på syv folketingskandidater, der har "no-follow" på deres hjemmesider, så Google ikke indekserer siderne. Disse hjemmesider crawler Bertel Torp ligeledes ikke.

Læses lige nu

    Event: Årets CISO 2026

    Sikkerhed | København

    Vi glæder os til at løfte sløret for flere detaljer til denne konference. I mellemtiden kan du tilmelde dig og dermed have tidspunktet reserveret i din kalender.

    22 oktober 2026 | Gratis deltagelse

    Navnenyt fra it-Danmark

    Immeo har pr. 1. marts 2026 ansat Theo Lyngaa Hansen som Consultant. Han kommer fra en stilling som Data Manager hos IDA. Han er uddannet i Business Administration & Data Science. Nyt job
    Henrik Vittrup Zoega, projektkoordinator hos Departementet for Fiskeri, Fangst, Landbrug og Selvforsyning, Grønland, har pr. 22. januar 2026 fuldført uddannelsen Master i it, linjen i organisation på Syddansk Universitet via It-vest-samarbejdet. Færdiggjort uddannelse

    Henrik Vittrup Zoega

    Departementet for Fiskeri, Fangst, Landbrug og Selvforsyning, Grønland

    Renewtech ApS har pr. 1. februar 2026 ansat Mads Linné Kaasgaard, 31 år,  som Marketing Specialist. Han skal især beskæftige sig med med at løfte Renewtechs brand og kommunikation yderligere ud globalt. Han kommer fra en stilling som Marketing Manager hos Induflex A/S. Han er uddannet fra Aalborg Universitet og har en Cand. Merc. i Sprog & International Virksomhedskommunikation. Nyt job

    Mads Linné Kaasgaard

    Renewtech ApS

    Mark Michaelsen, teknisk systemejer og projektleder hos Aarhus Kommune, har pr. 26. januar 2026 fuldført uddannelsen Master i it, linjen i organisation på Aarhus Universitet via It-vest-samarbejdet. Færdiggjort uddannelse

    Mark Michaelsen

    Aarhus Kommune