Nyt net bygges på danske Wikipedia

Information.dk lancerer det semantiske web, der lader data og tilhørende metadata flyde sammen for at give mening for læseren.

Danske Wikipedia bliver ofte beskyldt for at være en bleg kopi af den engelske moder-udgave. Men nu får de danske Wikipedia-skribenter en hjælpende hånd, der måske kan sætte gang i leksikonet - og få de flygtende læsere til at vende hjem.

Dagbladet Information har taget hul på et ambitiøst projekt om at sætte data i system. Det indebærer blandt andet, at informationer fra Wikipedia og andre aviser og databaser bliver trukket ind på avisens hjemmeside.

Missionen er kort sagt at træde ind i det semantiske web. Idéen om at data kan tale sammen på kryds og tværs.

Ved hjælp af sprogteknologi bliver alle artikler opmærket semantisk. Det betyder, at ord som Barack Obama og Søren Gade ikke bare er simpelt tekst. De bliver automatisk autotagget med metadata, så de kan indgå i andre sammenhænge og forbindes til eksisterende databaser og artikler.

Konkret betyder det, at Information har skabt 40.000 emnesider om personer, organisationer, steder og emner. Man kommer ind på emnesiderne via en boks i toppen af de fleste artikler. Se for eksempel oversigterne over Dronning Margrethe og Island.  

Er Wikipedia god nok
Men Wikipedia DK bliver ofte kritiseret for at være langsom og lille sammenlignet med andre Wikipedia-sider. Er det ikke farligt at basere en tjeneste på danske Wikipedia?

»Jeg har selv været en hård kritiker af det danske Wikipedia. Men vi gør meget for at opfordre folk til at bidrage til Wikipedia. Så jeg håber, at vi via det her projekt kan bidrage til, at der kommer mere indhold på Wikipedia. Men faktisk er Wikipedia ret hurtig på nyhedsfronten. For eksempel blev der hurtigt opstartet en kategori med ”lømmelpakken”. Men det er klart, at når man ser på historiske opslag, så har Wikipedia sine svagheder,« siger Nikolai Thyssen, der er chef for digitalt indhold på Information til ´CRN's søstersite ComON.

Men det er heller ikke Wikipedia alene, der skal sætte artikler i kontekst hos Information.

Information henter også data fra Dbpedia, det engelske Wikipedia og Geonames. Og brugen af Open Linked Data betyder også, at Informations artikler kan komplimenteres af artikler fra New York Times, der også anvender Open Linked Data.

»Fremover kan vi kombinere vores egen dækning af eksempelvis krigen i Irak med New York Times' dækning og lang række andre kilder. Brugerne vil opleve, at vi ikke blot skriver nyheder fra dag til dag, men sætter disse i sammenhæng og skaber viden, der giver mening og indsigt,« uddyber Nikolai Thyssen. Men når man ser på funktionen, så minder den meget om det vi kender som ”relaterede artikler” eller ”læs mere”.

»Jeg kan godt følge påstanden, men man skal forstå, at det her handler om metadata. Det er meget mere end at linke videre til gamle artikler. Det her giver helt nye muligheder. Vi er jo først lige begyndt, men snart kan vi forbinde vores artikler med CIA World Factbook og på den måde vil man for eksempel kunne bede om at se, hvilke artikler vi har skrevet om de 10 fattigste lande i de sidste 14 dage,« forklarer Nikolai Thyssen.

»Det er rigtig sjovt at lege med berigede metadata, for det er noget, som brager af sted i udlandet. For eksempel i det engelske med OpenCalais. Men det er skidesvært at opbygge og uforholdsmæssigt dyrt for et lille sprogområde som Danmark, så vi håber, at vi med vores projekt kan være med til at skabe en standard,« siger Nikolai Thyssen.

Information vil snart give omverdenen adgang til emnekataloget via api'er. Senere vil avisen også lave en professionel løsning til andre medier.

Ifølge Information er den danske avis blot den tredje i verden, der succesfuldt har indbygget forbundne data. De andre er BBC og The New York Times.

Læses lige nu

    Navnenyt fra it-Danmark

    Norriq Danmark A/S har pr. 1. september 2025 ansat Søren Vindfelt Røn som Data & AI Consultant. Han skal især beskæftige sig med at effektivisere, planlægge og implementere innovative, digitale løsninger for Norriqs kunder. Han kommer fra en stilling som Co-founder & CMO hos DrinkSaver. Han er uddannet Masters of science på Københavns IT-Universitet. Nyt job

    Søren Vindfelt Røn

    Norriq Danmark A/S

    Netip A/S har pr. 1. november 2025 ansat Christian Homann som Projektleder ved netIP's kontor i Thisted. Han kommer fra en stilling som Digitaliseringschef hos EUC Nordvest. Han er uddannet med en Cand.it og har en del års erfaring med projektledelse. Nyt job

    Christian Homann

    Netip A/S

    Tanja Schmidt Larsen, Director, Legal & Compliance hos Sentia A/S, er pr. 1. december 2025 forfremmet til Chief Operations Officer (COO). Hun skal fremover især beskæftige sig med synergi mellem kommercielle og tekniske processer samt sikre en sammenhængende kunderejse og fortsat driftsstabilitet. Forfremmelse
    Netip A/S har pr. 15. september 2025 ansat Jimmi Overgaard som Key Account Manager ved netIP's kontor i Viborg. Han kommer fra en stilling som Sales Executive hos Globalconnect A/S. Nyt job

    Jimmi Overgaard

    Netip A/S