Nyt net bygges på danske Wikipedia

Information.dk lancerer det semantiske web, der lader data og tilhørende metadata flyde sammen for at give mening for læseren.

Danske Wikipedia bliver ofte beskyldt for at være en bleg kopi af den engelske moder-udgave. Men nu får de danske Wikipedia-skribenter en hjælpende hånd, der måske kan sætte gang i leksikonet - og få de flygtende læsere til at vende hjem.

Dagbladet Information har taget hul på et ambitiøst projekt om at sætte data i system. Det indebærer blandt andet, at informationer fra Wikipedia og andre aviser og databaser bliver trukket ind på avisens hjemmeside.

Missionen er kort sagt at træde ind i det semantiske web. Idéen om at data kan tale sammen på kryds og tværs.

Ved hjælp af sprogteknologi bliver alle artikler opmærket semantisk. Det betyder, at ord som Barack Obama og Søren Gade ikke bare er simpelt tekst. De bliver automatisk autotagget med metadata, så de kan indgå i andre sammenhænge og forbindes til eksisterende databaser og artikler.

Konkret betyder det, at Information har skabt 40.000 emnesider om personer, organisationer, steder og emner. Man kommer ind på emnesiderne via en boks i toppen af de fleste artikler. Se for eksempel oversigterne over Dronning Margrethe og Island.  

Er Wikipedia god nok
Men Wikipedia DK bliver ofte kritiseret for at være langsom og lille sammenlignet med andre Wikipedia-sider. Er det ikke farligt at basere en tjeneste på danske Wikipedia?

»Jeg har selv været en hård kritiker af det danske Wikipedia. Men vi gør meget for at opfordre folk til at bidrage til Wikipedia. Så jeg håber, at vi via det her projekt kan bidrage til, at der kommer mere indhold på Wikipedia. Men faktisk er Wikipedia ret hurtig på nyhedsfronten. For eksempel blev der hurtigt opstartet en kategori med ”lømmelpakken”. Men det er klart, at når man ser på historiske opslag, så har Wikipedia sine svagheder,« siger Nikolai Thyssen, der er chef for digitalt indhold på Information til ´CRN's søstersite ComON.

Men det er heller ikke Wikipedia alene, der skal sætte artikler i kontekst hos Information.

Information henter også data fra Dbpedia, det engelske Wikipedia og Geonames. Og brugen af Open Linked Data betyder også, at Informations artikler kan komplimenteres af artikler fra New York Times, der også anvender Open Linked Data.

»Fremover kan vi kombinere vores egen dækning af eksempelvis krigen i Irak med New York Times' dækning og lang række andre kilder. Brugerne vil opleve, at vi ikke blot skriver nyheder fra dag til dag, men sætter disse i sammenhæng og skaber viden, der giver mening og indsigt,« uddyber Nikolai Thyssen. Men når man ser på funktionen, så minder den meget om det vi kender som ”relaterede artikler” eller ”læs mere”.

»Jeg kan godt følge påstanden, men man skal forstå, at det her handler om metadata. Det er meget mere end at linke videre til gamle artikler. Det her giver helt nye muligheder. Vi er jo først lige begyndt, men snart kan vi forbinde vores artikler med CIA World Factbook og på den måde vil man for eksempel kunne bede om at se, hvilke artikler vi har skrevet om de 10 fattigste lande i de sidste 14 dage,« forklarer Nikolai Thyssen.

»Det er rigtig sjovt at lege med berigede metadata, for det er noget, som brager af sted i udlandet. For eksempel i det engelske med OpenCalais. Men det er skidesvært at opbygge og uforholdsmæssigt dyrt for et lille sprogområde som Danmark, så vi håber, at vi med vores projekt kan være med til at skabe en standard,« siger Nikolai Thyssen.

Information vil snart give omverdenen adgang til emnekataloget via api'er. Senere vil avisen også lave en professionel løsning til andre medier.

Ifølge Information er den danske avis blot den tredje i verden, der succesfuldt har indbygget forbundne data. De andre er BBC og The New York Times.

Læses lige nu

    Event: SAP Excellence Day 2026

    It-løsninger | Nordhavn

    Få konkrete erfaringer med S/4HANA, automatisering og AI i praksis. Hør hvordan danske virksomheder realiserer gevinster og etablerer effektive SAP-løsninger. Vælg fysisk deltagelse hos SAP eller deltag digitalt.

    24. februar 2026 | Gratis deltagelse

    Navnenyt fra it-Danmark

    inciro K/S har pr. 1. februar 2026 ansat Lasse Fletcher som Cloud Consultant. Han skal især beskæftige sig med Governance og struktur i cloud miljøer. Han kommer fra en stilling som IT Tekniker hos CBrain A/S. Han er uddannet datatekniker med speciale i infrastruktur. Han har tidligere beskæftiget sig med kunde onboarding, Identitets styring, sikkerhed og IaC. Nyt job

    Lasse Fletcher

    inciro K/S

    Idura har pr. 5. januar 2026 ansat Arjuna Enait, 34 år,  som software engineer. Han skal især beskæftige sig med videreudvikling af Verify-systemet samt arbejde på implementeringen af CIBA i Norsk BankID. Han kommer fra en stilling som software engineer hos Lasso X. Han er uddannet civilingeniør med speciale i geoteknik. Han har tidligere beskæftiget sig med at bygge microservices til dataindsamling og -processering, samt opdatere legacy-systemer. Nyt job

    Arjuna Enait

    Idura

    Idura har pr. 1. januar 2026 ansat Martin Ingolf Broberg, 43 år,  som webmaster. Han skal især beskæftige sig med at få idura.eu til at spille på alle digitale tangenter og sikre, at siden genererer nye leads. Han kommer fra en stilling som team lead hos Danmarks Radio. Han har tidligere beskæftiget sig med blandt andet at stifte og lede et analyseteam i DR med fokus på web og lyd. Nyt job
    netIP har pr. 20. januar 2026 ansat Darnell Olsen som Datateknikerelev ved netIP's kontor i Herning. Han har tidligere beskæftiget sig med diverse opgaver omkring biludlejning, da han har været ansat hos Europcar. Nyt job