Artikel top billede

Information.dk leger med det semantiske web

Nyt liv til danske Wikipedia?

Danske Wikipedia bliver ofte beskyldt for at være en bleg kopi af den engelske moder-udgave. Men nu får de danske Wikipedia-skribenter en hjælpende hånd, der måske kan sætte gang i leksikonet - og få de flygtende læsere til at vende hjem.

Dagbladet Information har taget hul på et ambitiøst projekt om at sætte data i system. Det indebærer blandt andet, at informationer fra Wikipedia og andre aviser og databaser bliver trukket ind på avisens hjemmeside.

Missionen er kort sagt at træde ind i det semantiske web. Idéen om at data kan tale sammen på kryds og tværs.

Ved hjælp af sprogteknologi bliver alle artikler opmærket semantisk. Det betyder, at ord som Barack Obama og Søren Gade ikke bare er simpelt tekst. De bliver automatisk autotagget med metadata, så de kan indgå i andre sammenhænge og forbindes til eksisterende databaser og artikler.

Konkret betyder det, at Information har skabt 40.000 emnesider om personer, organisationer, steder og emner. Man kommer ind på emnesiderne via en boks i toppen af de fleste artikler. Se for eksempel oversigterne over Dronning Margrethe og Island.  

Er Wikipedia god nok
Men Wikipedia DK bliver ofte kritiseret for at være langsom og lille sammenlignet med andre Wikipedia-sider. Er det ikke farligt at basere en tjeneste på danske Wikipedia?

”Jeg har selv været en hård kritiker af det danske Wikipedia. Men vi gør meget for at opfordre folk til at bidrage til Wikipedia. Så jeg håber, at vi via det her projekt kan bidrage til, at der kommer mere indhold på Wikipedia. Men faktisk er Wikipedia ret hurtig på nyhedsfronten. For eksempel blev der hurtigt opstartet en kategori med ”lømmelpakken”. Men det er klart, at når man ser på historiske opslag, så har Wikipedia sine svagheder,” siger Nikolai Thyssen, der er chef for digitalt indhold på Information til ComON.

Men det er heller ikke Wikipedia alene, der skal sætte artikler i kontekst hos Information.

Information henter også data fra Dbpedia, det engelske Wikipedia og Geonames. Og brugen af Open Linked Data betyder også, at Informations artikler kan komplimenteres af artikler fra New York Times, der også anvender Open Linked Data.

”Fremover kan vi kombinere vores egen dækning af eksempelvis krigen i Irak med New York Times' dækning og lang række andre kilder. Brugerne vil opleve, at vi ikke blot skriver nyheder fra dag til dag, men sætter disse i sammenhæng og skaber viden, der giver mening og indsigt,” uddyber Nikolai Thyssen. Men når man ser på funktionen, så minder den meget om det vi kender som ”relaterede artikler” eller ”læs mere”.

”Jeg kan godt følge påstanden, men man skal forstå, at det her handler om metadata. Det er meget mere end at linke videre til gamle artikler. Det her giver helt nye muligheder. Vi er jo først lige begyndt, men snart kan vi forbinde vores artikler med CIA World Factbook og på den måde vil man for eksempel kunne bede om at se, hvilke artikler vi har skrevet om de 10 fattigste lande i de sidste 14 dage,” forklarer Nikolai Thyssen.

”Det er rigtig sjovt at lege med berigede metadata, for det er noget, som brager af sted i udlandet. For eksempel i det engelske med OpenCalais. Men det er skidesvært at opbygge og uforholdsmæssigt dyrt for et lille sprogområde som Danmark, så vi håber, at vi med vores projekt kan være med til at skabe en standard,” siger Nikolai Thyssen.

Information vil snart give omverdenen adgang til emnekataloget via api'er. Senere vil avisen også lave en professionel løsning til andre medier.

Ifølge Information er den danske avis blot den tredje i verden, der succesfuldt har indbygget forbundne data. De andre er BBC og The New York Times.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Also A/S
Salg af serviceydelser inden for logistik, finansiering, fragt og levering, helhedsløsninger, digitale tjenester og individuelle it-løsninger.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Cyber Security Summit 2025: Her er truslerne – og sådan beskytter du dine kritiske data

Deltag og få værktøjer til at beskytte din virksomhed mod de nyeste cybertrusler med den rette viden og teknologi.

19. august 2025 | Læs mere


Cyber Security Summit 2025 i Jylland

Deltag og få værktøjer til at beskytte din virksomhed mod de nyeste cybertrusler med den rette viden og teknologi.

21. august 2025 | Læs mere


AI i det offentlige: Potentiale, erfaringer og krav

Hør erfaringerne med at anvende AI til at transformere og effektivisere processer i det offentlige – og med at sikre datakvalitet, governance og overholdelse af retningslinjer.

27. august 2025 | Læs mere