Open source-projekt skal lokke danske hjemmesider til at dyppe tæerne i det semantiske web

Information.dk deler sine erfaringer på Tagger.dk.

Helt tilbage i 2003 begyndte web-pioneren Tim Berners-Lee at drømme om internettets næste skridt - det semantiske web. Men det lader stadig vente på sig i den form, som Bernes-Lee forventer.

Men de første spadestik er taget. I denne uge blev der taget et på dansk jord.

Tagger.dk, der udspringer af erfaringer fra avisen Information, blev tilgængelig for omverdenen i open source-klæder. 

Det semantiske net betyder, at nettet bliver så intelligent, at det kan se sammenhænge og ikke kun enkeltstående ord. For eksempel at søgemaskiner skal kunne kende forskel på ordet Kashmir alt efter om det står i relation til stoffet, regionen eller rockbandet.
På et højere niveau vil det semantiske net gøre systemer i stand til at tale sammen på tværs af systemer.

Tagger.dk udspringer af Informations eget projekt, der gik i gang sidste år, som gør det let at binde artikler sammen med tidligere artikler eller offentlige opslagsværker.

Hvad er der sket siden sidst?

"Vi har abstraheret projektet ud af vores eget system, så andre kan bruge det. Før var det meget knyttet til vores CMS. Der var ikke så meget automatisering af tags. Nu kan man finde tags i løbende tekst," Johannes Wehner, der er en af udviklerne på projektet.

På Tagger.dk kan man hente de datasæt, som Information har opbygget og bruger. Det er dog primært knyttet til personer, organisationer og firmaer. Tanken er, at Tagger-projektet skal skabe et open source-miljø omkring datasæt, så det bliver let at dele og opdatere. Lige nu er den automatiske opmarkering af ord tilgængeligt i en webservice, men der arbejdes netop nu på at gøre Tagger til et bibliotek, som kan bruges enten i en webservice eller i fx et Drupalmodul.

"Det skal gerne være teknologiuafhængigt. Men det er klart, at der er stærke bindinger til Drupal i første omgang, når projektet er vokset ud af Information, hvor vi er lidt Drupal-forelskede. Men vi er allerede gået fra at tilbyde det som en webservice til at gøre det tilgængeligt via et bibliotek så folk kan have det kørende lokalt. Det er netop for at blive så uafhængige af platformen," siger Johannes Wehner.

Tagger.dk er inspireret af OpenCalais, der er et lignende projekt, som dog kun knytter til det engelske sprog. Center for Sprogteknologi på Københavns Universitet har bidraget til Tagger.

Se mere på tagger.dk.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Targit A/S
Udvikling og salg af software til business intelligence.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
EA Excellence Day

Hvad er det, der gør it-arkitektens rolle så vigtig? Og hvad er det for udfordringer inden for områder som cloud, netværk og datacentre, som fylder hos nogle af landets bedste it-arkitekter lige nu? Det kan du her høre mere om og blive inspireret af på denne konference, hvor du også får lejlighed til at drøfte dette med ligesindede.

23. april 2024 | Læs mere


AI Business Excellence Day – sådan folder du mulighederne ud

Mange danske virksomheder har eksperimenteret med AI-projekter af begrænset omfang, men kun de færreste har for alvor udforsket mulighederne i storskala. Det gør vi her! Du vil blandt andet få mulighed for at se eksempler på, hvordan AI kan anvendes som accelerator i storskala og skubber til grænserne for, hvordan det er muligt at integrere teknologien, så potentialet for alvor foldes ud.

24. april 2024 | Læs mere


Unbreakable - sådan sikrer du dig vedvarende og uafbrudt adgang til dine data

Vi dykker ned i værdien af en stabil og pålidelig storage-platform og hvilke muligheder der findes, for at sikre den højeste grad af redundans og tilgængelighed. Områder som date-beskyttelse og cyber-sikkerhed vil også blive berørt.

25. april 2024 | Læs mere