Intelligent søgning på web

Der er en masse information på at finde på nettet, men hvad er det information om? Det spørgsmål prøver "det semantiske web" at besvare, men eksperterne er skeptiske over for ideen.

Af Torben B. Sørensen

Vi skal ikke bare mene, hvad vi siger, vi skal også sige, hvad vi mener. På denne måde blev begrebet ?det semantiske web? præsenteret på Hypertext 2001-konferencen for nylig. På web i dag siger vi en hel masse: Web-siderne er fulde af tekst og billeder. Men vi glemmer at fortælle, hvad de handler om.

Det kan man gøre ved hjælp af såkaldte metadata. Det er data om data. Manglen på metadata gør det svært at søge efter information: Hvis man søger efter ordet ?apple?, kan man få søgeresultater om æblemost, et computerfirma, et pladeselskab og sangerinden Fiona Apple.

Hvis man derimod kunne fortælle søgemaskinen, at man kun er interesseret i information om frugtdyrkning, kunne den skære de overflødige søgeresultater fra. I dag klarer man gerne den sag ved at søge på flere ord, som man gætter på kunne optræde i sammenhæng. Men i det semantiske web skal der blive mere styr på tingene.

Begrebet stammer fra Tim Berners-Lee, der opfandt world wide web. Men skønt det har været kendt siden midten af 90?erne, er det ikke blevet til meget i praksis. På konferencen var der da også udtalt skepsis blandt de fem eksperter, der var indbudt til at debattere emnet.

? Det er sikkert nok muligt at opbygge det semantiske web, men der er stadig nogle ubesvarede spørgsmål. Jeg tror, at vi vil arbejde på det, men at vi ender med at have noget, der måske ikke er et semantisk web, men hvor information trods alt bliver lidt nemmere at finde, mente Lloyd Rutledge fra CWI i Amsterdam.

Sild og fisk
Carole Goble fra University of Manchester gav et eksempel på, hvad det semantiske web skal kunne bruges til:

? Hvis jeg gerne vil vide, hvor mange sild, der bliver fanget hvert år i Danmark, skal jeg kunne lave en søgning. Resultatet indeholder en database, som godt nok kræver abonnement for at blive brugt, men til gengæld er det sikkert, at den indeholder data om fiskeri i Danmark. Et andet resultat er et web-sted om fisk i Skandinavien, skønt det ikke nødvendigvis indeholder ordene ?sild? og ?Danmark?. Og et tredje resultat kunne være en person, som ved meget om emnet, og som jeg kan kontakte. Den slags kræver en agent, der udfører opgaven ? og agenter kræver metadata, fortalte hun.

Hun mener, at der ikke kommer metadata om alle de websteder, der findes i dag. Derfor regner hun det for mere sandsynligt, at der kommer en række mindre, semantiske web. Det bliver de intranet, hvor små, veldefinerede brugergrupper deles om information.

Harmløst
Skepsisen var mere udtalt hos hypertekst-eksperten Cathy Marshall fra Microsoft. Det bedste, hun kunne sige om det semantiske web, var, at det nok er harmløst.
Hun mente, at det store problem ligger i at få folk til at udarbejde metadata, der beskriver deres web-steder. De har i forvejen nok at gøre med at vedligeholde web-stederne, så hvorfor skulle de også bruge kræfter på at vedligeholde metadata om dem, lød hendes argumentation.

David Durand, der er aktiv i udviklingen af XML-standarder, ser især det semantiske web som en mulighed for igen at få midler til forskning i kunstig intelligens. Det drejer sig især om forskningen i at få programmer til at forstå tekst som andet end rækker af tegn.

? Vi kunne kalde det ?de deprimerede vender tilbage?, idet kunstig intelligens-forskerne nu igen kan få penge til at forske for. Så jeg ser det semantiske web som et værdifuldt projekt, sagde han.

RDF som standard
World Wide Web Consortium (W3C) arbejder på en standard for, hvordan man tilknytter metadata til et dokument. Den hedder RDF (Resource Description Framework) og bygger på, at informationen ikke gemmes i det dokument, den beskriver. I stedet opbevares metadata om et dokument på en særlig server.

Den internationale konference Hypertext 2001 blev afholdt i Århus den 14.-18. august. Den samlede dels akademikere med interesse for hypertekst, dels forfattere og andre kunstnere, der bruger hypertekst i deres værker. Konferencen arrangeres af ACM (Association for Computing Machinery).

Yderligere information: www.ht01.org

Relevant link: PC World: Berners-Lees vision: Det meningsgivende web

Læses lige nu

    Annonceindlæg tema

    Forsvar & beredskab

    Cybersikkerhed, realtidsdata og robuste it-systemer er blevet fundamentet for moderne forsvar.

    Weilbach A/S

    Head of Operations Support

    Københavnsområdet

    Capgemini Danmark A/S

    SAP S/4HANA Business Controlling

    Københavnsområdet

    Jyske Bank

    Forretningsudvikler til porteføljestyring

    Københavnsområdet

    Netcompany A/S

    Test Consultant

    Københavnsområdet

    Navnenyt fra it-Danmark

    Marie Søndergaard, Acting Chief Product Owner hos Energinet, har pr. 26. januar 2026 fuldført uddannelsen Master i it, linjen i organisation på Aarhus Universitet via It-vest-samarbejdet. Færdiggjort uddannelse

    Marie Søndergaard

    Energinet

    Immeo har pr. 1. februar 2026 ansat Patricia Oczki som Marketing Manager. Hun kommer fra en stilling som Head of Marketing and Communication hos Coach Solutions. Nyt job
    Renewtech ApS har pr. 1. februar 2026 ansat Mads Linné Kaasgaard, 31 år,  som Marketing Specialist. Han skal især beskæftige sig med med at løfte Renewtechs brand og kommunikation yderligere ud globalt. Han kommer fra en stilling som Marketing Manager hos Induflex A/S. Han er uddannet fra Aalborg Universitet og har en Cand. Merc. i Sprog & International Virksomhedskommunikation. Nyt job

    Mads Linné Kaasgaard

    Renewtech ApS

    Lector ApS har pr. 2. februar 2026 ansat Jacob Pontoppidan som Sales Executive i Lectors TeamShare gruppe. Jacob skal især beskæftige sig med vækst af TeamShare med fokus på kommerciel skalering, mersalg og en stærk go to market eksekvering. Jacob har tidligere beskæftiget sig med salg og forretningsudvikling i internationale SaaS virksomheder. Nyt job

    Jacob Pontoppidan

    Lector ApS