Agenter
World Wide Web har været en kæmpe succes for udveksling af information blandt mennesker. For computere og software-agenter er livet dog ikke så nemt. Information på World Wide Web er struktureret til menneskelig aflæsning.
Problemet
Hvis man skal løse en bestemt opgave, for eksempel tilrettelægge en rejse, kan det hele gøres via webbet i dag: Booking af fly og hotelbilletter, opdatering af kalendere, ruteangivelse til og fra flyvepladser og så videre. Men det hele kræver, at der sidder et menneske bag skærmen. Problemet er, at de data, der findes på Webbet, ikke giver mening for computere.
I eksemplet han skitserer, skal to søskende transportere deres mor til og fra medicinsk behandling, og i scenariet kan software-agenter selv finde relevante behandlingssteder ud fra forskellige forhold som sygeforsikring, geografi og de involverede parters kalendere.
Det meningsgivende web
Tim Berners-Lee og andre har i de sidste par år brugt termen The Semantic Web, som i denne sammenhæng kan oversættes til det meningsgivende web. Grunden til, at computere ikke kan løse den type af opgaver, som er skitseret i eksemplet, er, at de ikke kan forstå meningen med de enkelte elementer på en webside.
Ved at gennemløbe en webside kan computeren se enkelte elementer som titel og links indlejret i websiden, men der er ingen måde, hvorpå computeren kan udlede, hvad meningen er med et givet link: Dette er Dr. Hansens hjemmeside, og dette link fører til Dr. Hansens CV.
I det meningsgivende web vil en agent, der besøger Dr. Hansens webside kunne udlede, at lægen er i konsultationen mandag, onsdag og fredag, samt at booking-scriptet kan acceptere tidsangivelser i formatet åååå-mm-dd, og returnerer en tid hos lægen.
For at agenten kan udføre disse opgaver, kræves der vel at mærke ikke kunstig intelligens, som det kendes fra robotter i science fiction. Tim Berners-Lee forestiller sig, at det blot kræver en meningskodning af indholdet på websiden - en opgave, der ikke kræver involvering af specialister, men blot et hyldevare-forfatterværktøj, samt et besøg hos hjemmesiden for den relevante brancheorganisation.
RDF
Mening i web-suppen
Det meningsgivende web er ikke et nyt World Wide Web, men en udvidelse af det eksisterende spind. Udfordringen for miljøet omkring Semantic Web er, hvorledes logikken skal tilføjes det eksisterende web. Som man kan tænke sig, er det en kompliceret opgave.
To vigtige brikker er på plads: XML og RDF, Resource Description Framework. Tidligere har der været forskellige metadata-initiativer. Metadata - data om data - bruges til at beskrive websidens indhold. Web-udviklerne kender allerede ideen, nemlig de eksisterende HTML-metatags Keywords og Description, der giver mulighed for at beskrive indholdet af hele websiden. Det er selvfølgelig en meget grovkornet type af metadata, men giver alligevel god mening i forbindelse med søgerobotter.
Et andet initiativ er PICS, som er en standard for beskrivelse af indhold på websider. PICS er en implementering af RDF. RDF - Resource Description Framework - er en XML-applikation, hvis mål er at understøtte udveksling og behandling af metadata. RDF beskriver ressourcer på internet - med internet-adressen som identifikator - på en facon, så maskiner kan læse og forstå informationen.
Mening udtrykkes i RDF som et forhold imellem en ressource, der har en egenskab, og egenskabens værdi. Ressourcen kan være en person, en webside, eller noget tredie som har en egenskab.
RDF benytter i udstrakt grad muligheden for at blande forskellige vokabularier i XML - XML namespaces. På den måde behøves ikke en enkelt altomfattende sprog-definition, men i stedet kan forskellige sprog blandes i det samme RDF-datasegment.
RDF-data kan for eksempel se ud som herunder:
<? xml version="1.0" ?>
<RDF xmlns = "http://w3.org/TR/1999/PR-rdf-syntax-19990105#"
xmlns:DC = "http://purl.org/DC#" >
<Description about = "http://dstc.com.au/report.html" >
<DC:Title> The Future of Metadata </DC:Title>
<DC:Creator> Jacky Crystal </DC:Creator>
<DC:Date> 1998-01-01 </DC:Date>
<DC:Subject> Metadata, RDF, Dublin Core </DC:Subject>
</Description>
</RDF>
De her angivne RDF-data beskriver en ressource ud fra de definitioner, der er fastlagt i definitionen Dublin Core (DC), som er et selvstændigt namespace.
Ontologier
Problemet ved RDF er, at det ikke lige til at se, om forskellige begreber dækker de samme koncepter. Her kommer et tredje grundlæggende begreb ved det meningsfyldte web ind: Ontologier. I filosofi betyder ontologi læren om tings væsen. Inden for kunstig intelligens bruges det om et dokument, der formelt definerer relationer i mellem termer.
For eksempel kunne en ontologi beskrive en sammenhæng i mellem vejnavne og postnumre, således at hvis et geografisk sted er knyttet til et vejnavn og vejnummer, og en ressource fastlægger en sammenhæng i mellem dette vejnavn/vejnummer og postnummer, så kan en agent tillade sig at konkludere, at stedet hører sammen med postnummeret. Denne sammenhæng kræver ikke egentlig kunstig intelligens hos agenten.
Et eksempel findes på webadressen http://www.cs.umd.edu/~hendler/, hvor man i websidens kildekode finder følgende ontologi:
<INSTANCE KEY="http://www.cs.umd.edu/users/hendler/">
<USE-ONTOLOGY ID="cs-dept-ontology" VERSION="1.0" PREFIX="cs" URL= "http://www.cs.umd.edu/projects/plus/SHOE/cs.html">
<CATEGORY NAME="cs.Professor" FOR="http://www.cs.umd.edu/users/hendler/">
<RELATION NAME="cs.name">
<ARG POS=2 VALUE="Dr. James Hendler">
</RELATION>
<RELATION NAME="cs.doctoralDegreeFrom">
<ARG POS=1 VALUE="http://www.cs.umd.edu/users/hendler/">
<ARG POS=2 VALUE="http://www.brown.edu">
</RELATION>
<RELATION NAME="cs.emailAddress">
<ARG POS=2 VALUE="hendler@cs.umd.edu">
</RELATION>
<RELATION NAME="cs.head">
<ARG POS=1 VALUE="http://www.cs.umd.edu/projects/plus/">
<ARG POS=2 VALUE="http://www.cs.umd.edu/users/hendler/">
</RELATION>
</INSTANCE>
Denne ontologi fastsætter en række sammenhænge i mellem Professor Hendler og de forskellige roller, han har på universitetet.
Fremtid eller utopi
Det meningsfyldte web lover mange ting, som lyder bekendte: Intelligente systemer, der løser hverdagens trivielle gøremål. Men der er ikke set mange eksempler på sådanne systemer, som er realiseret i praksis. Som tilfældet er for så mange andre teknologier, må tiden vise, om teknologien er farbar eller ej.
Men i modsætning til mange andre typer af teknologier, der skal forbinde forskellige systemer, er det meningsgivende web baseret på en pragmatisk og praktisk indfaldsvinkel. Og ideen om intelligente systemer går i hvert fald ikke væk foreløbig.
Læs mere
Scientific American: The Semantic Web.
W3C: Semantic Web Activity.
W3C: Web Architecture: Describing and Exchanging Data.
http://archive.dstc.edu.au/RDU/reports/RDF-Idiot/" TARGET="_blank">An Idiot's Guide to the Resource Description Framework.