Elementsæt
Som vi så i den forrige artikel om metadata, data om data, kan metadata benyttes til at organisere informationer, internt i virksomheden og eksternt på internet samt forbedre informationsfangst.
Teknologien, der benyttes, hedder Resource Description Framework, RDF, og er en standard for metadata i W3-konsortiets regi.
Som vi så i den forrige artikel, udtrykkes mening i RDF som et forhold imellem en ressource, der har en egenskab, og egenskabens værdi, som skitseret på grafen herunder. Ressourcen kan være en person, en webside, eller noget tredie, som har en egenskab.
Som tidligere nævnt, og som navnet også siger, er RDF et framework, og man er ikke tvunget til at benytte et bestemt sæt af elementer til at beskrive sine data med. Det giver fleksibilitet på kort og lang sigt. Man kan vælge at definere sine egne elementsæt, hvilket kan give udmærket mening i forbindelse med virksomhedens konkrete behov.
RDF benyttes som regel som et XML-sprog, men RDF er ikke bundet til XML, og der findes andre måder at repræsentere RDF-datasæt på, selv om XML umiddelbart er den mest oplagte facon at implementere RDF på.
Som sagt er en enkel stump RDF-information blot en tripel bestående af en ressource-type, en relation, og en værdi.
Ressourcetyperne er fastlagt i et elementsæt. Her er RDF fleksibelt, da det ikke definerer bestemte elementsæt. Det er der andre, der tager sig af. Man kan sagtens blande forskellige elementsæt, ved XML namespaces, og dermed kan man benytte forskellige eksisterende elementsæt, og udvide med hjemmestrikkede elementsæt, når der er behov for beskrivelser, der er specifikke for en bestemt virksomhed eller organisation.
Dublin Core
Dublin Core
Til mere almene formål er det bedste valg dog at benytte et standardiseret elementsæt. Ved hjælp af XML namespaces kan forskellige elementsæt blandes, så brug af det ene sæt udelukker ikke det andet.
Et elementsæt, som indgår i næsten alle RDF-deklarationer er Dublin Core-sættet. Nogle egenskaber er mere grundlæggende end andre, og Dublin Core er et elementsæt, som man vil have behov for at implementere i næsten alle sammenhænge. Dublin Core beskriver grundlæggende egenskaber som titel, ophavsperson med videre. Bag Dublin Core står en gruppe, Dublin Core Metadata Initiative, som siden 1995 har arbejdet med metadata-standarder. Dublin Core definerer en række basisegenskaber ved dokumenter såsom titel, ophavsperson, beskrivelse med videre. Men lad os nu se, hvordan det egentlig ser ud:
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://www.pcworld.dk/Default.asp?Mode=2&ArtikelID=2705"
dc:creator="Tania Andersen"
dc:title="Metadata giver masser af mening"
dc:description="PC World Online artikel, som giver en praktisk introduktion til RDF, Resource Description Framework"
dc:date="2001-08-29" />
</rdf:RDF>
Her ses anvendelsen af forskellige XML-namespaces. Nogle af XML-mærkerne stammer fra XML-definitionen af RDF, mens andre mærker stammer fra Dublin Core-elementsættet.
Det ses af prefixene "RDF:" og "DC:" i mærkerne. De definerer at elementsættene stammer fra henholdvis RDF-definitionen og Dublin Core-elementsættet.
De to indledende mærker i toppen af XML-stumpen definerer et namespace samt en URI (som er en generel form for webadresser), der henviser til en ressource, som definerer eller forklarer betydningen af dette navnerum. Det er den del, der begynder med "xmlns:"
Denne adresse har tidligere givet anledning til forvirring, så her er det på sin plads at komme med en hurtig forklaring. Oprindeligt var det ideen, at adressen skulle pege på en maskin-læsbar ressource som en DTD eller XML Schema, men denne ide er senere blevet forladt, og nu kan det blot være en webside, som forklarer meningen bag det anvendte namespace. Det behøves ikke at være en adresse, men kan også være en såkaldt URN - Uniform Ressource Name - som ikke direkte peger på en ressource, men giver en ressource et unikt navn. Denne mulighed benytter Microsoft som oftest, så i Microsoft-XML-dokumenter finder man ofte en notation i stil med xmlns:o="urn:schemas-microsoft-com:office:office".
Flere slags RDF'er
Der findes i øvrigt flere forskellige XML-formuleringer af RDF. Den ovenstående er velegnet til websider, da informationen er indkapslet i et mærke. Derfor er informationen kodet som attributter i stedet for selvstændige mærker, hvilket kan give anledning til visse problemer. Til XML-brug er det bedre at benytte en formulering, hvor hver enkelt RDF-tripel er angivet ved selvstændige mærker.
Andre elementer i Dublin Core elementsættet er Publisher, Contributor, Type, Format, Identifier, Source, Language, Relation, Coverage og Rights, og de er gennemgået nøjere på Dublic Cores hjemmeside.
Læs mere
RDF hører hjemme hos W3C, og på RDF-hjemmesiden kan man finde mange ressourcer på webbet.
Der er mange applikationer af RDF med tilhørende elementsæt, og for ikke at genopfinde hjulet skal man starte med at se på disse applikationer, før man skaber sine egne. En oversigt kan ses på University of Bristols hjemmeside.
Herhjemme har Statens Informationstjeneste kig på RDF i forbindelse med OiO - Offentlig Information Online. Man kan læse mere på SI's hjemmeside.