Metadata giver masser af mening

Metadata - data om data - tilfører de eksisterende informationer værdi. Arkitekturen for metadata hedder RDF, Resource Description Framework. RDF kan forbedre søgninger og give overblik over elektroniske dokumentsamlinger.

Hvorfor RDF

Metadata er data om data. I forbindelse med informationshåndtering, kan det være beskrivelse af de egenskaber, som data har, om det så er tekstdokumenter, musikfiler eller noget helt tredie. Metadata kan hjælpe med at organisere informationsmængder og gøre informationsfangst nemmere. Det gælder både organisationens interne dokumenter og data, og det gælder de offentlige tilgængelige data, der findes på world wide web og andre internet-tjenester.

Søgemaskiner
De redskaber, der findes til informationssøgning på websider, er i grunden ganske primitive. De fleste gammeldags søgeværktøjer som AltaVista og HotBot fungerer blot ved fritekstsøgning blandt den tekst, som søgetjenesterne har fanget på websider. Der er ikke meget intelligens involveret, og i praksis oplever man jo også, at søgeresultater fra disse søgemaskiner ofte kan virke vilkårlige.

Google har som den første søgemaskine implementeret et informationslag ovenover den rå tekst, som er fanget på websiderne. Kort fortalt rangerer Google søgeresultaterne efter hvor mange links, der peger på en bestemt webside. Jo flere links der peger på en given side, jo større informationsværdi må siden have. Det minder lidt om den måde man bedømmer forskningsmeritter på i videnskabelige kredse: Jo flere referencer en given artikel får, jo vigtigere må indholdet bedømmes til at være.

Det er selvfølgelig en gennemsnitlig betragtning, og selv om Google har forbedret kvaliteten af fritekstsøgninger på webbet, er der stadig en høj grad af vilkårlighed i svarene.

Søgninger kan forbedres voldsomt, hvis man tilføjer metadata, som beskriver indholdet på websiden eller ressourcen. Et aktuelt eksempel kan ses i peer-to-peer verdenen. Tjenesten Kazaa, som er en peer-to-peer baseret fil-udvekslingstjeneste som Napster og Gnutella, benytter metadata til at forbedre søgninger, og det fungerer i praksis. Som Napster og Gnutella handler det om at udveksle musikfiler, og metadata i Kazaa beskriver derfor egenskaber som titel, kunstnernavn, kategori, sprog med videre. I modsætning hertil benytter Gnutella og Napster blot en tekststreng, hvilket giver en væsentlig mindre grad af præcision i søgeresultaterne.

Brugen af metadata er ikke afgrænset til internet. Metadata er vigtige i alle sammenhænge, hvor elektronisk information behandles og opbevares. Ved overgang til en eller anden type af elektronisk dokumenthåndtering vil situationen i organisationen eller virksomheden ligne situationen på webbet: Mængden af information kan i sig selv blive en tærskel, og det bliver sværere at finde den relevante information, når informationsmængden stiger.

RDF beskriver data

RDF beskriver data
RDF - Resource Description Framework - er (som oftest) en XML-applikation, hvis mål er at understøtte udveksling og behandling af metadata. RDF beskriver ressourcer på internettet - med internet-adressen som identifikator - på en facon, så maskiner kan læse og forstå informationen. RDF er dog ikke fastlåst til XML. Der findes andre måder at repræsentere RDF-datasæt på, så man skal ikke stirre sig blind på XML i denne sammenhæng.

Mening udtrykkes i RDF som et forhold imellem en ressource, der har en egenskab, og egenskabens værdi. Ressourcen kan være en person, en webside, eller noget tredie, som har en egenskab.

De umiddelbare gevinster ved RDF er synlige og lige ved hånden. Alle typer af informationsbehandling, som det kendes fra områder som Knowlegde Management, Content Management og elektronisk dokumenthåndtering, kræver metadata. Hvis man ikke ved, hvad de enkelte dokumenter og datasamlinger indeholder, er det svært at kunne anvende data. Ved at bruge RDF, eller produkter, der understøtter RDF, kan man på den måde fremtidssikre sin arkitektur. Når et nuværende produkt skal udskiftes, eller blot når der skal udveksles data til andre applikationer, angiver RDF en standard for metadata.

Samtidig er RDF meget fleksibelt. Man er ikke tvunget til at benytte et bestemt sæt af beskrivelser, men kan blande forskellige RDF-vokabularier ved XML namespaces. XML namespaces er netop standarden for, hvorledes XML-sprog blandes.

Det meningsgivende web

Det meningsgivende web
Tim Berners-Lee, opfinderen af world wide web, har givet ophav til en vision om et intelligent web, der bygger på metadata i form af RDF.

Hvis man skal løse en bestemt opgave, for eksempel tilrettelægge en rejse, kan det hele gøres via webbet i dag: Booking af fly og hotelbilletter, opdatering af kalendere, ruteangivelse til og fra flyvepladser og så videre. Men det hele kræver, at der sidder et menneske bag skærmen. Problemet er, at de data, der findes på Webbet, ikke giver mening for computere.

RDF skulle kunne sætte elektroniske agenter i stand til at løse opgaver som den der er skitseret herover. Der skal dog mere til end RDF, nemlig en beskrivelse af relationer i mellem forskellige sæt af metadata. Det skal foregå ved hjælp af en størrelse som folkene bag det meningsgivende web kalder for ontologier. Det meningsgivende web er gennemgået i en tidligere artikel.

Der er dog fra mange kanter skepsis overfor, om det meningsgivende web er gennemførligt. Her er det vigtigt at bemærke, at RDF ikke bare handler om det meningsgivende web. Det et er en flot vision, men de praktiske anvendelser af RDF nu og her, som beskrevet ovenfor, er et godt argument for anvendelsen af RDF.

På en nylig konference om hypertekst i i Amsterdam, udtalte hypertekst-eksperten Cathy Marshall fra Microsoft, at det store problem ligger i at få folk til at udarbejde metadata, der beskriver deres websites, rapporterer Computerworld. De har i forvejen nok at gøre med at vedligeholde disse sites, siger Marshall, så hvorfor skulle de også bruge kræfter på at vedligeholde metadata om dem, lød hendes argumentation.

Det er i denne forbindelse på plads at nævne, at Microsoft har deres egne interesser i forbindelse med metadata. Firmaet står bag UDDI (Universal Description, Discovery and Integration), som er en tjeneste-baseret løsning relateret til B2B e-handel. Modellen prøver at løse mange af de samme problemer, som RDF og det semantiske web også prøver at løse. Men løsningsmodellen er ganske anderledes: Den baserer sig på proprietære API'er, og databaser, som skal administreres af blandt andre Microsoft og IBM.

I den næste artikel om RDF ser vi på, hvorledes RDF implementeres i praksis, og ser på det grundlæggende elementsæt i RDF, Dublin Core.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Konica Minolta Business Solutions Denmark A/S
Salg af kopimaskiner, digitale produktionssystemer og it-services.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Computerworld Cloud & AI Festival 2025

Med den eksplosive udvikling indenfor cloud & AI er behovet for at følge med og vidensdeling større end nogensinde før. Glæd dig til to dage, hvor du kan netværke med over 2.400 it-professionelle, møde mere end 50 it-leverandører og høre indlæg fra +90 talere. Vi sætter fokus på emner som AI; infrastruktur, compliance, sikkerhed og løsninger for både private og offentlige organisationer.

17. september 2025 | Læs mere


IT og OT i harmoni: Sikring uden at gå på kompromis med effektiviteten

IT og OT smelter sammen – men med risiko for dyre fejl. Få metoder til sikker integration med ERP, kundesystemer og produktion. Tilmeld dig og få styr på forskellene og faldgruberne.

24. september 2025 | Læs mere


NIS2: Vi gør status efter tre måneder og lærer af erfaringerne

Vær med, når vi deler oplevelser med implementering af NIS2 og drøfter, hvordan du undgår at gentage erfaringerne fra GDPR – og særligt undgår kostbar overimplementering.

30. september 2025 | Læs mere