Artikel top billede

Web 3.0: Data i skyen på anabolske steroider

Interview: Sammenfletning af relevante data på tværs af websider er en god forretning og giver samtidig en bedre brugeroplevelse. Udfordringen er at beskytte privatlivets fred.

Interview: Nogle kalder det web 3.0, andre det semantiske web. Kært barn har mange navne, men der kan hurtigt opstå tvivl om, hvad barnet egentlig hedder.

En af drivkræfterne i udviklingen af den næste generation internet erkender således, at der har været problemer med formidlingen af, hvad begreberne egentlig dækker over.

"Vi har været for dårlige til at forklare, hvad det semantiske web er. Mange har opfattelsen af, at det er meget tungt og akademisk stof, men det er faktisk ikke særlig kompliceret at forstå," fortæller Ivan Herman, der siden 2006 har været standardorganisationen W3C's semantiske web-boss.

World Wide Web Consortium eller W3C, er den organisation, som definerer de standarder, der anvendes på nettet. Og W3C har været i gang med at indkapsle det semantiske web i flere år.

"Det handler om at bruge data fra mange kilder og binde dem sammen, så de har relevans," barberer han de luftige begreber ned til.

"Jo flere data, der kan integreres i web-løsninger, jo større er den gevinst, man kan få ud at nettet. Det gælder både for erhvervsliv og brugere," fortæller Ivan Herman til Computerworld fra sin hollandske base.

Web på steroider

Det semantiske web er således et netværk, hvor computerne ikke bare genkender ord, men også har en forståelse af ordenes betydning og derved kan drage naturlige paralleller til relaterede emner på tværs af nettet.

"Jeg kalder det mashup på steroider," griner Ivan Herman.

"Det skal naturligvis bygges sammen via en række standarder og teknologier, og det er lige præcis den opgave, vi skal tage vare på i W3C," siger han med en accent, der afslører hans opvækst i Østeuropa.

Ivan Herman er født og uddannet i Ungarn, hvor han i slutningen af 1970'erne debuterede som datalog. I 1986 forlod han landet til fordel for Holland, hvor han stadig bor.

Et krav til, at det semantiske web kan spindes, er, at der er tilgængelige informationer, som frit kan bruges.

Det kan være alt fra databaser, websider, smartphones og måske endda også det sagnomspundne internet-køleskab, der har huseret i medierne i årevis, som vartegnet på den digitale evolution i hjemmet.

Muskler i skyen

Et spædt forsøg på en semantisk løsning finder man hos den danske avis Information.

Her tildeler journalisterne web-artiklerne nøgleord, som efterfølgende binder artiklerne sammen med relevant information fra andre artikler og eksterne websider som eksempelvis Wikipedia.

Indholdet fra de eksterne sites bliver så vist sidestillet med hovedhistoriens indhold. Et tiltag som avisen lancerede i begyndelsen af 2010.

Cloud computing bliver i denne henseende et kraftfuldt værktøj. I takt med, at data lægges ud i skyen, kan informationerne på enkel vis bruges som indhold på tværs af websider, forklarer Ivan Herman.

Oplagte web 3.0-sider

Informationer fra eksempelvis en avis er oplagte til opbevaring i en elastisk sky, fordi det er offentlige tekster, billeder eller video, som således ikke skal beskyttes af voldsomme sikkerhedsforanstaltninger.

"Fra et semantisk udgangspunkt er cloud computing et særdeles brugbart værktøj, og semantiske løsninger var nogle af de første web-løsninger, der udnyttede, at man kan gemme og efterfølgende bruge store datamængder i en sky."

Men det er væsentligt, at man holder øje med sikkerheden, ikke mindst i forbindelse med privatlivets fred, da informationerne kan knyttes sammen på kryds og tværs via automatiserede arbejdsgange.

Sikkerhed mangler

Det er stadig en akilleshæl, som man ikke har en løsning på endnu, erkender Ivan Herman.

"Jo flere informationer, der bliver tilgængelige, jo større bliver faren for en sammenblanding, som ikke er hensigtsmæssig. Samtidig er der en række lovmæssige krav, der skal overholdes, ikke mindst i forbindelse med privatlivets fred."

"Hvordan man skal håndtere den problematik, diskuterer vi i W3C. Det er stadig et åbent spørgsmål."

Løsningen skal i høj grad findes hos brugerne, virksomhederne eller web-tjenesterne selv, vurderer Ivan Herman.

"Det handler om at blokere for følsomme informationer, så de ikke blandes sammen med offentlige informationer. Det kan man løse ved at kategorisere sine databaser. Men der er en risiko for, at ting slipper ud og kommer ud af kontrol, og det har vi i øjeblikket ikke en løsning på," siger Ivan Herman.

Firmaer er glade

Erhvervslivet har forholdt sig tøvende til det semantiske web, og på udviklingssiden har man ikke set udviklingen blomstre, men der er ifølge W3C en stribe oplagte fordele for både brugere og erhvervsliv.

"Vi fornemmer langt større interesse for semantiske løsninger i dag end for bare to år siden - både i offentligt regi og i erhvervslivet," siger han.

Dataintegration og -analyse er da også allerede et arbejdsområde i rigtig mange virksomheder, hvor de figurerer under forskellige arbejdstitler, eksempelvis business intelligence.
Jo enklere, det bliver at sammenholde forskellige datatyper, eksempelvis i form af enkle standarder og teknologier, jo bedre for firmaerne, vurderer Ivan Herman.

"Mange ønsker at integrere data på tværs af alle kildesystemer, rense data og binde systemer effektivt sammen ved hjælp af metadata og gerne i eksisterende it-systemer," siger han.
 
Nogle af de gevinster, der ligger inden for rækkevidde, er minimering af tidsforbrug, bedre muligheder for at analysere på nuancerede informationer og mindre behov for forskellige integrationsprodukter.

Ivan Herman fra W3C peger desuden på store og avancerede dataintegrationer, der anvendes i forskningsmiljøer, som potentielle vinderområder, der kan vinde på en enklere tilgang til dataindsamlingen.

Brugere er ligeglade

I et semantisk netværk får de almindelige brugere bedre tjenester. Og selv om de måske nok er glade for de nyheder, er de basalt set ligeglade med teknologier, siger Ivan Herman.

Brugerne vil mærke forskellen ved at blive præsenteret for en mere præcis mængde information fra flere kilder end de almindelig søgealgoritmer kan diske op med.

Der er kritiske privacy-røster, som løfter pegefingeren overfor den meget kontrollerede informationssammensætning, men W3C-manden mener ikke, at den styrede indsamling kan misbruges til ensretning eller censur på nettet. Tværtimod vil det give langt større frihed, mener W3C-manden.

"Det er umuligt at kontrollere indhold på nettet, men hvis web-siderne fortæller, hvor de henter informationerne fra, kan brugeren selv bedømme kvaliteten. Det er altid en overvejelse om en webside er troværdig, det kan semantikken ikke ændre på," siger Ivan Herman.

"Potentielt kan semantikken dog give bedre overblik over indhold og derved et bedre grundlag til at bedømme informationskvaliteten."




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Alfapeople Nordic A/S
Rådgivning, implementering, udvikling og support af software og it-løsninger indenfor CRM og ERP.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Computerworld Summit 2022: Digitalisering, sikkerhed og strategi

Hvordan bruger A.P. Møller - Mærsk cloud? Hvordan sikrer digitalisering at TV 2 kan konkurrere med streaming-tjenesterne? Og er din organisation klædt på til at håndtere et DDoS-angreb? Svarerne får du på Computerworld Summit 2022: En hel dag til dig der arbejder professionelt med it.

17. maj 2022 | Læs mere


Datadrevet forretning 2022: Sæt data på den strategiske dagsorden

Lær hvordan du tænker automatisering, data og digitalisering ind i dagligdagen, over for kunderne og hvordan du får skabt ny forretning.

31. maj 2022 | Læs mere


Sådan gør du din forsyningskæde mere robust

Vi sætter fokus på standardværktøjer og tillægsløsninger til Microsoft Dynamics 365 FO i produktionsvirksomheder, som vil planlægge og drive en effektiv supply chain.

31. maj 2022 | Læs mere






CIO
Årets CIO 2022: Nu skal Danmarks dygtigste CIO findes - er det dig? Eller kender du en, du vil indstille?