Artikel top billede

(Foto: Dan Jensen)

Data er det nye olie, og om lidt er olien væk

Klumme: Der er en klar trend hen imod et mindre behov for store datamængder, og det skal man have in mente som virksomhed, hvis man ikke vil overhales inden om af dem, der forstår at løse de samme problemer med færre data.

Denne klumme er et debatindlæg og er alene udtryk for forfatterens synspunkter.

Data er blevet kaldt det nye olie og det med rette. Specielt med kunstig intelligens in mente opfattes værdien af data generelt som høj. Men inden vi får set os om, er olien væk – eller i hvert fald faldet i værdi til det rene vand.

Derfor skal virksomheder og iværksættere fremover operere efter, at data alligevel ikke har den enorme værdi, man skulle tro, og at der skal mere til end bare raffinerede rådata for at opnå en kommerciel succes.

For at blive lidt i olie-analogien, så sagde Sheikh Rashid fra de Forenede Arabiske Emirater følgende i et klarsyn om, at olieeventyret ikke ville vare evigt:

“Min bedstefar red på en kamel, min far red på en kamel, jeg kører i en Mercedes, min søn kører i en Land Rover, hans søn vil køre i en Land Rover, men hans søn vil ride på en kamel”.

Sprunget op ad jorden

Data er ligesom olien et nyt værdifuldt aktiv, der nærmest er sprunget op af jorden og skaber nye succesfulde virksomheder og vækstmuligheder for de etablerede.

Den eneste forskel på data og olie er i min optik, at dataeventyret bliver meget kortere, og at man knap nok en generation inde i historien er på vej tilbage til kamelerne.

Det er nok heller ikke tilfældigt, at oliesheikerne har kastet sig over nye markeder. De, der lever af data, bør gøre sheikerne kunsten efter.

Data er i stort omfang stadig enormt værdifuld. Man kan udrede sammenhænge i forretninger og markeder og øge salget ved at sælge de rigtige varer på det rigtige tidspunkter til den rette målgruppe.

Man kan ligeledes spare administration og optimere sine processer.

Mange virksomheder har for længst lukreret på data, men allerede nu, inden alle er kommet med, er eventyret altså ved at være slut.

Store datamængder er nemlig på vej mod at være både mere tilgængelige og mindre værdifulde, end man skulle tro.

Nogle data er selvfølgelig stadig svære at få adgang til og derfor værdifulde, blandt andet sundhedsdata, men for det meste er data blevet så tilgængelige, at de snarere er vand end olie.

Skal man bruge data til at løse et problem (eller bygge kunstig intelligens), så er de kun en Google-søgning væk. Nogle gange kan man endda slippe af sted med at generere syntetiske data, hvilket er en teknik, vi hele tiden bliver bedre til.

Bedre til at udnytte

En anden og endnu mere afgørende faktor for datas værdi er, at vi nu er langt bedre til at udnytte de data, vi har.

Det gøres både via bedre algoritmer og ved, at vi bygger videre på tidligere data med en teknologi, man i kunstig intelligens kalder transfer learning.

I mit arbejde med kunstig intelligens møder jeg mange virksomheder, der fortæller, at de har indsamlet millioner af datapunkter, som er meget værdifulde og helt sikkert vil betyde gode resultater for både kunstig intelligens og databaserede beslutninger.

Ofte må jeg dog forklare, at jeg nok ikke skal bruge mere end 100 datapunkter (eksempler) for en god model.

Da man kun skal bruge begrænsede data, så kan alle være med, og der er pludseligt åbent for konkurrence. Især kunstig intelligens, der skal forstå en tekst eller analysere et billede, kan skabes med meget få data.

I praksis betyder det her en hel del for, hvordan virksomheder skal tænke.

For nu er store mængder data altså ikke længere nødvendigvis værdifulde.

Virksomhederne skal i højere grad tænke over præcis hvilke data (et overraskende svært spørgsmål) der skal opsamles hvornår. Værdien af data kan nemlig være meget tidsbestemt, og de data, der er relevante nu, kan være værdiløse i morgen.

Mit skriv her er en sandhed med modifikationer, og der kan findes eksempler, der fortæller en helt anden historie.

Der er dog en klar trend hen imod et mindre behov for store datamængder, og det skal man have in mente som virksomhed, hvis man ikke vil overhales inden om af dem, der forstår at løse de samme problemer med færre data.

Klummer er læsernes platform på Computerworld til at fortælle de bedste historier, og samtidig er det vores meget populære og meget læste forum for videndeling. Har du en god historie eller har du specialviden, som du synes trænger til at blive delt?

Læs vores klumme-guidelines og send os din tekst, så kontakter vi dig - måske bliver du en del af vores hurtigt voksende korps af klummeskribenter.