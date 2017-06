Klumme: Jeg er big data-forsker, og jeg brænder for at gøre noget godt for samfundet. Men jeg (og mine kollegaer) har næsten givet op, når det handler om at bruge offentlig data.

Vi kunne spare staten for milliarder af kroner, finde kur mod alvorlige sygdomme, men politikerne siger nej tak.De frygter, at personfølsomme data vil blive lækket. Jeg har hørt om læk i administration (politi, hospitaler,..), men mangler endnu at høre om et eksempel fra dataeksperter.Hertil kommer, at adgang til offentlig data er bygget op om, at man tester hypoteser, men ikke at man finder dem, ligesom de personer, der skal give adgang til data, ofte også er dem, der udarbejder analyser på traditionel vis. Er der en sammenhæng her?Jeg tror også, at andre dataejere frygter, at vi vil påvise ineffektivitet hos dem selv.Jeg har konkrete cases på ovenstående, men har valgt ikke at nævne dem her.Der er tale om et samfundsproblem, der koster os rigtig dyrt - det handler ikke om personer.Der er få big data-forskere i Danmark, og vi har rigeligt at give os til, så vi kommer ikke til at "slås" for adgang til offentlige data.Men det ærgrer mig, at vi ikke kan hjælpe samfundet mere. Vi har hverken advokater, lobbyister eller andet til at løse ovenstående, ligesom vi ikke bliver krediteret for at skaffe adgang til data.Debatten om big data er meget præget af folk, der lever af at rådgive om it-sikkerhed og jura.Jeg savner et eneste eksempel på datalæk i Danmark fra forskere, der er dataeksperter. Alle læk, jeg har hørt om (og det er forresten ikke mange) kommer fra folk, der har adgang til data i administrativ funktioner.Dertil kommer, at big data-forskning kan udføres på 100 procent anonymiseret data i modsætning til administrative funktioner, hvor der kan være behov for ikke anonymiseret data.Debatten er ligeledes præget af bekymring afledt at mystificering af big data.Hollywood og journalister (samt nogle professorer) har en tendens til at tale meget mere om dette "mystiske" med 'neurale netværk' og 'kunstig intelligens' og lignende i stedet for at sige det, som det er: Der er tale om avancerede algoritmer og statiske beregningsmetoder.Lad os få en god debat og komme i gang med at høste de store værdier.Den gode debat blev blandt andet indledt på en konference afholdt af KOR (du kan finde slides og lignende her ), efterfølgende blev der debatteret på LinkedIn . Begge steder findes gode indlæg, slides, m.m.Ps. Ovenstående er ikke en kritik af enkelte personer eller Danmarks position som sådan. Danmark er et af de lande, der er længst fremme med digitalisering, og det gælder også i det offentlige. Men hvor vi er i gang med høste værdien af big data i industrien, er der kun få eksempler i det offentlige.