Artikel top billede

Sådan graver du millionerne frem i statens offentlige datasæt

Brug af gratis offentlige data har været den direkte vej til en millionomsætning for et tre år gammelt it-selskab. Læs her, hvordan der kan tjenes store penge på offentlige data, der er et af Danmarks nyeste råstoffer.

På statslige servere og computere ligger tonsvis af data, der ved hjælp af flid, indsigt og forretningsforståelse kan veksles til mange klingende, danske kroner.

Den chance for indtjening har eksempelvis it-konsulentselskabet Septima grebet, efter væsentlige grunddata som CVR-registret og Geodatastyrelsens højdemodeller blev frikøbt af staten og lagt ud til fri download i starten af 2013.

For virksomheden blev stiftet netop på grund af og på samme tidspunkt som frikøbet af disse værdifulde datasæt i januar 2013, og selskabet omsatte sidste år for knap seks millioner kroner.

Læs også: Syv it-folk opsiger jobbet: Går efter data-guldet

Siden stiftelsen 1, januar 2013 er der kommet fire nye medarbejdere til, og gjort plads til endnu flere i selskabets lokaler på Strøget i København.

"Vi er lige gået i gang med at bestille nye skriveborde, for vi regner med, at væksten fortsætter," forklarer medstifter og partner i Septima, Hans Gregers Petersen til Computerworld.

Data arbejder i jorden 

Han fortæller, at CVR- og højdemodelsdata blot er et lille udsnit af de offentlige, gratis data, som selskabet gør brug af.

Også GeoDanmarks tekniske kort med præcision ned til 10 cm for placeringen af eksempelvis åer, vandløb og industribygninger samt luftbilleder er blandt de datasamlinger, som ryger igennem Septimas elektroniske databehandling.

Disse data benytter Septima blandt andet til at bygge software-løsninger, der kan simulere, hvordan regnvandet løber omkring en ejendom, hvis der er meget eller lidt nedbør i kortere eller længere perioder.

Resultaterne af disse data-simuleringer er eksempelvis vigtige for Skats ejendomsvurderinger, og kan også sælges til forsikringsselskaber, der er interesserede i at kende risici ved skybrud.

"Hvis vi eksempelvis sælger vores produkter til et forsikringsselskab, så beriger vi deres modeller med vores ekspertviden og brug af offentlige data," forklarer partner i Septima, Hans Gregers Petersen.

Et andet eksempel er den optimale placering af en gylletank ude på en mark. For hvis der går hul på skidtet, skal gyllen kunne løbe forsvarligt væk uden at ramme alt for mange jordbærbed og stadsstuer på vej i jorden.

Til denne slags opgaver benytter Septima også andre datasæt som eksempelvis jordartskort for at se, om gylletanken er placeret i muld, på sandjord eller i kridtjord.

"Vi kan se og simulere mange forskellige scenarier med offentlige data, og folk er typisk interesserede i at se worst case-scenarier," siger Hans Gregers Petersen.

Da forskellige kommuner har forskellige landskaber, abonnerer flere kommuner på specifik viden om placering af diverse konstruktioner i det ganske landskab inden for netop deres kommunegrænse.

Mere vil have meget mere

Trods statens noget brogede udbud og tilgængelighed af offentlige data med et ukendt vækstpotentiale på hundredemillionvis af kroner har Hans Gregers Petersen mange roser til overs for statens arbejde med de frie datasæt.

"Vi benytter mange datasæt fra Erhvervsstyrelsen og Geodatastyrelsen, som har gjort et kæmpe stykke arbejde med at gøre data tilgængelige på en brugbar facon. Men efter frikøbet af CVR, højdemodellen og de gratis regnskaber vil mere jo have mere," siger han med et smil.

Læs også: Staten helt blank på gevinsterne ved at give gratis data væk

Det mere, som han specifikt efterlyser, er data Bygnings- og Boligregistret (BBR), som kunne udvide Septimas produktportefølje.

Han fremhæver flere eksempler på, at andre virksomheder som Bisbase med sit et værktøj til blandt andet benchmark- og konkurrenceanalyser af ens virksomhed mod resten af markedet samt boligportalen Boliga.com også gør brug af offentlige data med stor succes.

"De frie offentlige data giver jo hele tiden merværdi til vores egne produkter, som måske aldrig ville have blevet til noget, hvis man skulle ud og kaste flere millioner kroner efter disse datasæt," vurderer Hans Gregers Petersen.

Her gik grænsen åbenbart 
Tidligere har den daværende IT- og Telestyrelsen også luftet muligheden for at sælge ud af danskernes anonymiserede sundhedsdata til medicinalindustrien og husdata til energisektoren.

Disse tiltag ville uden tvivl have sparket vækstpotentialet i de offentlige datasæt op i den tunge milliardklasse, men koncepterne blev dog bremset inden fødslen grundet frygt for at gå på kompromis med privatlivets fred. 
Læs også: Sådan kan Danmark tjene milliarder på ubrugte data

Hans Gregers Petersen har tidligere arbejdet professionelt med den slags anonymiserede sundhedsdata, og han forstår godt modviljen, selvom han insisterer på, at så længe staten gør sit arbejde sobert, er der ikke noget at frygte af hensyn til privatlivets fred.

"I visse områder af København ville man eksempelvis kunne se, at der signifikant større udbredelse af tuberkulose. Det skyldes nok, at der i disse områder er flere hjemløse end andre steder," siger han.

Udover sundhedsdata og hus-data har staten også luftet muligheden for at udbyde finansielle data og forsikringsdata, men indtil videre har regnskaber, kortdata i alle former og CVR-registreret været blandt de mest efterspurgte datasæt.

Tungt at danse med kommunerne

At de åbne datasæt er noget, som alle kan gå i gang med, er pensionisten Tine Müller vel nok et af de bedste eksempler på.

Hun vandt i 2010 konkurrencen 'Offentlige Data i Spil' med sit projekt 'Find nærmeste toilet', hvor datasættene stammer fra kommunernes data over offentlige toiletter.

Læs om ny data-konkurrence: Brug offentlige data og vind 100.000 kroner

Den daværende efterlønsmodtager Tine Müllers forudsætninger, inden hun gik i gang med projektet, var et daghøjskolekursus i HTML og CSS, som siden er blevet suppleret med Drupal-onlinekurser og -selvstudier.

Siden har hun fået hjælp fra to unge udviklere til at få ideen, data og toiletvejviseren over på en decideret mobil-app 'FindToilet' - først til Android og senest i sidste uge også til iOS.

Målgruppen for disse apps er landets 98 kommuner og ikke mindst deres tissetrængende borgere.

I dag samarbejder hun med en lille snes af kommunerne, men det er også en halvsej vej at komme dertil, hvor hun kan tjene penge på app'en, fortæller hun.

"Jeg skal jo være udvikler, PR-afdeling og dataekspert. Jeg er jo bare en tissetrængende, gammel kone, der også gerne vil tjene nogle penge på alle de timer, som jeg har brugt. For det tager jo gerne flere måneder at komme i kontakt med kommunerne," siger Tine Müller til Computerworld.

"Når man henvender sig til en kommune for at få udleveret data, får jeg typisk efter lang ventetid nogle excel-ark udleveret, hvor data skal renses. Hos en kommune fik jeg data udleveret efter tre måneder, men handicaptoiletterne var markeret forkert, og 80 andre toilettet havde samme koordinater," fortsætter hun.

Derfor har hun nu bygget backenden således, at kommunerne selv kan indlæse deres toiletdata direkte i hendes system, så disse toiletdata ikke findes på 147 excel-ark i formatter, der først skal renses, før de kan bruges.

Håbet er nu, at kommunerne slår til med et godt tilbud på at abonnere på Tine Müllers toilet-kort indpakket i mobil-apps som en service over for borgerne.

"Ja, jeg vil jo gerne tjene to millioner kroner på dette her, og de søde, unge mænd, der har hjulpet mig med mobil-apps, skal jo også gerne tjene lidt på det. Hvordan jeg skal tjene penge på det, skal jeg dog nok have lidt hjælp til," lyder det fra folkepensionisten Tine Müller.

Læs også:

Sådan vil medicinbranchen udnytte dine sundhedsdata

Så er Big Data ved at være overstået