Artikel top billede

Dansk top-chef: Derfor er open source godt til big data

Selvom SAP er kernen i Karnov Groups it-miljø, valgte CTO Søren Gerlund en open source-løsning til big data.

Hvad har lovsamlinger, juridiske kommentarer og viden om revision, regnskab, skat og ledelse at gøre med big data?

Det kan måske umiddelbart være svært at se, men for Karnov Group, der leverer information om netop disse emner, er koblingen i dag helt oplagt.

Forklaringen er, at virksomhedens onlineløsninger spiller en stadig større rolle og i dag anvendes af omkring 30.000 brugere. Her kommer big data ind i billedet, forklarer CTO i Karnov Group, Søren Gerlund.

"Det handler ikke så meget om loven, men om kommenteringen af loven. Det er den value-add, vi lever af."

"Vi skal kunne tilbyde noget, der sikrer, at kunderne når frem til det rigtige resultat hurtigere og samtidig åbner op for nye forretningsmuligheder," siger han om baggrunden for at give sig i kast med big data.

Tidligere havde Karnov Group et begrænset overblik over kundernes brugsmønstre og havde derfor et ønske om i højere grad at anvende de informationer, der ligger gemt i onlinesystemerne.

"Vi skal forstå forretningen, og det kan man ikke med et SAP-system, der kun kan lave en P&L (profit and loss, red.) og en balance og så videre."

"Vi bliver nødt til at tage online-delen med. Hvilke produkter købte kunderne, hvornår købte de, hvorfor købte de, og hvad betyder det?" lyder helt grundlæggende spørgsmål for Karnov Group og Søren Gerlund.

Derfor taler alle om big data

Big data er en af de mest omtalte it-trends i de senere år. Som det ofte ses med nye, hotte teknologier har der været en del begrebsforvirring og hype, men nu begynder big data-projekterne for alvor at vise sig rundt omkring i offentlige og private organisationer.

Et eksempel er Vestas, der kombinerer vejrdata med data fra vindmøller og den vej rundt kan lave big data og skabe nye forretningsmuligheder.

Et andet eksempel er Københavns Kommune, der anvender omfattende data-analyser og realtids-informationer for at kunne agere på alt fra befolkningstilvækst til sygefravær og pressede budgetter.

Der er stadig mere end én definition på, hvad big data egentlig er, men grundlæggende dækker det over de værktøjer og processer, der skal bruges, for at man kan håndtere og udnytte ekstremt store datamængder og arbejde med ustrukturerede data og realtidsinformationer.

Det kan det bruges til

Gevinsten kan være alt fra en optimering af forretningsprocesserne, til at man er i stand til at levere nye og bedre produkter, fordi man i højere grad kan spotte mønstre og tendenser hos kunderne.

Hos Karnov Group udspringer big data-initiativet primært af et behov for i højere grad at kunne arbejde med ustrukturerede data og for at kombinere data fra forskellige systemer.

"Big data skal ikke i denne her sammenhæng forstås som volumen, men som ustruktureret information. Lige netop den del med de ustrukturerede data gør, at vores dataoverblik bliver komplet," lyder det fra Søren Gerlund.

Konkret giver big data-løsningen Karnov Groups sælgere informationer om, hvor meget og hvordan de forskellige kunder bruger onlineløsningerne.

Det gør det lettere at udvikle onlinetjenesterne på en måde, så brugerne lettere kan få overblik over og indsigt i fortolkningen af love, presedens og andre ting, der er vigtige, når man arbejder med jura, regnskab, revision, skat og ledelse.

Valgte open source

Med et klart formål i sigte valgte Søren Gerlund sammen med partneren Platon at give sig i kast med big data. Karnov Group har valgt Informatica som data warehouse-platform.

"Vi trækker data ud fra SAP og andre kilder, vi har, mikser det i vores data warehouse og ruller det ud i vores BI i form af SAP Business Objects. Men der skulle nogle andre ting til i forhold til de ustrukturerede informationer fra vores onlinesystem. Vi ville gerne have det fulde overblik," forklarer Søren Gerlund.

Jesper Jensen fra Platon uddyber:

"Af natur er det meget ustrukteret information. Det kommer meget af log-filer og JSON-strukturer (JavaScript Object Notation, red.), som traditionelt har været svære at tilgå."

Når jurister, revisorer og skattekonsulenter i gamle dage anvendte bøgerne fra Karnov Group, kunne man ikke se, hvilke sider, de slog op på, og hvilke love, der var de mest anvendte. Det kan man i en onlineverden.

"Vi kan se, hvordan de søger rundt, og hvordan deres adfærd er, og så kan man lettere optimere løsningen til dem," forklarer Jesper Jensen, practice director hos Platon.

Selvom en virksomhed som Karnov Group er førende på sit felt med at sælge information til jurister, revisorer og skattekonsulenter, er det med omkring 150 medarbejdere i Danmark og Sverige en forholdsvis lille organisation, når man taler SAP-installationer.

Derfor giver open source god mening

Derfor forsøger Søren Gerlund at sikre en vis smidighed og agilitet på it-fronten. Den strategi kom også ind i billedet, da big data-projektet skulle søsættes. Ret hurtigt fik han sig sporet ind på, at det kunne være en idé at satse på open source løsningen Hadoop.

"Som CTO kan jeg jo sagtens se idéen med open source, men tror også at, man skal være klar over, at man får omkostningerne down the road i stedet for up front," siger Søren Gerlund.

"Men hele mentaliteten omkring open source gjorde, at det var lidt lettere at sælge ind til vores udviklere. Vi etablerede et Hadoop-cluster, hvorpå vi lagde de her JSON-filer, og så brugte vi Hive (Apache-løsning oven på Hadoop, red.), så vi kunne tilgå de ustrukturerede informationer."

"Det handler om at få en 360 graders viden om vores kunder: Hvad er det, de køber, hvornår køber de det, hvorfor gør de det, og hvad bruger det det til? Det fulde billede af kunden ville vi ikke have, hvis vi kun havde to forskellige øer."

Erfaringer med Hadoop

Jesper Jensen fra Platon fortæller, at Hadoop ligesom resten af open source verdenen er præget af mange forskellige distributioner.

"Cloudera er nok den førende distribution af Hadoop, og den valgte vi at basere os på, fordi de har formået at pakketere installationsprocessen og det at rulle den ud relativt enkelt, som man kender det fra Windows-platformen," siger han.

"Distributionerne kan i bund og grund alle det samme, for de er alle baseret på Apaches open source udgave af Hadoop og Hive og Scoop og alle de her økosystemer, men der mangler en GUI på dem, og det er der på Cloudera."

"Linux er jo til, at man kan styre det hele fra en kommando-linje, hvis man ønsker det, men man kan komme rigtig langt med det GUI-baserede administrationsværktøj."

Lave startomkostninger

Søren Gerlund har som CTO i Karnov Group haft en positiv oplevelse med at tage Hadoop ind som en del af it-miljøet.

"Det er i mine øjne lidt uforståeligt, hvorfor der ikke er flere, der er kommet i gang med det, for der var meget få omkostninger forbundet med det til at starte med. Selve oprettelsen af clusteret gik også rimeligt smertefrit," siger han.

"Det er klart, at det skal være drevet af nogle veldefinerede behov, som du kan kommunikere om, og det er måske smertensbarnet. Hvad er det, du vil bruge dine ustrukterede informationer til?" lyder det helt afgørende spørgsmål ifølge Karnov Group CTO'en.

Én ting er, at big data-teknologierne kan bruges til en helt ny form for data-analyser; noget andet er imidlertid, at man ikke bare må indsamle og anvende hvad som helst om kunderne.

"Vi har lov til at logge de her informationer, for det siger brugerne ja til fra start. Men vi må ikke lave rapportering og opfølgning på de enkelte individer og på, hvad de søger efter. Det er mere mønstrene, vi leder efter, og dem samler vi så i nogle puljer. Det er på et noget højere niveau."

Fremtidens it i Karnov Group

Hvilke perspektiver er der i big data fremadrettet for Karnov Group?

"De er kæmpe. Det indhold, vi har, er semi-ustruktureret i og med at det er tekst. Og vi har rigtig meget," siger Søren Gerlund.

Han nævner som et eksempel, at Karnov Group har lanceret en ny tjeneste i Sverige, hvor man får alle nye domme ind - ikke færre end 700.000 om året.

"Det er rigtig meget, der kommer ind som PDF og skal omdannes til XML og ind på vores platform."

Satser på cloud

Samtidig giver en fleksibel værktøj som Hadoop god mening i forhold til virksomhedens overordnede it-strategi.

"Vi har lavet en it-strategi, hvor det hedder cloud first. Derfor skal vi ud og finde en partner, der kan hoste de her ting, for vi skal ikke bruge tid og kræfter på noget, der ikke er vores kernekompetence."

Det betyder også, at Karnov Group, der står over for at skulle til nye kontorer, rykker alle servere ud af huset og allerede er hoppet på Microsofts Office 365.

"Vi har brug for at være agile og skalerbare. Vi skal kunneskrue op og ned for vores kapacitet."

Karnov Groups it-medarbejdere er delt i to afdelinger.

I Development sidder der 11 personer, og derudover er der fem medarbejdere i selve IT-afdelingen samt de eksterne partnere.

Læs også:

Big data: Her er forklaringen på tidens store it-trend

Nyt it-område kan give dig en lang og gylden karriere




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
EG Danmark A/S
Udvikling, salg, implementering og support af software og it-løsninger til ERP, CRM, BA, BI, e-handel og portaler. Infrastrukturløsninger og hardware. Fokus på brancheløsninger.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
EA Excellence Day

Hvad er det, der gør it-arkitektens rolle så vigtig? Og hvad er det for udfordringer inden for områder som cloud, netværk og datacentre, som fylder hos nogle af landets bedste it-arkitekter lige nu? Det kan du her høre mere om og blive inspireret af på denne konference, hvor du også får lejlighed til at drøfte dette med ligesindede.

23. april 2024 | Læs mere


AI Business Excellence Day – sådan folder du mulighederne ud

Mange danske virksomheder har eksperimenteret med AI-projekter af begrænset omfang, men kun de færreste har for alvor udforsket mulighederne i storskala. Det gør vi her! Du vil blandt andet få mulighed for at se eksempler på, hvordan AI kan anvendes som accelerator i storskala og skubber til grænserne for, hvordan det er muligt at integrere teknologien, så potentialet for alvor foldes ud.

24. april 2024 | Læs mere


Unbreakable - sådan sikrer du dig vedvarende og uafbrudt adgang til dine data

Vi dykker ned i værdien af en stabil og pålidelig storage-platform og hvilke muligheder der findes, for at sikre den højeste grad af redundans og tilgængelighed. Områder som date-beskyttelse og cyber-sikkerhed vil også blive berørt.

25. april 2024 | Læs mere