Artikel top billede

Her er næste bølge af BI

I fremtiden vil analyser af millioner af dataenheder bestående af lyd, billeder og video danne rammen for ledelsesbeslutninger. Text mining står forrest i rækken.

Når mange virksomhedsledere i dag træffer beslutninger, læner de sig op ad såkaldt data mining, der kan analysere data, som i forvejen er struktureret. For eksempel spørgeskemaer med prædefinerede svarkategorier.

Men i fremtiden vil lederne have et endnu bedre datagrundlag at træffe beslutninger på, når også ustrukturerede data indgår i analyserne.

Inden for disciplinen business intelligence (BI) vil man således kunne omdanne lyd, billede og video til struktureret data. Ligesom omdannelse af fritekst i store dokumentmængder kan omdannes til strukturerede data, såkaldt text mining.

På Danmarks Tekniske Universitet i København er forskerne i gang med næste generation af BI-teknologierne. Universitetet samarbejder med Danmarks Radio om et video mining-projekt.

"Text mining var her allerede i 2002, men i dag er vi endnu længere fremme i udviklingen af nye muligheder," siger Henrik Madsen, professor i statistik på DTU.

Video mining-projektet kan betyde, at DR i fremtiden kan søge i deres arkiver efter personer, der har optrådt i et videoklip, uden at der på klippet er gemt metadata om personen. Således kan en forbipasserende i et videoklip identificeres ved hjælp af video mining.

En anden mulighed kan være, at man kan identificere lydene i et videoklip og finde ud af, hvem der har sagt hvad.

Men før data fra video, lyd og billeder rammer erhvervsledernes skriveborde, når der skal tages afgørende beslutninger, vil vi se text mining vokse frem.

"Text mining er ikke så udbredt endnu. Men virksomhederne er ved at få øjnene op for det. Det er især muligheden for at søge i ustrukturerede data, der er interessant," siger analytiker Brian Troelsen fra analysehuset IDC.

Han vurderer dog, at virksomheder ikke vil kaste sig over det, før finanskrisens slutning kan skimtes.

"Men text mining har potentiale. De virksomheder, der først får noget fornuftigt ud af at analysere disse data, vil virkelig få et stort forspring i forhold til konkurrenterne," siger han.

Ifølge analysehuset IDC vokser datamængden i en virksomhed, der ikke ekspanderer, med 20-30 procent om året.

Samtidig vokser mængden af ustrukturerede data mere end den strukturerede data. Faktisk udgør ustrukturerede data hele 75 procent af den samlede datatilvækst årligt.

Marked i vækst

I en rapport fra 2007 om det danske business intelligence-marked, forventer IDC da også, at det samlede danske marked for analyseværktøjer, business intelligence og datavarehuse vil vokse fra 1,1 milliard kroner i 2007 til 1,6 milliarder kroner i 2012. Og på verdensplan tales om et marked på knap 40 milliarder årligt med en årlig vækst på op imod 10 procent.

SAS Institute, der er en af de store BI-leverandører, fortæller da også, at man forventer stor vækst inden for værktøjer til ustruktuerede data.

For eksempel inden for sundhedssektoren er text mining et rigtig inter­essant værktøj, da læger ikke altid er tilfredse med at krydse oplysninger af på et skema, men hellere vil skrive i fritekst om patientens tilstand.

Stine Fangel, business advisor i SAS Institute, demonstrerede for Computerworld text mining-værktøjet på en database med 3.000 journaler fra et amerikansk hospital, hvor der både er strukturerede og ustrukturerede data.

Ved hjælp af værktøjet kunne hun i løbet af et par timer analysere, om de symptomer, der bliver opridset i journalerne, kunne give anledning til mere alvorlige komplikationer for patienterne.

Ved at krydstjekke med en liste over de patienter, der rent faktisk havde fået mere alvorlige symptomer, viste det sig, at Stine Fangels analysemodel vurderede 90 procent af journalerne korrekt.

Men når menneskeliv er på spil, er det klart, at en fejlprocent på 10 procent er urimelig høj. Derfor skal analysen fra disse værktøjer ikke stå alene.

"Det er klart, at resultaterne kan blive mere raffinerede, hvis vi havde haft en læge og lidt mere tid til rådighed. Det, som beslutningstagere kan bruge modellen til, er at overskue mange flere patientjournaler, end mennesker normalt kan, og derved kan værktøjet finde eventuelle mønstre, som er skjult for det enkelte menneske. Resultaterne fra et sådant værktøj kan altså støtte lægen i hans daglige arbejde, når han skal vælge behandlingstilbud til den enkelte patient," siger Stine Fangel.

IBM satser kraftigt på området

IBM satser også massivt på dataanalyse, som firmaet kalder for information management.

I starten af 2008 købte IBM business intelligence-virksomheden Cognos for fem milliarder dollars (26,4 milliarder kroner), og i juli 2009 købte IBM den statistiske analysevirksomhed, SPSS, for 1,2 milliarder dollars (6,3 milliarder kroner).

Samme dag, som IBM købte SPSS, lancerede IBM en ny produktlinje, Smart Analytics Systems, der angiveligt kan hjælpe IBM's kunder med at analysere ustrukturerede data, som video, e-mail, hjemmesider og podcasts.
Annonceringen af opkøbet af SPSS og den nye produktlinje på samme dag var på ingen måde en tilfældighed, fortæller Dr. Ambuj Goyal, direktør for IBM's information management-portefølje.

"Vi har investeret seks milliarder dollars i udviklingen af Smart Analytics Systems. Vi kan nu integrere SPSS‘ øjeblikkelige tendensanalyse med Smart Analytics Systems," fortæller Ambuj Goyal til Computerworld.

Den øjeblikkelige tendensanalyse betyder, at virksomhederne kan handle i realtid i stedet for at skulle vente i en uge på at få en rapport.

På grund af IBM's størrelse, har virksomheden efterhånden erhvervet sig en stor portefølje af interessante teknologier. LanguageWare er en af disse teknologier, der i dag er en integreret del af de IBM's analyseværktøje.

Mens Cognos er front end-delen, der sørger for at integrere data fra forskellige datavarehuse, er Infosphere det værktøj, der foretager analyserne. I Infosphere indgår LanguageWare, der tager sig af den lingvistiske forståelse.

"Vi oplever en stor interesse for text mining blandt vore kunder," siger Dane Coyer.

Der er bare ikke mange kunder, der vil stå frem og fortælle om deres erfaringer med text mining. Ifølge IBM er det fordi, text mining stadig betragtes som et first-mover marked, hvor udtalelser i offentligheden kan resultere i, at konkurrerende virksomheder får indsigt i forretningsmetoder, der ellers skulle være tophemmelige.

En af de institutioner, der dog gerne vil fortælle lidt om de analyseværktøjer, man bruger, er New York Police Departement (NYPD). På IBM's hjemmeside har NYPD bidraget med en over seks minutter lang video, der fortæller om, hvordan brugen af text mining har bidraget til opklare en forbrydelse meget hurtigt.

Data mining i danske virksomheder

Danske forsikringsselskaber har i flere år brugt data mining til blandt andet at finde ud af, hvor høj forsikringspræmien skal være. Det har de gjort ved at se på risikoen for skader som en funktion af en lang række faktorer, herunder geografisk lokalitet, alder på forsikringstager og indkomst. På samme måde tager det i dag en lånevirksomhed mindre end fem minutter at finde ud af, om du kan få et lån til den nye computer.

En af de danske offentlige institutioner, der er fremme i skoene med data mining, er Fiskeridirektoratet.

Direktoratet, der skal sørge for, at fiskerne i danske farvande ikke overfisker, er i gang med at udvikle et nyt værktøj, der forhåbentligt kan være med til at udpege de fartøjer, hvor der er størst chance for at fange fiskere, der har overfisket.

"Med den hurtige analyse, som data mining-værktøjet leverer, kan vores kontrolenhed være på et mistænkeligt fartøj lige i det øjeblik, det lægger til kaj," siger Troels Pade, kontorchef i Statistikkontoret i Fiskeridirektoratet.

"Vi udvikler systemet i samarbejde med de erfarne kontrollører. Så det er deres viden, vi nu kan lægge ned i systemet," siger Troels Pade.

I konsulenthuset NN Pharmaplan, der er et datterselskab af Novo Nordisk, bruger man IBM's business intelligence-løsning, Cognos, til at få mere viden om budgettet. Virksomheden får en dagsaktuel opdatering af, hvordan det realiserede resultat er i forhold til det budgetterede helt ned på medarbejderplan.

"Hvis vi ikke havde Cognos, ville vi agere i blinde. Værktøjet er i høj grad med til at give os et hurtigt data- og analysegrundlag, som vi kan træffe nogle fornuftige beslutninger ud fra.," siger Torben Drauschke, senior business controller i NN Pharmaplan.

Tidligere brugte NN Pharmaplan en mere simpel Excel-løsning til tidsregistreringen.

SAS Institute leverer analyseløsninger til det danske tøjfirma Bon'a Parte, og tøjfirmaet er rigtig glad for løsningen, der ifølge direktøren kan spare selskabet millioner af kroner, når der skal bestilles tøjleverancer.

"Vi bruger data mining, når vi skal analysere, hvilke produkter vores kunder potentielt vil købe. Hvert år får 40-50.000 kunder et katalog, hvorefter de så skal bestille testordrer. Vi ser så på sammenhænge i deres køb," siger Flemming Ib Windfeld, administrerende direktør i Bon'a Parte.

Bon'a Parte havde i 2008 en omsætning på 226 millioner kroner og et resultat før skat på knap 24 millioner kroner.
Helt konkret anvender Bon'a Parte data mining til at finde ud af, hvilket tøj kunderne helst vil have. Det er baseret på kundehistorik samt hvilket tøj, der sælger bedst sammen. Derudover er det meningen, at tøjvirksomheden skal i gang med analyser, der kan komme kundefrafald i forkøbet.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Ed A/S
Salg af hard- og software.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Compliance og strategisk it-sikkerhed efter DORA

Finansielle koncerner har i snit 85 sikkerhedsløsninger i drift – men er i snit op til 100 dage om at opdage et igangværende cyberangreb. Ydermere viser øvelser, at det typisk tager 4-6 uger at rense og genetablere sikker drift af centrale systemer efter et stort angreb. Fokus for dagen vil derfor være på henholdsvis governance samt om, hvordan du som it-leder i den finansielle sektor skal kunne håndtere fremtidens cybertrusler og arbejde effektivt med sikkerhed på et strategisk niveau.

04. april 2024 | Læs mere


EA Excellence Day

Hvad er det, der gør it-arkitektens rolle så vigtig? Og hvad er det for udfordringer inden for områder som cloud, netværk og datacentre, som fylder hos nogle af landets bedste it-arkitekter lige nu? Det kan du her høre mere om og blive inspireret af på denne konference, hvor du også får lejlighed til at drøfte dette med ligesindede.

16. april 2024 | Læs mere


IAM - din genvej til højere sikkerhed uden uautoriseret adgang og datatab

På denne dag udforsker vi de nyeste strategier, værktøjer og bedste praksis inden for IAM, med det formål at styrke virksomheders sikkerhedsposition og effektiviteten af deres adgangsstyringssystemer og dermed minimere risikoen for uautoriseret adgang og datatab. Og hvordan man kommer fra at overbevise ledelsen til rent faktisk at implementere IAM?

18. april 2024 | Læs mere