Her er næste bølge af BI

I fremtiden vil analyser af millioner af dataenheder bestående af lyd, billeder og video danne rammen for ledelsesbeslutninger. Text mining står forrest i rækken.

Når mange virksomhedsledere i dag træffer beslutninger, læner de sig op ad såkaldt data mining, der kan analysere data, som i forvejen er struktureret. For eksempel spørgeskemaer med prædefinerede svarkategorier.

Men i fremtiden vil lederne have et endnu bedre datagrundlag at træffe beslutninger på, når også ustrukturerede data indgår i analyserne.

Inden for disciplinen business intelligence (BI) vil man således kunne omdanne lyd, billede og video til struktureret data. Ligesom omdannelse af fritekst i store dokumentmængder kan omdannes til strukturerede data, såkaldt text mining.

På Danmarks Tekniske Universitet i København er forskerne i gang med næste generation af BI-teknologierne. Universitetet samarbejder med Danmarks Radio om et video mining-projekt.

"Text mining var her allerede i 2002, men i dag er vi endnu længere fremme i udviklingen af nye muligheder," siger Henrik Madsen, professor i statistik på DTU.

Video mining-projektet kan betyde, at DR i fremtiden kan søge i deres arkiver efter personer, der har optrådt i et videoklip, uden at der på klippet er gemt metadata om personen. Således kan en forbipasserende i et videoklip identificeres ved hjælp af video mining.

En anden mulighed kan være, at man kan identificere lydene i et videoklip og finde ud af, hvem der har sagt hvad.

Men før data fra video, lyd og billeder rammer erhvervsledernes skriveborde, når der skal tages afgørende beslutninger, vil vi se text mining vokse frem.

"Text mining er ikke så udbredt endnu. Men virksomhederne er ved at få øjnene op for det. Det er især muligheden for at søge i ustrukturerede data, der er interessant," siger analytiker Brian Troelsen fra analysehuset IDC.

Han vurderer dog, at virksomheder ikke vil kaste sig over det, før finanskrisens slutning kan skimtes.

"Men text mining har potentiale. De virksomheder, der først får noget fornuftigt ud af at analysere disse data, vil virkelig få et stort forspring i forhold til konkurrenterne," siger han.

Ifølge analysehuset IDC vokser datamængden i en virksomhed, der ikke ekspanderer, med 20-30 procent om året.

Samtidig vokser mængden af ustrukturerede data mere end den strukturerede data. Faktisk udgør ustrukturerede data hele 75 procent af den samlede datatilvækst årligt.

Marked i vækst
I en rapport fra 2007 om det danske business intelligence-marked, forventer IDC da også, at det samlede danske marked for analyseværktøjer, business intelligence og datavarehuse vil vokse fra 1,1 milliard kroner i 2007 til 1,6 milliarder kroner i 2012. Og på verdensplan tales om et marked på knap 40 milliarder årligt med en årlig vækst på op imod 10 procent.

SAS Institute, der er en af de store BI-leverandører, fortæller da også, at man forventer stor vækst inden for værktøjer til ustruktuerede data.

For eksempel inden for sundhedssektoren er text mining et rigtig inter­essant værktøj, da læger ikke altid er tilfredse med at krydse oplysninger af på et skema, men hellere vil skrive i fritekst om patientens tilstand.

Stine Fangel, business advisor i SAS Institute, demonstrerede for Computerworld text mining-værktøjet på en database med 3.000 journaler fra et amerikansk hospital, hvor der både er strukturerede og ustrukturerede data.

Ved hjælp af værktøjet kunne hun i løbet af et par timer analysere, om de symptomer, der bliver opridset i journalerne, kunne give anledning til mere alvorlige komplikationer for patienterne.

Ved at krydstjekke med en liste over de patienter, der rent faktisk havde fået mere alvorlige symptomer, viste det sig, at Stine Fangels analysemodel vurderede 90 procent af journalerne korrekt.

Men når menneskeliv er på spil, er det klart, at en fejlprocent på 10 procent er urimelig høj. Derfor skal analysen fra disse værktøjer ikke stå alene.

"Det er klart, at resultaterne kan blive mere raffinerede, hvis vi havde haft en læge og lidt mere tid til rådighed. Det, som beslutningstagere kan bruge modellen til, er at overskue mange flere patientjournaler, end mennesker normalt kan, og derved kan værktøjet finde eventuelle mønstre, som er skjult for det enkelte menneske. Resultaterne fra et sådant værktøj kan altså støtte lægen i hans daglige arbejde, når han skal vælge behandlingstilbud til den enkelte patient," siger Stine Fangel.

Artiklen fortsætter på næste side...




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Fiftytwo A/S
Udvikling og salg af software til integration, kommunikation og e-handel samt ERP med fokus på leasing, detailhandlen, digitale abonnementer og dagblade/magasiner.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
RPA og software-robotter: Businesscase og teknologi

Robot process automation - RPA - har i det seneste års tid for alvor fået et gennembrud i både virksomheder, organisationer og (ikke mindst) i den offentlige sektor, hvor både kommuner, styrelser og andre institutioner har taget de små software-robotter til sig.

23. september 2020 | Læs mere


"One Minute Workflow" til ad hoc-opgaver

De seneste mange måneder har givet os alle en helt ny opfattelse af arbejdspladsen. Fjernarbejde forventes at blive en del af den nye hverdag, som vi alle kigger ind i. Det har været en øjenåbner for mange, men det har også givet os vigtig læring - hvordan sikrer du, at dine medarbejdere har samme muligheder og kan opretholde effektiviteten, også når de ikke arbejder på kontoret?

23. september 2020 | Læs mere


Digitalt seminar: Styrk økonomistyringen i en krisetid med AI og robotter

Det stiller store krav til virksomhedens økonomistyring. Blandt andet fordi det er blevet sværere end nogensinde at tage bestik af virksomhedens økonomi, konkurrence- og driftssituation på selv den korte bane. Få inspiration til at komme i gang med at styrke økonomistyringen med AI og ML på grundlag af konkrete input og erfaringer.

24. september 2020 | Læs mere






Computerworld
Så kom der pris og dato på de nye PlayStation 5-modeller
Sony slipper de nye PlayStation 5 konsoller løs blot halvanden uge efter lanceringen af Microsofts Xbox-kollektion.
CIO
Podcast: Pandoras CIO Peter Cabello afslører sine tre vigtigste mål for digitaliseringen
Podcast, The Digital Edge: Hør Pandoras CIO Peter Cabello Holmberg fortælle om, hvordan et af verdens største smykkefirmaer arbejder med innovation og digitalisering af et traditionel offline salg, og hvordan Pandora udnytter data til at skabe en bedre kundeoplevelse.
Job & Karriere
På jagt efter et it-job i Jylland? Her er 10 stillinger fra Aabenraa til Aalborg, der ledige netop nu
Vi har fundet en række spændende stillinger til dig, der jagter et it-job. Her kan du vælge og vrage mellem ledige stillinger lige fra Aabenraa til Aalborg.
White paper
Den store test: Configurable Business Documents vs. SSRS og Lasernet
3 Output Management løsninger i direkte sammenligning. Vi har sat markedets 3 mest populære dokumenthåndteringsværktøjer under lup og vurderet bl.a. anvendelsesområder, muligheder og begrænsninger for hver løsning. Whitepaperet giver dig et overblik over forskellige muligheder indenfor implementering, design, udvikling og vedligeholdelse af eksterne ERP business documenter i Microsoft Dynamics 365 til Finance & Operations.