I gang med virksomhedsdata - har du data, der er gode nok til prædiktive modeller?

Skal dine løsninger være smartere med prædiktive modeller? Lav et selvcheck på de tre mest hyppige snubletråde, inden du går i gang. Her er de tre spørgsmål, du skal stille dig selv.

Artikel top billede

Klumme: En af de mest interessante teknikker inden for data mining er prædiktive modeller - altså modeller der skal forudsige et eller andet.

Det kan være mængden af nedbør, sandsynligheden for at en bruger klikker på en reklame, værdien af et parcelhus eller risikoen for at låntageren går konkurs.

Der findes mange forskellige typer af prædiktive modeller lige fra lineær regression til beslutningstræer, support vector machines og neurale netværk.

Men de er alle estimeret ud fra et datasæt af eksempler på sammenhængen mellem input og output og kræver derfor en bestemt type datagrundlag for at kunne bringes i spil.

De problemer der kan være med datagrundlaget er ofte de samme, så spørgsmålet er naturligvis: Har du data, der er gode nok?

Du kan lave et selvcheck på de tre mest hyppige snubletråde:

Check 1: Har du data på resultatet?

Når man skal estimere en sammenhæng mellem input og output, skal man selvfølgelig også bruge eksempler på output - altså resultatet af et eller andet.

Det er banalt. Og hvis output er mængden af regnvand, er der nok også målinger af mm regn hos DMI, som man kan finde frem til. 

Men det er ikke altid nemt: Hvis en skole ønsker at identificere hændelser i skoleforløbet, der er særligt positive eller negative for om eleven senere hen har succes, så må man starte med at spørge, hvad "succes" betyder i denne sammenhæng. 

Er det, at personen er fri af kriminalitet? Er i job? Tjener mange penge? Har familie? Føler at han eller hun har et godt liv? Og når man har defineret det, så er det jo ikke altid ligetil at finde data på det.

Check 2: Har du en historik i data?

Mange systemer er lavet til at være operationelle. De skal fungere her og nu og altid være opdaterede med seneste viden.

Derfor er data ofte mere aktuelle end godt er, forstået på den måde at når man estimerer en prædiktiv model til at lave forudsigelser, så er der brug for at kende data, som de så ud på det tidspunkt hvor forudsigelserne skal foretages. 

Det vil sige, at hvis man skal estimere en prædiktiv model for, om en bankkunde går konkurs, så skal man have data, som det så ud, dengang kunden ansøgte om lånet og ikke to år efter, hvor alle jo godt ved, at de gik ned. 

Man skal så at sige kunne spole filmen baglæns og genskabe situationen, som den så ud tidligere.

Check 3: Har du data der er relevant?

Når man skal estimere en sammenhæng mellem input og output, er det vigtigt ikke bare at have input data, men også at at have relevant input data.

Det handler om at være relevant for den output variabel, der skal forudsiges, og det er her, der kan være udfordringer.

Hvis f.eks. en fødevareproducent gerne vil estimere kvaliteten af de skinker, der kommer fra leverandørerne, er det ikke nok at kende leverandørernes omsætning, antal ansatte og adresse. Så skal man måske kende temperaturmålinger fra kølerummene eller luftfugtigheden under transporten. 

Mange forsøger at lave prædiktive modeller baseret på traditionelt registerdata - ikke fordi de tror at netop det vil virke godt, men fordi det er tilgængeligt - og det har ikke altid gode chancer for succes.

Kan du svare ja til alle tre ovenstående, står du rigtig stærkt og skal bare se at komme i gang med din første prædiktive model.

Computerworld Events

Vi samler hvert år mere end 6.000 deltagere på mere end 70 events for it-professionelle.

Ekspertindsigt – Lyt til førende specialister og virksomheder, der deler viden om den nyeste teknologi og de bedste løsninger.
Netværk – Mød beslutningstagere, kolleger og samarbejdspartnere på tværs af brancher.
Praktisk viden – Få konkrete cases, værktøjer og inspiration, som du kan tage direkte med hjem i organisationen.
Aktuelle tendenser – Bliv opdateret på de vigtigste dagsordener inden for cloud, sikkerhed, data, AI og digital forretning.

Infrastruktur | Horsens

Enterprise Architecture Day 2026: Sikker og strategisk suverænitet

Få ny inspiration til arbejdet med EA – fra sikkerhed og compliance til orkestrering, omkostningsoptimering og cloud governance i en usikker og ustabil tid.

Sikkerhed | Aarhus C

Executive roundtable: Cyberrobusthed i praksis

Cyberangreb rammer driften. NIS2 og DORA kræver dokumenteret gendannelse under pres. Få konkret metode til at teste, måle og bevise robusthed på tværs af cloud, SaaS og leverandører. Deltag i lukket roundtable med Commvault og Hitachi.

Digital transformation | København Ø

Sådan etablerer du digital suverænitet

Digital suverænitet afgør kontrol over data, systemer og afhængigheder i Danmark. Computerworld samler Dansk Erhverv og IBM-eksperter om konkrete arkitekturvalg, governance og platforme, der sikrer reel kontrol. Få overblik og handlekraft.

Se alle vores events inden for it

Navnenyt fra it-Danmark

Thomas Morville Helmert, chefkonsulent hos Rigspolitiet, har pr. 28. januar 2026 fuldført uddannelsen Master i it, linjen i organisation på Aarhus Universitet via It-vest-samarbejdet. Færdiggjort uddannelse
Infosuite A/S har pr. 1. marts 2026 ansat Henrik Sandmann som Chief Operating Officer (COO). Han skal især beskæftige sig med drift, produktudvikling og skalering, herunder også procesforbedringer og udnyttelse af AI og nye teknologier. Han kommer fra en stilling som Program Director hos ADMG ApS. Han er uddannet cand. scient i datalogi og har derudover en MBA indenfor strategi, ledelse og forretningsudvikling. Nyt job

Henrik Sandmann

Infosuite A/S

Adeno K/S har pr. 2. februar 2026 ansat Kia Harding Martinussen som ServiceNow Expert. Hun kommer fra en stilling som Principal Consultant hos Devoteam A/S. Nyt job