Java-program opdager forsikringssvindel

SPECIALESKRIVERNE: Outlier detection er nyttig, når man vil klarlægge en brugers ide om, hvad der udgør en sjælden afvigelse i et datasæt.

Forfattere:
Trine Sofie Vestergaard Nielsen, 31 år, og Tøger Gralle Nørgaard, 27 år. Begge har en eksamen i datalogi fra DIKU (Datalogisk Institut Københavns Universitet).

Skrev speciale om:
Outlier detection (OD) – det at finde sjældne afvigelser eller exceptionelle værdier i et datasæt. Hidtil har man benyttet statistik eller klyngeanalyse til at belyse dette. Trine Sofie Vestergaard Nielsen og Tøger Gralle Nørgaard mente, at man i stedet kunne benytte algoritmen "Outlier by example".

Med andre ord:
Ud fra en overordnet beskrivelse af algoritmen, der oprindeligt er præsenteret af forskere fra blandt andet Carnegie Mellon University, forsøgte Trine Sofie Vestergaard Nielsen og Tøger Gralle Nørgaard at genskabe algoritmen og skrive et program, der brugte den.


Specialeskriverne
Computerworld taler hver uge med studerende på de højere it-uddannelser om indhold og brug af deres specialer. Tøger Gralle Nørgaard skrev om "Outlier by example".
Se flere specialer

Hvad bruges det til?
– Outlier detection er relevant, når man vil undersøge registrerings- eller målefejl, svindel med kreditkort, falske forsikringskrav samt detektere indbrud i datanet (intrusion detection). Her kan det være interessant at se nærmere på det unormale tilfælde frem for det normale og brugerens evne til at opfange en afvigelse.

Kan jeres program anvendes i praksis?
– Afprøvningen af algoritmen viste store uregelmæssigheder i forhold til, hvad der tidligere var rapporteret. Vi bestemte os derfor til i stedet at gennemføre en mere realistisk og brugerorienteret afprøvning, som viste, at algoritmen er mindre funktionel end hidtil antaget. Det betyder også, at selve programmet ikke har særlig stor anvendelse i praksis. Dele af det ville dog kunne anvendes i sammenhæng med andet software til dataanalyse.

Hvilke hjælpemidler har I benyttet?
– Vi har programmeret i Java og anvendt Eclipse som hjælpemiddel. Det er et udviklingsværktøj til Java.

Hvordan fik I ideen?
– Tidligere på studiet havde vi lavet projekter om knowledge discovery – også kaldet data mining – og var her stødt på begrebet outlier detection, der virkede som et interessant og samtidigt overset område.

Hvordan er jeres fremtidsudsigter?
– Trine er jobsøgende, mens jeg allerede har været så heldig at få mit drømmejob. 1. november starter jeg som konsulent hos SAS Institute i deres public division.

Den 13. oktober fik Trine Sofie Vestergaard Nielsen og Tøger Gralle Nørgaard karakteren 10 for deres speciale.

Læs specialet "An insight into Outlier Detection
with Emphasis on the Outlier By Example Algorithm"

HVAD ER DIT SPECIALE?

Har du skrevet et speciale, er du i gang med et, eller kender du nogen, der skriver på et interessant speciale på en af it-uddannelserne, hører vi meget gerne fra dig. Ring eller skriv til Tine Havkrog Jensen på 77 300 363 eller t.jensen@cw.dk

Denne artikel stammer fra den trykte udgave af Computerworld




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Brother Nordic A/S
Import og engroshandel med kontormaskiner.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Parathed – Hvad gør din virksomhed, når I bliver ramt?

Cyberkriminalitet vokser som bekendt eksplosivt i takt med digitaliseringen i disse år og det kan være voldsomt dyrt at blive hacket. Potentielt kan det lægge jeres forretning helt ned, så I ikke kan rejse jer igen. Har jeres virksomhed styr på cybersikkerheden i en tid, der kalder på oprustning? Bliv inspireret til, hvad du som virksomhed kan gøre for at sikre virksomheden og medarbejdere, så I kan gå sikkert ind i fremtiden.

21. maj 2024 | Læs mere


Computerworld Summit 2024

Vi kigger ind i scenariet for fremtiden it-afdeling og hvordan virksomheden bedst muligt udnytter både nye og etablerede teknologier til at understøtte vækst og dermed sikre overlevelse i en konkurrencepræget verden.

23. maj 2024 | Læs mere


Den digitale trussel er konstant, kompleks og stadigt stigende - også i den offentlige sektor

I dagens Danmark har vi indrettet os sådan, at alt kommunikation mellem det offentlige og borgerne foregår på forskellige digitale platforme, hvilket gør både borgerne og de offentlige institutioner skrøbelige overfor cyberkriminalitet. Samtidig lyder det fra rapporter, at de offentliges it-systemer er støvede og fulde af teknisk gæld. Dette er en farlig cocktail for de offentlige institutioner, men en særdeles lækker drink for cyber-kriminelle.

28. maj 2024 | Læs mere