Artikel top billede

"Vi ved godt, hvordan de (Google, red.) gør. Men for det første handler det om at komme først til markedet, og for det andet er der et stykke vej fra en teoretisk algoritme og så til det færdige produkt," forklarer Lars Arge om Googles søge-algoritmer.


Foto: Søren Kjeldgaard (Foto: Søren Kjeldgaard/ AU-foto 2007 /)

Dansk algoritme-forsker får 1,2 millioner kroner

Bedre algoritmer skal hjælpe os med at håndtere stadig større datamængder, forklarer algoritme-forsker Lars Arge. Han tildeles i dag en pris på 1,2 millioner kroner.

Man tager fejl, hvis man tror, at hurtigere computere kun handler om bedre processorer og mere RAM, for softwaresiden - algoritmerne - spiller en mindst lige så stor rolle.

I hvert fald hvis man spørger Lars Arge, professor og leder af Danmarks Grundforskningsfonds Center for Massive Data Algorithmics på Århus Universitet.

Han bliver senere i dag belønnet for sin algoritme-forskning med videnskabsministeriets EliteForsk-pris på 1,2 millioner kroner. Prisens gives for Lars Arges og kollegernes arbejde med at udvikle teorier for fremtidens algoritmer.

"Dybest set er vi teoretikere. Vi har en model af en maskine og så forsøger vi at finde ud af, hvordan vi hurtigst eller bedst kan løse et givent problem med brug af så lidt ressourcer som muligt," fortæller Lars Arge.

Han forklarer, at "ressourcer" i denne kontekst typisk vil være tid, men at det også kan være plads eller energi, der er udfordringen. Et konkret eksempel kunne være en algoritme til søgninger, hvor tiden er afgørende.

"Det, vi gør som algoritmikere, er at designe algoritmer og finde på smartere måder at gøre tingene på."

Algoritmer forudsiger vand-problemer

Det kan måske lyde temmelig banalt, men løsningerne på Lars Arges algoritme-forskning ligger langt fra lige for. Hans hovedfokus-område er det, der kaldes I/O-effektive algoritmer, flytning af data mellem harddisken og hukommelsen.

"Når der er rigtig, rigtig meget data, er det tit et spørgsmål om at flytte så lidt data frem og tilbage mellem harddisken og maskinen som muligt, for det er det, der tager tid. Harddiske er så langsomme i forhold til RAM," forklarer Lars Arge.

Han uddyber, at en konkret udfordring er, når man eksempelvis laser-skanner hele Danmark, for at kunne vise konturerne i landskabet - og dermed forudsige, hvad der vil ske, hvis vandstanden stiger til et givent niveau.

"Det bliver til rigtig, rigtig meget data, vi snakker terabytes. Selvom man i princippet kan lave sådan nogle beregninger, så er problemet, at standard-software simpelthen ikke kan klare så store mængder data."

Derfor har Lars Arge og forsker-kollegerne udviklet algoritmer, der gør, at man kan lave den slags massive data-beregninger.

Forsøger at optimere brugen af data

Udfordringen med I/O-beregningerne er, forklarer Lars Arge, at man skal vente relativt lang tid, når man vil hente noget data på en harddisk. Det problem forsøger harddisk- og operativsystem-producenterne at skjule.

"Når du henter en byte på harddisken, får du i virkeligheden en hel masse mere. Du får en hel stor blok data, måske 64 kilobyte. Men pointen er så, at hvis du kun bruger den byte, du spurgte om, og ikke alle de andre, så har den givet dig en hel masse data, som du ikke bruger til noget."

Målet er derfor at udvikle algoritmer, der også udnytter de ekstra data, så det dermed varer længere tid, før der igen skal hentes data på harddisken.

"Derfor laver vi algoritmer, der dels søger for at lægge data ordentlig ud på harddisken, og dels bruger de data, som vi får gratis. Så kan vi virkelig få nogle store speed-ups på vores beregninger, og det gør, at vi kan håndtere de meget store data-sæt."

Men samtidig med, at algoritmerne bliver bedre, forbedres også hardwaren.

I øjeblikket begynder de flashbaserede solid state diske for eksempel at vinde frem, hvilket betyder hurtigere læse-og skrivehastigheder. Det mindsker dog ikke behovet for bedre algoritmer.

"Det er derfor, at vi laver matematiske modeller af hardware, så hver gang vi får et nyt stykke hardware med nye karakteristika, gælder det om at sikre, at algoritmerne tilpasser sig hardwaren."

Afmystificerer Google-algoritme

Selvom algoritme-udviklingen betyder, at vi er i stand til at foretage stadig større beregninger på stadig kortere tid, er der endnu masser af forbedringspotentiale, mener Lars Arge.

De to stiftere af Google, Larry Page og Sergey Brin, er et eksempel på, hvad man kan opnå med velskrevne algoritmer.

"De fandt basalt set ud af to ting: At løse det rigtige problem - hvad det egentlig er, man gerne vil, når man søger - og så fandt de ud af, hvordan man gør det hurtigt. Det er helt utroligt, at man på milli- eller mikrosekunder kan få et svar tilbage, og det er simpelthen fordi de har den rigtige algoritme til at gøre det."

Lars Arge fortæller, at der for så vidt ikke er noget hemmeligt ved Googles algoritme, fordi den er publiceret til offentligheden. Men alligevel er det sværere end som så at gøre Google kunsten efter.

"Vi ved godt, hvordan de gør. Men for det første handler det om at komme først til markedet, og for det andet er der et stykke vej fra en teoretisk algoritme og så til det færdige produkt."

"Det er lidt ligesom, at der er en masse folk, der ved, hvordan man teoretisk bygger en bro, men det er en anden sag, hvordan man så rent faktisk gør det," siger Lars Arge.

Han tilføjer, at der derfor er opstået begrebet algorithm engineering - det at føre teori ud i praksis.

"Det er ikke kun et spørgsmål om at finde ud af metoden. Bagefter skal man kunne klippe en hæl og hugge en tå og sætte hele infrastrukturen op. Men i princippet ved vi alle sammen godt, hvad de laver (Google, red.), og faktisk er de andre søgemaskiner fra Yahoo og Microsoft skiftet til mere eller mindre den samme teknik - de er bare bagud."

Fra teori til praksis

Selvom Lars Arge primært beskæftiger sig med algoritme-teorien, er netop arbejdet med at gå fra teori til praksis vigtigt.

"Dybt i mit hjerte er jeg teoretiker, men jeg kan også godt lide at se, at tingene rent faktisk virker i praksis," fortæller Lars Arge, der tidligere har haft en forsker-karriere i USA, hvor han blandt andet samarbejdede med det amerikanske militær.

Her i Danmark samarbejder han blandt andet med COWI omkring terrændata.

"Det gør, at vi får inspiration til, hvad det er for nogle problemer, vi skal løse teoretisk, og rent faktisk også får noget software ud af det, som kan blive brugt."

Samtidig har han sammen med en kollega og nogle studerende etableret firmaet SCALGO, der skal produkt-modne den terræn-software, han har været med til at udvikle.

"Der mangler lige det sidste, før det kan komme ud i virkeligheden," siger Lars Arge.

Videnskabsministeriet uddeler i dag i alt fem Eliteforsk-priser og en række rejsestipendier til ph.d.-studerende.

Lars Arge tildeles en pris på 1,2 millioner kroner, hvoraf de 200.000 er en personlig hæderspris, mens resten skal bruges til forskning.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
JN Data A/S
Driver og udvikler it-systemer for finanssektoren.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
AI Business Excellence Day – sådan folder du mulighederne ud

Mange danske virksomheder har eksperimenteret med AI-projekter af begrænset omfang, men kun de færreste har for alvor udforsket mulighederne i storskala. Det gør vi her! Du vil blandt andet få mulighed for at se eksempler på, hvordan AI kan anvendes som accelerator i storskala og skubber til grænserne for, hvordan det er muligt at integrere teknologien, så potentialet for alvor foldes ud.

24. april 2024 | Læs mere


Unbreakable - sådan sikrer du dig vedvarende og uafbrudt adgang til dine data

Vi dykker ned i værdien af en stabil og pålidelig storage-platform og hvilke muligheder der findes, for at sikre den højeste grad af redundans og tilgængelighed. Områder som date-beskyttelse og cyber-sikkerhed vil også blive berørt.

25. april 2024 | Læs mere


OT og IT: Modernisér produktionen og byg sikker bro efter et årelangt teknologisk efterslæb

Moderne produkter skal have mere end strøm for at fungere – og deres navlestreng skal ikke klippes når de forlader fabrikshallen. På denne konference kan du derfor lære mere om hvordan du får etableret det sikre setup når der går IT i OT.

30. april 2024 | Læs mere