Artikel top billede

"Vi ved godt, hvordan de (Google, red.) gør. Men for det første handler det om at komme først til markedet, og for det andet er der et stykke vej fra en teoretisk algoritme og så til det færdige produkt," forklarer Lars Arge om Googles søge-algoritmer.


Foto: Søren Kjeldgaard (Foto: Søren Kjeldgaard/ AU-foto 2007 /)

Dansk algoritme-forsker får 1,2 millioner kroner

Bedre algoritmer skal hjælpe os med at håndtere stadig større datamængder, forklarer algoritme-forsker Lars Arge. Han tildeles i dag en pris på 1,2 millioner kroner.

Man tager fejl, hvis man tror, at hurtigere computere kun handler om bedre processorer og mere RAM, for softwaresiden - algoritmerne - spiller en mindst lige så stor rolle.

I hvert fald hvis man spørger Lars Arge, professor og leder af Danmarks Grundforskningsfonds Center for Massive Data Algorithmics på Århus Universitet.

Han bliver senere i dag belønnet for sin algoritme-forskning med videnskabsministeriets EliteForsk-pris på 1,2 millioner kroner. Prisens gives for Lars Arges og kollegernes arbejde med at udvikle teorier for fremtidens algoritmer.

"Dybest set er vi teoretikere. Vi har en model af en maskine og så forsøger vi at finde ud af, hvordan vi hurtigst eller bedst kan løse et givent problem med brug af så lidt ressourcer som muligt," fortæller Lars Arge.

Han forklarer, at "ressourcer" i denne kontekst typisk vil være tid, men at det også kan være plads eller energi, der er udfordringen. Et konkret eksempel kunne være en algoritme til søgninger, hvor tiden er afgørende.

"Det, vi gør som algoritmikere, er at designe algoritmer og finde på smartere måder at gøre tingene på."

Algoritmer forudsiger vand-problemer

Det kan måske lyde temmelig banalt, men løsningerne på Lars Arges algoritme-forskning ligger langt fra lige for. Hans hovedfokus-område er det, der kaldes I/O-effektive algoritmer, flytning af data mellem harddisken og hukommelsen.

"Når der er rigtig, rigtig meget data, er det tit et spørgsmål om at flytte så lidt data frem og tilbage mellem harddisken og maskinen som muligt, for det er det, der tager tid. Harddiske er så langsomme i forhold til RAM," forklarer Lars Arge.

Han uddyber, at en konkret udfordring er, når man eksempelvis laser-skanner hele Danmark, for at kunne vise konturerne i landskabet - og dermed forudsige, hvad der vil ske, hvis vandstanden stiger til et givent niveau.

"Det bliver til rigtig, rigtig meget data, vi snakker terabytes. Selvom man i princippet kan lave sådan nogle beregninger, så er problemet, at standard-software simpelthen ikke kan klare så store mængder data."

Derfor har Lars Arge og forsker-kollegerne udviklet algoritmer, der gør, at man kan lave den slags massive data-beregninger.

Forsøger at optimere brugen af data

Udfordringen med I/O-beregningerne er, forklarer Lars Arge, at man skal vente relativt lang tid, når man vil hente noget data på en harddisk. Det problem forsøger harddisk- og operativsystem-producenterne at skjule.

"Når du henter en byte på harddisken, får du i virkeligheden en hel masse mere. Du får en hel stor blok data, måske 64 kilobyte. Men pointen er så, at hvis du kun bruger den byte, du spurgte om, og ikke alle de andre, så har den givet dig en hel masse data, som du ikke bruger til noget."

Målet er derfor at udvikle algoritmer, der også udnytter de ekstra data, så det dermed varer længere tid, før der igen skal hentes data på harddisken.

"Derfor laver vi algoritmer, der dels søger for at lægge data ordentlig ud på harddisken, og dels bruger de data, som vi får gratis. Så kan vi virkelig få nogle store speed-ups på vores beregninger, og det gør, at vi kan håndtere de meget store data-sæt."

Men samtidig med, at algoritmerne bliver bedre, forbedres også hardwaren.

I øjeblikket begynder de flashbaserede solid state diske for eksempel at vinde frem, hvilket betyder hurtigere læse-og skrivehastigheder. Det mindsker dog ikke behovet for bedre algoritmer.

"Det er derfor, at vi laver matematiske modeller af hardware, så hver gang vi får et nyt stykke hardware med nye karakteristika, gælder det om at sikre, at algoritmerne tilpasser sig hardwaren."

Afmystificerer Google-algoritme

Selvom algoritme-udviklingen betyder, at vi er i stand til at foretage stadig større beregninger på stadig kortere tid, er der endnu masser af forbedringspotentiale, mener Lars Arge.

De to stiftere af Google, Larry Page og Sergey Brin, er et eksempel på, hvad man kan opnå med velskrevne algoritmer.

"De fandt basalt set ud af to ting: At løse det rigtige problem - hvad det egentlig er, man gerne vil, når man søger - og så fandt de ud af, hvordan man gør det hurtigt. Det er helt utroligt, at man på milli- eller mikrosekunder kan få et svar tilbage, og det er simpelthen fordi de har den rigtige algoritme til at gøre det."

Lars Arge fortæller, at der for så vidt ikke er noget hemmeligt ved Googles algoritme, fordi den er publiceret til offentligheden. Men alligevel er det sværere end som så at gøre Google kunsten efter.

"Vi ved godt, hvordan de gør. Men for det første handler det om at komme først til markedet, og for det andet er der et stykke vej fra en teoretisk algoritme og så til det færdige produkt."

"Det er lidt ligesom, at der er en masse folk, der ved, hvordan man teoretisk bygger en bro, men det er en anden sag, hvordan man så rent faktisk gør det," siger Lars Arge.

Han tilføjer, at der derfor er opstået begrebet algorithm engineering - det at føre teori ud i praksis.

"Det er ikke kun et spørgsmål om at finde ud af metoden. Bagefter skal man kunne klippe en hæl og hugge en tå og sætte hele infrastrukturen op. Men i princippet ved vi alle sammen godt, hvad de laver (Google, red.), og faktisk er de andre søgemaskiner fra Yahoo og Microsoft skiftet til mere eller mindre den samme teknik - de er bare bagud."

Fra teori til praksis

Selvom Lars Arge primært beskæftiger sig med algoritme-teorien, er netop arbejdet med at gå fra teori til praksis vigtigt.

"Dybt i mit hjerte er jeg teoretiker, men jeg kan også godt lide at se, at tingene rent faktisk virker i praksis," fortæller Lars Arge, der tidligere har haft en forsker-karriere i USA, hvor han blandt andet samarbejdede med det amerikanske militær.

Her i Danmark samarbejder han blandt andet med COWI omkring terrændata.

"Det gør, at vi får inspiration til, hvad det er for nogle problemer, vi skal løse teoretisk, og rent faktisk også får noget software ud af det, som kan blive brugt."

Samtidig har han sammen med en kollega og nogle studerende etableret firmaet SCALGO, der skal produkt-modne den terræn-software, han har været med til at udvikle.

"Der mangler lige det sidste, før det kan komme ud i virkeligheden," siger Lars Arge.

Videnskabsministeriet uddeler i dag i alt fem Eliteforsk-priser og en række rejsestipendier til ph.d.-studerende.

Lars Arge tildeles en pris på 1,2 millioner kroner, hvoraf de 200.000 er en personlig hæderspris, mens resten skal bruges til forskning.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Jobindex Media A/S
Salg af telemarketing og research for it-branchen, it-kurser og konferencer

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Compliance og strategisk it-sikkerhed efter DORA

Finansielle koncerner har i snit 85 sikkerhedsløsninger i drift – men er i snit op til 100 dage om at opdage et igangværende cyberangreb. Ydermere viser øvelser, at det typisk tager 4-6 uger at rense og genetablere sikker drift af centrale systemer efter et stort angreb. Fokus for dagen vil derfor være på henholdsvis governance samt om, hvordan du som it-leder i den finansielle sektor skal kunne håndtere fremtidens cybertrusler og arbejde effektivt med sikkerhed på et strategisk niveau.

04. april 2024 | Læs mere


EA Excellence Day

Hvad er det, der gør it-arkitektens rolle så vigtig? Og hvad er det for udfordringer inden for områder som cloud, netværk og datacentre, som fylder hos nogle af landets bedste it-arkitekter lige nu? Det kan du her høre mere om og blive inspireret af på denne konference, hvor du også får lejlighed til at drøfte dette med ligesindede.

16. april 2024 | Læs mere


IAM - din genvej til højere sikkerhed uden uautoriseret adgang og datatab

På denne dag udforsker vi de nyeste strategier, værktøjer og bedste praksis inden for IAM, med det formål at styrke virksomheders sikkerhedsposition og effektiviteten af deres adgangsstyringssystemer og dermed minimere risikoen for uautoriseret adgang og datatab. Og hvordan man kommer fra at overbevise ledelsen til rent faktisk at implementere IAM?

18. april 2024 | Læs mere