Trods styrtdyk i storagepriser: Deduplikering kan stadig bruges til noget

Klumme: Dedublikering var moderne og nyttigt for år tilbage, men har det nogen relevans nu, hvor storage er så billigt? Backupstorage er måske svaret.

Artikel top billede

Giver det overhovedet mening med deduplikering længere?

Det lyder måske isoleret set som en lidt underlig udmelding, men den skal forstås i det rette perspektiv.

Der er næppe nogen tvivl om, at ideen med datareduktion var glimrende som udgangspunkt.

For få år tilbage var det nærmest trendy, at datalagringsteknologi skulle indeholde væsentlige elementer af data-reduktion - for eksempel data-komprimering eller data-deduplikering.

I starten arbejdede man med relativt primitive koncepter som "single-instancing", hvor simple algoritmer kunne finde sammenlignelige filer og herefter sørge for, at man kun havde én kopi på sit system - og herved sparede plads.

Sådanne teknikker blev efterfølgende stadig mere avancerede og udviklede sig til at kunne forskelsbehandle data på et ganske granulært niveau - faktisk helt ned i byte størrelse.

Men det er klart, at som disse ting kompliceres, benyttes computeresourcer i stigende grad.

Så man fandt i mange tilfælde særlig gavn af at implementere post-process datareduktion, således at en efterbehandling af data - for eksempel at foretage datareducerende arbejde - skete uden for normal arbejdstid for at undgå eventuel negativ påvirkning.

Deduplikering i datacentret

I de senere år har verdens storageleverandører kæmpet for at være først med in-line-datareduktion. Måske fandt man det særligt passende i forbindelse med finanskrisens fokus på besparende effekter.

In-line-datareduktion betyder, at der sker real-time datareduktion, når for eksempel data bliver skrevet direkte til disksystemer eller lignende, og data deduplikeres i samme omgang.

Med x86-processorens udvikling har man de senere år i stigende grad kunnet håndtere in-line 'dedupe' med stadigt flere kerner i CPU'en, højere clock-frekvens og så videre.

Men det sker ofte alligevel på bekostning af andre processer.

Når der er særligt travlt i butikken, vil man for eksempel helst bruge de fleste resourcer på at servicere forretningen med IO til for eksempel applikationer.

Men deduplikering og komprimering blev opfundet i en tid, hvor storage kapacitet var dyr. Ja faktisk endda temmelig kostbar.

Man havde lav densitet, som ofte betød mange investeringskroner, brugte meget strøm og det fyldte meget i datacentret.

Men storage er ikke så dyrt længere, og det fylder ikke meget. Faktisk har det aldrig været billigere, og selv avancerede flashstorage-komponenter er nede i forbrugerniveau - flashtyper findes i stort set alle telefoner, tablets og er sågar mainstream i enterprise-storagesystemer.

Så er "dedupe" stadig relevant?

Hvad er det så, vi skal bruge deduplikering til? Det er svært at få øje på dets relevans i primærstorage med de hastigt faldende storagepriser, og sammen med den teknologiske udvikling giver det næppe mening at bruge computeresourcer på den slags.

Behovet for compute og IO stiger nemlig stødt i takt med, at applikationerne stiller større krav, og enhederne bliver stadig større - derfor er kapacitet efterhånden noget, man har i overskud.

Derfor har det måske lidt mistet sin relevans eller betydning - i hvertfald lige i den sammenhæng

Men der, hvor der stadig kan være særlig god mening i datareduktion, er i en lidt anden genre - et nødvendigt onde - nemlig backupstorage.

Her kan data under ideelle omstændigheder kommer til at ligge længe uden at blive rørt - måske i årevis - og her drejer det sig om at spare alt, hvad man kan.

For forretningen betaler her for noget, som ikke bliver brugt. Det er en slags forsikring af virksomhedens data, som måske en dag bliver relevant i tilfælde af, at noget skulle gå tabt eller blive ødelagt.

De fleste softwareløsninger på markedet til backupformål indeholder elementer af datareduktion - det vil sige både komprimering og deduplikering af data.

Software kan endda ofte kombineres med hardware designet til backupformål med netop in-line datareduktion for at få det optimale og mest effektive setup til langtidslagring og sikring af kritisk data - ofte med mere end 10 gange reduktion i lagringsbehov over tid.

Man skal huske det, der er vigtigt for forretningen

Efter min mening bør man fokusere på at designe sin storageløsning til at levere netop den performance, forretningen har behov for, og til den mest fornuftige pris pr. gigabyte.

Herefter kan man altid vurdere, om datareduktions-elementer giver virksomheden noget mere for pengene, eller om der er en trade-off - for eksempel med hensyn til performance.

Mange leverandører, som lover in-line-deduplikering eller komprimering af data, vil have væsentlige reduktioner i performance, når sådanne features er slået til.

Nogen leverandører anbefaler sågar, at man helt undlader at bruge deduplikering til trods for, at det findes på featurelisten.

Så deduplikering er formentlig stadig ganske relevant, men sammenhængskraften har ændret sig over tid, og det vil vise sig, om det lidt forblændede fokus på in-line-data-reduktion i primær storage finder en mere nuanceret anvendelse i fremtidens datacenter.

Computerworld Events

Vi samler hvert år mere end 6.000 deltagere på mere end 70 events for it-professionelle.

Ekspertindsigt – Lyt til førende specialister og virksomheder, der deler viden om den nyeste teknologi og de bedste løsninger.
Netværk – Mød beslutningstagere, kolleger og samarbejdspartnere på tværs af brancher.
Praktisk viden – Få konkrete cases, værktøjer og inspiration, som du kan tage direkte med hjem i organisationen.
Aktuelle tendenser – Bliv opdateret på de vigtigste dagsordener inden for cloud, sikkerhed, data, AI og digital forretning.

Digital transformation | København

Executive Conversations: Kina, Trump og AI-ledelse

Kina, USA og AI flytter magt og markeder. Geopolitik rammer leverandørkæder, chips, data og standarder. Lær at koble global risiko med konkret it-ledelse. Få styr på governance, sikkerhed og compliance i AI. Deltag og styrk din handlekraft.

Infrastruktur | København

Cloud & infrastruktur 2026: AI, afhængighed og digital handlefrihed

Cloud er strategisk infrastruktur og fundament for AI, drift og innovation. Geopolitik og regulering ændrer leverandørvalg og dataplacering. Computerworld samler beslutningstagere om afhængighed, europæiske alternativer og digital handlefrihed.

Digital transformation | Aarhus C

Computerworld Summit 2026 - Aarhus

Styrk din digitale strategi med konkret brug af AI og ny teknologi. Mød 200 it-professionelle, få indsigter, løsninger og netværk på én dag. Computerworld Summit i Aarhus viser hvordan teknologi skaber forretningsværdi – her og nu.

Se alle vores events inden for it

Navnenyt fra it-Danmark

Markus Dalsgaard Sisseck, Business Developer hos Martinsen Rådgivning & Revision, har pr. 21. januar 2026 fuldført uddannelsen Master i it, linjen i organisation på Aalborg Universitet via It-vest-samarbejdet. Færdiggjort uddannelse

Markus Dalsgaard Sisseck

Martinsen Rådgivning & Revision

Renewtech ApS har pr. 1. marts 2026 ansat Emil Holme Fisker som Customer Service Specialist. Han skal især beskæftige sig med at levere høj kvalitets kundeservice og hjælpe Renewtechs kunder med at få de rette løsninger til deres behov. Han kommer fra en stilling som Key Account Manager hos Camro A/S. Han er uddannet som salgselev hos Camro A/S. Han har tidligere beskæftiget sig med at udvikle gode kunderelationer, opsøgende salg og udvikling af salgsaktiviteter. Nyt job

Emil Holme Fisker

Renewtech ApS

Infosuite A/S har pr. 1. marts 2026 ansat Henrik Sandmann som Chief Operating Officer (COO). Han skal især beskæftige sig med drift, produktudvikling og skalering, herunder også procesforbedringer og udnyttelse af AI og nye teknologier. Han kommer fra en stilling som Program Director hos ADMG ApS. Han er uddannet cand. scient i datalogi og har derudover en MBA indenfor strategi, ledelse og forretningsudvikling. Nyt job

Henrik Sandmann

Infosuite A/S

Immeo har pr. 1. marts 2026 ansat Theo Lyngaa Hansen som Consultant. Han kommer fra en stilling som Data Manager hos IDA. Han er uddannet i Business Administration & Data Science. Nyt job