Trods styrtdyk i storagepriser: Deduplikering kan stadig bruges til noget

Klumme: Dedublikering var moderne og nyttigt for år tilbage, men har det nogen relevans nu, hvor storage er så billigt? Backupstorage er måske svaret.

Artikel top billede

Giver det overhovedet mening med deduplikering længere?

Det lyder måske isoleret set som en lidt underlig udmelding, men den skal forstås i det rette perspektiv.

Der er næppe nogen tvivl om, at ideen med datareduktion var glimrende som udgangspunkt.

For få år tilbage var det nærmest trendy, at datalagringsteknologi skulle indeholde væsentlige elementer af data-reduktion - for eksempel data-komprimering eller data-deduplikering.

I starten arbejdede man med relativt primitive koncepter som "single-instancing", hvor simple algoritmer kunne finde sammenlignelige filer og herefter sørge for, at man kun havde én kopi på sit system - og herved sparede plads.

Sådanne teknikker blev efterfølgende stadig mere avancerede og udviklede sig til at kunne forskelsbehandle data på et ganske granulært niveau - faktisk helt ned i byte størrelse.

Men det er klart, at som disse ting kompliceres, benyttes computeresourcer i stigende grad.

Så man fandt i mange tilfælde særlig gavn af at implementere post-process datareduktion, således at en efterbehandling af data - for eksempel at foretage datareducerende arbejde - skete uden for normal arbejdstid for at undgå eventuel negativ påvirkning.

Deduplikering i datacentret

I de senere år har verdens storageleverandører kæmpet for at være først med in-line-datareduktion. Måske fandt man det særligt passende i forbindelse med finanskrisens fokus på besparende effekter.

In-line-datareduktion betyder, at der sker real-time datareduktion, når for eksempel data bliver skrevet direkte til disksystemer eller lignende, og data deduplikeres i samme omgang.

Med x86-processorens udvikling har man de senere år i stigende grad kunnet håndtere in-line 'dedupe' med stadigt flere kerner i CPU'en, højere clock-frekvens og så videre.

Men det sker ofte alligevel på bekostning af andre processer.

Når der er særligt travlt i butikken, vil man for eksempel helst bruge de fleste resourcer på at servicere forretningen med IO til for eksempel applikationer.

Men deduplikering og komprimering blev opfundet i en tid, hvor storage kapacitet var dyr. Ja faktisk endda temmelig kostbar.

Man havde lav densitet, som ofte betød mange investeringskroner, brugte meget strøm og det fyldte meget i datacentret.

Men storage er ikke så dyrt længere, og det fylder ikke meget. Faktisk har det aldrig været billigere, og selv avancerede flashstorage-komponenter er nede i forbrugerniveau - flashtyper findes i stort set alle telefoner, tablets og er sågar mainstream i enterprise-storagesystemer.

Så er "dedupe" stadig relevant?

Hvad er det så, vi skal bruge deduplikering til? Det er svært at få øje på dets relevans i primærstorage med de hastigt faldende storagepriser, og sammen med den teknologiske udvikling giver det næppe mening at bruge computeresourcer på den slags.

Behovet for compute og IO stiger nemlig stødt i takt med, at applikationerne stiller større krav, og enhederne bliver stadig større - derfor er kapacitet efterhånden noget, man har i overskud.

Derfor har det måske lidt mistet sin relevans eller betydning - i hvertfald lige i den sammenhæng

Men der, hvor der stadig kan være særlig god mening i datareduktion, er i en lidt anden genre - et nødvendigt onde - nemlig backupstorage.

Her kan data under ideelle omstændigheder kommer til at ligge længe uden at blive rørt - måske i årevis - og her drejer det sig om at spare alt, hvad man kan.

For forretningen betaler her for noget, som ikke bliver brugt. Det er en slags forsikring af virksomhedens data, som måske en dag bliver relevant i tilfælde af, at noget skulle gå tabt eller blive ødelagt.

De fleste softwareløsninger på markedet til backupformål indeholder elementer af datareduktion - det vil sige både komprimering og deduplikering af data.

Software kan endda ofte kombineres med hardware designet til backupformål med netop in-line datareduktion for at få det optimale og mest effektive setup til langtidslagring og sikring af kritisk data - ofte med mere end 10 gange reduktion i lagringsbehov over tid.

Man skal huske det, der er vigtigt for forretningen

Efter min mening bør man fokusere på at designe sin storageløsning til at levere netop den performance, forretningen har behov for, og til den mest fornuftige pris pr. gigabyte.

Herefter kan man altid vurdere, om datareduktions-elementer giver virksomheden noget mere for pengene, eller om der er en trade-off - for eksempel med hensyn til performance.

Mange leverandører, som lover in-line-deduplikering eller komprimering af data, vil have væsentlige reduktioner i performance, når sådanne features er slået til.

Nogen leverandører anbefaler sågar, at man helt undlader at bruge deduplikering til trods for, at det findes på featurelisten.

Så deduplikering er formentlig stadig ganske relevant, men sammenhængskraften har ændret sig over tid, og det vil vise sig, om det lidt forblændede fokus på in-line-data-reduktion i primær storage finder en mere nuanceret anvendelse i fremtidens datacenter.

Læses lige nu
    Computerworld Events

    Vi samler hvert år mere end 6.000 deltagere på mere end 70 events for it-professionelle.

    Ekspertindsigt – Lyt til førende specialister og virksomheder, der deler viden om den nyeste teknologi og de bedste løsninger.
    Netværk – Mød beslutningstagere, kolleger og samarbejdspartnere på tværs af brancher.
    Praktisk viden – Få konkrete cases, værktøjer og inspiration, som du kan tage direkte med hjem i organisationen.
    Aktuelle tendenser – Bliv opdateret på de vigtigste dagsordener inden for cloud, sikkerhed, data, AI og digital forretning.

    It-løsninger | Online

    Kod smartere med GitHub Copilot

    Få styr på GitHub Copilot og skriv bedre kode hurtigere. Se hvordan Copilot løser opgaver, sparrer på fejl og løfter komplekse workflows. Oplev live demo og lær hvordan du kommer i gang med licenser og opsætning.

    Sikkerhed | København

    Cyber Threats

    Få teknisk indsigt og konkrete løsninger til at modstå moderne cyberangreb. Lær af fejl, stop angreb i tide og byg systemer med ægte resiliens. Fokus på lavniveau-detektion, netværksovervågning og hurtig gendannelse. Deltag i Cyber Threats fra...

    It-løsninger | København V

    Platform X 2026: Forretning, teknologi og transformation

    Mød verdens stærkeste og mest effektive platforme der driver den digitale transformation samlet i København - og dyk ned i den nyeste teknologi.

    Se alle vores events inden for it

    Navnenyt fra it-Danmark

    Netip A/S har pr. 1. februar 2026 ansat Henrik Mejnhardt Nielsen som ny kollega til Product Sales Teamet i Herlev. Han kommer fra en stilling som Business Development Manager hos Arrow. Nyt job
    Lector ApS har pr. 2. februar 2026 ansat Jacob Pontoppidan som Sales Executive i Lectors TeamShare gruppe. Jacob skal især beskæftige sig med vækst af TeamShare med fokus på kommerciel skalering, mersalg og en stærk go to market eksekvering. Jacob har tidligere beskæftiget sig med salg og forretningsudvikling i internationale SaaS virksomheder. Nyt job

    Jacob Pontoppidan

    Lector ApS

    Sharp Consumer Electronics har pr. 1. april 2026 ansat Daniel Eriksson som salgsdirektør for de nordiske lande. Han skal især beskæftige sig med at accelerere virksomhedens vækst i Norden. Han kommer fra en stilling som nordisk salgsdirektør hos Hisense. Han har tidligere beskæftiget sig med detailhandel, kommerciel strategi og markedsudvidelser med bemærkelsesværdige resultater til følge. Nyt job

    Daniel Eriksson

    Sharp Consumer Electronics

    Immeo har pr. 1. marts 2026 ansat Theo Lyngaa Hansen som Consultant. Han kommer fra en stilling som Data Manager hos IDA. Han er uddannet i Business Administration & Data Science. Nyt job