Populære open source-værktøjer i skudlinjen: Så meget data kan Hadoop og MongoDB blotte

Open source-løsninger som MongoDB og Hadoop anvendes på titusindvis af servere verden over. Der er langt fra altid godt nok styr på data-beskyttelsen.

Artikel top billede

Massive mængder data fra HDFS (Hadoop Distributed File System), der blandt andet bruges til big data-projekter, kan søges frem via en internetforbindelse - hvis man altså har de rigtige værktøjer, og dataene ikke er beskyttet godt nok.

Det skriver John Matherly, der står bag Shodan-søgemaskinen, der bruges til at søge efter maskiner og servere, der er tilsluttet internettet.

Hans indlæg kommer efter, at der i længere tid har været fokus på datasikkerheden i blandt andet MongoDB, Elastic og Redis - andre populære værktøjer for udviklere og dataanalytikere.

"Men i forhold til datavolumen er det HDFS, der er mastodonten," skriver John Matherly.

Så mange servere og data er der

Han har via Shodan fundet 48.820 MongoDB-servere, der potentielt udstiller 25 TB data.

Der er 'kun' 4.487 HDFS-servere, men de indeholder til gengæld hele 5.120 TB data, der potentielt kan blive tilgået af de forkerte.

"Selvom der er flere MongoDB-databaser tilsluttet til internettet uden autentificering i forhold til data, så overgås det af HDFS-clusters (25 TB vs 5 PB)."

Næsten alle de HDFS NameNodes, Shodan-søgemaskinen finder, er placeret i USA (1.900) og i Kina (1.426), og de hostes næsten alle på Amazons og Alibabas cloud-løsninger.

John Matherly mener, at denne viden er vigtig, især i lyset af aktuelle sikkerhedstrusler.

"De ransomware-angreb på databaser, som blev omtalt vidt og bredt tidligere i år, finder stadig sted. Og de påvirker både MongoDB- og HDFS-udrulninger."

Det fremgår ikke af Shodan-stifterens indlæg, hvor alvorligt det reelt står til med dataene fra MongoDB og HDFS, men der er næppe tvivl om, at langt fra alle de store data-projekter, der finder sted i disse år, har godt nok styr på den sikkerhedsmæssige del af det.

Læs også:

Sådan fungerer Hadoop - det mest hypede open source-værktøj lige nu

Stor mangel på data-eksperter: Derfor er det et problem for Danmark

Verdenskendt analysehus: Ingen vej uden om Hadoop for nogen virksomhed: Her er de bedste løsninger lige nu

Annonceindlæg fra IBM

Digital suverænitet: De her spørgsmål skal du stille

Sådan sikrer din virksomhed kontrollen over data, arkitektur, processer og AI i en stadig mere omskiftelig verden.

KMD A/S

Senior Full Stack Developer

Københavnsområdet

Netcompany A/S

IT Consultant

Midtjylland

Forsvarsministeriets Materiel- og Indkøbsstyrelse

Projektleder / Technical Delivery Manager – Dataplatform og Digitalt Fundament

Københavnsområdet

Navnenyt fra it-Danmark

Thomas Morville Helmert, chefkonsulent hos Rigspolitiet, har pr. 28. januar 2026 fuldført uddannelsen Master i it, linjen i organisation på Aarhus Universitet via It-vest-samarbejdet. Færdiggjort uddannelse
Renewtech ApS har pr. 1. februar 2026 ansat Kirsten Skriver som Warehouse Team Lead. Hun skal især beskæftige sig med udviklingen af det globale lagersetup hos Renewtech. Hun kommer fra en stilling som Lagerchef hos BORG Automotive Reman A/S. Nyt job

Kirsten Skriver

Renewtech ApS

Idura har pr. 5. januar 2026 ansat Arjuna Enait, 34 år,  som software engineer. Han skal især beskæftige sig med videreudvikling af Verify-systemet samt arbejde på implementeringen af CIBA i Norsk BankID. Han kommer fra en stilling som software engineer hos Lasso X. Han er uddannet civilingeniør med speciale i geoteknik. Han har tidligere beskæftiget sig med at bygge microservices til dataindsamling og -processering, samt opdatere legacy-systemer. Nyt job

Arjuna Enait

Idura