Populære open source-værktøjer i skudlinjen: Så meget data kan Hadoop og MongoDB blotte

Open source-løsninger som MongoDB og Hadoop anvendes på titusindvis af servere verden over. Der er langt fra altid godt nok styr på data-beskyttelsen.

Artikel top billede

Massive mængder data fra HDFS (Hadoop Distributed File System), der blandt andet bruges til big data-projekter, kan søges frem via en internetforbindelse - hvis man altså har de rigtige værktøjer, og dataene ikke er beskyttet godt nok.

Det skriver John Matherly, der står bag Shodan-søgemaskinen, der bruges til at søge efter maskiner og servere, der er tilsluttet internettet.

Hans indlæg kommer efter, at der i længere tid har været fokus på datasikkerheden i blandt andet MongoDB, Elastic og Redis - andre populære værktøjer for udviklere og dataanalytikere.

"Men i forhold til datavolumen er det HDFS, der er mastodonten," skriver John Matherly.

Så mange servere og data er der

Han har via Shodan fundet 48.820 MongoDB-servere, der potentielt udstiller 25 TB data.

Der er 'kun' 4.487 HDFS-servere, men de indeholder til gengæld hele 5.120 TB data, der potentielt kan blive tilgået af de forkerte.

"Selvom der er flere MongoDB-databaser tilsluttet til internettet uden autentificering i forhold til data, så overgås det af HDFS-clusters (25 TB vs 5 PB)."

Næsten alle de HDFS NameNodes, Shodan-søgemaskinen finder, er placeret i USA (1.900) og i Kina (1.426), og de hostes næsten alle på Amazons og Alibabas cloud-løsninger.

John Matherly mener, at denne viden er vigtig, især i lyset af aktuelle sikkerhedstrusler.

"De ransomware-angreb på databaser, som blev omtalt vidt og bredt tidligere i år, finder stadig sted. Og de påvirker både MongoDB- og HDFS-udrulninger."

Det fremgår ikke af Shodan-stifterens indlæg, hvor alvorligt det reelt står til med dataene fra MongoDB og HDFS, men der er næppe tvivl om, at langt fra alle de store data-projekter, der finder sted i disse år, har godt nok styr på den sikkerhedsmæssige del af det.

Læs også:

Sådan fungerer Hadoop - det mest hypede open source-værktøj lige nu

Stor mangel på data-eksperter: Derfor er det et problem for Danmark

Verdenskendt analysehus: Ingen vej uden om Hadoop for nogen virksomhed: Her er de bedste løsninger lige nu

Annonceindlæg fra Opentext

Identity er omdrejningspunkt for AI, applikationer og angreb og kræver klar governance

Det gælder om at reducere risici – fra medarbejdere over privilegerede brugere til maskinidentiteter.

Navnenyt fra it-Danmark

Thomas Morville Helmert, chefkonsulent hos Rigspolitiet, har pr. 28. januar 2026 fuldført uddannelsen Master i it, linjen i organisation på Aarhus Universitet via It-vest-samarbejdet. Færdiggjort uddannelse
netIP har pr. 1. januar 2026 ansat Michael Kjøgx som Systemkonsulent ved netIP's kontor i Esbjerg. Han kommer fra en stilling som Konsulent hos Blue Byte og før da ATEA og XPconsult. Nyt job
inciro K/S har pr. 1. februar 2026 ansat Lasse Fletcher som Cloud Consultant. Han skal især beskæftige sig med Governance og struktur i cloud miljøer. Han kommer fra en stilling som IT Tekniker hos CBrain A/S. Han er uddannet datatekniker med speciale i infrastruktur. Han har tidligere beskæftiget sig med kunde onboarding, Identitets styring, sikkerhed og IaC. Nyt job

Lasse Fletcher

inciro K/S