2.500 siders lækkede dokumenter afslører, hvordan Googles søgemaskine fungerer

Et datalæk af flere tusinde siders interne dokumenter fra Google kaster lys over, hvordan selskabets sagnomspundne søgealgoritme fungerer.

Artikel top billede

(Foto: Solen Feyissa/Unsplash)

Mere end 2.500 siders lækkede dokumenter, som påstås at være interne Google-dokumenter, der giver et sjældent indblik i selskabets søgealgoritme, er blevet lækket.

Det er denne søgealgoritme, der bestemmer, hvilke sider, der bliver set, og hvilket indhold, der dominerer internettet.

Mange har igennem tiden forsøgt at løse mysteriet om, hvordan søgealgoritmen fungerer. Og nu giver disse dokumenter altså et vink med en vognstang om, hvordan det hele går til.

Og ifølge de lækkede dokumenter, så har Google ikke været ærlige om deres praksis i årevis.

Det skriver The Verge.

Et kig ind i Googles 'blackbox'

Sagen tager sin begyndelse en søndag. Det er 5. maj, og Rand Fishkin, der har arbejdet med SEO i mere end årti, modtager en mail fra en person.

Personen påstår, at vedkommende har adgang til et massivt læk bestående af Googles søge-API, skriver Rand Fishkin på sin virksomheds blog.

Personen påstår også, at de lækkede dokumenter er blevet autentificeret af tidligere Google-ansatte, og at disse tidligere Google-ansatte har delt yderligere oplysninger omkring måden, hvorpå Google opererer sine søgninger.

Ifølge Rand Fishkin håbede kilden, som delte de 2.500 sider med dokumenter med ham, at modbevise de "løgne", som Google-medarbejdere angiveligt har delt om, hvordan søgealgoritmen fungerer og giver et overblik over 14.000 påståede nøglefeatures, når det kommer til rangering af søgeresultater.

Detaljerne, som Fishkin har delt, er komplekse og tekniske, er sandsynligvis mere forståelige for udviklere og SEO-eksperter end for den almindelige bruger.

Indholdet af lækket beviser ikke nødvendigvis, at Google bruger de nævnte data og signaler til rangering.

Snarere viser lækket, hvilke data Google indsamler fra websider, hjemmesider og brugere, og giver indirekte hints til SEO-eksperter om, hvad Google synes at vægte, som SEO-ekspert Mike King skriver i sin oversigt over dokumenterne.

Modstridende oplysninger

De lækkede dokumenter berører emner, som hvilken slags data Google indsamler og bruger, hvilke sider Google fremhæver i følsomme emner som valg, hvordan Google håndterer små hjemmesider og meget mere.

Nogle af oplysningerne i dokumenterne ser ud til at være i modstrid med offentlige udtalelser fra Google-repræsentanter, lyder det blandt andet fra Fishkin.

Mike King, som er en anden SEO-ekspert, der har set på dokumenterne, siger, at ordet "løgn" er hårdt, men at det er det eneste præcise ord at bruge i denne sammenhæng.

"Selvom jeg ikke nødvendigvis bebrejder Googles offentlige repræsentanter for at beskytte deres hemmelige informationer, har jeg et problem med deres indsats for aktivt at miskreditere folk i marketing-, teknologi- og journalistikverdenen, som har præsenteret opdagelser, der kan gentages og bevises," lyder det videre i Mike Kings kommentar til de lækkede dokumenter.

Google har ikke svaret på The Verges anmodninger om kommentarer vedrørende dokumenterne, herunder en direkte anmodning om at afvise deres ægthed.

Søgealgoritmen og SEO

Googles hemmelighedsfulde søgealgoritme har skabt en industri af marketingfolk, der følger Googles retningslinjer nøje og anvender dem for millioner af virksomheder.

Men de lækkede dokumenter rejser tvivl om Googles offentlige udtalelser om, hvordan søgning fungerer.

De lækkede dokumenter får SEO-eksperterne Rand Fishkin og Mike King til at spørge, om Google Chrome-data bruges i rangeringer.

Google-repræsentanter har gentagne gange sagt, at de ikke bruger Chrome-data til rangering, men i flere afsnit i de lækkede dokumenter bliver Chrome specifikt nævnt i forhold til, hvordan websites vises i søgninger.

Mike King beskriver også, hvordan Google indsamler forfatterdata fra sider og har et felt for, om en enhed på siden er forfatteren.

I en del af dokumenterne, som Mike King har delt, lyder det, at feltet "hovedsageligt er udviklet og justeret til nyhedsartikler... men også udfyldes for andet indhold (for eksempel videnskabelige artikler)."

Dette bekræfter ikke, at forfatterbylines er en eksplicit rangeringsmetrik, men viser, at Google holder øje med denne attribut, lyder det.

Google har ellers tidligere insisteret på, at forfatterbylines er til for læsernes skyld, ikke for Google, da det ikke påvirker rangeringen.

Ud over de lækkede dokumenter har den amerikanske regerings antitrust-sag mod Google har også afsløret interne dokumenter, hvilket giver yderligere indsigt i, hvordan Googles hovedprodukt fungerer.

Google advarer

Google selv har bekræftet lækket af dokumenter og advarer mod at drage konklusioner på baggrund af oplysningerne.

"Vi vil advare mod at komme med unøjagtige antagelser om søgning baseret på out-of-context, forældede eller ufuldstændige oplysninger," sagde Google-talsmand Davis Thompson til The Verge i en e-mail og fortsætter:

"Vi har delt omfattende information om, hvordan Search fungerer, og de typer faktorer, som vores systemer vægter, samtidig med at vi arbejder på at beskytte integriteten af ​​vores resultater mod manipulation."

Læses lige nu

    Annonceindlæg fra Computerworld

    AI’s produktivitetsparadoks: Hvor bliver gevinsterne af?

    Undersøgelser i Danmark og udlandet tyder på, at AI endnu ikke for alvor kan aflæses i produktivitet og bundlinje.

    Unik System Design A/S

    DevOps Engineer

    Nordjylland

    Forsvarsministeriets Materiel- og Indkøbsstyrelse

    Nye kolleger søges til IT Stab i Forsvaret

    Midtjylland

    Netcompany A/S

    Microsoft Operations Engineer

    Nordjylland

    Navnenyt fra it-Danmark

    Renewtech ApS har pr. 1. februar 2026 ansat Thomas Bjørn Nielsen som E-Commerce Manager. Han skal især beskæftige sig med at optimere og vækste virksomhedens digitale platforme yderligere. Han kommer fra en stilling som Operations Project Manager hos Tiger Media. Han er uddannet fra Aalborg Universitet og har en MSc. i International Virksomhedsøkonomi. Nyt job

    Thomas Bjørn Nielsen

    Renewtech ApS

    Infosuite A/S har pr. 1. marts 2026 ansat Henrik Sandmann som Chief Operating Officer (COO). Han skal især beskæftige sig med drift, produktudvikling og skalering, herunder også procesforbedringer og udnyttelse af AI og nye teknologier. Han kommer fra en stilling som Program Director hos ADMG ApS. Han er uddannet cand. scient i datalogi og har derudover en MBA indenfor strategi, ledelse og forretningsudvikling. Nyt job

    Henrik Sandmann

    Infosuite A/S

    netIP har pr. 20. januar 2026 ansat Mikkel Lykke Petersen som Datateknikerelev ved netIP Thisted/Aalborg. Han er uddannet håndværker og har arbejdet som både montør, mekaniker, tømrer og tagdækker. Nyt job
    Thomas Nakai, Product Owner hos Carlsberg, har pr. 27. januar 2026 fuldført uddannelsen Master i it, linjen i organisation på Aarhus Universitet via It-vest-samarbejdet. Færdiggjort uddannelse

    Thomas Nakai

    Carlsberg