Sådan rangordner Google verdens nyhedsartikler

Google har for tredje gang siden 2003 indsendt en patentansøgning, der skal raffinere selskabets algoritme til rangordning af nyhedsartikler. Se nogle af de nye parametre her.

Artikel top billede

Computerworld News Service: En patentansøgning, indsendt af Google sidste år, giver et detaljeret indblik i nogle af de parametre, selskabet vægter i rangordningen af nyhedshistorier, der afgør, i hvilken rækkefølge de vises på Google News.

Patentansøgningen, der blev indsendt i februar 2012 og offentliggjort fem måneder senere, er en videreudvikling af et patent, Google fik tildelt i 2009 med titlen Systems and Methods for Improving the Ranking of News Articles.

Computerworlds amerikanske søstermedie faldt over dokumentet ved søgning på den amerikanske patentstyrelses website i anden sammenhæng.

En talsmand fra Google har ingen kommentarer til detaljerne i patentansøgningen.

"Vi indsender patentansøgninger om mange forskellige ideer, vores medarbejdere får," kommenterer han via e-mail.

Modnes til faktiske produkter

"Nogle af de ideer modnes senere til faktiske produkter, mens andre ikke gør. Man kan ikke nødvendigvis udlede fremtidige produktlanceringer fra vores patentansøgninger."

Patentansøgningen fra sidste år giver dog et indblik i en række forskellige parametre, som selskabet bruger til at rangordne nyhedshistorier på nettet.

Hvordan Google bedømmer og behandler nyhedshistorier har været kritiseret af forskellige medievirksomheder, som for eksempel har hævdet, at selskabet krænker deres ophavsrettigheder.

Mange har også påtalt, at Google i praksis kan åbne eller lukke for en strøm af besøgende til nyhedswebsites, alt efter hvordan deres nyhedshistorier rangordnes.

Google rangordning påvirker, hvilke nyhedshistorier folk bliver præsenteret for, hvilket potentielt er med til at forme deres opfattelse af begivenhederne.

Siden lanceringen i 2002 er Google News blevet en af de største aggregatorer af nyhedshistorier på nettet.

Websitet, hvis indhold sammensættes helt automatisk, indsamler og viser overskrifter fra tusindvis af nyhedskilder fra hele verden.

Her er parametrene

I patentansøgningen beskrives parametre såsom antallet af nyhedsartikler produceret af en nyhedskilde i en given periode, den gennemsnitlige længde af en artikel fra en nyhedskilde og hvor vigtig dækningen fra en nyhedskilde er.

Af andre parametre nævnes en vurdering af nyhedskilders aktualitet samt faktorer som brugsmønstre, menneskelige holdninger, oplagsstatistik og antallet af medarbejdere hos en given nyhedskilde.

Desuden tages der højde for, hvor mange nyhedsbureauer en given nyhedskilde er associeret med, andelen af originale nyhedsartikler i nyhedskildens samlede mængde af nyhedsartikler, nyhedskildens bredde i sin generelle dækning, mængden og diversiteten af international trafik til nyhedskildens website og endda nyhedskildens skrivestil.

Ligner redaktørernes parametre

Patentansøgningen giver således et indblik i, hvordan selskaber som Google rangordner indhold på nettet, kommenterer Sree Sreenivasan, der underviser i faglig praksis ved Columbia Universitys Journalism School. Han er desuden universitets første chief digital officer.

"I den teknologiske verden er mange ting uigennemskuelige. Det er rart at få lidt klarhed om det her," siger Sreenivasan.

Han bemærker, at nogle af de parametre, Google tilsyneladende anvender til at bedømme kvaliteten af en nyhedskilde, er meget lig de parametre, redaktører selv bruger til at bedømme nyhedskilders troværdighed.

Her fremhæver han parametre såsom medarbejderantal og målgruppens mangfoldighed.

Også Googles anvendelse af nyhedshistoriers længde er et godt parameter, vurderer Sreenivasan.

Ved første øjekast ser det ud som om, Google lægger vægt på kvantitet fremfor kvalitet, siger han.

Men i dag er det sådan, at mange medievirksomheder, der producerer indhold af høj kvalitet, producerer mere, end de gjorde tidligere.

Derfor kan det forsvares at bruge nyhedshistoriers længde og antal ord som parameter, forklarer han.

"Det afspejler virkeligheden i journalistikken i dag," siger Sreenivasan.

Google: Sådan udvælger vi artiklerne

I en artikel fra The Atlantic fra sidste september udtalte chefer fra Google News, at websitet "algoritmisk" indsamler nyhedshistorier fra flere end 50.000 nyhedskilder og har flere end en milliard unikke brugere hver uge.

Kritikken fra mange især i den europæiske mediebranche lyder, at Google snylter læsere og annoncekroner ved hjælp af Google News.

Men kun få har indtil videre blokeret for, at deres indhold kan vises på Googles website, selvom Google tilbyder en ret nem måde at gøre det.

Google selv giver ikke mange oplysninger om de algoritmer, der bruges til at opdage og rangordne nyhedshistorier.

Sådan udvælges artikler

Selskabet oplyser blot, at nyhedsartikler udvælges og rangordnes på baggrund af parametre såsom hvor mange og på hvilke websites, de vises; indholdets aktualitet; geografisk område; relevans og diversitet.

Google har tidligere udtalt, at selskabet konstant justerer i sin rangordning af nyheder, for at sikre at der vises indhold af høj kvalitet.

Patentansøgningen ser ud til at være det seneste tiltag i denne raffineringsproces og giver et sjældent indblik i nogle af vigtigste parametre, som Google vægter:

Historiestørrelsen bedømmes

- For at afgøre kvaliteten af en nyhedskilde kan Google enten se på antallet af producerede originale ("ikke-genbrugte") nyhedsartikler eller ligefrem tælle antallet af originale sætninger produceret af en given nyhedskilde.

- For at afgøre hvor væsentlig en given dækning er, bedømmer Google en "historiestørrelse" for alle originale nyhedsartikler produceret af en medievirksomhed i løbet af en uge, en måned eller en længere periode. "For eksempel ... hvis D er en artikel om ulykken med rumfærgen Columbia og der var 500 andre separate artikler om emnet, så ville historiestørrelsen være 500."

- For at beregne en "breaking news-karakter" for en given medievirksomhed kan Google "måle nyhedskildens evne til at udgive en historie hurtigt efter en vigtig begivenhed har fundet sted."

- For at vurdere en nyhedskildes evne til at producere originalt indhold af høj kvalitet benyttes antallet af personer, der nævnes i nyhedshistorierne med særlig vægt på personer, der ikke i udbredt grad citeres andre steder. "Dette kan indikere, at nyhedskilden er i stand til at producere original journalistik."

Google holder også øje med links fra søgemaskiner til individuelle nyhedsartikler. "Velkendte websites såsom CNN foretrækkes ofte fremfor mindre populære websites med for eksempel ukendte lokalnyheder, som brugerne kan tænkes at gå uden om," står der i patentansøgningen.

Oversat af Thomas Bøndergaard

Læses lige nu

    En kaotisk verden kræver stærk cybersikkerhed, resiliens og digital suverænitet

    Mød David Heinemeier, Flemming Splidsboel Hansen, Casper Klynge, Rasmus Knappe, Jens Myrup Pedersen og forfattere som fhv. jægersoldat Thomas Rathsack og adfærdsforsker Henrik Tingleff.

    Computerworld afholder d. 4. og 5. november Cyber Security Festival i København - med fokus på sikkerhed, resiliens og digital suverænitet. Det er helt gratis - men reserver din plads allerede nu.

    Hele programmet er online lige nu - og du kan reservere din gratis plads lige her - jeg håber vi ses! 

    Lars Jacobsen

    Chefredaktør på Computerworld

    Se alle Lars's artikler her

    Navnenyt fra it-Danmark

    Norriq Danmark A/S har pr. 1. oktober 2025 ansat Huy Duc Nguyen som Developer ERP. Han skal især beskæftige sig med at bidrage til at udvikle, bygge og skræddersy IT-løsninger, der skaber vækst og succes i vores kunders forretninger. Han kommer fra en stilling som Software Developer hos Navtilus. Han er uddannet i bioteknologi på Aalborg University. Nyt job

    Huy Duc Nguyen

    Norriq Danmark A/S

    Norriq Danmark A/S har pr. 1. september 2025 ansat Katrine Køpke Rasmussen som Consultant. Hun skal især beskæftige sig med sikre vækst i NORRIQS kunders forretninger gennem hendes skarpe rapporteringer. Nyt job

    Katrine Køpke Rasmussen

    Norriq Danmark A/S

    Netip A/S har pr. 15. september 2025 ansat Jimmi Overgaard som Key Account Manager ved netIP's kontor i Viborg. Han kommer fra en stilling som Sales Executive hos Globalconnect A/S. Nyt job

    Jimmi Overgaard

    Netip A/S

    Norriq Danmark A/S har pr. 1. oktober 2025 ansat Rasmus Stage Sørensen som Operations Director. Han kommer fra en stilling som Partner & Director, Delivery hos Impact Commerce. Han er uddannet kandidat it i communication and organization på Aarhus University. Han har tidligere beskæftiget sig med med at drive leveranceorganisationer. Nyt job

    Rasmus Stage Sørensen

    Norriq Danmark A/S