Artikel top billede

Sådan rangordner Google verdens nyhedsartikler

Google har for tredje gang siden 2003 indsendt en patentansøgning, der skal raffinere selskabets algoritme til rangordning af nyhedsartikler. Se nogle af de nye parametre her.

Computerworld News Service: En patentansøgning, indsendt af Google sidste år, giver et detaljeret indblik i nogle af de parametre, selskabet vægter i rangordningen af nyhedshistorier, der afgør, i hvilken rækkefølge de vises på Google News.

Patentansøgningen, der blev indsendt i februar 2012 og offentliggjort fem måneder senere, er en videreudvikling af et patent, Google fik tildelt i 2009 med titlen Systems and Methods for Improving the Ranking of News Articles.

Computerworlds amerikanske søstermedie faldt over dokumentet ved søgning på den amerikanske patentstyrelses website i anden sammenhæng.

En talsmand fra Google har ingen kommentarer til detaljerne i patentansøgningen.

"Vi indsender patentansøgninger om mange forskellige ideer, vores medarbejdere får," kommenterer han via e-mail.

Modnes til faktiske produkter

"Nogle af de ideer modnes senere til faktiske produkter, mens andre ikke gør. Man kan ikke nødvendigvis udlede fremtidige produktlanceringer fra vores patentansøgninger."

Patentansøgningen fra sidste år giver dog et indblik i en række forskellige parametre, som selskabet bruger til at rangordne nyhedshistorier på nettet.

Hvordan Google bedømmer og behandler nyhedshistorier har været kritiseret af forskellige medievirksomheder, som for eksempel har hævdet, at selskabet krænker deres ophavsrettigheder.

Mange har også påtalt, at Google i praksis kan åbne eller lukke for en strøm af besøgende til nyhedswebsites, alt efter hvordan deres nyhedshistorier rangordnes.

Google rangordning påvirker, hvilke nyhedshistorier folk bliver præsenteret for, hvilket potentielt er med til at forme deres opfattelse af begivenhederne.

Siden lanceringen i 2002 er Google News blevet en af de største aggregatorer af nyhedshistorier på nettet.

Websitet, hvis indhold sammensættes helt automatisk, indsamler og viser overskrifter fra tusindvis af nyhedskilder fra hele verden.

Her er parametrene

I patentansøgningen beskrives parametre såsom antallet af nyhedsartikler produceret af en nyhedskilde i en given periode, den gennemsnitlige længde af en artikel fra en nyhedskilde og hvor vigtig dækningen fra en nyhedskilde er.

Af andre parametre nævnes en vurdering af nyhedskilders aktualitet samt faktorer som brugsmønstre, menneskelige holdninger, oplagsstatistik og antallet af medarbejdere hos en given nyhedskilde.

Desuden tages der højde for, hvor mange nyhedsbureauer en given nyhedskilde er associeret med, andelen af originale nyhedsartikler i nyhedskildens samlede mængde af nyhedsartikler, nyhedskildens bredde i sin generelle dækning, mængden og diversiteten af international trafik til nyhedskildens website og endda nyhedskildens skrivestil.

Ligner redaktørernes parametre

Patentansøgningen giver således et indblik i, hvordan selskaber som Google rangordner indhold på nettet, kommenterer Sree Sreenivasan, der underviser i faglig praksis ved Columbia Universitys Journalism School. Han er desuden universitets første chief digital officer.

"I den teknologiske verden er mange ting uigennemskuelige. Det er rart at få lidt klarhed om det her," siger Sreenivasan.

Han bemærker, at nogle af de parametre, Google tilsyneladende anvender til at bedømme kvaliteten af en nyhedskilde, er meget lig de parametre, redaktører selv bruger til at bedømme nyhedskilders troværdighed.

Her fremhæver han parametre såsom medarbejderantal og målgruppens mangfoldighed.

Også Googles anvendelse af nyhedshistoriers længde er et godt parameter, vurderer Sreenivasan.

Ved første øjekast ser det ud som om, Google lægger vægt på kvantitet fremfor kvalitet, siger han.

Men i dag er det sådan, at mange medievirksomheder, der producerer indhold af høj kvalitet, producerer mere, end de gjorde tidligere.

Derfor kan det forsvares at bruge nyhedshistoriers længde og antal ord som parameter, forklarer han.

"Det afspejler virkeligheden i journalistikken i dag," siger Sreenivasan.

Google: Sådan udvælger vi artiklerne

I en artikel fra The Atlantic fra sidste september udtalte chefer fra Google News, at websitet "algoritmisk" indsamler nyhedshistorier fra flere end 50.000 nyhedskilder og har flere end en milliard unikke brugere hver uge.

Kritikken fra mange især i den europæiske mediebranche lyder, at Google snylter læsere og annoncekroner ved hjælp af Google News.

Men kun få har indtil videre blokeret for, at deres indhold kan vises på Googles website, selvom Google tilbyder en ret nem måde at gøre det.

Google selv giver ikke mange oplysninger om de algoritmer, der bruges til at opdage og rangordne nyhedshistorier.

Sådan udvælges artikler

Selskabet oplyser blot, at nyhedsartikler udvælges og rangordnes på baggrund af parametre såsom hvor mange og på hvilke websites, de vises; indholdets aktualitet; geografisk område; relevans og diversitet.

Google har tidligere udtalt, at selskabet konstant justerer i sin rangordning af nyheder, for at sikre at der vises indhold af høj kvalitet.

Patentansøgningen ser ud til at være det seneste tiltag i denne raffineringsproces og giver et sjældent indblik i nogle af vigtigste parametre, som Google vægter:

Historiestørrelsen bedømmes

- For at afgøre kvaliteten af en nyhedskilde kan Google enten se på antallet af producerede originale ("ikke-genbrugte") nyhedsartikler eller ligefrem tælle antallet af originale sætninger produceret af en given nyhedskilde.

- For at afgøre hvor væsentlig en given dækning er, bedømmer Google en "historiestørrelse" for alle originale nyhedsartikler produceret af en medievirksomhed i løbet af en uge, en måned eller en længere periode. "For eksempel ... hvis D er en artikel om ulykken med rumfærgen Columbia og der var 500 andre separate artikler om emnet, så ville historiestørrelsen være 500."

- For at beregne en "breaking news-karakter" for en given medievirksomhed kan Google "måle nyhedskildens evne til at udgive en historie hurtigt efter en vigtig begivenhed har fundet sted."

- For at vurdere en nyhedskildes evne til at producere originalt indhold af høj kvalitet benyttes antallet af personer, der nævnes i nyhedshistorierne med særlig vægt på personer, der ikke i udbredt grad citeres andre steder. "Dette kan indikere, at nyhedskilden er i stand til at producere original journalistik."

Google holder også øje med links fra søgemaskiner til individuelle nyhedsartikler. "Velkendte websites såsom CNN foretrækkes ofte fremfor mindre populære websites med for eksempel ukendte lokalnyheder, som brugerne kan tænkes at gå uden om," står der i patentansøgningen.

Oversat af Thomas Bøndergaard




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Advania Danmark A/S
Hardware, licenser, konsulentydelser

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Drukner din sikkerhed i et hav af falske advarsler?

Der er et konstant våbenkapløb i gang mellem de værktøjer, din IT-sikkerhedsafdeling har til rådighed og et stigende antal komplekse og mangeartede cybertrusler. Men når sikkerhedsinfrastrukturen udbygges, stiger kompleksiteten og mængden af advarsler også. Hermed får du svært ved at skelne mellem et stort antal falsk positive og de få – men reelle og kritiske! – advarsler, du skal prioritere at håndtere. Bliv klogere på hvordan du håndtere det.

15. juni 2021 | Læs mere


Datadrevet forretning 2021: Sæt automatisering og data på den strategiske dagsorden

Ved at anvende data på den korrekte måde, kan du og din virksomhed for alvor sætte skub i konkurrencen. Der ligger en værdifuld viden om kunder, kundeadfærd, konkurrenter, markeder og meget andet i den data, der svæver rundt omkring os. Med den nyeste teknologi er det endda blevet nemmere at automatisere disse processer.

16. juni 2021 | Læs mere


Cloud giver dig fleksibilitet, skalerbarhed og agilitet – men hvordan håndterer man sikkerheden?

Cloudsikkerhed handler om effektiv orkestrering og automatisering for at muliggøre hurtig detektion af og reaktion på incidents. Det handler om at eliminere kompleksitet, det handler om at fortsat sikre smidighed og fleksibilitet. På dette seminar bliver du klogere på hvordan du planlægger, designer, implementerer og kører dit cybersikkerhedsprogram effektivt.

23. juni 2021 | Læs mere






Premium
Test: Duer Samsungs første Pro-pc'er til noget?
Samsung Galaxy Book Pro serien er et bevis på, at de etablerede pc-producenter får sig en formidabel udfordrer i den sydkoreanske supersværvægter.
CIO
Der findes ikke noget vigtigere for din virksomhedskultur end psychological safety
Klumme: Forskningen er entydig: Vidensarbejde er mere effektiv, når du tør stille spørgsmål, rejse kritik og indrømme fejl helt uden frygt for at blive straffet eller gjort til grin. Hvis du ikke har fokus på denne del af din virksomhedskultur, så lever din virksomhed og dine medarbejdere ikke op til deres fulde potentiale.
White paper
Sådan sikrer du hovednøglen til jeres data
80% af alle ransomwareangreb skyldes misbrug af privilegerede brugeradgange. Ved at begrænse og overvåge adfærden på de privilegerede konti samt kontrollere mængden af tildelte rettigheder kan du mindske skaden ved hackerangreb mod din virksomhed og i visse tilfælde helt blokere dem. Internt kan du bruge kontrollen med brugeradgange til at dokumentere, hvem der bevæger sig i hvilke systemer, og hvad der foregår derinde. Privilegeret brugerstyring har de seneste to år stået øverst på Gartners Top10-liste over it-sikkerhedsprojekter, der bør få højeste prioritet. Alligevel er teknologien kun så småt ved at finde fodfæste i Danmark. Det kan viden om åbenlyse gevinster, relativ kort implementeringstid og yderst rimeligt budget være med til at ændre på. I dette whitepaper folder vi temaet privilegeret brugerstyring ud og placerer teknologien i det væld af prioriteringer, som CISO’en hver dag skal foretage.