Artikel top billede

(Foto: Computerworld)

Nye sandheder om falske nyheder

”Fake news”, der spredes livligt på internettet, er et stadigt voksende problem. Forskerne arbejder intenst på at udvikle skarpsindige sprog-algoritmer, der kan skelne løgn fra sandhed. Og de er nået ganske langt.

Af Palle Vibe, Alt om Data

Denne artikel er oprindeligt bragt på Alt om Data. Computerworld overtog i november 2022 Alt om Data. Du kan læse mere om overtagelsen her.

Falske nyheder har formentlig været i omløb siden mennesket fik tunge, og bøger, radio og tv har ikke gjort det bedre. Med nutidens digitale medier kan falske historier imidlertid sprede sig med tankens fart, og mange af dem er derfor ikke blot tankeløse, men direkte meningsløse og kan skabe vrede, panik og angst og i værste fald dræbe. Det evige 24-timers nyhedspres og den benhårde konkurrence nyhedsmedierne imellem har resulteret i både mere overfladisk reportage og meningsforskellighed med god plads til misinformation, forudindtagethed og faktuelle fejl.

Men i dag er mange nyheder også bevidst forkerte og vildledende, og historien har vist, at falske rygter kan påvirke både aktiemarkedet, samfundsøkonomien og menneskers hele livsopfattelse. Omvendt kan falske nyheder også forføre, skabe fejlagtig glæde og ikke mindst forkerte forventninger. Eksempelvis kan anmeldelser af produkter og tjenesteydelser, som omtales positivt på nettet, se troværdige og reelle ud, men de er måske i virkeligheden iscenesat af producenten eller leverandøren selv.

I dag er det desuden også muligt at fordreje og manipulere billeder og endog videoer, så de gengiver en falsk eller ”alternativ” virkelighed. Heldigvis kan de fleste fornuftige mennesker skelne sandhed fra løgn, men som antallet af potentielt falske nyheder stiger, bliver det sværere og sværere. Her kommer computeren ind, men hvordan skiller du skæg fra det, der er værre, med en computer, der i bund og grund selv er snotdum?

Udgangspunktet er menneskelig vurdering

”Det er ikke nok at analysere sprogbrug og tegnsætning (der kan afsløre visse psykologiske kendetegn), for en tekst skal også vurderes på sammenhæng mellem indhold og overskrift,” forklarer Leon Derczynski, der er specialist i AI, Natural Language Processing og Machine Learning og forsker i kunstig intelligens, lingvistik og datalogi på IT-universitetet. ”Desuden også helst sammenlignes med andre tekster, der handler om det samme.” Derudover træner forskerne sprogintelligente algoritmer ved at lade dem tygge sig igennem titusindvis af udsagn hentet fra digitale sociale medier, tweets og newsfeeds.

”Disse historier kan være sande og falske mellem hinanden,” fortæller Leon Derczynski, ”men forinden har vi gerne grupperet dem og sat dem i sammenhæng og derpå ladet et hold kritiske redaktører gå dem igennem med både deres erfaring og sunde fornuft. Redaktørernes vurderinger, dvs. om de anerkender (og evt. deler), anfægter eller slet og ret fornægter udsagnene, bliver efterfølgende indarbejdet i algoritmen. På den måde lærer de neurale netværk at skelne typiske mønstre og kendetegn for falske historier.”

leon Leon Derczynski er britisk ekspert i kunstig intelligens, lingvistik og datalogi og nu tilknyttet IT-universitetet på Islands Brygge.

Her ville det måske være smart at bede nogle erfarne og dygtige psykologer om at udfærdige veldrejede og umiddelbart overbevisende og troværdige løgnehistorier, som algoritmerne kunne øve sig på. Dette forslag er Leon Derczynski helt enig i, men han indrømmer med et stort smil, at det bare – så vidt han ved – aldrig har været forsøgt.

Alligevel har forskerne indkredset fire typiske kendetegn:

1. Snæversynet og meget fokuseret

De fleste spredere af falske nyheder holder sig målrettet til få emner. Så kort sagt jo færre emner samme nyhedskilde behandler, og jo mere indædt den behandler et enkelt emne, jo mere sandsynligt er det, at historien har et bestemt ærinde, og at nyheden er falsk.

2. Flere versioner af samme historie

Ofte kan du møde samme historie skildret fra flere vinkler. Det sikrer nyhedskilden større chance for at blive delt, ligesom enhver der deler ligefrem selv kan vælge og give en foretrukken synsvinkel videre.

3. Ægte historie, men for meget kant

Spredere af falske nyheder kan tage udgangspunkt i en nyhed fra en anset og uafhængig kilde men ændre lidt på historien, så den både får kant og måske en helt anden vinkel. Det er udbredt blandt visse interessegrupper at betale folk for at tilføje små løgne, når de deler historien.

4. Tegneserieagtig – bare for meget

Undertiden kommer falske nyheder i iver efter at falde i øjnene til at fremstå karikerede. Formålet kan være at belaste et i forvejen belastet område endnu mere, og et eksempel kunne være at forsyne et neutralt billede af en kat med en væmmelig udpenslet historie om dyremishandling, der bare er alt for lang og detaljeret til at være umiddelbart troværdig og uden støtte af politirapport mv.

”Men der er selvfølgelig også andre pejlemærker”, tilføjer Leon Derczynski. ”En nyhed kan jo være så grotesk som for eksempel, at Hillary Clinton er blevet besat af en dæmon! Selv om det reelt hverken kan direkte bevises eller modbevises, turde det alligevel nok være en lodret løgn. Det kan også lønne sig at finde ud af, hvor en given nyhed geografisk kommer fra for at afgrænse mulighederne, ligesom tidspunktet på dagen er en faktor, fordi de fleste begivenheder sker og bedst kan spredes i dagtimerne (og her kan der være stor forskel på f.eks. amerikansk og russisk lokaltid). Desuden skal computeren kunne skelne, om en nyhed bevidst spiller på forskellige fordomme. Det kræver alt i alt enorme databaser.”

Mennesker spreder løgne, ikke bots

Forskere fra MIT har ud fra en omfattende undersøgelse af nyheder via Twitter fundet ud af, at fake news spreder sig hurtigere og bredere end sande nyheder. Det gælder Ikke mindst politiske nyheder. Undersøgelsen viser også lidt overraskende, at det er mennesker og ikke robotter, der spreder falske nyheder.

Det forklarer forskerne med, at falske og ikke mindst politisk prægede nyheder har stor nyhedsværdi, og at mennesker har en naturlig trang til at dele den slags nyt. Men interessant er det også, at personer, der spreder falske nyheder, generelt har få følgere, ligesom de selv følger færre, end personer der primært deler sande nyheder. Endelig er falske nyhedsspredere som helhed langt mindre aktive på Twitter.

Alle algoritmer laver fejl

Samtidig gælder, at hvis sådanne algoritmer skal få virkelig praktisk og effektiv anvendelse, skal de kunne fungere i realtime (i hvert fald på specifikke nyhedsemner (som for eksempel tweets om det britiske Brexit), men der er naturligvis grænser. Hvis eksempelvis Twitter ville inddrage sådan et ”løgnefilter”, skulle programmet vurdere over 6000 tweets i sekundet for at sikre sine brugere mod falske meddelelser, og det er endnu hverken almindelige softwarealgoritmer eller hardware i stand til.

”Desuden laver alle algoritmer fejl,” pointerer Leon Derczynski, ”så selv om en given succesrate på 90 % lyder imponerende, indebærer det fejl i 10 % af alle tilfælde (eller 20 % ved en succesrate på 80 %). Går vi ud fra 6000 tweets i sekundet betyder en fejlrate på 10 %, at 600 tweets ikke bliver fanget i analysenettet. Og her er det vigtigt at huske, at da der ofte er indsat flere algoritmer i serie, vil eventuelle fejl kunne akkumulere.”

”Sprogintelligente algoritmer er tung software, som forskeren i dag afvikler på lige så tungt materiel, men med tiden vil et velvirkende løgnefilter uden tvivl kunne skaleres ned til almindelig app-størrelse,” forudser Leon Derczynski.

Online løgndetektorer

Google og Facebook har allerede lanceret løsninger, der skal forhindre spredningen af tvivlsomme artikler. Google har en ambitiøs plan om at anvende et automatiseret program kaldet Conversation AL, der både kan spotte og fjerne digital chikane. Tiltaget kaldes Jigsaw (tidligere kendt som Google Ideas) og skal slippes løs på New York Times og her hjælpe med at rydde op i kommentarsporene.

Facebook har indført en funktion, der viser, om søgeresultater er faktatjekket eller ej, ligesom brugerne selv kan markere falske nyhedshistorier. Facebook sender herefter den potentielle falske nyhed videre til et korps af faktatjekker-organisationer, og hvis to af disse anfægter sandhedsværdien, kategoriseres den som fake news. En forudsætning for at Facebooks initiativ kan komme videre, er dog, at der etableres faktatjekker-organisationer i hele verden – en opgave, der kan tage mange år at udføre, hvis den nogensinde bliver udført.

Herhjemme har ugemagasinet Mandag Morgen i et stykke tid drevet Viralspiralen, der løbende skriver om cirkulerende rygter og falske historier på internettet. Chefredaktør på Mandag Morgen, Lisbeth Knudsen, har yderligere for nylig lanceret faktatjek-initiativet tjekdet.dk