ANNONCE:
Ikke et ord om valg.
Ok, måske et par enkelte. Men først til allersidst.
Der var to spændende it-relaterede nyheder i denne uge, der fangede min interesse.
Twitter-feeds og millioner af nyhedsartikler giver fingerpeg om fremtidenDen første var historien om den engelske hedgefond, der
anvender Twitter-feeds til at forudsige aktiekursernes bevægelser.Den anden var historien om
supercomputeren, der analyserede 100 millioner nyhedsartikler og forudsagde det arabiske forår. Jo, den er god nok, hvis man altså skal tro artiklens overskrift.
Som sædvanlig skal man tage den slags rapporter med et gran salt og læse indholdet af artiklerne. Og helst selve de videnskabelige artikler, som artiklerne baserer sig på.
Historien om supercomputeren handler egentlig ikke så meget om supercomputeren, men om en model til tekstanalyse. Via modellen kan man udlede om en given artikel er overvejende positiv eller negativ. Samles alle artiklerne om et bestemt geografisk område, vil man få et indtryk af den overordnede tone om et land eller en by. Er der en positiv eller negativ rapportering? Det kan indikere forestående konflikter.
Her er den oprindelige artikel af Kalev Leetaru fra Text and Digital Analytics fra University of Illinois. Læs den. Den er halvlang, men bestemt interessant. Blandt andet hævder Kalev Leetaru, at Bin Ladens opholdssted ved hjælp af modellen kunne bestemmes indenfor en radius af 200 kilometer. Læs selv og vurder.
Historien om hedgefonden med den Twitter-baserede investeringsstrategi anvender også nogle af de samme redskaber som Kalev Leetaru. Tekstanalyse til at bestemme tonen og humøret hos de analyserede twittere.
Er humøret negativt hos Twitterne afspejler det sig i aktiekurserne.
Læs selv
den oprindelige artikel (pdf) af datalogi-professor Johan Bollen.
Hvad nu, hvis man kombinerede de to modeller? Den nyhedshistoriske analyse kombineret med realtids-analyse af folks følelser/holdninger via twitter-feeds.
Måske tilsat
Facebooks og Googles uanede datamængder om os.
Twitter + nyhedsstrøm + Facebook + Google + ... = Psychohistory Det begynder at nærme sig noget, der kunne minde om
Psychohistory, som Isaac Asimov opfandt til sin fantastiske
Stiftelsen-serie.
Ved hjælp af historie, sociologi og statistiske modeller kan
Hari Seldon i Isaac Asimovs romaner lave generelle forudsigelser om (meget) store befolkningsgruppers opførsel.
Hvem ved; måske behøves vi slet ikke at stemme fremover. Vi skal blot twitte løs og anvende Facebook/Google+, så vil computermodellen udlede vores politiske ønsker. Kombineret med en sociohistorisk nyhedsdatabase kan modellen måske endda vælge den rigtige regering for os =:-O
Eller er virkeligheden så kaotisk og de mulige fremtidsscenarier så mangfoldige, at det er naivt at opstille computermodeller, der forsøger at forudsige menneskers fremtid?
P.S. Ja, der er indvendinger mod de to modeller og deres påståede egenskaber.
Hedgefonden med den twitter-baserede investeringsstrategi tjente flere penge end gennemsnittet af hedgefonde. For en enkelt måned. Hvordan mon det ser ud om et år eller to?
Jeg kan ikke undgå at tænke på den gamle historie om, at
aber kan vælge bedre aktier end eksperterne.
Nyhedsanalysen kan kun vise, at der er ved at opstå en potentiel konflikt. Ikke hvad der reelt vil ske.
Efterretningstjenester anvender formentlig allerede tilsvarende modeller. To af nyhedsarkiverne som indgik i Kalev Leetarus model blev etableret i optakten til 2. Verdenskrig for netop at holde øje med tonen overfor vesten i fremmede landes medier. Dengang foregik det manuelt.