ArXiv er en af verdens vigtigste onlineplatforme for forskere, der vil dele nye videnskabelige artikler, før de er fagfællebedømt og udgivet i tidsskrifter.
Platformen bruges især inden for computer science, fysik, matematik og AI, hvor nye resultater ofte deles hurtigt.
Men efter at have oplevet en voksende tilstrømning af AI-genereret materiale, der bliver sendt ind som seriøs forskning, har platformen nu besluttet at stramme kursen over for AI-slop.
Brugere kan fremover blive udelukket i et år, hvis de indsender åbenlyst AI-genereret materiale, som de ikke selv har kontrolleret ordentligt, skriver 404 Media.
Ikke et regulært forbud mod AI
Thomas Dietterich, der er formand for computer science-sektionen på arXiv, har skrevet på det sociale medie X (tidligere Twitter), at AI-værktøjer kan generere upassende sprog, plagieret indhold, biased indhold, fejl, forkerte referencer og vildledende indhold.
Hvis den slags ender i videnskabelige artikler, er det ifølge ham forfatternes ansvar. ArXiv har derfor præciseret sine sanktioner.
Hvis en indsendelse indeholder uomtvistelige tegn på, at forfatterne ikke har kontrolleret resultatet af LLM-genereringen, kan arXiv ifølge Thomas Dietterich ikke stole på noget som helst andet i artiklen.
Derfor kan forfatterne blive udelukket fra at indsende nyt materiale i et år.
Der er dog ikke tale om et regulært forbud mod brugen af AI-værktøjer.
Men platformen gør det klart, at ansvaret stadig ligger hos forfatterne, hvis de bruger værktøjerne.
Hvis AI-genereret tekst, fejl eller falske henvisninger ender i en forskningsartikel, er det ikke værktøjet, men derimod forskeren, der hæfter for indholdet, lyder det.
Falske referencer og AI-kommentarer
Thomas Dietterich opremser i den forbindelse flere eksempler på, hvad arXiv vil betragte som klare tegn på ukontrolleret AI-brug.
Det kan være hallucinerede referencer eller meta-kommentarer fra AI-modellen, som ved en fejl er blevet stående i teksten.
Som eksempel nævner han formuleringer i stil med: “Her er et resumé på 200 ord”, “vil du gerne have mig til at lave ændringer?” eller “dataene i denne tabel er illustrative, indsæt de rigtige tal fra dine eksperimenter”.
Den type tekst viser ifølge arXiv, at forfatterne ikke har gennemgået indholdet ordentligt, før de sendte det ind.
Ud over et års karantæne skal forskerne, når udelukkelsen er ovre, først have deres kommende arXiv-indsendelser accepteret af et anerkendt fagfællebedømt tidsskrift eller en tilsvarende faglig platform.