Artikel top billede

Ingen kan gemme sig: Programmørers skrivestil kan afkodes så nøjagtigt som fingeraftryk

Ny analysemetode af små detaljer og forskellige i programmerings-kode kan vise helt nøjagtigt, hvem der har skrevet koden. Det kan komme til at gøre en forskel, når det gælder malware samt i copyright-sager og lignende.

Alle programmører har bestemte måder at skrive kode på, selv om det godt kan være, at de ikke selv er særligt bevidste om det.

Det kan være en forkærlighed for eksempelvis bestemte måder at skrive comments på eller tabs eller navngivning.

Et stort forskningsprojekt viser nu, at skrive-stilen faktisk er en slags fingeraftryk, der ret nøjagtigt kan pege i retning af en bestemt programmør, hvis der skulle være brug for at afgøre, hvem der har skrevet hvad.

Det kan for eksempel være i forbindelse med malware eller copyright-sager og lignende.

Forskerne - der er fra en række forskellige universiteter - har udviklet en særlig metode, der kan genkende skrive-måde og koble det til bestemte programmører.

Du kan læse om deres resultater i papiret 'De-anonymizing Programmers via Code Stylometry.'

Analyseværktøjet kigger på layout og på fordelingen af de forskellige tokens-typer.

Det helt nye er imidlertid en funktion, som forskerne kalder for 'abstract syntax trees,' der ifølge forskerne kigger på kode-stil 'helt uafhængigt af skrive-stilen.'

Kan gennemskue ændringer

Det betyder, at værktøjet ikke bliver forvirret og vildledt, hvis programmøren pludselig ændrer sin måde at anvende eksempelvis navngivning, spacing eller comments på - så længe den bagvedliggende funktionalitet er den samme.

Forskerne har testet deres teorier på større mængder data indsamlet fra Googles Code Jam for at se, om det faktisk kunne lade sig gøre at identificere bestemte programmører.

Her kiggede de på C++-kode skrevet fra 2008 til 2014 af mere end 100.000 forskellige programmører.

Her nåede de frem til, at analyseværktøjet i 95 procent af tilfældene kunne identificere programmøren, der havde skrevet koden baseret på analyse af 640 kodelinier skrevet af 250 forskellige programmører.

I en analyse af 30 programmører, der havde skrevet 1.900 kodelinier, ramte værktøjet rigtigt i 97 procent af tilfældene.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Konica Minolta Business Solutions Denmark A/S
Salg af kopimaskiner, digitale produktionssystemer og it-services.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Computerworld Summit 2021

En moderne digital vindervirksomhed bringer nye teknologier i spil, skaber digital innovation, udnytter data som styringsværktøj og ser verden som én stor markedsplads. Men succes kræver, at du ved, hvor den dyre teknologi kan gøre den største forskel i forretningen. Den kræver, at du ved i hvilken retning den øgede politiske regulering af teknologi og data bevæger sig hen. Og den succes kræver, at du kan udnytte teknologien til at automatisere og skalere til gavn for bundlinjen og budgettet.

26. oktober 2021 | Læs mere


Sats på DevOps og få mere kvalitet og hastighed i både udvikling og drift

Der er mange potentielle gevinster at hente ved at satse på DevOps. Rigtig mange danske virksomheder er allerede i gang. På denne konference får du et indblik i mulighederne med DevOps og gode råd, der kan sikre dig succesen.

02. november 2021 | Læs mere


CIO Trends 2021: Sådan ser teknologiradaren ud hos Danmarks bedste CIOs

Teknologien i virksomheder spiller i den grad en større og større rolle, hvor vi er nødt til at stille endnu større krav til, hvordan vi udnytter den, og hvilke muligheder den giver. Spørgsmålet er dog, hvordan man formår at lede en virksomhed, der konstant skal forholde sig til teknologiens forandringer.

16. november 2021 | Læs mere