Brug sprogmodeller som din personlige data scientist

Klumme: Få en gennemgang i en af de mest oversete GPT-funktionaliteter overhovedet.

Artikel top billede

(Foto: JumpStory)

Denne klumme er et debatindlæg og er alene udtryk for forfatterens synspunkter.

En af de mest oversete og undervurderede funktionaliteter i GPT-4/GPT4o fra OpenAI må være deres Code Interpreter-funktionalitet, som også somme tider omtales af OpenAI som Advanced Data Analysis.

Her viser sprogmodeller deres fulde potentiale, som rækker langt ud over at skrive mails og tage mødenotater.

De fleste ved, at store sprogmodeller kan skrive kode i flere programmeringssprog, da programmeringssprog også behandles som sprog i den større sprogmodel. Men vidste du, at nogle af dem også kan køre den kode, den skriver og dermed udføre konkrete løsninger?

Det er, hvad Code Interpreter, som jeg vil referere til det, kan.

Det skriver programmer målrettet din problemstilling og kører programmet for at nå frem til en konkret løsning, frem for blot et løsningsforslag.

Et simpelt eksempel

Lad os se på et eksempel i ChatGPT Plus, hvor jeg har en lydfil, hvorfra jeg ønsker at fjerne de sidste 30 sekunders lydoptagelse.

Jeg uploader derfor filen (papirklip-ikon til venstre for input tekstfeltet) i GPT-4/GPT4o og beder om dette:

Når jeg trykker på linket MinLydfil_trimmed.wav, kan jeg downloade en ny version af lydfilen uden de sidste 30 sekunder.

Men hvad skete der her?

Jo, Code Interpreter fungerer som et udviklingsmiljø med egen diskplads, hvor den kan håndtere filer, du uploader, og de filer, den returnerer.

Det lever og dør med hver samtale, når man bruger det via GPT-4/GPT4o i ChatGPT Plus, og her kan den så skrive programmer i programmeringssproget Python, som konkret løser dine problemer.

Men store sprogmodeller kan jo altid tage fejl?

Som jeg har været inde på i tidligere i klummen, så kan store sprogmodeller i deres nuværende arkitektur altid tage fejl, men her er der et særligt perspektiv til Code Interpreter.

Den kode, der skrives for at løse dit problem, er nemlig, til forskel for de sproglige svar, fuldstændigt læsbar og sporbar, og ville kunne bruges direkte som bevisbyrde, hvis man bliver spurgt om, hvordan man er nået frem til et resultat, den har leveret.

Det sætter to ekstra fede streger under værdien af værktøjet, og der er mange gode anvendelser af Code Interpreter, som kan konvertere dine filer til andre formater, generere en QR-kode for din hjemmeside samt meget andet.

Kan den levere analyser af mine ikke-sproglige data?

En meget stor del af de godt 300 Python-biblioteker, som Code Interpreter har adgang til i sin værktøjskasse, handler om at analysere og manipulere data, som for eksempel et Excel-ark med en masse tal og kategorier.

Derfor har OpenAI også kaldt det Advanced Data Analysis, men det er den samme ting.

Jeg kan kun anbefale at lege og afprøve dette, hvis man ikke har prøvet det endnu.

Det er en øjenåbner, for her kan man stille åbne spørgsmål til sine tal-data.

Et af mine favoriteksempler er hvor jeg har uploadet en stor Excel-fil fra OpenData.dk med over 28.000 parkeringsområder i Københavns kommune, repræsenteret som geografiske data (latitude, longitude), mm.

Code Interpreter kunne så komme med indsigter om parkeringsområdernes distribution på tværs af distrikter, som den også kan visualisere som grafer.

Alt sammen ved blot at uploade filen og spørge helt åbent: ”Er der nogen indsigter, og kan du visualisere dem?”.

Den kunne endda generere en dynamisk hjemmeside-fil i html med et heatmap over parkeringsområder på et geografisk kort, som jeg kunne zoome ind og ud af – klar direkte til download og brug:

Husk sikkerheden når du uploader data

ChatGPT Plus arbejder med kryptering og andre sikkerhedsaspekter, men har alligevel et niveau af sikkerhed og GDPR-compliance, som jeg vil vurdere tilstrækkeligt til at man afleverer sine GDPR-sensitive og/eller forretningskritiske data.

Derfor er det godt at man kan hente åbne datasæt og eksperimentere med dem.

Vil man bruge Code Interpreter på sensitive data, så er et mere sikkert alternativ Azure OpenAI Assistants Code Interpreter fra Microsoft, men dette er et API – altså en byggeklods, man kan bruge, når man laver sine egne adgang til Code Interpreter, og er en smule bagefter den version, man har i betalt ChatGPT Plus.

Det samme gælder det lige så sikre Microsoft 365 Copilot, hvor man direkte i Excel kan bruge GPT-modeller til at hjælpe sig, men hvor ovenstående eksempler ikke helt er mulige endnu, selv om det nok helt sikkert er på vej.

Klummer er læsernes platform på Computerworld til at fortælle de bedste historier, og samtidig er det vores meget populære og meget læste forum for videndeling.

Har du en god historie, eller har du specialviden, som du synes trænger til at blive delt?

Læs vores klumme-guidelines og send os din tekst, så kontakter vi dig - måske bliver du en del af vores hurtigt voksende korps af klummeskribenter.

Læses lige nu

    Navnenyt fra it-Danmark

    EG Danmark A/S har pr. 1. december 2025 ansat Søren Jermiin Olesen som Senior Product Manager. Han skal især beskæftige sig med finans- og debitorstyring i det offentlige med ansvar for økonomistyringssystemet EG ØS Indsigt. Han kommer fra en stilling som Product Manager hos KMD A/S. Han er uddannet Cand. oecon. Han har tidligere beskæftiget sig med økonomi bl.a. i Aarhus Kommune og været med til at udvikle NemØkonom før og efter salget til KMD. Nyt job

    Søren Jermiin Olesen

    EG Danmark A/S

    Sentia har pr. 1. oktober 2025 ansat Morten Jørgensen som Chief Commercial Officer. Han skal især beskæftige sig med udbygning af Sentias markedsposition og forretningsområder med det overordnede ansvar for den kommercielle organisation. Han kommer fra en stilling som Forretningsdirektør hos Emagine. Nyt job
    Netip A/S har pr. 1. november 2025 ansat Christian Homann som Projektleder ved netIP's kontor i Thisted. Han kommer fra en stilling som Digitaliseringschef hos EUC Nordvest. Han er uddannet med en Cand.it og har en del års erfaring med projektledelse. Nyt job

    Christian Homann

    Netip A/S