Artikel top billede

(Foto: JumpStory)

Brug sprogmodeller som din personlige data scientist

Klumme: Få en gennemgang i en af de mest oversete GPT-funktionaliteter overhovedet.

Denne klumme er et debatindlæg og er alene udtryk for forfatterens synspunkter.

En af de mest oversete og undervurderede funktionaliteter i GPT-4/GPT4o fra OpenAI må være deres Code Interpreter-funktionalitet, som også somme tider omtales af OpenAI som Advanced Data Analysis.

Her viser sprogmodeller deres fulde potentiale, som rækker langt ud over at skrive mails og tage mødenotater.

De fleste ved, at store sprogmodeller kan skrive kode i flere programmeringssprog, da programmeringssprog også behandles som sprog i den større sprogmodel. Men vidste du, at nogle af dem også kan køre den kode, den skriver og dermed udføre konkrete løsninger?

Det er, hvad Code Interpreter, som jeg vil referere til det, kan.

Det skriver programmer målrettet din problemstilling og kører programmet for at nå frem til en konkret løsning, frem for blot et løsningsforslag.

Et simpelt eksempel

Lad os se på et eksempel i ChatGPT Plus, hvor jeg har en lydfil, hvorfra jeg ønsker at fjerne de sidste 30 sekunders lydoptagelse.

Jeg uploader derfor filen (papirklip-ikon til venstre for input tekstfeltet) i GPT-4/GPT4o og beder om dette:

Når jeg trykker på linket MinLydfil_trimmed.wav, kan jeg downloade en ny version af lydfilen uden de sidste 30 sekunder.

Men hvad skete der her?

Jo, Code Interpreter fungerer som et udviklingsmiljø med egen diskplads, hvor den kan håndtere filer, du uploader, og de filer, den returnerer.

Det lever og dør med hver samtale, når man bruger det via GPT-4/GPT4o i ChatGPT Plus, og her kan den så skrive programmer i programmeringssproget Python, som konkret løser dine problemer.

Men store sprogmodeller kan jo altid tage fejl?

Som jeg har været inde på i tidligere i klummen, så kan store sprogmodeller i deres nuværende arkitektur altid tage fejl, men her er der et særligt perspektiv til Code Interpreter.

Den kode, der skrives for at løse dit problem, er nemlig, til forskel for de sproglige svar, fuldstændigt læsbar og sporbar, og ville kunne bruges direkte som bevisbyrde, hvis man bliver spurgt om, hvordan man er nået frem til et resultat, den har leveret.

Det sætter to ekstra fede streger under værdien af værktøjet, og der er mange gode anvendelser af Code Interpreter, som kan konvertere dine filer til andre formater, generere en QR-kode for din hjemmeside samt meget andet.

Kan den levere analyser af mine ikke-sproglige data?

En meget stor del af de godt 300 Python-biblioteker, som Code Interpreter har adgang til i sin værktøjskasse, handler om at analysere og manipulere data, som for eksempel et Excel-ark med en masse tal og kategorier.

Derfor har OpenAI også kaldt det Advanced Data Analysis, men det er den samme ting.

Jeg kan kun anbefale at lege og afprøve dette, hvis man ikke har prøvet det endnu.

Det er en øjenåbner, for her kan man stille åbne spørgsmål til sine tal-data.

Et af mine favoriteksempler er hvor jeg har uploadet en stor Excel-fil fra OpenData.dk med over 28.000 parkeringsområder i Københavns kommune, repræsenteret som geografiske data (latitude, longitude), mm.

Code Interpreter kunne så komme med indsigter om parkeringsområdernes distribution på tværs af distrikter, som den også kan visualisere som grafer.

Alt sammen ved blot at uploade filen og spørge helt åbent: ”Er der nogen indsigter, og kan du visualisere dem?”.

Den kunne endda generere en dynamisk hjemmeside-fil i html med et heatmap over parkeringsområder på et geografisk kort, som jeg kunne zoome ind og ud af – klar direkte til download og brug:

Husk sikkerheden når du uploader data

ChatGPT Plus arbejder med kryptering og andre sikkerhedsaspekter, men har alligevel et niveau af sikkerhed og GDPR-compliance, som jeg vil vurdere tilstrækkeligt til at man afleverer sine GDPR-sensitive og/eller forretningskritiske data.

Derfor er det godt at man kan hente åbne datasæt og eksperimentere med dem.

Vil man bruge Code Interpreter på sensitive data, så er et mere sikkert alternativ Azure OpenAI Assistants Code Interpreter fra Microsoft, men dette er et API – altså en byggeklods, man kan bruge, når man laver sine egne adgang til Code Interpreter, og er en smule bagefter den version, man har i betalt ChatGPT Plus.

Det samme gælder det lige så sikre Microsoft 365 Copilot, hvor man direkte i Excel kan bruge GPT-modeller til at hjælpe sig, men hvor ovenstående eksempler ikke helt er mulige endnu, selv om det nok helt sikkert er på vej.

Klummer er læsernes platform på Computerworld til at fortælle de bedste historier, og samtidig er det vores meget populære og meget læste forum for videndeling.

Har du en god historie, eller har du specialviden, som du synes trænger til at blive delt?

Læs vores klumme-guidelines og send os din tekst, så kontakter vi dig - måske bliver du en del af vores hurtigt voksende korps af klummeskribenter.