Det vælter ind med nyt fra klodens førende AI-virksomhed. OpenAI har i den seneste uge været ude med den ene store nyhed efter den anden.
Om det er ansporet af den kinesiske udfordrer DeepSeeks massive omtale er uvist, men resultatet er ikke desto mindre, at selskabet er ude med tre markante overhalinger til tjenesten.
Nu tilbydes en spritny ræsonnerende model, døbt o3-mini, mens ChatGPT får nye muligheder for at agere selvstændigt på dine vegne med ’agent’-funktionen ’Operator’ og den AI-assisterende research-funktion ’Deep Research'.
Mini-model i tre størrelser
OpenAI’s førende model har hidtil været den ræsonnerende ’o1’, som blev den første kommercielt tilgængelige sprogmodel, der arbejder ved at tænke sig om nogle gange, inden den svarer – en beregningstung teknik, som siden er blevet benyttet i gratismodellen DeepSeek R1.
Denne leveres nu i en ny o3 mini-model, som står til at overgå både ’o1’ og den mindre ’o1 mini’, målt efter nogle af OpenAI's udvalgte benchmarks.
Kvaliteten af de leverede svar afhænger dog i høj grad af den ’ræsonnements’-level, der anvendes.
O3-mini modellen kan nemlig indstilles til tre niveauer for det regnekrævende ræsonnement: low, medium og high.
Indstilles o3 til high eller medium, formår den nye model at overgå o1 i opgaver som matematik og programmering.
Hvad angår andre typer opgaver klarer o3 mini sig væsentlig bedre end o1-mini, om end OpenAI ikke oplyser her, hvor godt den nye model klarer sig i forhold til o1.
o3-mini vil i modsætning til sin forgænger blive tilbudt gratis, hvor den nu figurerer som en ny ’Reason’ mulighed i ChatGPT's søgefelt.
For brugere af de betalte ChatGPT Plus- og Teams-tjenester, vil o3 mini kunne anvendes som ved de forskellige niveauer og med op til 150 gange om dagen. GPT Pro-kunder får ubegrænset adgang til o3 mini.
O3 mini er lillebror til den omtalte ’o3’-model som OpenAI scorede en ny topscore for kunstig menneskelignende intelligens, såkaldt ’AGI’, i den svære ’Arc AGI’ -benchmark.
Dybdegående research
Mens sprogmodeller oftest skal bero på deres træningsdata, når de skal svare, giver en ny ’Deep Research' ChatGPT-funktion mulighed for at få et sammendrag af relevant forskning eller information fra nettet, når der skal researches.
Hvor selskabets GPT 4o-model giver mere generiske sammendrag, når der efterlyses bestemte og konkrette informationer i de fleste emner, vil ’deep research’-funktionen give mere detaljerede svar og knytte kilder til de leverede svar.
Ifølge OpenAI rammer tjenesten plet i 26 procent af tilfældene, væsentligt højere end nogen anden af selskabets tjenester og modeller.
Funktionen minder til forveksling om Googles overbygning til Gemini af samme navn, som blev lanceret i december 2024.
AI-agenter slippes løs
Sidste markante nyhed fra OpenAI’s side er på flere måder den med mest fremadrettet potentiale.
Selskabet løfter nu sløret for sit bud på AI-agenter, her kaldet ’Operator’, som er en kunstig intelligens, som kan sendes ud i felten på nettet og udrette opgaver for brugerne.
Tjenesten er fortsat i testfasen, men kan hos de første brugere allerede overtage kedelige eller rutineprægede opgaver for brugerne, såsom at udfylde formularer, bestille dagligvarer eller bestille en tid hos frisøren.
Operator’er udrulles i øjeblikket hos udvalgte ’Pro’-brugere på det amerikanske hjemmemarked.
Du kan se dem i aktion i videoen nedenunder.