Denne klumme er et debatindlæg og er alene udtryk for forfatterens synspunkter.
Vi kender alle GPT-modellerne fra OpenAI som bruges i ChatGPT og Copilot – og mange har nok også bemærket deres nye o-modeller som jeg skrev om i sidste indlæg.
De er alle ”closed source” på trods af at de kommer fra en virksomhed med ”Open” i navnet.
Kort sagt betyder dette, at vi ikke kan få adgang til modellerne og downloade dem lokalt, hvor vi rigtig kan pille ved dem, og bruge dem gratis (modregnet vores egen servers anskaffelse, vedligehold og strømforbrug selvfølgelig).
I stedet ligger de kun i skyen, og så tilbydes vi at kunne have vores applikationer til at sende spørgsmål til dem og få svar tilbage via et API som for eksempel med Azure AI Services, eller at vi tilgår dem direkte i en hjemmeside som kan sende og modtage spørgsmål/svar fra sprogmodellerne, sådan som vi kender det fra for eksempel ChatGPT.
ChatGPT er abonnementsbaseret, mens det er lidt mere kompliceret med Azure AI Services hvor vi betaler for forbrug – det vil sige hvordan og hvor mange ord vi sender op i skyen.
Hvor langt bagud er open source-sprogmodeller?
Historisk set har open source-sprogmodeller altid været et godt stykke bagud i forhold til til de mere kommercielle closed source sprogmodeller, hvoriblandt særligt OpenAI har nydt en rimelig stabil førerposition.
Det har både været gældende performance – altså omfang, præcision og kvalitet af de svar der kunne gives, samt grad af multi-modalitet – det vil sige hvor mange andre ting end tekst modellerne kunne tage som input; såsom lyd, billeder, video og så videre.
For nyligt har der dog været en ekstrem udvikling accelereret af open source-sprogmodellen r1 fra kinesiske DeepSeek.
Da denne model blev lanceret, viste den sig at være cirka lige så stærk som OpenAI’s på det tidspunkt stærkeste, lancerede model kaldet o1, som til gengæld var 27 gange dyrere at kalde via et API.
En åbenlys udfordring ved r1 er dens bias for den kinesiske regerings virke, men dette burde overskygges af hvor stort et win, det er for open source, for r1 kan sagtens hentes ned og skrues i en anden retning hvis man vil.
Er open source-sprogmodeller mere sikre?
Der er bestemt også et sikkerhedsperspektiv i at man kan hente open source-sprogmodeller ned og køre dem offline lokalt.
Men dette omtales ofte med en hvis naivitet, der overser, at hvis der er flere brugere, der skal anvende denne sprogmodel, så skal man stadig selv stå for al sikkerhed.
Og her er det rigtig svært at svinge sig op på niveau med den grad af sikkerhed, der følger med, når man bruger eksempelvis Azure AI Services eller lignende.
Bias i modellen er heller ikke forbeholdt en model som r1 fra Deep Seek. Der er bias i alle sprogmodeller – det er bare en meget tydelig og åbenlys pro-socialistisk bias, som man ser ved brug af r1 fra Deep Seek.
Men er det godt eller skidt at en bias er meget åbenlys og identificerbar?
Hvordan influerer open source-sprogmodeller markedet?
Der er ingen tvivl om, at hvis man som virksomhed har mod på en større investering i at lykkes med sin egen open source sprogmodel, kan man bedre skalere sine omkostninger ved dens brug.
Udbyder man for eksempel et produkt, der anvender store sprogmodeller indirekte, kan man herved undgå at betale forbrug på vegne af alle ens kunder, eller at hæve priserne hertil.
Det betyder helt konkret, at niveauet af open source sprogmodellernes performance er instrumentel til at holde priserne på closed source-sprogmodellernes forbrug nede.
Derfor er fremgang inden for open source-sprogmodeller i sig selv et kæmpe win for forbrugerne, men dertil kommer også at open source-modeller som r1, der giver selve sin bageopskrift med, også sætter ekstra fart i den generelle udvikling og innovation for store sprogmodeller.
Den stærkeste model, jeg har oplevet indtil nu, er o3 i sin ”mini-high” version i betalt ChatGPT, men den fik vi nok tidligere end planlagt, fordi OpenAI var nødt til at svare igen, da r1 kom op på siden af OpenAI's o1 model.
Der er altså et sundere konkurrencelandskab, der er til forbrugernes fordel her.
Kommer der så r3 fra Deep Seek, som pendant til o3 lige om lidt?
Eller har nogle helt andre spillere samlet bageopskriften op og innoveret videre?
Jeg er overbevist om, at disse udviklinger allerede er i fuld gang, og at kapløbet kun lige er startet.
Klummer er læsernes platform på Computerworld til at fortælle de bedste historier, og samtidig er det vores meget populære og meget læste forum for videndeling.
Har du en god historie, eller har du specialviden, som du synes trænger til at blive delt?
Læs vores klumme-guidelines og send os din tekst, så kontakter vi dig - måske bliver du en del af vores hurtigt voksende korps af klummeskribenter.