Det vrimler frem med nye, dygtige AI-assistenter i år. Hvor vi tidligere blot skulle lære tjenester som ChatGPT og CoPilot at kende er udvalget nu mangedoblet ikke bare med nye spillere, men også med versioneringer af eksisterende modeller.
AI-markedet er derfor blevet til lidt af en jungle, hvor man som bruger skal vurdere ikke bare hvilken model man vil ty til, hvorvidt man vil betale for tjenesten eller dele af tjenesten.
Herunder følger en oversigt over AI-modeller årgang 2025, hvad de tilbyder af features og det du skal vide og forstå når du vælger AI-tjeneste.
Flerdobling af modeller
Det hele startede med ChatGPT i efteråret 2022. Her var kun en enkel model at få adgang, GPT version 3.5, som dog hurtig skulle afløses af en langt mere kapabel GPT 4.0.
Men disse modeller er ekstremt dyre i drift og med to niveauer i spil, blev der hurtigt lagt begrænsning på brugen eller indført betaling for de bedre modeller.
Senere kom udvidelserne, såsom multimodalitet, hvor de genererende modeller kunne se, afkode og generere andet end tekst, såsom fotos, videoer og filer.
Den store efterspørgsel lagde kimen til, at ChatGPT og andre aktører versionerede sin modeller, med lettere, mindre regnetunge modeller som ’mini’, ’lite’ eller ’haiku’, mens de større og mere eksakte modeller fik efternavne som ’Opus’, Pro’ eller ’Advanced’
Den næste store udvikling blev den ræsonnerende model, ChatGPT o1, som tog sig tid til at tænke over og strukturere et svar, før der blev svaret.
Overblikket
For AI-tjeneste er der derfor gået inflation i modellerne som dog generelt kan klassificeres i fire kategorier:
Sprogmodeller -modeller såsom Den oprindelige ChatGPT 3.5 og 4.0 eller lokale sprogmodeller
Multimodale modeller – sprogmodeller som også kan håndtere andet input end tekst såsom ChatGPT 4o, Claude Sonnet, DeepSeek V3 eller Grok 3-
Ræsonnerende modeller: Sprogmodeller, som bruger ekstra regnekraft på at tænke sig om, før der svares. Bliver ofte kaldt for ’thinking’ modeller, såsom ChatGPT o1, DeepSeek R1, Claude Sonnet 3.7 Thinking, Grok 3 Thinking, Gemini 2.0 Flash Thinking
Mini-modeller: Med stadigt større kompleksitet i modellerne og behov forræsonnement, bliver modeller versioneret i light eller mini-varianter. Her er det værd at bemærke, at udviklingen går så hurtigt, at en nyere light-model kan være bedre end forudgående sværvægtere. Eksempler på disse er ChatGPT o3-mini og Googles Gemini 2.0 Flash.
Pro-modeller: De bedste og mest avancerede modeller findes her, hvor der lægges maksimalt med regnekraft i svarene. Her finder du modeller såsom ChatGPT o3 og o1 Pro og Google Gemini 2.0 Pro.
Øvrige smarte tricks og fiduser
Dagens sprogmodeller anvendelighed er ikke alene bestemt af, hvad det er modellerne bag gør, men også af hvad de bliver sat til.
Her har AI-selskaberne fundet en række metoder til at få skræddersy opgaver til tjenesterne, som giver nye muligheder.
Her kan nævnes disse:
AI-Agenter: En af de nye funktioner, som vinder frem i 2025 er ’AI-agenter’ – som er AI-systemer designet til selvstændigt at klare opgaver på brugerens vegne. Disse vil hermed kunne automatisere processer, analysere data, finde svar på spørgsmål og interagere med internettet for brugeren med mindre eller høj grad ag autonomi. Disse tilbydes i form af OpenAI’s ’Operator’ og Claudes agent-API’er.
Søgefunktioner: Når en sprogmodel trænes, stopper den samtidig med at lære nyt, hvorfor selv en relativ ny models viden kan være flere uger eller måneder gammel. Sprøger man den om, hvem der vandt en pokalkamp forleden, vil den ikke kunne svare medmindre du slår ’websearch’ eller ’søg’-funktionen til, så den selv kan finde oplysningen på nettet for dig.
Deep Search/Research: Det at gennemsøge nettet for svar kan gøres mere eller mindre grundigt. Med ’Deep Search’ eller ’Deep Research’ funktionerne fra henholdsvis Google/Grok og OpenAI’s ChatGPT går modellerne flere spadestik dybere for at hive indsigter ud af internettet. Det giver modeller der kan bruge op til halve eller hele timer på at generere svar, men som også kommer med resultater, som er gennemresearchet, undersøgt for fejl og annoteret med kildehenvisninger – et arbejde som kunne tage et menneske dagevis at udrette.
Masser af kontekst: Nogle AI-modeller, såsom Googles Gemini 2.0-modeller specialiserer sig i at kunne håndtere kæmpemæssige dataset, med det der kaldes et ’kontekstvindue’. Her tilbydes kontekstvinduer på op imod to millioner tokens, svarende til omkring 6.000 sider – eller nok til at hælde flere års rapporter og få dem bearbejdet af sin AI-tjeneste.
Samtale-funktion: Du kan spare en del tid ved at diktere dine prompts fremfor at stave dem, hvilket gør at stadigt flere AI-modeller understøtter både at forstå tale, men også at svare med tale. ChatGPT går dog et skridt videre, ved at benytte såkaldte voice-tokens i deres ’advanced voice’ feature, som giver en langt mere flydende og naturlig tale og konversation med AI’en.
Programmerings-optimeret modeller: Programmerings-opgaver er en af de tjanser, som AI-modeller hurtigt er blevet sat til, og de bedste er ved at være så dygtige, at de kan levere så god kode, at det ikke kræver de store justeringer. Det gælder særligt programmeringsoptimerede AI’er såsom Claude Code og Qwens Artefact som letter udviklerens opgaver yderligere.
Data-sikkerhed og compliance: Har du med følsomme data at gøre, bør du ikke være tryg ved at hælde data ned i den sorte boks, som en AI-tjeneste kan være. Her markerer enkelte udbydere såsom OpenAI sig ved at tilbyde en GDPR-compliant, men det løser ikke det grundlæggende problem. Omvendt kan det læses med småt, at alt hvad der bliver hældt i en model såsom DeepSeeks sendes videre. Her er svaret at vende sig mod modeller, der kan afvikles lokalt såsom Metas LLama, Mistrals Small eller Large eller anden open-source model.