Den franske AI-virksomhed Mistral AI’s nyeste AI-sprogmodel, Pixtral Large 2, stryger til tops i et felt domineret af stærke internationale aktører.
Modellen er ligesom Chat GPT 4o multimodal, hvorfor den kan bearbejde og generere andet end tekst, såsom billeder og grafik.
Modsat førende modeller fra OpenAI’s ChatGPT, Googles Gemini og Anthropics Claude er vægtningen i Pixtral Large 2 tilgængelig under åbne forksnings og undervisningslicenser samt kommercielle licenser.
Modellen medregner i alt 124 milliarder parametre, mens kontekstvinduet kan rumme 128.000 - nok til 30 fotos i høj opløsning eller omkring 500 siders tekst. Det vil derfor også kræve særdeles kraftig hardware i workstation-klassen at afvikle modellen lokalt.
Ydelsen på modellen er ifølge Mistrals egne benchmark-målinger helt i front. Her lykkedes det Pixtral Large 2 at placere sig i front i fire ud af syv målte discipliner.
Den ydelse kan omsættes til praktiske anvendelser, som Mistral demonstrerer ved at lade Pixtral Large 2 scanne en restaurantkvittering, der skal deles, forstå de enkelte emner, og udregne hvem der skal betale hvad og lægge drikkepenge oveni.