Hemmelighedskræmmeriet omkring en af OpenAI’s kommende opdateringer til ChatGPT har været omfattende.
Opdateringen, som er blevet kendt som ’Strawberry’ eller tidligere som ’Q*’ eller ’Star’ har internt i den toneangivende AI-virksomhed været anset som så omfattende et gennembrud, at den var med til at drive den kortvarige bestyrelsesopstand mod og fyring af OpenAI’s topchef, Sam Altman.
Teknologien skulle nu ikke være mere end et par uger fra at blive offentliggjort, lyder det fra tech-mediet The Information.
’Strawberry’ bliver en opdatering til tjenesten ChatGPT, som vil udmærke sig ved at kunne ræsonnere før den svarer, noget som de verserende sprogmodel-baserede AI-bots døjer med.
Ifølge finansmediet Bloomberg er modellen blevet fremvist internt, hvor den kunne mønstre ræsonnements-evner næsten på niveau med mennesker.
Det vil bringe tjenesten op fra niveau et til to på OpenAI's femtrinskala for kunstig intelligen. Her svarer trin to til kunstig intelligens, der kan løse opgaver på Ph.D niveau.
Niveau fem er hvad OpenAI definerer som generel kunstig intelligens (AGI), der kan udrette en hel organisations arbejde.
Overbygning til ChatGPT
Selvom Strawberry featuren bliver integreret med OpenAI’s ChatGPT-tjeneste, vil den fungere som en overbygning, lyder det ifølge The Informations kilder, som har prøvet den nye kunstige intelligens.
Strawberry bliver ifølge mediet en anden model, som kan tilvælges i ChatGPT’s model-oversigt og som vil byde på væsentlige fordele, mens ulemper såsom længere ventetid, før svaret overhovedet begynder at blive genereret.
Den nye model blev tidligere omtalt af Reuters kilder som en storskala sprogmodel som ud over at generere svar også planlægge og strukturere svar og selvstændigt opsøge informationer på nettet.
Det gør ’Strawberry’-modellen i stand til at udføre det OpenAI kalder ’dyb research’, lyder det.
Allerede tidlige versioner af modellen var ifølge mediet i stand til at løse matematik- og fysik-opgaver, som er udenfor de nuværende GPT-modellers evner.
Siden har modellen vist sig at være i stand til at løse 90 procent af opgaverne i MATH – et benchmark baseret på opgaver fra matematik-mesterskaber.