AI-benchmarking har fanget en Pokémon

Pokéball brugt som illustration til AI-benchmarking med Pokémon
Nu bruges også Pokémon-spillet til at benchmarke AI-modeller. Foto: Shutterstock

Nu bruges også Pokémon til at sammenligne forskellige AI-modeller.

Vi har tidligere skrevet, at forskere på Hao AI Lab, der hører under University of California San Diego, har benyttet videospillet Super Mario Bros til at benchmarke fire AI-modeller.

Men nu er det ikoniske Pokémon-videospil også blevet fanget af glubske personer, der vil forstå, hvad AI-modellerne kan bruges til, og hvor gode de er i forhold til hinanden.

TechCrunch skriver nemlig, at et opslag på det sociale medie X, som desuden er gået viralt, hævder, Googles nyeste Gemini-model er kommet længere i Pokémon end Anthropics Claude-model.

Gemini-modellen skulle eftersigende være kommet til Lavender Town, hvorimod Claude-modellen har siddet fast ved Mount Moon siden slutningen af februar.

Fordel til Gemini

I TechCrunchs artikel fremgår det dog, at Gemini-modellen måske har haft lidt andre vilkår at arbejde under end Claude-modellen – vel og mære til fordel for Googles AI-model.

Brugere på Reddit har nemlig påpeget, at Gemini-modellen var udstyret med et brugerdefineret ’mini-kort’, som eftersigende skulle gøre det nemmere for modellen at identificere ’veje’ i spillet.

Derved skulle Gemini-modellen ikke bruge lige så meget tid på at analysere skærmbilleder, før modellen kunne foretage sine gameplay-beslutninger.

Det er dermed svært at komme med en entydig konklusion på denne Pokémon-benchmark, eftersom de to modeller har haft forskellige udgangspunkter.

Sidst opdateret: 15. april 2025

Ingen kommentarer

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

Del Artikel
Læs også

Abonner på vores ugentlige nyhedsbrev

Du kan blive opdateret på nyheder inden for tech & startups ved at tilmelde dig vores nyhedsbrev. Vi sender dig en mail med 7 udvalgte artikler tirsdag og fredag.