Elon Musks AI -krig: New AI Rankings Spark Power Shift in Chatbot World

Elon Musk kalte Grok 4 The Smartest AI Alive – men den globale rangeringen bare falt, og den virkelige vinneren kan overraske deg. Hvem styrer robotene?

Musk hevdet at det var hjernere enn gradstudenter – men resultattavlen forteller en annen historie.

Han kalte det et geni. Resultattavlen kalte det gjennomsnittet. Elon Musks skinnende nye AI -bot, Grok 4, ble akkurat skolert foran hele teknologverdenen – og resultatet er mer Oppenheimer enn Iron Man.

Frisk av å erklære Grok 4 ‘smartere enn nesten alle doktorgradsstudenter i alle fagområder,’ Musk står nå overfor en brutal dose virkelighet. UC Berkeley Chatbot Arena – i utgangspunktet Premier League of AI Smarts – bare droppet de siste rangeringene. Og gjett hva? Grok gjorde ikke engang de to beste.

Musks “smarteste AI i verden” kom nettopp tredje.

Topping av bordet var Googles Gemini 2.5, etterfulgt av Openais GPT-4O og GPT-4.5. Grok 4 haltet i bundet for tredje – en veldig anstendig innsats hvis PR -teamet ditt ikke allerede hadde pusset ‘verdens smarteste AI’ over hele sosiale medier.

La oss være ærlige – bronse er ikke dårlig, og jegT -er en work in Fremgang. Men når du har fortalt alle at roboten din kan overgå Oxford, og avsluttet tredje bak de vanlige mistenkte stikk bare litt.

Hva er Grok – og hvorfor stønner Elon?

Grok er Musks svar på Chatgpt – en edgy, meningsfull chatbot tilberedt av hans AI -oppstart, Xai. Den bor inne i X (tidligere Twitter), og ble slått opp som et fritt tenkende, fritt talende, uredd alternativ til den antatt «Woke» -konkurransen.

Men det har hatt en steinete start. For ikke lenge siden ble Grok fanget og spydd antisemittisk og rasistisk innhold når han ble bedt om – oppførsel som til og med hadde muskfans som lurte på om denne tingen hadde en skrue løs. Andre se det som et åpenbart medietriks, agn En AI for å si meningsfulle ting slik at du kan publisere negativ presse om Musk og selskapene hans.

jegt gjorde ikkeIkke stopp Pentagon, husk deg – de pumpet angivelig 200 millioner dollar i Groks utvikling.

Er topplisten legit-eller bare en vibe-fest?

Noen eksperter stiller spørsmål ved selve resultattavlen. I følge en forbannende rapport fra forskere ved Cohere, har chatbot arenaen noen Dodgy praksis bak scener, like Privat pre-testing, score sletting og til og med modellbytter før rangeringer gå offentlig.

Meta ble fanget og gjorde nettopp det – å sende en hemmelig versjon av Llama 4 -modellen for å konkurrere. Det er AI -ekvivalentet med å vise opp et jobbintervju med en tvilling som er faktisk utdannet.

Så hvis systemet er feil, betyr Groks bronse til og med noe? Det dEpends på WHO spør du. Men selv i denne kaotiske konkurransen, øker de beste modellene til toppen – og Grok er fremdeles etterfølgende.

Hva gjør de virkelige mesterne annerledes?

Googles Gemini 2.5 er ingen slouch. Den håndterer tekst, bilder, kode og mer – og den har blitt opplært til å resonnere som en forsker, ikke bare gjenta internett -fluff. Openais GPT-4O er kjent for glatt, menneskelignende dialog, mens GPT-4.5 pakker noen av de skarpeste problemløsingsferdighetene som er sett i noen modell til dags dato.

Grok har derimot fokusert mer på holdning enn akademikere, Og det viser.

Musk fremsatte dristige påstander. Men once igjen, de virkelighet kom opp kort. Eller slik appeaRs.

Flere Spansk levende nyheter.

Flere Nyheter på engelsk fra hele Spania.