GPT 5.2 vs Gemini 3, hvilken av de to best oppfyller brukerforespørsler: vi prøvde begge

- Ole Andersen

Hvilken AI er bedre: GPT 5.2 eller Gemini 3? Hvis du også har spurt deg selv problemet, følger du tydeligvis nøye med på den siste utviklingen innen kunstig intelligens fra OpenAI og Google. Hvis vi måtte gi deg et rett svar, ville vi fortalt deg det i øyeblikket GPT-5.2 og Gemini 3 møter brukerforespørsler på en veldig lik måtemen med forskjellige aksenter: den første har en tendens til å favorisere presisjon, operasjonell klarhet og støtte for strukturert profesjonelt arbeid, den andre tilbyr et bredere økosystem og større integrasjon med verktøy og tjenester, noe som gjør den mer fleksibel i daglig bruk.

Fra de første sammenligningene kommer det frem at det ikke er noen absolutt vinner: ytelsene målt gjennom benchmarks, det vil si standardiserte tester som brukes til å sammenligne ulike modeller på de samme oppgavene, viser blandede resultater, med fordeler som endres avhengig av området. Tilgangskostnader og grunnleggende funksjoner er også veldig nærme. I hovedsak, i stedet for å spørre oss selv hva som er «best», er det fornuftig å spørre oss selv hvilken som reagerer best på våre vaner og vår arbeidsflyt. Det er på dette nivået at konkurransen mellom OpenAI og Google blir virkelig interessant, fordi den markerer overgangen fra et kappløp om brute power til en modenhetsfase, der brukeropplevelsen teller like mye, om ikke mer, enn tallene og poengsummene oppnådd i de ulike testene.

GPT-5.2 og Gemini 3: funksjoner og benchmarks sammenlignet

GPT-5.2 det er den siste utviklingen av modellen som ligger til grunn for ChatGPT og ble opprinnelig gjort tilgjengelig for betalte brukere, med en utvidelse av tilgangen gradvis også tilgjengelig for brukere av gratisplanen. Hans ankomst kommer på et delikat øyeblikk for OpenAI, som står overfor den raske veksten av Gemini 3Googles mest avanserte AI-modell. Ifølge noen analyser sirkulerer på Gemini 3 ville ha tatt 6% av trafikken bort fra OpenAI i ukene etter lanseringen, som han ville presse Sam Altmanadministrerende direktør i OpenAI, for å stemple hendelsen som farlig «kode rød». Dette er et tegn på stadig mer direkte konkurranse fra Google. Utover markedsdynamikken er det imidlertid den tekniske og funksjonelle sammenligningen mellom de to modellene som er av interesse i denne dybdeanalysen.

OpenAI presenterer GPT-5.2 som spesielt effektiv i den såkalte «faglig kunnskapsarbeid». I følge OpenAI ville faktisk GPT 5.2 være «bedre til å lage regneark, lage presentasjoner, skrive kode, oppfatte bilder, forstå lange sammenhenger, bruke verktøy og administrere komplekse flertrinnsprosjekter». Alle disse oppgavene krever konsistens, flertrinnsplanlegging og nøyaktig bruk av informasjon som brukeren gir til modellen. En første bekreftelse på forbedringene gjort av GPT-5.2 kommer fra LMArenaen plattform som samler inn sammenlignende vurderinger basert på brukerpreferanser: her GPT-5.2 oppnår relevante resultater innen webutviklingsom overgår Gemini 3 i denne spesifikke kategorien.

Hvis vi utvider blikket vårt, dominerer Gemini 3 fortsatt mange LMArena-rangeringer relatert til tekst, bilder, søk og multimedieinnhold, i tillegg til den generelle rangeringen. Dette minner oss om at GPT-5.2 nettopp har ankommet og ennå ikke er tilstede på alle rangeringer, mens Gemini 3 drar nytte av større «senioritet» og en allerede veltestet modellfamilie.

Selv de offisielle benchmarkene viser et balansert scenario. I tester dedikert til programvareutvikling, avansert matematikk eller multimodal forståelse, veksler de to modellene i resultater: i noen tester viser GPT-5.2 en liten fordel, i andre vinner Gemini 3. Det er imidlertid viktig å understreke at disse resultatene er deklarert av selskapene selv og ikke alltid kan verifiseres uavhengig av tredjeparter (ergo… de tar sin tid).

Når det gjelder funksjonalitet, har Gemini 3 en betydelig fordel ettersom den er integrert i mange flere produkter. I tillegg til Gemini-appen driver den Google-verktøy som Search Engine AI Mode, Google AI Studio og NotebookLM. Dette betyr at vi kan bruke samme modell i ulike sammenhenger uten å bytte plattform. GPT-5.2, på den annen side, er sterkt sentrert om ChatGPT; Det tillater generering av bilder, men for videoer krever det bruk av en egen app som Sora.

GPT 5.2 vs Gemini 3: hvem vinner i hverdagen?

De som ikke er fan av benchmarks laget av selskaper (OpenAI og Google i dette spesifikke tilfellet), har derfor den vanskelige oppgaven med å etablere med praktiske tester hvilken modell som passer best for deres behov. Her er du to øvingsprøver som vi prøvde å teste og sammenligne de to modellene med for å analysere noen forskjeller.

Test #1 – Handleliste

I første prøve vi ba begge modellene om å gi oss en handleliste som tok hensyn til visse veldefinerte parametere, ved å bruke følgende ledetekst:

Oppfør deg som en spareekspert. Lag en handleliste for en familie på to, ta hensyn til at ett voksent medlem er veganer, det andre er vegetarianer og de to barna er altetende. Husk også at budsjettet som skal respekteres for månedlige utgifter er 450 euro.

I det følgende skjermbildet finner du deler av utdataene som ble returnert til oss.

Bilde

Test #2 – Strategi for å finne arbeid

I andre prøve Vi ba begge modellene om å gi oss en strategi som kan hjelpe en arbeidsledig person med å finne arbeid, ved å bruke følgende spørsmål:

Oppfør deg som en profesjonell rekrutterer. Definer en presis strategi som kan tillate en profesjonell webdesigner, som har mistet jobben på grunn av AI, å finne en ny jobb som kan vare over tid.

I det følgende skjermbildet finner du utdataene som delvis ble levert til oss av de to AI-ene.

Bilde

Konklusjoner

Ved å analysere utdataene mer detaljert, angår imidlertid forskjellene mellom GPT-5.2 og Gemini 3 ikke så mye riktigheten av svarene, men snarere stilen, syntesenivået og tilnærmingen til å løse problemet.

I handleliste testGemini 3 viser en mer narrativ og pedagogisk tilnærming. Før du går inn på detaljene i produktene, introduserer den en generell strategi («vanlig-basert matlaging»), forklarer sparelogikken og gir en rekke sikkerhetsråd, for eksempel ukentlig budsjettinndeling eller batch-matlaging. Resultatet er en lengre og mer detaljert respons, som følger brukeren steg for steg og passer spesielt godt for de som trenger kontekst, eksempler og ulike forsikringer. Også veldig nyttig er inkluderingen av tabellen for å eksportere til Google Sheets, noe som gjør utdataene virkelig klar til bruk.

I test på strategi for å finne jobbGPT-5.2 bruker en svært operasjonell og resultatorientert tilnærming. Responsen er strukturert som et ekte profesjonelt veikart: det identifiserer det underliggende problemet, foreslår en klar reposisjonering, foreslår nisjer som kan forsvares over tid og indikerer konkrete handlinger som skal iverksettes, ved å bruke språk som er typisk for HR- og rekrutteringsverdenen. Det nesten totale fraværet av ingresser og innledende forklaringer gjør utgangen umiddelbart brukbar, spesielt for de som leter etter praktiske indikasjoner i stedet for teoretiske refleksjoner.

Merk: de to testene som vi testet modellene med er ikke uttømmende og kan i andre tilfeller gi resultater som ikke er i tråd med konklusjonene vi har kommet til.