hva er OpenAIs siste grep for å motvirke Google og Meta

- Ole Andersen

Codex GPT-5.2The Agentisk kodemodell definert av OpenAI «(as) den mest avanserte for programvareutvikling i komplekse sammenhenger» (hovedsakelig ingeniørfag og cybersikkerhet), representerer det siste forsøket fra giganten med kunstig intelligens på å styrke sin posisjon i den stadig mer intense konkurransen i sektoren. Utgivelsen av GPT-5.2-Codex er faktisk et presist signal om prioriteringene til selskapet ledet av Sam Altman som de siste ukene utløste «koden rød» for OpenAInettopp på grunn av den presserende konkurransen fra Google Gemini. La oss se dem funksjonene til GPT-5.2-Codex og dens rolle i konkurranse mellom OpenAI, Google og Meta.

Funksjonene til GPT-5.2-Codex

GPT-5.2-kodeks født som en variant av GPT-5.2 optimalisert for såkalt agentkodingdet vil si evnen til et kunstig intelligenssystem til å fungere som en autonom agent som planlegger, utfører og korrigerer sekvenser av komplekse operasjoner over tid. I motsetning til modeller som svarer på enkeltstående, isolerte forespørsler, opprettholder en agent kontekst over lange tidshorisonter og samhandler med verktøy som terminaler og utviklingsmiljøer. For å oppnå dette jobbet OpenAI med kontekstkomprimeringen teknikk som lar deg beholde relevant informasjon samtidig som du reduserer tokenforbruket, og dermed forbedrer effektiviteten og sammenhengen i resonnementet.

Fra et praktisk perspektiv gir dette seg utslag i overlegen ytelse på oppgaver som f.eks refaktoriseringdet vil si å omorganisere koden uten å endre oppførselen. GPT-5.2-Codex demonstrerer også større pålitelighet i Windows-miljøer, historisk sett mer kompleks for automatiserte verktøy å administrere, og integrerer mer avanserte visuelle evner å tolke skjermbilder, tekniske diagrammer og mockups, det vil si foreløpige utkast til et applikasjonsgrensesnitt.

Gitt fremgangen gjort av OpenAI, er det ikke overraskende at GPT-5.2-Codex har oppnådd interessante score i noen tester. I benchmark SWE-Bench Proen test hvor modellen blir gitt et reelt depot og bedt om å generere en fungerende oppdatering. Modellen oppnådde poengsummen på 56,4 %; mens du er i benchmark Terminal Bench 2.0en test som simulerer autentiske terminalmiljøer med komplekse oppgaver som å kompilere kode eller konfigurere servere, oppnådde modellen poengsummen på 64,0 %. Disse resultatene indikerer at modellen ikke begrenser seg til å «skrive kode», men også har evne til å operere i realistiske og dynamiske sammenhenger.

Bilde

Et spesielt delikat aspekt angår cybersikkerhet. Etter hvert som mulighetene til modellene øker, deres effektivitet i å identifisere sårbarheter vokser ogsådvs. defekter som kan utnyttes til å kompromittere et system. Teknikker som uklarsom består av testing av programvare med tilfeldige eller misformede innganger, ellernullskuddsanalyseder modellen adresserer et problem uten å ha gitt foreløpige eksempler, blir kraftigere hvis den støttes av agentsystemer.

OpenAI erkjenner at de samme egenskapene som hjelper forsvarere kan bli misbrukt. I denne forbindelse har selskapet faktisk forklart:

Disse fremskrittene kan styrke cybersikkerhet i stor skala, men de introduserer også nye risikoer for misbruk som krever nøye implementering. Selv om GPT‑5.2-Codex ikke når det «høye» nivået av cybersikkerhetsevner i henhold til vårt Readiness Framework, designer vi vår distribusjonstilnærming⁠med fremtidig kapasitetsvekst i tankene.

GPT-5.2-Codex er allerede under utgivelse på alle Codex-funksjoner reservert for betalte ChatGPT-abonnenter, mens OpenAI fullfører arbeidet som er nødvendig for å gjøre modellen også tilgjengelig via API gradvis og sikkert i de kommende ukene. Samtidig igangsettes et eksperimentelt prosjekt, basert på invitasjon, som vil gi verifiserte fagpersoner og organisasjoner som driver med cyberforsvar tilgang til på en kontrollert måte mer avanserte kapasiteter og modeller med færre begrensninger, med sikte på «(balansere) tilgjengelighet med sikkerhet», for å sitere OpenAI ordrett.

Konkurransen mellom OpenAI, Google og Meta

Denne utgivelsen må også leses fra et optisk perspektiv konkurranse med Google (som fikk ganske mange poeng med utgivelsen av Gemini 3-familien) og Halv. Vi må faktisk ikke glemme hvor mye Sam Altmanadministrerende direktør i OpenAI, har bevist seg selv bekymret for den eksponentielle veksten til konkurrerende modeller. Vekst som utløste «kode rød» på kontorene til AI-giganten. Angående dette, Fidji Simoleder for applikasjoner i OpenAI, forklarte i anledning utgivelsen av GPT 5.2:

Vi annonserte «koden rød» for å tydelig signalisere til selskapet at vi ønsker å konsentrere ressursene i et spesifikt område; det er en måte å prioritere og bestemme hva som kan settes på baksiden. (…) Vi har økt ressursene dedikert til ChatGPT generelt; Jeg vil si at dette hjelper i utgivelsen av modellen, men det er ikke grunnen til at den kommer ut denne uken.