Anthropic stenger AI-modellene Claude Fable 5 og Mythos på grunn av amerikanske myndigheter: Hva skjer

Tre dager er tiden Claude Fable 5 måtte nyte tittelen som verdens best presterende kunstig intelligens-modell blant de tilgjengelige for publikum, før den amerikanske regjeringen beordret sin umiddelbar nedleggelse for alle ikke-amerikanske brukere, over hele planeten, inkludert i USA, og til og med for ikke-amerikanske antropiske ansatte. I pressemeldingen utgitt av selskapet ledet av Amodei-brødrene leser vi faktisk: «USAs regjering, med henvisning til nasjonale sikkerhetsmyndigheter, har utstedt et direktiv om eksportkontroll for suspendere tilgangen til Fable 5 og Mythos 5 for enhver utenlandsk statsborgerbåde i og utenfor USA, inkludert Anthropics utenlandske ansatte».

Som du nettopp har lært, i tillegg til Fabel 5 den ble også deaktivert Mythos 5dens «storebror» som inntil da hadde vært reservert for svært få utvalgte partnere. Anthropic, selskapet som utviklet begge modellene, sa at de var klare til å respektere ordren, men gjorde det også kjent at de betraktet det som en feil: i henhold til rekonstruksjonen vil det på grunnlag av det være en påstått og begrenset «jailbreak» identifisert i Fable 5, en feil i sikkerhetsmekanismene som ifølge selskapet allerede er tilstede i andre konkurrerende modeller. Historien fikk også en enorm innvirkning utenfor USA, hvor flere europeiske politikere tok utgangspunkt i å snakke om teknologisk suverenitet og behovet for at kontinentet utvikler sine egne kunstig intelligens-modeller. La oss se sammen, i rekkefølge, hva som skjedde og hvorfor.

Blokkeringen av Mythos 5 og Fable 5 av den amerikanske regjeringen

La oss starte med Mythos: ifølge Anthropic er det den mest avanserte modellen som noen gang er laget av selskapet, forhåndsvist i april, men aldri distribuert i stor skala fordi den er i stand til, ifølge selskapet selv, å identifisere sikkerhetssårbarheter på egen hånd i praktisk talt alle testede operativsystemer og nettlesere. Det er derfor det bare hadde blitt delt med rundt 50 organisasjoner, inkludert Amazon, Apple, Google, Microsoft og CrowdStrike, under et program kalt Prosjekt Glasswingdesignet for å bruke disse egenskapene til defensive formål, det vil si å finne og rette feil før de blir utnyttet av ondsinnede aktører.

Fable 5 kom bare tre dager før nedleggelsen, og den var der «temmet» versjon av Mythos: Samme grunnleggende funksjoner, men med tilleggsfiltre for å blokkere svar på høyrisiko-emner, som nettsikkerhet og biologi. Dette gjorde den, ifølge Anthropic, trygg nok til å være tilgjengelig for alle, og så snart den ble utgitt viste den seg å være den best presterende modellen blant de offentlige i testene. Vals AIet selskap som måler ytelsen til AI-modeller gjennom benchmarks, det vil si standardiserte tester som gjør at forskjellige systemer kan sammenlignes med hverandre.

Vi kommer nå til regjeringens ordre. Formelt er det en eksportkontrolltiltaket verktøy som normalt tjener til å forhindre at visse teknologier faller i hendene på utenlandske enheter av nasjonale sikkerhetsgrunner. I dette tilfellet var imidlertid den praktiske effekten mye bredere: å respektere ordren, Anthropic måtte deaktivere begge modellene for alle brukere over hele verdeninkludert amerikanske statsborgere, fordi det ikke var noen teknisk måte å bruke blokkeringen kun på utenlandske statsborgere, inkludert dine egne ikke-amerikanske ansatte. De andre antropiske modellene fortsetter å fungere normalt for alle.

I følge Anthropics rekonstruksjon, Regjeringen ga ikke detaljerte begrunnelser i denne forbindelsemen selskapet mener at bekymringen gjelder nettopp det «jailbreaket» av Fable 5. For å si det enkelt, i AI-verdenen indikerer dette begrepet en måte å «overbevise» en modell om å ignorere sine egne interne regler. I dette tilfellet vil det være en teknikk som lar modellen analysere kode og identifisere allerede kjente programvaresårbarheter, en funksjon som ifølge selskapet også er tilgjengelig i andre offentlige modeller, bl.a. GPT-5.5 av OpenAIog som cybersikkerhetseksperter jevnlig bruker til defensive formål.

Anthropic understreker også at dens viktigste beskyttelse ikke bare avhenger av oppførselen til modellen, men av uavhengige kontrollsystemer som forblir aktive selv om modellen i seg selv er «overbevist» om å reagere unormalt.

Antropics frustrasjon

Herfra Antropics frustrasjon: Å trekke fra markedet en modell brukt av hundrevis av millioner mennesker på grunn av begrenset sårbarhet, etter hans mening, risikerer blokkere lanseringen av enhver ny modell av ethvert selskap i sektoren. Det er også et grunnleggende paradoks: selskapet har bygget mye av sitt image på forsiktigheten vist med Mythos, presentert som for kraftig for gratis distribusjon, og i dag finner det seg selv «straffet» av nesten samme grunn, så mye at det allerede i april, Sam Altman fra OpenAI hadde snakket om en markedsføringsstrategi basert på frykt.

Historien fikk også et umiddelbar ekko i Europa, der flere politikere, fra Frankrike til Storbritannia, som passerte gjennom Nederland, benyttet anledningen til å be om større investeringer i europeiske AI-modeller, og argumenterte for at avhengig av teknologier utviklet andre steder utsetter deg for risikoen for å bli avskåret fra dem når som helst, akkurat som det skjedde med ikke-amerikanske brukere av Fable 5 og Mythos.