Her er hva opus og sonnet kan gjøre

- Ole Andersen

Antropisk Den lanserte nylig to nye kunstige intelligensmodeller i serien Claude 4det vil si Opus 4 Og Sonnet 4. Selv om de deler mange teknologiske nyvinninger, har de to modellene blitt designet med forskjellige formål og bruksområder. Claude Opus 4 Det representerer det absolutte toppmøtet når det gjelder makt og dyp resonnementskapasitet, designet for å møte veldig komplekse aktiviteter og langvarige prosjekter med enestående presisjon. Claude Sonnet 4I stedet har det blitt optimalisert for effektivitet og tilgjengelighet, og tilbyr høy ytelse på praktiske områder med hverdagsbruk, med raske responstider og forståelse av konteksten forbedret med hensyn til forgjengeren, Sonnet 3.7. Begge modellene integrerer en Ny funksjon av «utvidet tanke» og er i stand til å bruke eksterne verktøysom nettforskning, under resonnementsprosesser. I tillegg kan de skryte av et avansert minne som lar dem beholde relevant informasjon over tid. Claude Sonnet 4 er også tilgjengelig for gratis brukere, mens Opus 4 er inkludert i de mest avanserte betalte planene.

De mest interessante funksjonene i de nye Claude 4 -modellene

En av de mest interessante innovasjonene som er introdusert i begge modellene er den så -kalt «Tanke utvidet med bruk av verktøy». I praksis, når en forespørsel krever det, kan modellen veksle øyeblikk med intern resonnement med bruk av eksterne verktøy – hvordan du får tilgang til informasjon på internett – for å bygge en mer fullstendig respons. Denne evnen, kombinert med en Forbedret minne (som, hvis autorisert, lar modellen lagre og gjenopprette informasjon mellom forskjellige økter), lar Claude møte komplekse scenarier med en kontinuitet som bringer den nærmere menneskelig oppførsel. Når det gjelder dette siste aspektet, sa Anthropic:

Når utviklere lager applikasjoner som gir tilgang til Claude sine lokale filer, blir Opus 4 dyktige i å lage og vedlikeholde «minnefiler» for å arkivere nøkkelinformasjonen. Dette låser opp en bedre bevissthet om langvarige aktiviteter, konsistens og ytelse på aktivitetene til agentene, for eksempel Opus 4 som skaper en «navigasjonsguide» mens du spiller Pokémon (se følgende bilde).

Bilde

Fra programvareutviklingen er Claude 4 også beriket med systemet Claude -kodeet sett med verktøy dedikert til programvareutvikling som lar deg integrere Claude direkte i terminalen, i hovedutviklingsmiljøene (for eksempel VS -kode og jetbrains), og å bruke den i sekundær utførelse gjennom en SDK.

På forsiden av Bie (Applikasjonsprogrammeringsgrensesnitt), Har Anthropic introdusert nye funksjoner designet for å lette opprettelsen av avanserte intelligente agenter. Blant disse skiller kodeutførelsen, filhåndtering, integrasjon gjennom kontakter og muligheten for å midlertidig huske spørsmål for å forbedre reaktiviteten ut. Alt dette utvider mulighetene for tilpasning og kontroll for de som utvikler applikasjoner basert på Claude.

Sist, men ikke minstbør understrekesAntropisk engasjement for pålitelighetsfronten. De nye Claude 4 -modellene viser faktisk en 65% reduksjon i bruk av logiske snarveier eller unøyaktige svar sammenlignet med forrige versjon. Dette er et grunnleggende faktum spesielt for de mest følsomme applikasjonene, der riktigheten av informasjonen er essensiell.

Forskjellene mellom Claude Opus 4 og Sonnet 4 -modeller

Å bedre forstå hva som skiller Claude Sonnet 4 fra hans «eldre bror» Opus 4vi starter fra egenskapene til sistnevnte. Opus 4 er for tiden den mest avanserte modellen produsert av antropisk, designet for å møte komplekse arbeidsflyter og langvarige aktiviteter med kontinuitet og presisjon. Det skiller seg fremover i sammenheng med programvareutvikling, der den har overvunnet alle de andre modellene i referanseindeksen Swe-Bench (72,5%) e Terminalbenken (43,2%). Disse testene evaluerer effektiviteten til en modell for å korrigere, generere og forstå reell kode, aktiviteter som krever langvarig minne, forståelse av avhengighet mellom filer og evne til å opprettholde konteksten selv etter mange iterasjoner. Ytelsen til Opus 4 ble validert med store navn i sektoren som for eksempel Replika, Github Og Rakutensom har berømmet evnen til å håndtere langvarige økter uten tap av konsistens eller kvalitet.

Parallelt, Claude Sonnet 4 Det ble utviklet for å bringe en del av disse innovasjonene til en mer tilgjengelig og lett kontekst, ideell for scenarier med daglig bruk. Mens de ikke når beregningstoppene til Opus 4, klarer Sonnet 4 å kombinere hastighet og presisjon på en balansert måte, noe som resulterer perfekt for utviklere, analytikere og reklamer som trenger et kraftig og samtidig reaktivt verktøy. Han viser også utmerkede resultater i referansebenken, som en poengsum på 72,7% på Swe-Benchog viser seg å være spesielt effektiv når det gjelder komplekse instruksjoner, genererer ren og strukturert kode og utfører mer artikulerte resonnementaktiviteter enn versjon 3.7.

Bilde