Dolphingemma, den nye Google AI -modellen for å tolke språket til Dolphins

Å forstå delfiner er ikke lenger bare en drøm for etologer og fans av den marine verden: i dag, takket væreKunstig intelligensNye stier som er åpne for en dypere kommunikasjon mellom mennesker og cetaceans. I anledning World Delfini Day, Google har kunngjort et ekstraordinært resultat: Dolphinxen modell å utvikle i samarbeid med Georgia Institute of Technology og WDP (Wild Dolphin Project), er i stand til å analysere vokaliseringene av delfinene og generere nye lignende lyder på en realistisk måte. Dette prosjektet representerer et viktig skritt fremover i Forståelse av «språket» i Atlanterhavet makuolat delfiner (Stenella frontalis), en art som ble studert i dybden i over tretti år.

Ved å kombinere en enorm mengde data samlet inn under vann med avanserte lydalgoritmer, kan Dolphingemma identifisere tilbakevendende lydmønstre, og åpne veien for en interaktiv kommunikasjon mellom arten. Og det slutter ikke her: gjennom et system som heter ChatFormer for toveis dialog blir også testet, ved bruk av kunstige lyder for å lette interaksjon med dyr.

Fødselen av Dolphingemma -modellen

I flere tiår var språket til delfiner et fascinerende mysterium. Fløyter, klikk, nynn og impulsive lyder fylte forskernes lydarkiver, men å tolke betydningen deres har alltid vært en kompleks oppgave. De Wild Dolphin Projectaktiv siden 1985 i Bahamas vann, gjennomførte han den lengste feltundersøkelsen som noen gang er utført på et enkelt samfunn av delfiner. Hans ikke -invasive tilnærming – oppsummert i mottoet «i deres verden, til deres forhold» – har gjort det mulig å samle et enkelt arkiv: tiår med lyd- og undervannsvideo med omsorg nøye på atferden og individuelle identiteter til de observerte delfinene. Disse data eiendelene gjorde det mulig å starte Koble spesifikke lyder til tilbakevendende atferdssituasjoner: For eksempel jeg «Karakteristiske fløyter»ligner på riktige navn, pleide å huske hverandre eller «Squawk» intermitterende, assosiert med konflikter mellom individer.

Det er på denne veldig rike korpus at Google -teknologien ble podet. Dolphinx er en Avansert lydmodell basert på arkitektur Perleen serie med lette og åpne språklige modeller. I motsetning til bare tekstmodeller, Dolphingemma er lyd-inn og lyd-ut: Lytt til en lydsekvens av delfinene, analyserer den interne strukturen og genererer en sammenhengende fortsettelse, akkurat som prediktive språklige modeller gjør med ord. Baseteknologien er avhengig av Soundstreamen lydtokenisator som kan representere komplekse vokalsignaler effektivt, og en modell med omtrent 400 millioner parameterestørrelse for å jobbe selv på smarttelefoner, spesielt jeg Google Pixel brukt direkte på feltet.

I tillegg til analysen av naturlige lyder, inkluderer prosjektet en annen forskningsfront: Bidireksjonell kommunikasjon. Her kommer systemet inn Chat (Cetacean Hearing Augmentation Telemetry), et undervannsgrensesnitt utviklet seg sammen med Georgia Tech. Chat tar ikke sikte på å direkte oversette språket til delfiner, men å skape et delt ordforråd fra kunstige fløyter. Disse lydene, assosiert med familieobjekter med delfiner, som alger eller spill, presenteres i den naturlige konteksten. Hvis en delfin imiterer den tilsvarende fløyten, kan han motta det aktuelle objektet, og dermed styrke assosiasjonen.

Bruken av Google Pixel -telefoner i disse eksperimentene representerer en viktig fordel: det gjør det mulig å redusere behovet for spesifikk maskinvare, senke kostnader, forbruk og størrelsen på utstyret. De siste modellene av smarttelefonen «Big G», for eksempel Pixel 9, er i stand til å utføre begge modellene av Dyp læring som en delfinx som algoritmer av MalmatchingDet vil si å sammenligne med allerede kjente lyder, forbedre systemets evne til å svare raskt på vokaliseringene av delfinene. Forskere kan dermed få øyeblikkelig tilbakemelding gjennom beinledningshodetelefoner, og forblir nedsenket i det marine miljøet.

Åpningen av prosjektet til det vitenskapelige samfunnet

Et avgjørende aspekt av prosjektet er hans åpner for det vitenskapelige samfunnet. Google har kunngjort at det vil dele Dolphingemma som Open source -modell sommeren 2025gjør det tilgjengelig for forskere som også jobber med andre arter av cetaceans, for eksempel Tursopi eller Dolphins med en lang talerstol. Selv om det vil være nødvendig å tilpasse modellen til de spesifikke vokaliseringene av hver art, letter den modulære strukturen i Dolphingemma dens tilpasning og skalerbarhet.