Hvordan bestemmer algoritmer hva de skal anbefale til oss og vet hva vi liker

- Ole Andersen

Vi er hele tiden omgitt av digitale forslag: hver gang vi går inn på en strømmeplattform eller besøker en e-handelnoen algoritme basert påkunstig intelligens jobber for oss med å kuratere utvalget av innhold vi finner foran oss, det være seg digitalt innhold, produkter å kjøpe, og så videre. Dette systemet, teknisk definert anbefalingsmotorer basert på analysen av store data og på komplekse algoritmer maskinlæring designet for å tolke vår tidligere atferd og forutse våre fremtidige ønsker. Hensikten med disse teknologiene er todelt: på den ene siden hjelper de oss brukere til å orientere oss i endeløse kataloger, slik at vi kan oppdage filmer, sanger eller produkter som vi vil slite med å finne på egenhånd, og på den andre siden er de avgjørende for at bedrifter skal holde vårt engasjement høyt og stimulere salget. Det er ingen tilfeldighet at markedet for disse systemene nesten er verdt det i dag 7 milliarder dollarmed dette tallet som forventes å tredobles i løpet av de neste årene.

Men Hvordan bestemmer algoritmer hva de skal anbefale til oss? Oppsummert begynner prosessen med omfattende innsamling av våre databåde de som er gitt frivillig og de som er utledet fra våre nettaktiviteter. Denne informasjonen lagres i enorme databaser, analyseres for å identifisere tilbakevendende mønstre og filtreres til slutt gjennom tre hovedmetodikker: samarbeidsfiltreringsom sammenligner oss med andre lignende brukere; den som er basert på innholdsom analyserer de iboende egenskapene til det vi allerede har satt pris på; hei hybridsystemer. Selv om disse algoritmene dramatisk forbedrer brukeropplevelsen vår, bringer de med seg betydelige utfordringer, fra behovet for å beskytte personvernet vårt og overholde regelverk, til risikoen for å møte skjevheter lært fra selve dataene, til den tekniske kompleksiteten ved å gi oss forslag i sanntid. La oss gå dypere inn i emnet og ta i betraktning at anbefalingssystemer kan ha forskjellige spesifisiteter og modus operandi ulik hverandre.

Hvordan anbefalingsalgoritmer fungerer og hvilke fordeler de gir

Å forstå fullt ut hvordan anbefalingsalgoritmer er i stand til å tyde vår smakmå vi analysere 5 driftsfaser som forvandler våre interaksjoner til nøyaktige spådommer, fra første faseden datainnsamlingsom representerer hoveddrivstoffet i hele prosessen. Anbefalingsmotorer lever av to kategorier spor som vi legger igjen på nettet: i eksplisitte datadet vil si våre direkte og bevisste handlinger, for eksempel en «Like», en skriftlig anmeldelse eller en stjernerangering, ei implisitte datamye mer tallrike og subtile, som inkluderer nettleserhistorikken vår, klikk, tidligere kjøp eller til og med tiden vi bruker på å se på et produkt. De legges ofte til disse demografiske og psykografiske datafor eksempel vår alder eller livsstil. Alle disse dataene, når de er samlet inn, går videre til andre fasedet av arkivering. Det er på dette tidspunktet at dataene lagres i komplekse lagringsstrukturer, kjent som datavarehus eller datainnsjø. Når de er «lagret», går dataene til tredje fasedet av analyserder maskinlæringsalgoritmer ser etter matematiske korrelasjoner å skape prediktive modeller.

Der fjerde faseen av de viktigste, er at av filtreringsom bestemmer logikken i forslaget. I samarbeidsfiltreringbrukt massivt av giganter som f.eks Amazon Og Spotifyer systemet basert på antagelsen om at hvis vi og en annen bruker har hatt lignende preferanser tidligere, vil vi sannsynligvis fortsette å ha dem; hvis vi likte de samme filmene som en annen bruker, vil algoritmen også anbefale de han har sett og vi ikke har. Denne metoden kan være basert på hukommelsenberegner nærheten mellom brukere eller det kan være modellbasertutnytte nevrale nettverk av dyp læring å fylle hullene i våre preferanser. Hovedgrensen her er den såkalte «kaldstarten»: hvis vi er nye brukere og ikke har historikk, sliter systemet med å identifisere oss.

Alternativet er innholdsbasert filtreringsom i stedet for å observere andre brukere, fokuserer på egenskapene til objektene vi likte. Hvis vi lyttet til en sang med visse tagger, sjanger og rytme, Algoritmen vil behandle oss som vektorer i et vektorromog tilbyr oss andre sanger «nær» de kjente. Denne tilnærmingen løser det nettopp nevnte problemet med den skjebnesvangre «kaldstarten», men risikerer å låse oss inn i en boble der vi alltid blir tilbudt ting som er for like de vi allerede kjenner, og begrenser oppdagelsen av det nye.

For å overvinne feilene ved begge filtreringsmetodene, plattformer som f.eks Netflix de adopterer hybridsystemerveldig kraftig, men dyr i form av beregning. Fordelene for opplevelsen vår er håndgripelige: vi sparer tid ved å unngå endeløs rulling og vi oppdager relevant innhold, så mye at 80 % av Netflix-seingen kommer fra disse forslagene.

Kritiske problemstillinger knyttet til anbefalingssystemer

Uansett anbefalingssystem i bruknoen mangler ikke kritikalitet iboende i denne teknologien. I tillegg til kompleksitet av å administrere millioner av samtidige anbefalinger, er det en risiko for at algoritmer lære og forsterke sosiale fordommer tilstede i treningsdataene, og genererer partiske anbefalinger, uten å glemme det delikate personvernproblem knyttet til den massive innsamlingen av vår personlige informasjon. Det er så mye å si om de kritiske spørsmålene til disse systemene, og det er et så stort og grenseløst emne at det fortjener en ad hoc-studie.