Hvor kommer CAPTCHA-bilder fra? - Nordnesrepublikken

«Velg alle bilder med en buss». Hvem vet hvor mange ganger du har måttet bestå en online sikkerhetssjekk, den såkalte CAPTCHAog må velge alle boksene som inneholder en buss, trafikklys, fotgjengerfelt eller en sykkel. Har du noen gang lurt på Hvor kommer disse bildene fra og hvorfor sendes de til oss? Mange av bildene som brukes er fra Google Street View. Disse testene tjener til å blokkere tilgang til roboter, det vil si automatiserte programmer designet for å utføre repeterende og ofte ondsinnede handlinger.

Det originale systemet ble designet i 2007 av forskere av Carnegie Mellon University og ble Googles eiendom i 2009med oppkjøpet av selskapet reCAPTCHA Inc.. I sine tidlige inkarnasjoner brukte systemet ikke fotografier, men baserte seg helt på tolkningen av bilder som inneholder bevisst forvrengte typografiske tegn.

Målet var å utnytte menneskelige visuelle evner for å forbedre teknologien OCR (Optisk tegngjenkjenning), eller optisk tegngjenkjenning, ved å la brukere transkribere ord som er vanskelige å gjenkjenne automatisk, for å trene optiske tegngjenkjenningssystemer. Etter det som ble erklært av TechCrunch i en artikkel fra 2012, «systemet er utviklet for å redusere spam og svindel, men det hjelper også med å digitalisere teksten til trykt materiale, som bøker og aviser. Google bruker for eksempel reCAPTCHA for å digitalisere innholdet i Google Books og Google News-arkiver».

Starter fra 2012tilnærmingen endret seg med introduksjonen av fotografier hentet fra Google Street View-prosjektet. Etter de første tegnene på nyhetene angående tilstedeværelsen av bilder i CAPTCHA-er, bekreftet en Google-talsperson nyhetene med følgende uttalelse:

(Hos Google) trekker vi ut data som gatenavn og gateskilt fra Street View-bilder for å forbedre Google Maps med nyttig informasjon som bedriftsadresser og lokasjoner. Basert på dataene og resultatene fra disse reCAPTCHA-testene, vil vi avgjøre om bruk av bilder også kan være en effektiv måte å videreutvikle verktøyene våre for å bekjempe online misbruk forårsaket av roboter og algoritmer.

Noen eksperter hadde til og med antatt at interaksjonen mellom brukere i å gjenkjenne trafikklys, fotgjengeroverganger, kjøretøy osv. tjente til å trene de kunstige intelligensalgoritmene som ligger til grunn for det autonome kjøresystemet til Waymoet datterselskap av Google, men rundt midten av 2021 selskapets representanter hadde uttalt en Vox det «selskapet bruker ikke disse bildedataene til å trene sine autonome biler».