fredag 18. april 2008

Genialt!

Av og til er det nokon som klarer å snu eit samfunns-problem til samfunnsnytte. Verifiseringssystemet CAPTCHA (Completely Automated Turing Test To Tell Computers and Humans Apart) fungerer på ein slik måte. Det blir brukt til den velkjende verifiseringa med å skriva inn ein tekst som blir presentert grafisk, for å hindra automatisk tilgang til tenester.

reCAPTCHA er eit prosjekt som hentar tekstane som blir fordreid grafisk, frå gamle bøker. Brukarane som blir bedne om verifisering av teksten bidreg dermed direkte til digitalisering av bøker. Enkelt og genialt. Neste gang du har bruk for ei verifiseringsteneste bør du altså bruka CAPTCHA.

7 kommentarer:

i1277 sa...

Herlig måte å nyttiggjøre seg av det arbeidet summen av alle våre små klikk og tastetrykk faktisk utgjør. Minner litt om the ESP Game og Google Image Labeler, som utnytter vår iboende hang til spill og moro til å løse problemet med å beskrive bilder på nettet.

Enkelte spammere har visstnok brukt lignende metoder for å komme seg inn på CAPTCHA-sikrede systemer: De snapper opp CAPTCHA-bildet, og bruker det selv ved innloggingen til en side som tilbyr "gratis porno" - dermed er det bare å høste fruktene av arbeidet tusener av villige CAPTCHA-knusere utfører. De skal ha for kreativiteten...

Ellers bør det bemerkes at bruken av CAPCTHAs er ganske kontroversiell i og med at det er flere enn datamaskiner som ikke kan se den forvrengte teksten de inneholder. W3C har forståelse for at store nettsteder trenger å verifisere at det er en identitet bak en bruker, men anbefaler at sider med lav trafikk unngår bruk av CAPTCHA - for slike er som regel spamfilter og manuell oppfølging bedre. Og bruker man CAPTCHA bør en selvfølgelig tilby alternativer til brukere som har problemer med teknologien.

Ola Haugen Havrevoll sa...

Men korleis kan tenaren vita at ordet (frå den gamle boka)du skriv er rett, om han ikkje sjølv veit det alt?

Svein Ø sa...

Godt spørsmål. På Wikipedia står det at den som loggar inn blir presentert for to ord; det eine ordet er kjent for maskina medan det andre ordet er ukjent. Programmet går då ut frå at dersom det kjende ordet blir rett skrive, er sjansen stor for at det andre ordet også er rett.

I tillegg blir dei same to orda gitt til ein annan brukar, og dersom dei to brukarane gir same svaret, oppfattar reCAPTHCA det som rett.

Det står elles å lesa at det ved bruken av reCAPTHCA dagleg blir utført 3000 timeverk (des. 2007) gratis oversetjingsarbeid!

Anonym sa...

Dette er et system som utestenger alle med synshemming! og som ikke kan se bilder.
Les http://www.bekkelund.net/blogg/2007/10/24/captcha/

Svein Ø sa...

Tilgjengelegheit for svaksynte er ei stor utfordring ved CAPTHCA og tilsvarande løysingar. Men CAPTHCA har trass alt høgtlesing av orda som skal tastast inn.

Martin Bekkelunds innvendingar mot CAPTCHA er eg ikkje einig i, då må ein vera grunnleggjande ueinig i autentisering. Alle autentiserings-løysingar eg kjenner til, har ei utfordring når det gjeld interaktivetet, og den er veldig vanskeleg å komma utanom. Dei fleste aut.løysingar har også ei dårlegare løysing enn CAPTHCA når det gjeld tilgj.heit.

Anonym sa...

Olas poeng er godt: Det ene ordet i reCaptcha er kjent (gjennom tidligere ocr-tolking), og det er bare dette ordet reCaptcha kan validere mot. Det andre ordet er det således hipp som happ om en robot tolker riktig eller galt.

Sikkerheten i reCaptcha ligger således i streken og at ordet er bøyd/bølget.

Ellers er captcha et av få eksemler på ren attributtautentisering, en vellyket captcha bekrefter attributtet "jeg er ikke en maskin".

Det ligger i captchaens natur at den ikke skal kunne omgås ved hjelp av maskiner alene. Funksjonshemmete er derfor avhengige av at captchaen utnytter en menneskelig egenskap hvor de ikke er funksjonshemmet. ReCaptcha støtter altså lyd (om enn temmelig vanskelig!) i tillegg til tekst - og dekker derfor både syns- og hørselshemmede, men ikke døvblinde.

Captcha er et registrert varemerke. "Human interaction proof" er et alternativt, og muligens bedre, begrep. På norsk er det kanskje best å bruke uttrykket "skriptsperre" eller "automatiseringssperre", selv om disse begrepene er noe romsligere enn Captcha.

Lars Marius Garshol sa...

Jeg ville vært forsiktig med begrepet "skriptsperre". Det er veldig lett å oppfatte det som noe annet. Jeg ville f.eks si at jeg bruker det på bloggen min, siden den eneste antispam-funksjonen jeg har der er at jeg antar brukeren ikke kjører JavaScript, og gjør noen veldig enkle ting basert på det. Det har så langt fungert 100%.