Captchas do bem

Não faz muito tempo, escrevi aqui uma coluna desancando os CAPTCHAs. Para quem não leu (ou não se lembra), esse é o nome que se dá ao inconveniente sistema que mostra palavras ou números aleatórios e pede para você lê-los e digitá-los quando quer interagir com alguns sites ou blogs como esse aqui, ó.

Essas palavras ou números servem para o administrador do site saber que você é uma pessoa, não um robô virtual tentando fazer spam ou burlar o sistema. Aí, ele pede para você fazer uma coisa que um software ainda não consegue, mas um ser humano tira de letra: ler uma palavra mal impressa, distorcida ou meio apagada.

A questão é que saber se você é humano ou não é um problema do administrador do site, não seu. É injusto você perder seu tempo para fazer o trabalho dele. Você é o cliente; ele que se vire com um bom anti-spam para resolver o problema.

E tem mais: você sabia que uma pessoa gasta, em média, 10 segundos para responder um CAPTCHA e todo dia são mais de 200 milhões dessas coisas digitadas por esse mundão de meodeos? Pois é, faça as contas: 200.000.000 x 10 segundos de tempo perdido. São 64 anos de trabalho humano inteligente (que um computador não faz) jogados no lixo todo santo dia. Não é mesmo para se revoltar?

Pois é, Luis von Ahn, o pai (ou um dos pais) da criança, passado o orgulho inicial do sucesso, viu que tinha criado um monstro e ficou com a consciência pesada (com razão). Aí, sujeito inteligente que é, botou a massa furta-cor para trabalhar e teve uma ideia nada menos que genial.

Bom, todo mundo sabe que há um movimento mundial para a digitalização de livros. A Amazon, o Google e mais um monte de instituições grandes estão digitalizando todo o seu acervo para que mais gente possa ter acesso. Então eles colocam página por página de cada documento impresso em um scanner e um software transforma a imagem em texto, interpretando e convertendo palavra por palavra. A questão é que nos livros mais antigos e amarelados, a legibilidade está comprometida e o softwares não conseguem “ler” várias palavras.

Daí que o Luis pensou: os computadores não podem, mas as pessoas sim. Por que não colocar essas palavras que ficaram pendentes (são quase 30% do total, segundo o próprio) como CAPTCHAS? Aí o tempo que os viventes usam para digitar não seria jogado fora; eles estariam ajudando a traduzir um patrimônio da humanidade. Bingo!!

Ok, mas se o computador ainda não sabe o que significa aquela palavra, como é que ele vai conferir se a pessoa digitou certo e ela não é um robô chutando qualquer coisa?

Aha, mas esse caras são espertos e não se deixam abater por tão pouco. Pois eles fazem o seguinte: colocam duas palavras. Uma o software já conseguiu ler, a outra não. A pessoa precisa digitar as duas sem saber qual está traduzindo. Se 10 pessoas interpretarem aquela palavra da mesma maneira, significa que o problema foi resolvido. Está certo que nisso vão mais que os 10 segundos, mas pelo menos o tempo não está sendo jogado fora.

E olha agora o mais impressionante: o povo (incluindo você e eu) está traduzindo mais ou menos 100 milhões de palavras por dia, o que equivale a 2,5 milhões de livros por ano. Não é o máximo?

Luis von Ahn chama esse novo sistema de reCAPTCHA e agora, pelo menos na minha opinião, o cara se redimiu e com louvor.

Continuo achando que não se deve obrigar o cliente a fazer parte do seu trabalho, assim como não se deve dificultar que ele faça uma coisa que é de seu interesse, como comentar num blog ou preencher um cadastro, por exemplo.

Mesmo assim, se o administrador do lugar não está ligando muito para o conforto e o tempo alheios, pelo menos que use um reCAPTCHA. E que não se esqueça de explicar que seu cliente está trabalhando compulsoriamente, mas também contribuindo para um projeto maior.

É o mínimo.

***

PS: Os dados numéricos e as informações sobre o reCAPTCHA saíram de uma palestra que o próprio Luís von Ahn deu no TED (lá ele fala de um outro projeto muito bacana. Clique aqui para ver o vídeo). Dica luxuosa do queridíssimo Guto de Lima que me conhece bem e sabia que eu ia adorar saber disso (obrigadão, valeu mesmo!).

* CAPTCHA: Completely Automated Public Turing Test to tell Computers and Humans Apart ou Teste Público de Turing Completamente Automatizado para Diferenciação de Computadores e Humanos.

8 Responses

  1. 19 abril 2012 at 8:58 pm

    Este artigo ainda não tem nenhum comentário? Que injustiça!
    Este texto é extremamente útil e esclarecedor. (agradeço a Lígia pela pesquisa).
    Estou conversando com o pessoal que trabalha no meu site pra ver se a gente incorpora isso aí. Vamos participar do projeto.

    • ligiafascioni
      Responder
      20 abril 2012 at 12:31 pm

      Que bom, Ênio! Pois é, o povo não é muito de comentar, e olha que meu blog nem CAPTCHAS tem…ehehehehe

  2. anna
    Responder
    22 abril 2012 at 5:15 pm

    merece mesmo um comentário: adorei descobrir que os captchas têm tudo a ver com o teste de turing! e que podem ter um lado bom…
    e aliás, gosto muito do blog! virei fã.

    • ligiafascioni
      Responder
      23 abril 2012 at 1:37 pm

      Obrigada, Anna! Volte sempre 🙂

  3. willian
    Responder
    23 abril 2012 at 10:36 am

    Excelente! Por via das dúvidas, esses livros que serão traduzidos pelo Amazon e pelo Google serão disponibilizados para todo o público né?

    • ligiafascioni
      Responder
      23 abril 2012 at 1:36 pm

      Ah, isso eu já não sei, William. Mas acho que estarão nas bibliotecas; aí ficam disponíveis para todo mundo. Na verdade, não sei como fica isso com arquivos em bibliotecas. Mas acho que sim (espero)!

  4. 2 maio 2012 at 9:41 am

    Lígia, querida.
    Esta é pra você se sentir orgulhosa: acaba de entrar em cena, no meu site (http://www.eniopadilha.com.br/artigo/2777), o novo sistema de CAPTCHAS, motivado por este seu artigo “Captchas do Bem”

    Obrigado pelo esclarecimento valioso.

    • ligiafascioni
      Responder
      2 maio 2012 at 2:51 pm

      Uhuuu!!! Eu é que agradeço, querido!
      Beijocas e sucesso 🙂

* All fields are required