cisco40 40x40f oracle40 oracle40 lgo4

Cada vez que completas un Captcha estás trabajando gratis

captcha4

Si aún no sabes cómo funcionan los captcha, puede que te sorprenda saber que buena parte de ellos están basados en el trabajo gratis.

CAPTCHA viene de “Completely Automated Public Turing test to tell Computers and Humans Apart”, “Test de Turing complétamente automatizado para distinguir entre ordenadores y humanos”. El nombre lo dice todo, ¿verdad?

Fue creado a principios de los 2000 por el equipo dirigido por Luis von Ahn, cuando el problema de los bots empezó a resultar más evidente. El concepto básico de los Captcha es modificar una imagen con palabras, letras o números de tal manera que un programa OCR (de reconocimiento de caracteres) no sea capaz de distinguirlos, pero sí una persona normal.

Captcha no era un sistema perfecto, claro, como se demostró cuando los spammers empezaron a contratar a cientos de personas por cantidades irrisorias, principalmente en China, únicamente para resolver Captchas uno detrás de otro.

Pero funcionaba lo suficientemente bien como para dejar fuera a muchos bots, al menos. Pero a von Ahn no se le escapó la ironía de que tantísimas personas estuviesen descifrando palabras que no tenían ningún significado ni propósito, y se propuso arreglar esto.

Así nació reCAPTCHA, un nuevo proyecto basado en la misma idea, pero con una base diferente. En vez de aplicar filtros y estirar las letras dispuestas aleatoriamente, reCAPTCHA obtenía las palabras de una enorme base de datos de páginas escaneadas con algún tipo de problema, como por ejemplo, fallos de impresión, palabras impresas hace tanto tiempo que habían perdido la tinta, palabras escritas en papel roto o mojado, o palabras raras que no estaban en ninguna base de datos.

Si te fijas, reCAPTCHA siempre muestra dos palabras, una de las dos tiene un significado conocido en la base de datos, y la otra no ha podido ser reconocida por el software OCR. Cuando rellenamos un reCAPTCHA, en realidad el sistema sólo comprueba que hemos escrito bien una palabra, la que sabe cuál es.

En el caso de la palabra desconocida, guarda lo que hemos escrito, y una vez que suficiente gente ha escrito lo mismo, guarda el nuevo significado en la base de datos. Por lo tanto, en la práctica sólo tenemos que escribir una de las dos palabras que vemos para pasar el test, pero para eso tendríamos que saber cuál de las dos es la palabra desconocida para el sistema (aunque en algunos casos es fácil de ver).

¿Qué idea más loca, emplear a los propios usuarios para que hagan tu trabajo de manera gratuita, verdad? Pues curiosamente hubo mucha gente interesada en la tecnología, empezando por el periódico The New York Times, con su base de datos de periódicos viejos que no era capaz de consultar porque los ordenadores no eran capaces de leerlos.

captcha3

Poco después el proyecto reCAPTCHA llamó la atención de Google, y el resto es historia. El gigante de Internet tenía gigantesca tarea por delante, escanear y digitalizar todos los libros que existen para el mayor catálogo online de la red, Google Books.

La compañía se había encontrado con el mismo problema, tenía acceso a una gran cantidad de material pero no tenía manera de descifrar automáticamente los papeles doblados, las tintas desaparecidas y las manchas de café. Así que reCAPTCHA fue una de las compras más claras de su historia.

Así fue como toda Internet ayudó a Google a digitalizar libros, de manera gratuita, y ofreciendo un servicio contra bots al mismo momento. Eso hasta hace dos años, cuando quedó claro que los spammers habían conseguido la tecnología y la potencia necesaria para pasarse estos test sin problemas.

Entonces nació noCAPTCHA, una nueva versión que ya no pide introducir palabras, sino que se basa en detalles como nuestra navegación, nuestras cookies y nuestro comportamiento; basándose en esos datos, Google puede llegar a la conclusión de que somos usuarios verídicos, y sólo tendremos que pulsar en una casilla para demostrar que no somos un bot.

 

Cursos disponibles
Inscribite hoy mismo!
CCNA 1 v7: Introduction to Networks
Inicia: 16/01/2025
Online | Intensiva
CCNA 2 v7: Routing, Switching and Wireless Essentials
Inicia: 16/01/2025
Online | Intensiva
CCNA 3 v7: Enterprise Networking, Security and Automation
Inicia: 16/01/2025
Online | Intensiva
ver todas