18 de octubre de 2011

Una imagen vale más que 500 mil millones de palabras

Pozo de sabiduría infinita, los libros.
Erez Lieberman Aiden y Jean-Baptiste Michel son dos profesores de la Universidad de Harvard fundadores del proyecto Cultoromics. Un estudio de la lexicología computacional que se interesa en el comportamiento humano y las tendencias culturales a través del análisis de textos digitalizados.

Evolución de las palabras "crisis" y "esperanza" desde el año 1800 hasta el 2000.
Gracias a los 15 millones de libros escaneados por Google Books y de la adictiva herramienta
"n-gramas de Google Labs" que te permite buscar palabras en una base de datos del aproximadamente 4% de todos los libros publicados, Aiden y Michel nos muestran en esta charla TED algunas de los datos sorprendentes que podemos aprender partiendo de 500.000 millones de palabras:



Michel y Aiden ayudaron a crear el Visor Ngram, un modelo n-gram que analiza en los libros de la biblioteca digital de Google los patrones culturales de la lengua a lo largo de 200 años. Herramienta que sirvió para investigaciones que fueron capaces de predecir el efecto de la Primavera Árabe y de calcular el lugar donde se ocultaba Bin Laden con un error de apenas 200 km.

With digitized text from five million books, one is never at a loss for words
Culturomics research uses quarter-century of media coverage to forecast human behavior


Otras 'palabras' en Meridianos:
Cristina Calderón, la última portadora de las palabras del fin del mundo
Titina la palabra más larga en todos los idiomas
Palabras raras
El poema más corto en lengua inglesa
Un mensaje para dentro de 5000 años
¿De donde viene la palabra "Google"?
Todos los sonidos japoneses en un poema
Historia del Alirón
La nube sin nombre
La navaja oculta de Ockham
El sepulcro de un bufón en la Catedral de Barcelona
Daghe l'aiga a le corde! (¡Agua a las cuerdas!)
Por los cuernos de Moisés