El Book scraper es una de esas interesantísimas herramientas que van surgiendo pero a la que uno jamás le encuentra una utilidad concreta.
Este programa, creado por The Times, permite explorar el vocabulario de cientos de libros y autores. Entonces, por ejemplo, se puede explorar por autor y descubrir que el vocabulario de Shakespeare rondaba las 24.000 palabras; se puede buscar por palabra y ver que, por ejemplo, la palabra Argentina aparece 4 veces en El Conde de Montecristo, de Alexandre Dumas.
También se puede comparar el vocabulario entre dos libros. Por ejemplo, vemos que en Ana Karenina se utiliza el 43% del vocabulario que se utiliza en Moby Dick, sin embargo, Ana Karenina tiene más de 351.000 palabras mientras que Moby Dick tiene 215.000. Nos indica también que la palabra más larga que aparece en la novela de Tolstoi (de 19 letras) es straightforwardness; mientras que en la de Melville (de 20 letras) es uninterpenetratingly.
En fin, es una de esas cosas interesantes pero que no dejan de ser una pérdida de tiempo.
Interesante, aunque se debería comparar dos obras de la misma lengua y no entre obras traducidas.
Lo marco para revisarlo algún día en que esté muy, muy aburrida
jajaja Dayana! Tanto tiempo!
Un gusto tenerte por acá.
http://labs.timesonline.co.uk/bookscraper/words/boring
jajaja