14 enero, 2011

Usa a Darwin como medida de fama de un científico

Ya en diciembre se había publicado, en la versión online de Science, un análisis profundo de los libros digitales, los cuales comprenden cerca del 4% —unos 5'195,769— de todos los libros alguna vez publicados. En este estudio, matemáticos de Harvard liderados por Jean-Baptiste Michel y Erez Lieberman Aiden, usaron métodos cuantitativos para explorar los patrones lingüísticos e históricos de las 500 mil millones de palabras presentes en los libros digitalizados de Google Books que fueron publicados entre los años 1800 y 2000. A esta data generada fue llamada como culturómica, un análogo a la genómica y las otras "ómicas".

Fue así que John Bohannon (The Gonzo Scientist) se alió con Adrian Veres, uno de los co-autores de aquel estudio y que estaba trabajando en la fama científica basada en los datos de la culturómica para elaborar un Salón de la Fama de la Ciencia, que a diferencia de los salones de la fama tradicionales, este no será elaborado en base a los criterios de un pequeño grupo de expertos quienes hacen de jueces para determinar si un científico debe o no ser considerado apto para formar parte de este selecto grupo.

Según comenta Bohannon, este nuevo salón de la fama será más objetivo ya que se basará en la cantidad de veces que aparece el nombre de una persona en los libros a través de los años. La gran ventaja de este enfoque para elaborar un salón de la fama de la ciencia es que mide también la influencia que tiene el científico o sus trabajos en la sociedad. Por ejemplo, la forma más rigurosa de medir el impacto que genera un científico es a través de las citas generadas por su trabajo, la cual depende de la cantidad de publicaciones que ha realizado y del factor de impacto de las revistas donde ha publicado y donde es citado. Como pueden ver, este impacto es sólo para el científico o para los expertos en una determinada área de la ciencia, pero, si su trabajo es comentado en diferentes medios de comunicación y llega a ser citado en libros, la huella que dejará en la sociedad es mayor.

Para empezar, hay una interfaz en Google Labs, donde puedes analizar los datos en bruto de la culturómica. Esta interfaz te puede ayudar a cuantificar el impacto de tu científico favorito en base a las veces que aparece su nombre en los libros digitalizados. Simplemente lo que debes hacer es digitar el nombre de un científico y seleccionar un rango de años (desde 1800 hasta el 2008) —para que la búsqueda sea sólo en los libros publicados en ese rango— y finalmente le das ENTER. Te aparecerá una gráfica de Años Vs Frecuencia que aparece su nombre en las páginas de todos los libros publicados durante esos años. (ADVERTENCIA: puede ser adictivo). Por ejemplo, yo puse Craig Venter (el que secuenció el primer genoma, el genoma humano y creo el primer genoma sintético), luego puse que busque en los libros publicados desde 1970 y le di ENTER, me salió la siguiente gráfica:


Como pueden ver, el pico máximo se da después del 2003, que es el año donde publicó en Science el primer borrador del genoma humano. Pero, los valores de porcentaje son sumamente bajos, y es obvio porque imagínense la cantidad de libros publicados y digitalizados cada año y el número páginas que existirán en todos ellos juntos. Aún así su nombre aparece en el 0.000004% de las páginas totales de aquel año. Como los valores son tan pequeños se requiere de algún tipo de unidad de medida que sea de fácil interpretación y que permita saber cuan famoso es un científico en base a estos valores. Aquí entra en escena nuestro amigo Charles Darwin.

Darwin es sin dudas un chico famoso. Una búsqueda avanzada en los libros presentes en Google Books entre los años 1839 hasta el 2000, revela que el nombre completo de Darwin aparece al menos una vez en el 2% de todos los libros alguna vez publicados en inglés y sigue en aumento. Por ejemplo, en el 2000, su nombre apareció en el 4% de los libros publicados en inglés ese año. Entonces, como Darwin es bastante famoso, Bohannon y Veres crearon una unidad llamada "Darwin" para calcular la fama de cualquier científico. Esta unidad está definida como la frecuencia promedio anual que "Charles Darwin" aparece dentro de los libros escritos en inglés entre 1839 y el 2000. Como esta unidad de fama es bastante grande, la forma mas conveniente de expresarla es a través de los "miliDarwins" (mD), o sea, la milésima parte de dicha frecuencia anual.

Usando los valores de mD, Bohannon y Veres crearon su primera versión del Salón de la Fama de la Ciencia, el cual es bastante interactivo, para ello Veres diseño un algoritmo que permitía detectar a las personas que eran científicos a partir de la base de datos de Wikipedia. Luego, el siguiente paso fue calcular el valor exacto de fama en base a los nombres completos de los científicos, para así descartar aquellos nombres que son usados para identificar ecuaciones, constantes, fórmulas, metodologías, etc.

La distribución de la fama se rige bajo una ley de potencias, esto quiere decir que el 1% de los científicos con mayor fama como A. Einstein (878mD), M. Curie (189mD) o F. Galton (289mD), son órdenes de magnitud más famosos que la mayoría de científicos que están en el otro 99%. Los requerimientos mínimos para que un científico sea considerado por el algoritmo diseñado por Veres es que su nombre este presente en al menos 40 libros y que tenga una biografía bien estructurada en Wikipedia, esto le da casi de manera automática una fama de 3mD.

Sin embargo, hay grandes científicos que tienen una fama de 1mD, como es el caso del genetista chino Tak Mak, quien junto a sus colegas clonaron los genes de los receptores de las células T humanas en 1984, el cual es considerado como "el santo grial de la inmunología". Este ejemplo nos muestra que aún hay detalles por ajustar.

Este Primer Salón de la Fama de la Ciencia (SHoF: Science Hall of Fame) muestra que los ganadores del Premio Nobel no dominan la SHoF, es más, el 80% de ellos tienen famas menores a 10mD, esto quiere decir que de la lista de los científicos más famosos, los ganadores del Nobel se encuentran ampliamente distribuídos, por un lado tenemos a A. Einstein con 878mD y por el otro a Édouard Guillaume —ganador del Nobel de física en 1920— con 1mD de fama. Con esto concluyen que ganar un Nobel te garantiza que tu nombre aparecerá en los libros lo suficiente como para que te asegures un mínimo de fama.

Otra falla que por ahora tiene este método es que son los representantes de las ciencias sociales lo que tienen mayor fama que los científicos de otras áreas de la ciencia. Esto se debe a que los involucrados con las ciencias sociales (psicólogos, sociólogos o lingüistas) tienden a escribir más libros, aumentanto su fama a diferencia de los químicos o físicos. Además, todavía hay una controversia en si debe ser considerada o no a la sociología como ciencia. Es por esta razón, que el ranking de fama esta ampliamente dominado por los representantes de las ciencias sociales. Debemos bajar hasta los 109mD de fama para encontrar a algún representante vivo de las ciencias naturales, en este caso al biólogo Barry Commoner de 93 años, quien fuera el pionero de los movimientos ecologistas y ambientales.

Por otro lado, hay otros casos como el del matemático Bertrand Rusell, quien tiene una fama de 1500mD (más que el mismo Darwin), quien escribió el libro Principia Mathematica quien es famoso no por hacer matemática sino por sus críticas sociales. Las citas o el número de publicaciones científicas tampoco te garantizan una buena fama. Por ejemplo, el físico Edward Witten, quien es considerado como el científico más citado de todos los tiempos tiene una fama de sólo 8mD, o el matemático Paul Erdos, un prolífico colaborador de todos los matemáticos del mundo, quien ha publicado más de 1400 artículos (como autor principal y co-autor) pero sólo tiene una fama de 3.5mD.

Si quieres ser famoso, escribe un libro que llegue a ser muy popular. En este caso, el mejor ejemplo es el de un profesor de bioquímica de la Universidad de Boston llamado Isaac Asimov (183mD), quien se hizo muy famoso gracias a sus libros de ciencia ficción. También tenemos como buenos ejemplos a reconocidos divulgadores científicos como el físico Carl Sagan (152mD) o el biólogo Richard Dawkins (90mD).

Lo más gracioso es que muchos científicos se vuelven famosos no precisamente por hacer ciencia sino por estar involucrados en ciertos escándalos y controversias, por ejemplo el matemático Ted Kaczynski (5 mD) y el físico Klaus Fuchs (84 mD) por estar involucrado en un caso de espionaje nuclear del proyecto Manhattan. Así que si quieres ser famoso, es recomendable escribir algo que sea bastante controversial, el mismo Darwin (1000mD) es un claro ejemplo de esto, ya que su Teoría de la Evolución removió a toda la comunidad científica de la época y lo sigue haciendo hasta nuestros días.

0 comentarios:

Publicar un comentario

Se respetuoso con tus comentarios y críticas. Cualquier comentario ofensivo será eliminado.