Tirar 200 veces una moneda

 

 

De acuerdo con lo que escribió Malcolm W. Browne en un artículo que apareció en el New York Times, el doctor Theodore P. Hill pidió a sus estudiantes de Matemática del Instituto de Tecnología de Georgia que hicieran el siguiente trabajo en sus casas:

 

“Tomen una moneda, arrójenla al aire 200 veces y anoten los resultados que obtuvieron. Si no tienen ganas de hacerlo, pretendan que lo hicieron, y anoten lo que les parece que podría darles”. Al día siguiente, cuando los alumnos trajeron los resultados, con asombro observaron que el profesor podía detectar, casi sin errar, quiénes habían efectivamente tirado 200 veces la moneda al aire y quiénes no.

 

En una entrevista, Hill dijo que lo que sucedía era que la gente no tenía idea de lo que realmente significa el azar. Por lo tanto, cuando tiene que inventar datos, lo hace de acuerdo con su creencia y, como en general suele errar, es fácil descubrir quién se tomó el trabajo de hacer el experimento, y quién, en su defecto, eligió imaginarlo.

 

¿Usted diría que es alta o baja la probabilidad de que aparezcan seis o más caras consecutivas, o bien seis (o más) cecas consecutivas? Imagino que su respuesta será: “Bastante baja”. Es posible que ni usted ni yo sepamos cómo explicar esto, pero la intuición que tenemos nos hace sospechar que es poco probable que sucedan seis o más caras o cecas consecutivas en 200 tiradas. ¿Está de acuerdo conmigo en esto? ¿O cree que la probabilidad es alta?

 

Lo notable es que la probabilidad de que esto suceda es muy alta. Eso fue lo que comprobó Hill y lo escribió en un artículo que apareció en la revista American Scientist hace casi diez años. En particular, eso también es consecuencia de la Ley de Benford, y es tan antiintuitiva que, como hemos dicho, permite detectar a aquellos que quieren fraguar datos impositivos, por ejemplo, u otro tipo de fraudes por el estilo.

 

 

Los números suelen empezar por «1»

Cory Doctorow cuenta que los números suelen comenzar más frecuentemente por «1» que por cualquier otro dígito.

Una teoría matemática llamada Ley de Benford predice que en un conjunto determinado de números, aquellos cuyos primer dígito es «1» aparecerán de forma más frecuente que los números números que empiezan por otros dígitos. Benford, un físico de General Electric formuló esta ley en 1938, tras descubrir que un libro de tablas de logaritmos de GE había bastantes más páginas dedicadas a los números que empezaban por «1» que a los demás. Como los números que empiezan por «1» aparecen tan a menudo, es posible descubrir a tramposillos (con los impuestos, con los deberes de clase, etc.) simplemente comprobando si los números que se inventan tienen esa desviación hacia los que comienzan por «1» más frecuentemente que los otros, o no. Este sistema no es perfecto, claro – en un artículo de 1998 el New York Times explicaba que gente que tiene dietas de 25 dólares para cenar a veces pasaba tickets de 24,90… pero aun así es fascinante.

Como dice Cory, la ley de Benford es realmente fascinante. Benford trabajó con más de 20.000 conjuntos de números de todo tipo: longitudes de ríos, estadísticas de béisbol, números de las calles de cientos de personas, hasta poder tener datos suficientes para enunciar su teoría. Como se ve en el gráfico del artículo, la frecuencia esperada para números que comienzan por 1 es casi del 30%, para el 2 es de un poco más del 17%, para el 3 algo más del 12% y para el resto disminuye. Los conjuntos en los que sucede esto muestran invariancia de escala: si se trata de un conjunto como valores de la bolsa o de divisas, da igual si se usan tablas en yenes o dólares o euros, por ejemplo.

Como apunta Cory, el artículo original del New York Times contiene algunos errores matemáticos obvios (en el cuadro de ejemplos), pero aun así es una buena explicación.

Buscando por ahí encontré Benford's Law en MarthWorld, uno de mis sitios de referencia favoritos, mucho más tecnico y a la vez preciso. Allí se explica esta ley fenomenológica con muchos más ejemplos asombrosos. El más fácil de comprobar es tal vez utilizar una base de datos de direcciones con números de calles (el 30 por ciento más o menos deben empezar por «1»). La fórmula, cuando es aplicable a un conjunto de datos, es algo así como:

La probabilidad de que el primer dígito de X sea n es aproximadamente

Log10(n+1) - Log10(n)

Al parecer este fenómeno tiene que ver con cómo los seres humanos usamos los números en la práctica a partir de conjuntos procedentes de la la naturaleza (o el MundoReal™). No fue hasta 1996 que un matemático llamado Ted Hill dio con una demostración matemática de lo enunciado por Frank Benford en 1938, a pesar de que la ley resultaba obvia con sólo hacer algunas comprobaciones sencillas – siempre que el conjunto de datos fuera válido, porque no todos lo son. La demostración tiene que ver con algunos teoremas del límite central y su relación con el comportamiento de las mantisas en las multiplicaciones de valores aleatorias.

Actualización: Un interesante enlace como demostración visual: Significant Figure Distribution Generator, que muestra cómo resulta la distribución de «primeros dígitos» cuando eliges cualquier número y un factor multiplicador, y vas haciendo las multiplicaciones y fijándote sólo ese primer dígito.