domingo, 18 de enero de 2026

Distribuciones normales en la torre de Pisa

Por dura que sea una losa de mármol de la escalera de la torre inclinada de Pisa, no es rival para el calzado de los millones de turistas que año tras año la han ido pisando. En cada escalón se ven dos suaves hendiduras a izquierda y derecha, correspondientes al desgaste producido por el goteo de pies izquierdos y derechos que han pasado por allí.

Fuente: escaleras en la torre de Pisa


Tomando el escalón inferior, cuya cara vertical aparece aproximadamente frontal a la cámara y por lo tanto no requiere ningún cambio de perspectiva para mostrar el perfil de desgaste en sus dimensiones reales, invirtiéndola, y exagerando su escala en altura, podemos intuir que la pérdida acumulada de material sigue la forma de dos curvas gaussianas descentradas superpuestas:



ChatGPT me ha proporcionado una función para dibujar el solape de dos curvas normales sesgadas basadas en 3 parámetros: posición, ancho y asimetría. Cuando el parámetro de asimetría tiende a 0, la distribución tiende a una normal pura donde la posición se convierte en la media y el ancho en la desviación estándar.

Tanteando un poco los parámetros he ajustado dos distribuciones normales gemelas, situadas cada una a un lado, y ligeramente sesgadas hacia sus respectivos lados para mejorar el ajuste del valle central, más pronunciado que si nos restringimos a dos normales puras. De esto podríamos deducir que sea más probable desviar la pisada respecto al punto más esperable hacia los extremos que hacia el centro, lo que resulta bastante razonable:



Y aquí dibujamos esta suma de distribuciones sobre la fotografía del escalón, obteniendo un ajuste bastante bueno del desgaste real de las escaleras. Lo que hemos hecho es modelar por separado el impacto de los pies izquierdo y derecho (que se convierten en derecho e izquierdo a la bajada) de todos los visitantes, acumulando luego sus pisadas por superposición lineal:


~~~

Generalizando la función para un número arbitrario de curvas podemos aproximar distribuciones multimodales ad-hoc como suma de N normales ponderadas. La suma de las distribuciones parciales sería la envolvente del conjunto, y para que sea una función de densidad de probabilidad válida (integral igual a 1) es necesario y suficiente que el sumatorio de pesos valga 1:



Notar que en todo el ejercicio estamos haciendo la mezcla o combinación de las funciones de densidad, no una suma de variables aleatorias que, partiendo de distribuciones normales, siempre darían otra distribución normal. No es el caso aquí.

Aunque no tengan significado estadístico, pueden incluso usarse pesos negativos para tener más grados de libertad en la construcción, pero en este caso siempre cuidando de que la suma final no resulte negativa para ningún valor de la variable:



Repositorio con el código R: GitHub.

No hay comentarios:

Publicar un comentario

Por claridad del blog, por favor trata de utilizar una sintaxis lo más correcta posible y no abusar del uso de emoticonos, mayúsculas y similares.