Por dura que sea una losa de mármol de la escalera de la torre inclinada de Pisa, no es rival para los pies de los millones de turistas que año tras año la han ido pisando. En cada escalón se ven dos suaves hendiduras a izquierda y derecha, correspondientes al desgaste de todos los pies izquierdos y derechos que han pasado por allí.

Fuente: escaleras en la torre de Pisa
Tomando la losa inferior, que aparece aproximadamente frontal y por lo tanto no requeriría ningún cambio de perspectiva para mostrar el perfil de desgaste en sus dimensiones reales, invirtiéndola, y exagerando su escala en altura, podemos intuir que la pérdida acumulada de material sigue la forma de dos curvas gaussianas superpuestas, cada una centrada en un lado de la piedra:

ChatGPT me ha proporcionado una función para dibujar el solape de dos curvas normales sesgadas basadas en 3 parámetros: posición, ancho y asimetría. Cuando el parámetro de asimetría tiende a 0, la distribución tiende a una normal pura donde la posición se convierte en la media y el ancho en la desviación estándar.
Tanteando un poco los parámetros he ajustado dos distribuciones normales gemelas, situadas cada una a un lado, y ligeramente sesgadas hacia sus respectivos lados para mejorar el ajuste del valle central, más pronunciado que si nos restringimos a dos normales puras. De esto podríamos deducir que sea más probable desviar la pisada respecto al punto más esperable hacia los extremos que hacia el centro, lo que resulta bastante razonable:

Aquí vemos la superposición o mezcla (acumulación de pisadas) de ambas distribuciones, obteniendo una forma muy parecida a la curva real de desgaste de las escaleras:

~~~
Generalizando la función para un número arbitrario de curvas podemos aproximar distribuciones ad-hoc como suma de N normales ponderadas. La suma de las distribuciones parciales sería la envolvente del conjunto, y para que sea una función de densidad de probabilidad válida (integral igual a 1) es necesario y suficiente que el sumatorio de pesos valga 1:

Notar que en todo el ejercicio estamos haciendo la mezcla o combinación de las funciones de densidad, no una suma de variables aleatorias que, partiendo de distribuciones normales, siempre darían otra distribución normal. No es el caso aquí.
Aunque no tengan significado estadístico, pueden incluso usarse pesos negativos para tener más grados de libertad en la construcción, pero en este caso siempre cuidando de que la suma final no resulte negativa para ningún valor de la variable:

Repositorio con el código R: GitHub.
No hay comentarios:
Publicar un comentario
Por claridad del blog, por favor trata de utilizar una sintaxis lo más correcta posible y no abusar del uso de emoticonos, mayúsculas y similares.