Distribuciones de probabilidad y su uso en la simulación de eventos discretos
Consejos generales para el uso de distribuciones
Se plantean a continuación algunos consejos generales que ponen en práctica los conceptos aprendidos en esta cápsula para determinar la mejor distribución de probabilidad para los datos recogidos en una muestra aleatoria de una v. a..
- Debes empezar por analizar la muestra: media, desviación estándar, valores mínimo y máximo... además de dibujar el histograma, que te permite determinar si hay una única moda, si los datos se distribuyen simétricamente frente a la media, si están claramente acotados...
- Utiliza un software de ajuste automático de distribuciones. Analiza con cuidado los resultados de los tests de ajuste, usándolos como referencia y no como único elemento de decisión. Para conseguir un buen ajuste, a veces ayuda eliminar valores anómalos (outliers) o segmentar los datos.
- Si hay varias distribuciones candidatas, ten en cuenta las características de tu v. a. (acotamiento, simetría...)
- Si ninguno de los ajustes automáticos con distribuciones de probabilidad más sofisticadas es suficientemente bueno, prueba a usar, en este orden:
- Distribución normal
- Distribución triangular
- Distribución uniforme
- Distribución empírica
- En general, es preferible usar una distribución teórica que una empírica, ya que permiten filtrar valores extremos que no siguen la dinámica general del sistema y "suavizan" la realidad. Este suavizado es especialmente útil cuando se dispone de pocos datos en la muestra y hay un exceso de ruido.
Obra publicada con Licencia Creative Commons Reconocimiento No comercial Compartir igual 3.0