Saltar al contenido principal

La cascada estadística de cuatro niveles

Por qué cada SKU recibe el método estadístico apropiado según cuánto histórico tenga, en una cascada de cuatro niveles que migra sola a métodos más precisos.

El principio central

La estadística no es neutral respecto al tamaño de la muestra. Un producto con tres semanas de ventas y uno con tres años de ventas no merecen el mismo tratamiento: el primero acumula incertidumbre paramétrica —no sabemos bien qué distribución tiene su demanda— mientras que el segundo tiene suficientes datos para que los propios datos hablen sin supuestos distribucionales.

La cascada estadística de cuatro niveles formaliza esa intuición: el método más adecuado para cada SKU se determina automáticamente a partir del número de filas n disponibles en la matriz de errores históricos, y el sistema migra al siguiente nivel sin intervención manual a medida que el producto acumula ventas.

El principio subyacente es simple: a más datos, menos supuestos.

Los cuatro niveles

La variable de corte es n = número de observaciones en la matriz de errores históricos del SKU.

Sin histórico

El sistema no calcula ninguna política para este SKU. En cambio, emite un warning BLOQUEANTE y lo marca para revisión del planificador. La razón es que, con cero filas de errores, cualquier número que el modelo produjera sería pura invención sin respaldo estadístico ni empírico.

Decisión de diseño

Emitir un warning bloqueante —y no recomendar silenciosamente un valor por defecto— es una decisión deliberada de honestidad sobre la incertidumbre. Una recomendación fabricada es más peligrosa que una ausencia reconocida.

Poco histórico

Con pocas observaciones, el bootstrap paramétrico por Method of Moments (MoM) es el instrumento disponible. El sistema ajusta los parámetros de tres candidatas —Normal, Gamma y Lognormal— usando MoM, y elige la distribución con menor AIC (Akaike Information Criterion):

distribución* = argmin_{d ∈ {Normal, Gamma, Lognormal}} AIC(d)

MoM en muestras pequeñas es menos eficiente que MLE, pero MLE es inestable con poco histórico (las estimaciones de varianza pueden colapsar o divergir). El AIC penaliza la complejidad del modelo, por lo que con pocos datos la distribución más parsimoniosa tiende a ganar.

Histórico moderado

Con un histórico moderado, la estimación por Maximum Likelihood Estimation (MLE) se estabiliza (Lawless, 2003). El flujo agrega una prueba de normalidad:

  1. Se aplica la prueba Shapiro-Wilk a los errores históricos.
  2. Si no se rechaza la normalidad (p ≥ α, con α típicamente 0,05), se adopta la distribución Normal.
  3. Si se rechaza, se corre argmin AIC entre Gamma y Lognormal, ajustadas por MLE.

La prueba de Shapiro-Wilk en este rango de n tiene buen poder para detectar desviaciones graves de la normalidad sin ser excesivamente sensible al ruido muestral. El sistema emite un warning INFO cuando la prueba rechaza, para que el planificador sepa qué distribución se usó y por qué.

Producto maduro (histórico amplio)

Con histórico amplio, el sistema abandona cualquier supuesto distribucional y usa non-parametric bootstrap de filas completas: remuestrea con reemplazo directamente desde la matriz de errores históricos, preservando la estructura de correlación intra-horizonte. La base académica es Efron & Tibshirani (1993, §6): la cobertura empírica de los cuantiles del bootstrap no paramétrico converge a la cobertura nominal con histórico suficiente.

El resultado es que la simulación Monte Carlo en este nivel capta asimetrías, colas gruesas y cualquier comportamiento inusual de la demanda sin forzarla a encajar en una campana gaussiana.

Por qué importa la migración automática

Los sistemas tradicionales asignan un método fijo a todos los SKUs —generalmente la distribución Normal, que es la más cómoda matemáticamente. El problema es que esa elección penaliza los extremos: con poco histórico, la Normal sobreestima la confianza en los parámetros; con mucho histórico, descarta información real sobre las colas de la demanda.

La cascada resuelve el problema opuesto: nunca usa un método más sofisticado del que los datos pueden sostener, y nunca usa uno más simple del que los datos merecen.

Los umbrales entre niveles son configurables por instancia. Los valores por defecto responden a las referencias citadas, pero mercados con patrones de demanda muy estables pueden reducir el umbral de acceso al nivel de producto maduro, mientras que categorías muy volátiles pueden querer exigir más datos antes de confiar en el bootstrap no paramétrico.

Resumen

NivelHistóricoMétodoBase
Sin históricoSin datosSin cálculo; warning BLOQUEANTE
Poco históricoPoco históricoBootstrap paramétrico, MoM, argmin AICParsimonia con muestra pequeña
Histórico moderadoHistórico moderadoBootstrap paramétrico, MLE + Shapiro-WilkLawless (2003)
Producto maduroHistórico amplioBootstrap no paramétrico (filas completas)Efron & Tibshirani (1993) §6