La naturaleza y las ventajas del nowcasting
Con frecuencia se acusa a los economistas de conducir mirando por el espejo retrovisor pues aventuran recomendaciones de política económica basados en información del pasado. Esta situación no siempre es su culpa. La información que necesitan para darse una idea de cómo van las cosas, como los buenos vinos, toma su tiempo para generarse. Por ejemplo, el Indicador Global de la Actividad Económica o IGAE, que es una medición aproximada del Producto Interno Bruto (PIB) mensual de México, aparece alrededor de 55 días, casi dos meses, después de cerrado el mes de referencia.2 Esto significa que el IGAE de septiembre de 2020 se publicará hasta el 26 de noviembre de 2020. Cabe entonces preguntarse si la creciente disponibilidad de información, cada vez más oportuna, de fuentes tradicionales y no tradicionales, de dentro y de fuera del Instituto Nacional de Estadística y Geografía (INEGI), permitiría construir modelos econométricos y estadísticos robustos que aporten estimaciones sensiblemente más oportunas del IGAE y posiblemente también, de otros indicadores macroeconómicos mensuales producidos por el INEGI ¿Podemos ayudar a que los economistas sean menos dependientes de su espejo retrovisor?
La respuesta es afirmativa y la obtenemos gracias a los desarrollos en modelos estadísticos de nowcasting o de estimación del momento actual, los cuales han sido objeto de creciente atención durante los últimos años. La cada vez mayor disponibilidad de fuentes de información de alta frecuencia y oportunidad, como las que provienen de internet, redes sociales o registros digitales de la movilidad y la actividad económica, han estimulado la idea de explorar y explotar las posibles asociaciones estadísticas entre ese tipo de datos con indicadores económicos duros para tratar de adelantar su evolución en el tiempo. El atractivo de aprovechar la oferta creciente de datos de alta frecuencia y alta oportunidad es indiscutible.
Los modelos de nowcasting se encuentran a la mitad entre los modelos de ajuste y los modelos de pronóstico. Los primeros suponen que las covariables que se utilizan para estimar la variable dependiente se encuentran todas disponibles de manera contemporánea con ésta. Los segundos suponen la estimación de la variable dependiente para momentos del tiempo en los cuales no se dispone de información sobre las covariables que se usan como argumentos. Esto es evidente cuando se trata de pronosticar la evolución futura de alguna variable macroeconómica y cuya estimación típicamente requiere de hacer supuestos sobre las variables explicativas. En cambio, en el caso del nowcasting, se acepta que una parte de las variables explicativas puede no estar disponible para los momentos más recientes, pero se aprovecha la parte que sí lo está, lo que permite explotar la relación estadística entre las covariables más oportunas y la variable dependiente, para generar estimaciones de esta última que adelanten las que días, semanas o meses después se darán a conocer mediante los procesos estadísticos tradicionales y oficiales.
Los modelos de nowcasting son cada vez más frecuentes en el mundo de las estadísticas oficiales. STATCAN (Statistics Canada) y CBS (Centraal Bureau voor de Statistiek), las oficinas de estadísticas oficiales de Canadá y de Holanda, respectivamente, publican estimaciones del PIB a partir de modelos de nowcasting. Lo mismo ocurre con el Centro de Excelencia para las Estadísticas Económicas y la Oficina Nacional de Estadísticas del Reino Unido. Asimismo, el Banco de la Reserva Federal de Atlanta y el de la Reserva Federal de Nueva York publican este tipo de modelos. Mismo caso para el Banco Central de Nueva Zelanda, Eurostat (European Statistical Office), el Banco Mundial, el Banco Central de Italia, el Banco de España, el Banco Central Europeo y la CEPAL (Comisión Económica para América Latina y el Caribe). El mismo INEGI ya ha incursionado en el uso de estas técnicas con la Estimación Oportuna del PIB, que se publica aproximadamente un mes después del trimestre de referencia y con el Indicador Mensual Oportuno de la Actividad Manufacturera (IMOAM), que relaciona el consumo de energía eléctrica reportado por la Comisión Federal de Electricidad con la actividad manufacturera para generar estimaciones que adelantan en hasta 20 días a la salida de las cifras oficiales del Indicador Mensual de la Actividad Industrial (IMAI).
Nowcasting del IGAE
En el marco de la incertidumbre derivada de la volatilidad macroeconómica derivada de la pandemia de la COVID-19, en el INEGI nos dimos a la tarea de acelerar nuestros trabajos de investigación para desarrollar modelos de nowcasting que nos ayudaran a tener una idea razonablemente precisa y más oportuna del tamaño de las variaciones anuales de la actividad económica en su conjunto, vista desde el IGAE. Con los modelos de nowcasting no solamente estaríamos en condiciones de dar señales de la posible dirección y magnitud de las variaciones económicas, como hacemos, por ejemplo, con la Encuesta Nacional de Opinión Empresarial, sino que podríamos además ofrecer estimaciones puntuales, con sus respectivos intervalos de confianza, que nos permitan ganar tiempo para conocer el comportamiento que cabría esperar en los indicadores de nuestro interés.
Nuestro nuevo modelo de nowcasting, desarrollado por los investigadores Francisco Corona Villavicencio y Jesús López Pérez, al que hemos denominado Indicador Oportuno de la Actividad Económica (IOAE), se construye como un trabajo de última milla, que se cimienta sobre una base construida durante décadas dentro y fuera del INEGI para mejorar, ampliar y hacer más oportuna la información económica disponible. También se alimenta de la oferta de información proveída por fuentes no tradicionales, así como de las bondades de las actuales tecnologías para el manejo y procesamiento de la información. El uso de estos modelos no se hace para sustituir, sino para complementar la oferta de información actualmente disponible. Esperar 55 días para conocer los datos más recientes del IGAE ofrece como premio el contar con las cifras precisas del indicador original. Sin embargo, y especialmente en tiempos como los actuales, los analistas de la economía pueden encontrar de suma utilidad sacrificar un poco de precisión a cambio de más de prontitud, sobre todo en la medida en que la pérdida en precisión sea mínima y la ganancia en oportunidad sea máxima.
No podemos dejar de lado que la oportunidad es un atributo de la calidad de la información, de manera que ganar días o semanas en el reporte de la evolución de la actividad económica aporta ventajas muy valiosas para los analistas y los tomadores de decisiones en materia económica. Estar en condiciones de evaluar el rumbo de la coyuntura casi en tiempo real o hacerlo a toro pasado, puede hacer un mundo de diferencia para la asignación más eficiente de recursos o la mejor y más oportuna toma de decisiones, con importantes beneficios potenciales para las personas, las organizaciones y los gobiernos. El más perfecto y exacto de los indicadores pierde mucha de su utilidad mientras más extemporáneo sea y mientras más alejado del momento de referencia esté, y por eso ganar tiempo en el reporte de indicadores clave, con una pérdida mínima en precisión, es un objetivo deseable.
La producción de las cifras duras del IGAE toma aproximadamente 8 semanas, tiempo que muy dífilamente se podría recortar en la actualidad dados los procesos que se tiene que seguir para integración del dato de cada mes y en particular el tiempo que requiere el INEGI para allegarse de los insumos estadísticos indispensables. Con el IOAE logramos mantener el rigor en la integración del IGAE y por la otra dar una versión adelantada de su dinámica mediante el empleo de un tipo distinto de técnicas estadísticas. Al final, se trata de un ejercicio de equilibrio entre las exigencias de precisión máxima y las de oportunidad máxima. El IGAE es más preciso, pero toma más tiempo, mientras que el IOAE es más oportuno aunque algo menos preciso.
De arranque, hemos elegido reportar los resultados del IOAE una sola vez al mes, pero no descartamos hacerlo con mayor frecuencia, si llegara a considerarse necesario. Así las cosas, el IOAE se dará a conocer a principios de la tercera semana de cada mes, dos días hábiles después de que aparezca la información sobre actividad industrial de Estados Unidos, lo que implica que saldrá aproximadamente una semana antes de que salgan los datos del IGAE correspondientes a dos meses atrás. Sin embargo, nuestro modelo de nowcasting estará arrojando estimaciones no solo de dos meses atrás, sino también del mes inmediato anterior, de manera que estaremos adelantando la variación anual del IGAE de cada mes en aproximadamente cinco semanas para el mes inmediato anterior y en una semana para el mes antepasado. Cabe aclarar que, una vez comenzada la secuencia de publicaciones, cuando el que fuera mes pasado se convierta en mes antepasado, se estará dando una segunda estimación con una semana de antelación para ese mes, de tal manera que la variación del IGAE de cada mes y sus intervalos de confianza al 95%, serán reportados en primera instancia con cinco semanas de anticipación, pero con menos información disponible, y por segunda vez, con una semana de anticipación, pero con mucha más información disponible. Entonces, al adelantar en cinco semanas un proceso que toma ocho, y dado que cada mes tiene cuatro semanas, el IOAE estará reportando dos nowcasts sucesivos para cada mes de referencia.
Características y resultados del modelo
Dado que la idea es generar estimaciones sumamente oportunas y confiables del crecimiento del IGAE, encontramos que un modelo de nowcasting basado en la construcción de un factor dinámico oportuno y econométricamente válido, en la línea de la propuesta metodológica de Doz, et. al. (2011)3, nos sirve bastante bien. En la lógica de los análisis de componentes principales que permiten extraer los elementos esenciales de la información contenida en un conjunto amplio de variables, el uso de un factor dinámico permite reducir las dimensiones del problema, haciéndolo más manejable con una pérdida mínima de información, al tiempo que incorporamos un conjunto amplio de variables. Para el caso del IOAE son al menos 25 variables, cuya información esencial se condensa en una sola variable mediante el uso de factores dinámicos.4
El IOAE es un modelo de series de tiempo que no aspira a ser estructural o a establecer relaciones de causalidad. Sin embargo, diferencia de lo que suele ocurrir en otros trabajos de este tipo, se buscó seleccionar variables que no solo tuvieran una dinámica relevante en la modelación de las tasas anuales (respecto al mismo mes del año anterior) de crecimiento del IGAE, sino que se procuró que la mayor parte de ellas fuesen teóricamente pertinentes e intuitivas. Solo hicimos excepciones en el caso de las variables obtenidas de Google Trends, para las cuales usamos de manera sistemática técnicas estadísticas especializadas para la selección de variables, por lo que no hay garantía de que los tópicos resultantes resulten intuitivos desde la teoría económica5. No es de sorprender que, en la coyuntura actual, términos como "pandemia" o "cubrebocas" hayan resultado estadísticamente significativos de manera reiterada, aunque estos tópicos seguramente irán evolucionando con el tiempo. De esta manera tenemos tres conjuntos de variables: 1) Las oportunas tradicionales, como el índice de volumen físico de la actividad industrial, los asegurados permanentes y eventuales en el IMSS y el índice de producción industrial de Estados Unidos; 2) Las de alta frecuencia tradicionales, como el Índice de Precios y Cotizaciones de la Bolsa Mexicana de Valores, el tipo de cambio nominal y la demanda semanal de gasolinas; y 3) las de alta frecuencia no tradicionales, integradas por un Índice de Movilidad construido con información geolocalizada de Twitter y una selección de tópicos de búsqueda de Google Trends. La lista completa de variables utilizadas se presenta en el cuadro 1:
Dado que, a medida que se busca hacer una estimación más cercana al momento actual se dispone de información para un menor número de variables se hace necesario suavizar el factor mediante filtros estadísticos que permiten la modelación del valor del factor dinámico en cada momento del tiempo con sus valores pasados, lo que permite administrar esas ausencias de manera óptima6. Entonces, en todo momento, la variable dependiente, digamos el IGAE, se estima como una función lineal del factor dinámico suavizado: Yt=α+βFt+Et, donde Yt es la variable dependiente, Ft es el factor dinámico, α y β son los parámetros a estimar y Et es el error, susceptible de ser modelado como un proceso tipo autorregresivo de promedios móviles.
El IOAE insume sólo series desestacionalizadas, de manera que las estimaciones que de él resultan también corresponden a series desestacionalizadas. En la gráfica 1, se muestra el modelo ajustado a lo largo del tiempo en relación con los datos oficiales del IGAE (desestacionalizado). Al final de la serie, con un sombreado azul más oscuro, se presenta el nowcast correspondiente a los meses de agosto y septiembre de 2020. Nótese, por una parte, cómo las variaciones anuales para cada mes, que resultan del proceso de ajuste del modelo (línea punteada), son mucho muy cercanas a las que se obtienen directamente de la serie del IGAE (sombreado azul claro). De manera destacada vemos también como el modelo permite estimar las variaciones a esperar para los dos meses próximos pasados, para los cuales, al momento de publicar el nowcast, aún no se reportan las cifras oficiales correspondientes. Las líneas naranja hacen referencia a los intervalos de confianza correspondientes al 95 por ciento.
Haciendo zoom en el nowcast de los últimos dos meses, tenemos que en agosto de 2020 el IGAE tendría una variación anual negativa anual de entre -9.6% y -6.2%, con valor central de -7.9%; mientras que para septiembre, sería de entre -8.8% y -4.9%, con valor central de -6.9 por ciento (cuadro 2).
Los resultados del modelo nos muestran que el valor absoluto de las caídas en las tasas anuales de crecimiento del IGAE en agosto y septiembre continúan su tendencia a la baja, si bien con una clara desaceleración. Es decir, vemos que a medida que pasan los meses, el valor absoluto de la variación del mes más reciente es menor pero cada vez menos diferente al del mes anterior. Con las cifras del crecimiento esperado del IGAE para el mes de septiembre, completaríamos el tercer trimestre de 2020 y por tanto estamos en condiciones de hacer una aproximación a la tasa de crecimiento del PIB del periodo, que sería de alrededor de -8.2 por ciento, que sería una caída anual bastante menor en valor absoluto a la de -18.7% registrada en el PIB del segundo trimestre. Este resultado puede compararse inmediatamente con los pronósticos de distintos analistas, como los que se reportan en la Encuesta de Analistas que lleva a cabo el Banco de México, cuyas cifras más recientes muestran que, en promedio, los especialistas en economía del sector privado que participan en ese ejercicio esperan una variación del PIB en 2020 de -9.8%.
Con base en estos datos, es posible estimar la tasa de crecimiento implícita para el cuarto trimestre y a partir de ello evaluar si es necesario ajustar las expectativas de crecimiento para 2020, en consideración de lo más o menos plausible de la secuencia que resulte, especialmente dado el inicio del proceso de recuperación de la actividad económica manifiesto en la trayectoria de las tasas de crecimiento para el segundo y tercer trimestres del año. Viene a cuento destacar que, a pocas horas de que se hubieran dado a conocer los nowcasts de agosto y septiembre, varios economistas ya habían comenzado a reportar en Twitter sus opiniones sobre las implicaciones de estos nuevos datos para las expectativas de crecimiento del año en curso, justamente con base en consideraciones de aritmética de tasas como las que acabamos de bosquejar. Sin el IOAE, estas discusiones habrían debido esperar casi un mes más para ocurrir.
Así las cosas, con el IOAE se está logrando que la discusión sobre la coyuntura económica sea más vigente y que la discusión sobre el futuro sea más actual y esté mejor informada en cada momento. En un mundo en el que el tiempo es oro, es difícil perder de vista los beneficios de ganar tiempo en el conocimiento de cómo va la actividad económica del país. Si bien es conveniente recordar que las cifras reales las iremos conociendo conforme maduren los plazos y se vayan publicando los resultados de las fuentes oficiales correspondientes, ya sea del PIB trimestral o del IGAE, creemos que el nuevo IOAE nos ofrece una mejor y más actualizada imagen de la situación económica presente y permite a los economistas depender un poco menos del uso del espejo retrovisor para conducir sus análisis de la realidad7.
2 Dada la enorme cantidad de fuentes de información que requiere para su integración, es realmente muy difícil reducir el tiempo de reporte del IGAE.
3 Doz, C., Giannone, D., and Reichlin, L. (2011). "A two-step estimator for large approximate dynamic factor models based on Kalman filtering". Journal of Econometrics, 164(1):188-205.
4 Son 24 variables más los tópicos de Google Trends, los cuales pueden ser más de una variable.
5 Hablamos de regresiones LASSO.
6 Nos referimos al Filtro de Kalman.
7 Para mayores detalles sobre el IOAE, consultar http://www.inegi.org.mx/investigacion/ioae/. Para profundizar en los aspectos técnicos recomendamos revisar la nota metodológica disponible en el sitio.