2025-07-012025-07-012025-07-02https://repositorio.banrep.gov.co/handle/20.500.12134/11241Este artículo evalúa la capacidad predictiva de un modelo de aprendizaje automático basado en Random Forest (RF), combinado con datos de Google Trends (GT), para realizar nowcasting de la inflación mensual en Colombia. El modelo propuesto, denominado RF-GT, se entrena utilizando datos históricos de inflación, indicadores macroeconómicos y actividad de búsqueda en internet. Tras la optimización de los hiperparámetros mediante validación cruzada para series de tiempo, se evalúa su desempeño fuera de muestra durante el periodo 2023–2024. Los resultados se comparan con enfoques tradicionales, incluidos los modelos SARIMA, regresiones Ridge y Lasso, así como con los pronósticos profesionales de la Encuesta Mensual de Expectativas (EME) del Banco de la República. En términos de precisión predictiva, el modelo RF-GT supera de forma consistente a los modelos estadísticos y muestra un desempeño comparable al pronóstico mediano de los analistas, con la ventaja adicional de generar predicciones aproximadamente semana y media antes. Estos hallazgos destacan el valor práctico de integrar fuentes de datos alternativas y técnicas de aprendizaje automático en los sistemas de monitoreo de inflación de economías emergentes.This paper evaluates the predictive capacity of a machine learning model based on Random Forests (RF), combined with Google Trends (GT) data, for nowcasting monthly inflation in Colombia. The proposed RF-GT model is trained using historical inflation data, macroeconomic indicators, and internet search activity. After optimizing the model’s hyperparameters through time series cross-validation, we assess its out-of-sample performance over the period 2023–2024. The results are benchmarked against traditional approaches, including SARIMA, Ridge, and Lasso regressions, as well as professional forecasts from the Banco de la República’s monthly survey of financial analysts (MES). In terms of forecast accuracy, the RF-GT model consistently outperforms the statistical models and performs comparably to the analysts’ median forecast, while offering the additional advantage of producing predictions approximately one and a half weeks earlier. These findings highlight the practical value of integrating alternative data sources and machine learning techniques into the inflation monitoring toolkit of emerging economies.18 páginasPDFengOpen AccessInflaciónPronóstico en tiempo realPronósticoBosques aleatoriosTendencias de GoogleAprendizaje automáticoEnhancing inflation nowcasting with online search data: a random forest application for ColombiaMejorando el nowcasting de la inflación con datos de búsquedas en línea: Una aplicación de random forest para ColombiaWorking PaperC14 - Semiparametric and Nonparametric Methods: GeneralC53 - Forecasting and Prediction Methods; Simulation MethodsE17 - General Aggregative Models: Forecasting and Simulation: Models and ApplicationE31 - Price Level; Inflation; DeflationE37 - Prices, Business Fluctuations, and Cycles: Forecasting and Simulation: Models and ApplicationInflationNowcastingForecastingRandom ForestGoogle TrendsMachine learningInflación - ColombiaEstudios económicos -- Metodos de simulación - - ColombiaAcceso abiertoAtribucion-NoComercial-CompartirIgual CC BY-NC-SA 4.0C14 - Métodos semiparamétricos y no paramétricos: generalidadesC53 - Métodos de pronóstico y predicción; métodos de simulaciónE17 - Modelos agregados generales: Predicción y simulación; Modelos y aplicaciónE31 - Nivel de precios; Inflación; DeflaciónE37 - Precios, fluctuaciones y ciclos económicos: Predicción y simulación; Modelos y aplicaciónLas opiniones contenidas en el presente documento son responsabilidad exclusiva de los autores y no comprometen al Banco de la República ni a su Junta Directiva.The opinions contained in this document are the sole responsibility of the author and do not commit Banco de la República or its Board of Directors.Objeto de publicación: La obra de mí (nuestra) autoría tiene por objeto ser publicada en el Portal de Investigaciones del Banco de la República e incluirla en el repositorio institucional de esa misma entidad. La obra podrá consistir en documento escrito, audiovisual, audio, gráfico, fotográfico, infográfico, podcasts, etc., y podrá estar en cualquier formato conocido o por conocerse.Datos personales: El(los) autor(es) ha(n) incluido sus datos personales (nombres, correo electrónico, filiación académica, perfil académico, entre otros) en el Portal de Investigaciones o la obra remitida para publicación, y por consiguiente, manifiesta(n) que mediante el diligenciamiento y registro de sus datos personales autoriza(n) al Banco de la República el tratamiento (recolección, almacenamiento, uso, circulación o supresión) de todos los datos suministrados con la finalidad de adelantar la publicación de la obra en el Portal de Investigaciones, dar a conocer su perfil académico y medios de contacto para fines académicos y divulgativos, así como para la construcción de indicadores y estadísticas para el seguimiento y control de las actividades de divulgación del Portal de Investigaciones. Para tal fin, se informa que el tratamiento de los datos personales se realizará de acuerdo con las políticas o lineamientos generales disponibles en http://www.banrep.gov.co/proteccion-datos-personales, en la sección “Protección de Datos Personales - Habeas Data”.https://hdl.handle.net/20.500.12134/112415. Precios, inflación y política monetaria