Risk analysis in microfinance using machine learning and potential integration with artificial intelligence agent

Arriola León, Diego; Ghodrat , Mohsen

Risk analysis in microfinance using machine learning and potential integration with artificial intelligence agent

Files

6482.html (164 B)

Date

2026-01

Authors

Arriola León, Diego

Ghodrat , Mohsen

Publisher

Universidad del Pacífico. Facultad de Ciencias Empresariales

Abstract

This study proposes a comprehensive approach for the early detection of default risk in microfinance portfolios, combining machine learning techniques with historical analysis of clients’ payment behavior. A database of more than 50,000 microcredits granted in Peru by a microfinance institution in Huancayo (2019–2021) was used, constructing a risk indicator based on the proportion of days in arrears relative to the agreed payment frequency, with a critical threshold of 25% of the installment period. This criterion differentiates clients with a higher propensity to default without penalizing minor delays, improving analytical accuracy. The study focuses on microenterprises and informal entrepreneurs, traditionally excluded from formal banking. It provides predictive tools adapted to segments with limited credit history, fostering financial inclusion and strengthening risk management in microfinance institutions. Four predictive models were evaluated, representing the main families of supervised learning: Gradient Boosting Machine (GBM) for Boosting, Bayesian Additive Regression Trees (BART) for Bayesian ensembles, Random Forest (RF) for Bagging, and Support Vector Machines (SVM) as optimal margin classifiers. This selection allows contrasting methodologies and identifying the most suitable approach for the microfinance context. The use of supervised learning is justified because the problem has historical labels of default and non-default, enabling predictions directly applicable to credit decision-making. Performance was assessed using metrics such as Cohen’s Kappa, Geometric Mean, and F1-score. Results show that GBM delivers the most consistent performance, BART achieves the best F1-score, and SVM excels in geometric precision. These findings validate the effectiveness of supervised learning in segmenting credit risk, optimizing operational management, and laying the foundation for incorporating artificial intelligence agents to monitor payments in real time and reduce losses from default.
Este estudio propone un enfoque integral para la detección temprana del riesgo de mora en carteras de microfinanzas, combinando aprendizaje automático y análisis histórico del comportamiento de pago de los clientes. Se utilizó una base de datos de más de 50,000 microcréditos otorgados en Perú por una entidad microfinanciera en Huancayo (2019-2021), construyendo un indicador de riesgo basado en la proporción de días de atraso respecto a la frecuencia pactada, con un umbral crítico del 25% del periodo de la cuota. Este criterio permite diferenciar clientes con mayor propensión al incumplimiento sin penalizar retrasos menores, mejorando la precisión del análisis. El estudio se enfoca en microempresas y emprendedores informales, tradicionalmente excluidos de la banca formal. Aporta herramientas predictivas adaptadas a segmentos con poco historial crediticio, favoreciendo su inclusión financiera y fortaleciendo la gestión de riesgo en microfinancieras. Se evaluaron cuatro modelos predictivos representativos de las principales familias de aprendizaje supervisado: Gradient Boosting Machine (GBM) para Boosting, Bayesian Additive Regression Trees (BART) para ensemble bayesiano, Random Forest (RF) para Bagging y Support Vector Machines (SVM) como clasificador de margen óptimo. Esta selección busca contrastar metodologías y determinar el enfoque más adecuado para el contexto de microfinanzas. El uso de aprendizaje supervisado se justifica porque el problema cuenta con etiquetas históricas de mora y no mora, lo que permite generar predicciones directamente aplicables a decisiones de crédito. El rendimiento se evaluó mediante métricas como Kappa de Cohen, Media Geométrica y F1-score. Los resultados muestran que GBM ofrece el desempeño más consistente, BART el mejor F1-score y SVM destaca en precisión geométrica. Estos hallazgos validan la eficacia del aprendizaje supervisado para segmentar riesgo crediticio, optimizar la gestión operativa y sentar bases para incorporar agentes de inteligencia artificial que monitoreen pagos en tiempo real y reduzcan pérdidas por mora.

Keywords

Microfinanzas--Perú, Riesgo de crédito--Perú, Pequeñas y medianas empresas--Finanzas--Perú, Inteligencia artificial--Aplicaciones en los negocios

Citation

Arriola León, D., & Ghodrat, M. (2026). Risk analysis in microfinance using machine learning and potential integration with artificial intelligence agent. Journal of Business, 17(1), 93-130. https://doi.org/10.21678/jb.2026.2798

URI

https://hdl.handle.net/11354/6482

Collections

Journal of Business

Full item page

Risk analysis in microfinance using machine learning and potential integration with artificial intelligence agent

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections