Recomendação de produtos financeiros utilizando aprendizado de máquina

Batista, Jonathan Jalles Silva

Recomendação de produtos financeiros utilizando aprendizado de máquina

Página do item simplificado Estatísticas

dc.contributor.advisor	Araújo, Daniel Sabino Amorim de
dc.contributor.advisorID	https://orcid.org/0000-0001-5572-0505	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/4744754780165354	pt_BR
dc.contributor.author	Batista, Jonathan Jalles Silva
dc.contributor.authorLattes	http://lattes.cnpq.br/0333672178508920	pt_BR
dc.contributor.referees1	Menezes Neto, Elias Jacob de
dc.contributor.referees2	Rego, Thais Gaudêncio do
dc.date.accessioned	2025-04-08T23:31:25Z
dc.date.available	2025-04-08T23:31:25Z
dc.date.issued	2024-12-17
dc.description.abstract	Recommendation systems play a crucial role across various sectors, including finance, by offering personalized suggestions to customers based on their past preferences. In the financial and credit industries, such systems have the potential to revolutionize how institutions engage with customers, particularly through personalized recommendations for financial products like investments, insurance, and loans. This study analyzed 208,570 customer records from three types of financial insurance services to develop a solution capable of supporting marketing strategies for offering these services to the clients of a fintech. Clustering with k-means, tested with two to six clusters, revealed significant customer segmentation patterns. While the two-cluster configuration achieved the highest Silhouette Score (0.4169), the four-cluster approach provided more informative segmentation for strategic purposes. For predictive modeling, after initial tests and random hyperparameter search with 5-fold and 10-fold cross-validation, XGBoost and LightGBM achieved 82.0% recall and 80.5 % F1-score. LightGBM was selected for final evaluation on validation data due to cost-benefit considerations. When applied to the validation set, which had a significantly different insurance distribution from the training data due to covariate shift, the model’s performance dropped significantly to 43.1% recall and F1-score to 39.0%. The model performed best with Insurance C (63.7% recall and 60.0% F1-score) but struggled with Insurances A (45.8% recall and 26.7% F1-score) and B (2.6% recall and 4.8% F1-score). When trained on 80% of the combined training and validation dataset and validated on the remaining 20%, LightGBM showed substantial improvements for Insurances A and C, achieving recall scores of 83.3% and 81.6 and F1-scores of 83.0% and 77.6%, respectively. In all cases, the models struggled with Insurance B. Although the model’s performance with the combined dataset was significantly better, covariate shifts pose a notable challenge in developing the solution for the purpose of this study.	pt_BR
dc.description.resumo	Sistemas de recomendação desempenham um papel crucial em diversos setores, incluindo o financeiro, ao oferecer sugestões personalizadas para os clientes, com base em seus históricos de preferências. No contexto da indústria financeira e de crédito, tais sistemas têm o potencial de revolucionar a maneira como as instituições interagem com os clientes, sobretudo ao personalizar recomendações de produtos financeiros, como investimentos, seguros e empréstimos. Nesse estudo, foram analisados 208.570 registros de clientes de três serviços financeiros do tipo seguro, com o objetivo de criar uma solução capaz de apoiar estratégias de marketing, utilizadas na oferta desses serviços financeiros aos clientes de uma Fintech. A clusterização com k-means, testada com dois a seis clusters, revelou importantes padrões de segmentação de clientes. Embora a configuração de dois clusters tenha alcançado o maior valor de silhouette score (0,4169), a abordagem com quatro clusters forneceu um cenário mais informativo para fins estratégicos. Para modelagem preditiva, após testes iniciais e busca aleatória de hiperparâmetros, com validação cruzada em 5 e 10 folds, XGBoost e LightGBM reportaram 82,0% de recall e 80,5% de F1-score. O LightGBM foi selecionado para uso nos dados de validação, por questões de custo-benefício. Quando aplicado ao conjunto de validação, que apresentou uma distribuição de seguros significativamente diferente dos dados de treino, causada por mudança nas covariáveis, o desempenho do modelo caiu consideravelmente, para 43,1% de recall, e 39,0% de F1-score. O modelo teve melhor desempenho com o Seguro C (63,7% de recall e 60,0% de F1-score), mas teve dificuldades com os seguros A (45,8% de recall e 26,7% de F1-score) e B (2,6% de recall e 4,8% de F1-score). Quando treinado em 80% do conjunto de dados resultando da combinação de dados de treino e validação, e validado nos 20% restantes, o LightGBM demonstrou melhorias substanciais para os seguros A e C, alcançando recall de 83,3% e 81,6%, e F1-Score de 83,0% e 77,6%, respectivamente. Em todos os casos, os modelos apresentaram dificuldades com o Seguro B. Embora a performance do modelo com dados combinados tenha sido significativamente melhor, a mudança de covariáveis configura um desafio expressivo na modelagem da solução para o propósito desse trabalho.	pt_BR
dc.identifier.citation	BATISTA, Jonathan Jalles Silva. Recomendação de produtos financeiros utilizando aprendizado de máquina. Orientador: Dr. Daniel Sabino Amorim de Araújo. 2024. 72f. Dissertação (Mestrado Profissional em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2024.	pt_BR
dc.identifier.uri	https://repositorio.ufrn.br/handle/123456789/63425
dc.language	pt_BR	pt_BR
dc.publisher	Universidade Federal do Rio Grande do Norte	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.initials	UFRN	pt_BR
dc.publisher.program	PROGRAMA DE PÓS-GRADUAÇÃO EM TECNOLOGIA DA INFORMAÇÃO	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Seguros	pt_BR
dc.subject	Fintech	pt_BR
dc.subject	Clusterização	pt_BR
dc.subject	Modelagem preditiva	pt_BR
dc.subject.cnpq	CNPQ::ENGENHARIAS	pt_BR
dc.title	Recomendação de produtos financeiros utilizando aprendizado de máquina	pt_BR
dc.title.alternative	Financial products recommendation using machine learning	pt_BR
dc.type	masterThesis	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: Recomendacaoprodutosfinanceiros_Batista_2024.pdf
Tamanho:: 2.92 MB
Formato:: Adobe Portable Document Format

Baixar

Coleções

MPPGTI - Mestrado Profissional em Tecnologia da Informação

SIGAA

Recomendação de produtos financeiros utilizando aprendizado de máquina

Arquivos

Pacote Original

Coleções