Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data

dc.contributor.advisorFernandes, Marcelo Augusto Costa
dc.contributor.advisor-co1Barbosa, Raquel de Melo
dc.contributor.advisorIDhttps://orcid.org/0000-0001-7536-2506pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3475337353676349pt_BR
dc.contributor.authorLopes Júnior, Márcio Luiz Bezerra
dc.contributor.authorLatteshttp://lattes.cnpq.br/0833804654660654pt_BR
dc.contributor.referees1Chiavegatto Filho, Alexandre Dias Porto
dc.contributor.referees2Silva, Ivanovitch Medeiros Dantas da
dc.contributor.referees2IDhttps://orcid.org/0000-0002-0116-6489pt_BR
dc.contributor.referees2Latteshttp://lattes.cnpq.br/3608440944832201pt_BR
dc.contributor.referees3Dias, Leonardo Alves
dc.date.accessioned2022-07-05T22:14:39Z
dc.date.available2022-07-05T22:14:39Z
dc.date.issued2022-04-29
dc.description.abstractPreterm birth (PTB) is a phenomenon that brings risks and challenges to the survival of the newborn child. Despite many advances in research, not all the causes of PTB are yet clear. It is currently understood that PTB risk is multi-factorial and may also be associated with socioeconomic factors. In order to analyse this possible relationship, this work seeks to stratify PTB risk in Brazil using only socioeconomic data, extracting and analysing those clusters that present relevant PTB divergence, all of which will be found by automatic clustering processes using a series of unsupervised machine learning methods. Through the use of datasets made publicly available by the Federal Government of Brazil, a new dataset was generated with municipality-level socioeconomic data and a PTB occurrence rate. This dataset was processed using two separate clustering methods, both built by assembling unsupervised learning techniques, such as k-means, principal component analysis (PCA), density-based spatial clustering of applications with noise (DBSCAN), self-organising maps (SOM) and hierarchical clustering. The methods discovered clusters of municipalities with both high levels and low levels of PTB occurrence. The clusters with high PTB were comprised predominantly of municipalities with lower levels of education, worse quality of public services – such as basic sanitation and garbage collection – and a less white population. The regional distribution of the clusters was also observed, with clusters of high PTB located primarily in the North and Northeast regions of Brazil. The results indicate a positive influence of the quality of life and the offer of public services on the reduction of PTB risk.pt_BR
dc.description.resumoNascimento prematuro (PTB) é um fenômeno que traz riscos e desafios à sobrevivência de um recém-nascido. Apesar de muitos avanços na pesquisa, nem todas as causas do PTB estão bem definidas. Atualmente, entende-se que risco de PTB é multifatorial e que pode, também, estar associado a fatores socioeconômicos. Objetivando analisar essa possível relação, este trabalho busca estratificar o risco de PTB no Brasil utilizandose apenas de dados socioeconômicos, extraindo e analisando clusters que apresentarem divergência relevante de PTB, todos os quais serão descobertos por processos de clusterização automáticos usando uma série de métodos de aprendizagem de máquina nãosupervisionada. Através do uso de bancos de dados públicos disponibilizados pelo Governo Federal do Brasil, um novo banco de dados foi gerado com dados socioeconômicos a nível municipal e uma taxa de ocorrência de PTB. Esse banco de dados foi processado utilizando dois métodos de clusterização distintos, ambos construídos através da união de métodos de aprendizagem não-supervisionada, tais como k-médias, análise de componentes principais (PCA), clusterização espacial baseada em densidade de aplicações com ruído (DBSCAN), mapas auto-organizáveis (SOM) e clusterização hierárquica. Os clusters com alto PTB foram formados majoritariamente por municípios com baixos níveis educacionais, com pior qualidade de serviços públicos – como saneamento básico e coleta de lixo – e com populações mais brancas. A distribuição dos clusters também foi observada, com clusters com alto PTB concentrados nas regiões Norte e Nordeste. Os resultados indicam, uma influência positiva da qualidade de vida e da oferta de serviços públicos na redução do risco de PTB.pt_BR
dc.identifier.citationLOPES JÚNIOR, Márcio Luiz Bezerra. Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data. 2022. 83f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/48347
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectRisco de PTBpt_BR
dc.subjectClusterizaçãopt_BR
dc.subjectAprendizagem não-supervisionadapt_BR
dc.subjectk-Meanspt_BR
dc.subjectMapas auto-organizáveispt_BR
dc.titleStratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic datapt_BR
dc.typemasterThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Stratificationpretermbirth_LopesJunior_2022.pdf
Tamanho:
7.11 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar