Programa de Pós-Graduação em Ciência, Tecnologia e inovação
URI Permanente desta comunidadehttps://repositorio.ufrn.br/handle/123456789/24250
Navegar
Navegando Programa de Pós-Graduação em Ciência, Tecnologia e inovação por Assunto "Análise preditiva"
Agora exibindo 1 - 2 de 2
- Resultados por página
- Opções de Ordenação
Dissertação Mineração de dados educacionais e machine learning para análise e prevenção da evasão escolar em um curso de graduação(Universidade Federal do Rio Grande do Norte, 2024-07-25) Lima, Anderson Costa; Santana Júnior, Orivaldo Vieira de; Matamoros, Efrain Pantaleon; https://orcid.org/0000-0002-4052-5739; http://lattes.cnpq.br/5336356193599447; https://orcid.org/0000-0003-4918-3162; http://lattes.cnpq.br/5050555219716698; http://lattes.cnpq.br/7175138864569004; Freitas, André Lage; Rodrigues, Kelly Kaliane Rego da PazAs universidades enfrentam o desafio de como transformar uma grande quantidade de dados de seus estudantes em informações que possam gerar conhecimento para aprimorar a gestão acadêmica e diminuir os índices de evasão escolar no ensino superior. Uma abordagem promissora para identificar os fatores que influenciam o desempenho acadêmico é a mineração de dados educacionais (MDE) e Machine Learning (ML). Objetiva-se com esta pesquisa desenvolver um método que permita encontrar as principais características relacionadas à evasão no curso Interdisciplinar em Ciências e Tecnologia (C&T) na Universidade Federal do Rio Grande do Norte (UFRN), considerando os alunos ingressantes entre os anos de 2014 a 2023. Por meio de uma revisão da literatura, foram identificados algoritmos de ML adequados para uma abordagem híbrida, combinando o Random Forest (classificação) e Self-Organizing Maps (clustering), com análises de explicabilidade SHapley Additive exPlanations (SHAP), o processo incluiu Knowledge Discovery in Databases adaptado com etapas (coleta de dados, pré-processamento, mapeamento de características, treinamento e teste, análise de explicabilidade). Como resultados, tem-se um modelo preditivo usando Random Forest que alcançou uma acurácia inicial de 93% na identificação de alunos em risco de evasão, e posteriormente acurácia de 91% e 89% para dados desconhecidos, mostrando consistência e capacidade de generalização. A pesquisa revelou que a evasão escolar é influenciada por diversos fatores, incluindo aspectos curriculares, socioeconômicos e demográficos. A análise com Self-Organizing Maps permitiu criar um mapa de características que mostra a relação entre diversos atributos e a situação educacional dos alunos. A combinação com SHAP possibilitou entender de forma abrangente a influência dos atributos nas previsões do modelo, destacando a importância de variáveis como desempenho acadêmico, idade de ingresso, cidade de origem e condição socioeconômica. Por fim, desenvolveu-se um Minimum Viable Product (MVP) como prova de conceito para demonstrar os resultados das predições e a explicabilidade das descobertas, com análises descritivas e preditivas dos padrões que podem influenciar na permanência dos alunos no curso.Dissertação Mining Health - sistema de identificação análise e previsão para diagnóstico antecipado de doenças(Universidade Federal do Rio Grande do Norte, 2024-03-07) Lira, Krisna de Aquino; Alchieri, João Carlos; Matamoros, Efrain Pantaleon; https://orcid.org/0000-0002-4052-5739; http://lattes.cnpq.br/5336356193599447; https://orcid.org/0000-0002-4150-8519; http://lattes.cnpq.br/1325459110950508; http://lattes.cnpq.br/1007515178933550; Santana Júnior, Orivaldo Vieira de; Castro, Angélica Félix deA pandemia de Covid-19 teve repercussões globais desde seu início em Wuhan, China, em 2019 e causou impacto significativo na cadeia de produção brasileira, sendo a saúde suplementar uma das mais afetadas. Atualmente, com a retomada dos procedimentos médicos adiados, observa-se um aumento significativo nas internações, tratamentos e exames. O instituto de estudos de saúde suplementar relatou um aumento de 157% nos gastos com saúde no Brasil até 2030. Este trabalho propõe o desenvolvimento da plataforma Mining Health de mineração de dados para prever e diagnosticar doenças precocemente, utilizando uma análise exploratória e explicativa dos dados. Para o desenvolvimento, foram utilizados dados abertos disponibilizados pelo ministério da saúde e empregadas técnicas da estatística descritiva e inferencial, bibliotecas poderosas para análises e visualizações de dados através da linguagem de programação Python. O software Weka foi utilizado para testes dos algoritmos de classificação. As análises exploratórias conseguiram classificar os pacientes com mais riscos de desenvolver casos graves de Covid-19 ou doenças crônicas que afetam a qualidade de vida, ou que levam a mais tempo de hospitalização, aprimorando a capacidade da operadora de oferecer cuidados preventivos e personalizados aos seus beneficiários, além de contribuir significativamente para a redução de custos . As informações são disponibilizadas em dashboards e relatórios, visando melhorar a tomada de decisão para as operadoras de saúde. As análises preditivas apresentadas aqui oferecem benefícios cruciais na área de saúde.