Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
dc.contributor.advisor | Costa, Eliardo Guimarães da | |
dc.contributor.advisor-co1 | Nunes, Marcus Alexandre | |
dc.contributor.author | Trindade, Mateus Oliveira Salvador da | |
dc.contributor.referees1 | Castro, Bruno Monte de | |
dc.contributor.referees2 | Silva Júnior, Antônio Hermes Marques da | |
dc.date.accessioned | 2023-12-15T19:20:32Z | |
dc.date.available | 2023-12-15T19:20:32Z | |
dc.date.issued | 2023-12-06 | |
dc.description.abstract | This work studies the relationship between Statistics and Machine Learning, specifically in the context of Classifiers Methods, where the computer must learn statistical and computational patterns from the provided data and be able to classify new data based on its learning. The database analyzed in this study contains information about patients with or without heart diseases, and the goal of the methods is to classify new patients as either having or not having the disease. The classifiers chosen for this work were Naive Bayes, K-Nearest Neighbors, and Random Forest. Performance was measured using statistical metrics such as accuracy, specificity, and sensitivity. Additionally, the execution time of each classifier was also measured. In the end, it was observed that Random Forest achieved the best accuracy and specificity, despite other classifiers showing similar results, but it had the worst execution time result. It can be concluded that the selection of the best model may be subjective, as it should take into consideration the application context and the available computational power. | pt_BR |
dc.description.resumo | Esse trabalho estuda a relação da Estatística com o Aprendizado de Máquina, especificamente no contexto de Métodos de Classificação, onde o computador deve aprender padrões estatísticos e computacionais com base nos dados propostos e conseguir classificar dados ainda não vistos com base em seu aprendizado. O banco de dados analisado nesse trabalho contém informações sobre pacientes com ou sem doenças no coração, em que o objetivo dos métodos é classificar novos pacientes, estimando se eles possuem ou não a doença. Os classificadores escolhidos para esse trabalho foram o Naive Bayes, K-Vizinhos mais próximos e o Random Forest. O desempenho foi medido através das métricas estatísticas acurácia, especificidade e sensitividade. Além disso, também foi medido o tempo de execução de cada classificador. No final, foi visto que o Random Forest obteve os melhores resultados nas métricas acurácia e sensitividade, apesar dos outros métodos alcançarem valores bastante próximos. Entretanto, também apresentou o pior resultado de tempo de execução. Dessa forma, é possível concluir que a seleção do melhor modelo, pode ser subjetiva, pois deve ser levado em consideração o contexto da aplicação e o poder computacional disponível. | pt_BR |
dc.identifier.citation | TRINDADE, Mateus Oliveira Salvador da. Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística. Orientador: Eliardo Guimarães da Costa. 2023. 36 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023. | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/55980 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Estatística | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.publisher.program | Estatística | pt_BR |
dc.subject | Naive Bayes | pt_BR |
dc.subject | K-Vizinhos mais Próximos | pt_BR |
dc.subject | Random Forest | pt_BR |
dc.subject | Aprendizado de Máquina | pt_BR |
dc.subject | K-Nearest Neighbors | pt_BR |
dc.subject | Machine Learning | pt_BR |
dc.title | Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística | pt_BR |
dc.title.alternative | Exploration and comparison of classification algorithms in Machine Learning: a statistical approach | pt_BR |
dc.type | bachelorThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- ExploracaoComparacaoAlgoritmos_Trindade_2023.pdf
- Tamanho:
- 652.03 KB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.45 KB
- Formato:
- Item-specific license agreed upon to submission
Nenhuma Miniatura disponível