Please use this identifier to cite or link to this item:
https://repositorio.ufrn.br/handle/123456789/55191
Title: | A deep learning model for identifying academic publications aligned with the sustainable development goals |
Authors: | Dias, Alexandre Henrique Soares |
Advisor: | Silva, Ivanovitch Medeiros Dantas da |
Keywords: | Sustainable development;Multilabel classification;Deep learning;Natural language;Scientometrics |
Issue Date: | 31-Aug-2023 |
Publisher: | Universidade Federal do Rio Grande do Norte |
Citation: | DIAS, Alexandre Henrique Soares. A deep learning model for identifying academic publications aligned with the sustainable development goals. Orientador: Dr. Ivanovitch Medeiros Dantas da Silva. 2023. 63f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023. |
Portuguese Abstract: | Em 2015, as Nações Unidas estabeleceram os 17 Objetivos de Desenvolvimento Sustentável (ODS) para promover a responsabilidade ambiental, o avanço econômico e a equidade social. Dentro desse contexto, a pesquisa científica desempenha um papel fundamental na abordagem dos desafios abrangidos pelos ODS. Este trabalho apresenta o desenvolvimento e a implementação de um classificador multirrótulo para identificar artigos científicos alinhados com os ODS, estabelecidos pelas Nações Unidas. Reconhecendo as complexidades e desafios inerentes aos ODS, o trabalho visa auxiliar instituições governamentais, educacionais e privadas na tomada de decisões informadas relacionadas à implementação dos ODS. O classificador proposto foi treinado e avaliado em um conjunto de dados de aproximadamente um milhão de amostras da base de dados Scopus, consistindo em títulos de publicações científicas e rótulos dos ODS. Foram exploradas três arquiteturas distintas de aprendizado profundo: Redes Neurais Recorrentes, BERT e Distilled BERT. Consideração especial foi dada ao tratamento do desequilíbrio de classes, e uma nova métrica multiobjetivo, F-Green, foi introduzida para avaliar tanto o desempenho do modelo quanto a sua pegada de carbono. Entre as arquiteturas de modelo experimentadas, a arquitetura Distilled BERT mostrou-se a melhor opção em equilíbrio entre desempenho e impacto ambiental. Uma aplicação web de prova de conceito foi desenvolvida para demonstrar a funcionalidade do modelo, permitindo que os usuários classifiquem títulos acadêmicos hipotéticos de acordo com os ODS relevantes. O trabalho destaca a importância de alinhar a produção científica com os objetivos de sustentabilidade e fornece uma ferramenta prática para apoiar a tomada de decisões na academia e além. |
Abstract: | In 2015, the United Nations established the 17 Sustainable Development Goals (SDGs) to promote environmental stewardship, economic advancement, and social equity. Within this framework, scientific research plays a pivotal role in addressing the challenges encompassed by the SDGs. This work presents the development and implementation of a multi-label classifier for identifying scientific articles aligned with the SDGs, established by the United Nations. Recognizing the inherent complexities and challenges associated with the SDGs, the work aims to assist governmental, educational, and private institutions in making informed decisions related to SDG implementation. The proposed classifier was trained and evaluated on a dataset of approximately one million samples from the Scopus database, consisting of titles of scientific publications and SDG labels. Three distinct deep learning architectures were explored: Recurrent Neural Networks, BERT, and Distilled BERT. Special consideration was given to handling class imbalance, and a new multi-objective metric, F-Green, was proposed as a way to assess the models’ performances considering not only their performance metrics but also their carbon footprint. Among the model architectures experimented with, the Distilled BERT architecture was found to provide the optimal balance between performance and environmental impact. A proof-of-concept web application was developed to demonstrate the model’s functionality, allowing users to interact with the model and classify hypothetical academic article titles according to one or more SDGs. The work highlights the importance of aligning scientific production with sustainability goals and provides a practical tool to support decision-making in academia and beyond. |
URI: | https://repositorio.ufrn.br/handle/123456789/55191 |
Appears in Collections: | PPGEE - Mestrado em Engenharia Elétrica e de Computação |
Files in This Item:
File | Size | Format | |
---|---|---|---|
Deeplearningmodel_Dias_2023.pdf | 4,31 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.