Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN

dc.contributor.advisorMenezes Neto, Elias Jacob de
dc.contributor.advisor-co1Magalhães, Ismenia Blavatsky de
dc.contributor.authorBrito, Bruna Alice Oliveira de
dc.contributor.authorIDhttps://orcid.org/0009-0001-8116-495Xpt_BR
dc.contributor.referees1Bezerra, Leonardo César Teonacio
dc.contributor.referees2Gurgel, André Morais
dc.date.accessioned2023-11-22T15:05:47Z
dc.date.available2023-11-22T15:05:47Z
dc.date.issued2023-10-26
dc.description.abstractThe jurisdiction exercised by the Federal Court of Rio Grande do Norte (JFRN) is extensive and encompasses the analysis and resolution of a wide range of judicial cases of various natures, which may pertain to the environment, social security, tax law, among others [1]. In these cases, on one side, there are private individuals, and on the other side, there are the Union, public enterprises, federal autarchies and foundations, or professional oversight councils [1]. In this context, the integration of Artificial Intelligence (AI) is of significant interest in the field. One of the crucial tools in this scenario is Natural Language Processing (NLP), as numerous legal procedures involve the analysis and interpretation of textual documents. Named Entity Recognition (NER) is one area of NLP dedicated to recognizing and classifying entities mentioned in texts. NER gains special prominence in the legal field, where a multitude of legal documents, contracts, petitions, jurisprudence, and other textual genres require meticulous analysis. Given the foregoing, the main objective of this work is the application of NLP techniques in the processes of the Special Federal Courts of the JFRN, and the secondary objective is the construction of BI dashboards for visualizing the data applied in these techniques. This application analyzed the texts of initial petitions and judgments, and two distinct models were developed. The first model aims to discern whether a process is related to healthcare or not, using an XGBoost model. The second model is responsible for identifying and highlighting words and terms denoting some form of ailment, using a pre-trained BERT (Bidirectional Encoder Representations from Transformers) model, specifically BioBERTpt for disease recognition [3]. By implementing these models, the goal was to facilitate the identification of healthcare-related issues within the texts so that responsible officials could have an overview of the diseases found and optimize the allocation of resources.pt_BR
dc.description.resumoA jurisdição exercida pela Justiça Federal no Rio Grande do Norte (JFRN) é ampla e abarca a análise e resolução de uma variada gama de casos judiciais de diversas naturezas, os processos podem ser referentes ao meio ambiente, previdência social, direito tributário, entre outros. [1]. Nesses processos aparecem, de um lado, os particulares e de outro a União, as empresas públicas, autarquias e fundações públicas federais ou os conselhos de fiscalização profissional [1]. Nesse contexto, a integração da Inteligência Artificial (IA) desperta significativo interesse da área, uma das ferramentas cruciais nesse panorama é o Processamento de Linguagem Natural (PLN), pois inúmeros procedimentos legais envolvem a análise e interpretação de documentos textuais. O Reconhecimento de Entidades Nomeadas (do inglês NER - Named Entity Recognition) é uma das áreas do PLN, que é destinada a reconhecer e classificar entidades mencionadas em textos. O NER ganha especial destaque no campo jurídico, onde uma profusão de documentos legais, contratos, petições, jurisprudências e outros gêneros textuais demandam análises minuciosas. Diante do exposto, o objetivo principal deste trabalho é a aplicação de técnicas de PLN em processos dos Juizados Especiais Federais da JFRN, e o objetivo secundário é a construção de painéis de BI para visualização dos dados aplicados nessas técnicas. Essa aplicação analisou os textos das petições iniciais e das sentenças, dois modelos distintos foram desenvolvidos. O primeiro modelo desempenha a função de discernir se um processo é da área da saúde ou não, foi utilizado um modelo XGBoost. O segundo modelo é responsável por identificar e destacar palavras e termos que denotam algum tipo de enfermidade, foi utilizado um modelo pré-treinado de BERT(Bidirectional Encoder Representations from Transformers), o BioBERTpt para reconhecimento de doenças [3]. Ao implementar esses modelos, visou-se promover a identificação de questões relacionadas à saúde existentes nos textos para que os servidores responsáveis tenham um panorama geral das doenças encontradas e possam otimizar a alocação de recursos.pt_BR
dc.identifier.citationBRITO, Bruna Alice Oliveira de. Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN. 2023. 59 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/55408
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.subjectNERpt_BR
dc.subjectPLNpt_BR
dc.subjectProcessos de saúde.pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpt_BR
dc.titleUtilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRNpt_BR
dc.typebachelorThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
UtilizacaodePLNnaJFRN.pdf
Tamanho:
1.09 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.45 KB
Formato:
Item-specific license agreed upon to submission
Nenhuma Miniatura disponível
Baixar