Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN
dc.contributor.advisor | Menezes Neto, Elias Jacob de | |
dc.contributor.advisor-co1 | Magalhães, Ismenia Blavatsky de | |
dc.contributor.author | Brito, Bruna Alice Oliveira de | |
dc.contributor.authorID | https://orcid.org/0009-0001-8116-495X | pt_BR |
dc.contributor.referees1 | Bezerra, Leonardo César Teonacio | |
dc.contributor.referees2 | Gurgel, André Morais | |
dc.date.accessioned | 2023-11-22T15:05:47Z | |
dc.date.available | 2023-11-22T15:05:47Z | |
dc.date.issued | 2023-10-26 | |
dc.description.abstract | The jurisdiction exercised by the Federal Court of Rio Grande do Norte (JFRN) is extensive and encompasses the analysis and resolution of a wide range of judicial cases of various natures, which may pertain to the environment, social security, tax law, among others [1]. In these cases, on one side, there are private individuals, and on the other side, there are the Union, public enterprises, federal autarchies and foundations, or professional oversight councils [1]. In this context, the integration of Artificial Intelligence (AI) is of significant interest in the field. One of the crucial tools in this scenario is Natural Language Processing (NLP), as numerous legal procedures involve the analysis and interpretation of textual documents. Named Entity Recognition (NER) is one area of NLP dedicated to recognizing and classifying entities mentioned in texts. NER gains special prominence in the legal field, where a multitude of legal documents, contracts, petitions, jurisprudence, and other textual genres require meticulous analysis. Given the foregoing, the main objective of this work is the application of NLP techniques in the processes of the Special Federal Courts of the JFRN, and the secondary objective is the construction of BI dashboards for visualizing the data applied in these techniques. This application analyzed the texts of initial petitions and judgments, and two distinct models were developed. The first model aims to discern whether a process is related to healthcare or not, using an XGBoost model. The second model is responsible for identifying and highlighting words and terms denoting some form of ailment, using a pre-trained BERT (Bidirectional Encoder Representations from Transformers) model, specifically BioBERTpt for disease recognition [3]. By implementing these models, the goal was to facilitate the identification of healthcare-related issues within the texts so that responsible officials could have an overview of the diseases found and optimize the allocation of resources. | pt_BR |
dc.description.resumo | A jurisdição exercida pela Justiça Federal no Rio Grande do Norte (JFRN) é ampla e abarca a análise e resolução de uma variada gama de casos judiciais de diversas naturezas, os processos podem ser referentes ao meio ambiente, previdência social, direito tributário, entre outros. [1]. Nesses processos aparecem, de um lado, os particulares e de outro a União, as empresas públicas, autarquias e fundações públicas federais ou os conselhos de fiscalização profissional [1]. Nesse contexto, a integração da Inteligência Artificial (IA) desperta significativo interesse da área, uma das ferramentas cruciais nesse panorama é o Processamento de Linguagem Natural (PLN), pois inúmeros procedimentos legais envolvem a análise e interpretação de documentos textuais. O Reconhecimento de Entidades Nomeadas (do inglês NER - Named Entity Recognition) é uma das áreas do PLN, que é destinada a reconhecer e classificar entidades mencionadas em textos. O NER ganha especial destaque no campo jurídico, onde uma profusão de documentos legais, contratos, petições, jurisprudências e outros gêneros textuais demandam análises minuciosas. Diante do exposto, o objetivo principal deste trabalho é a aplicação de técnicas de PLN em processos dos Juizados Especiais Federais da JFRN, e o objetivo secundário é a construção de painéis de BI para visualização dos dados aplicados nessas técnicas. Essa aplicação analisou os textos das petições iniciais e das sentenças, dois modelos distintos foram desenvolvidos. O primeiro modelo desempenha a função de discernir se um processo é da área da saúde ou não, foi utilizado um modelo XGBoost. O segundo modelo é responsável por identificar e destacar palavras e termos que denotam algum tipo de enfermidade, foi utilizado um modelo pré-treinado de BERT(Bidirectional Encoder Representations from Transformers), o BioBERTpt para reconhecimento de doenças [3]. Ao implementar esses modelos, visou-se promover a identificação de questões relacionadas à saúde existentes nos textos para que os servidores responsáveis tenham um panorama geral das doenças encontradas e possam otimizar a alocação de recursos. | pt_BR |
dc.identifier.citation | BRITO, Bruna Alice Oliveira de. Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN. 2023. 59 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023. | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/55408 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.subject | NER | pt_BR |
dc.subject | PLN | pt_BR |
dc.subject | Processos de saúde. | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO | pt_BR |
dc.title | Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN | pt_BR |
dc.type | bachelorThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- UtilizacaodePLNnaJFRN.pdf
- Tamanho:
- 1.09 MB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.45 KB
- Formato:
- Item-specific license agreed upon to submission
Nenhuma Miniatura disponível