Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN

Brito, Bruna Alice Oliveira de

Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN

Página do item simplificado Estatísticas

dc.contributor.advisor	Menezes Neto, Elias Jacob de
dc.contributor.advisor-co1	Magalhães, Ismenia Blavatsky de
dc.contributor.author	Brito, Bruna Alice Oliveira de
dc.contributor.authorID	https://orcid.org/0009-0001-8116-495X	pt_BR
dc.contributor.referees1	Bezerra, Leonardo César Teonacio
dc.contributor.referees2	Gurgel, André Morais
dc.date.accessioned	2023-11-22T15:05:47Z
dc.date.available	2023-11-22T15:05:47Z
dc.date.issued	2023-10-26
dc.description.abstract	The jurisdiction exercised by the Federal Court of Rio Grande do Norte (JFRN) is extensive and encompasses the analysis and resolution of a wide range of judicial cases of various natures, which may pertain to the environment, social security, tax law, among others [1]. In these cases, on one side, there are private individuals, and on the other side, there are the Union, public enterprises, federal autarchies and foundations, or professional oversight councils [1]. In this context, the integration of Artificial Intelligence (AI) is of significant interest in the field. One of the crucial tools in this scenario is Natural Language Processing (NLP), as numerous legal procedures involve the analysis and interpretation of textual documents. Named Entity Recognition (NER) is one area of NLP dedicated to recognizing and classifying entities mentioned in texts. NER gains special prominence in the legal field, where a multitude of legal documents, contracts, petitions, jurisprudence, and other textual genres require meticulous analysis. Given the foregoing, the main objective of this work is the application of NLP techniques in the processes of the Special Federal Courts of the JFRN, and the secondary objective is the construction of BI dashboards for visualizing the data applied in these techniques. This application analyzed the texts of initial petitions and judgments, and two distinct models were developed. The first model aims to discern whether a process is related to healthcare or not, using an XGBoost model. The second model is responsible for identifying and highlighting words and terms denoting some form of ailment, using a pre-trained BERT (Bidirectional Encoder Representations from Transformers) model, specifically BioBERTpt for disease recognition [3]. By implementing these models, the goal was to facilitate the identification of healthcare-related issues within the texts so that responsible officials could have an overview of the diseases found and optimize the allocation of resources.	pt_BR
dc.description.resumo	A jurisdição exercida pela Justiça Federal no Rio Grande do Norte (JFRN) é ampla e abarca a análise e resolução de uma variada gama de casos judiciais de diversas naturezas, os processos podem ser referentes ao meio ambiente, previdência social, direito tributário, entre outros. [1]. Nesses processos aparecem, de um lado, os particulares e de outro a União, as empresas públicas, autarquias e fundações públicas federais ou os conselhos de fiscalização profissional [1]. Nesse contexto, a integração da Inteligência Artificial (IA) desperta significativo interesse da área, uma das ferramentas cruciais nesse panorama é o Processamento de Linguagem Natural (PLN), pois inúmeros procedimentos legais envolvem a análise e interpretação de documentos textuais. O Reconhecimento de Entidades Nomeadas (do inglês NER - Named Entity Recognition) é uma das áreas do PLN, que é destinada a reconhecer e classificar entidades mencionadas em textos. O NER ganha especial destaque no campo jurídico, onde uma profusão de documentos legais, contratos, petições, jurisprudências e outros gêneros textuais demandam análises minuciosas. Diante do exposto, o objetivo principal deste trabalho é a aplicação de técnicas de PLN em processos dos Juizados Especiais Federais da JFRN, e o objetivo secundário é a construção de painéis de BI para visualização dos dados aplicados nessas técnicas. Essa aplicação analisou os textos das petições iniciais e das sentenças, dois modelos distintos foram desenvolvidos. O primeiro modelo desempenha a função de discernir se um processo é da área da saúde ou não, foi utilizado um modelo XGBoost. O segundo modelo é responsável por identificar e destacar palavras e termos que denotam algum tipo de enfermidade, foi utilizado um modelo pré-treinado de BERT(Bidirectional Encoder Representations from Transformers), o BioBERTpt para reconhecimento de doenças [3]. Ao implementar esses modelos, visou-se promover a identificação de questões relacionadas à saúde existentes nos textos para que os servidores responsáveis tenham um panorama geral das doenças encontradas e possam otimizar a alocação de recursos.	pt_BR
dc.identifier.citation	BRITO, Bruna Alice Oliveira de. Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN. 2023. 59 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023.	pt_BR
dc.identifier.uri	https://repositorio.ufrn.br/handle/123456789/55408
dc.language	pt_BR	pt_BR
dc.publisher	Universidade Federal do Rio Grande do Norte	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.initials	UFRN	pt_BR
dc.subject	NER	pt_BR
dc.subject	PLN	pt_BR
dc.subject	Processos de saúde.	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO	pt_BR
dc.title	Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN	pt_BR
dc.type	bachelorThesis	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: UtilizacaodePLNnaJFRN.pdf
Tamanho:: 1.09 MB
Formato:: Adobe Portable Document Format

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.45 KB
Formato:: Item-specific license agreed upon to submission

Baixar

Coleções

IMD - Residência em Tecnologia da Informação

SIGAA

Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN

Arquivos

Pacote Original

Licença do Pacote

Coleções