Uso de modelos de linguagem para catalogação automatizada de cartas de sesmaria: uma aplicação à plataforma SILB

dc.contributor.advisorFalcão, Eduardo de Lucena
dc.contributor.advisorIDhttps://orcid.org/0000-0003-3307-8798
dc.contributor.advisorLatteshttp://lattes.cnpq.br/8335184809043358
dc.contributor.authorCosta, José Victor de Sena
dc.contributor.authorLatteshttp://lattes.cnpq.br/6782219011252684
dc.contributor.referees1Silva, Ivanovitch Medeiros Dantas da
dc.contributor.referees1IDhttps://orcid.org/0000-0002-0116-6489
dc.contributor.referees1Latteshttp://lattes.cnpq.br/3608440944832201
dc.contributor.referees2Alveal, Carmen Margarida Oliveira
dc.contributor.referees2IDhttps://orcid.org/0000-0002-1202-0231
dc.contributor.referees2Latteshttp://lattes.cnpq.br/1118391491224309
dc.date.accessioned2025-07-21T13:09:40Z
dc.date.available2025-07-21T13:09:40Z
dc.date.issued2025-07-08
dc.description.abstractThis study investigates the application of Large Language Models (LLMs) to automate the cataloging of colonial land grant documents (sesmarias) from the SILB Platform, addressing challenges posed by archaic language, textual variations, and lack of standardization. Using GPT-4o and advanced prompt engineering techniques (zero-shot, few-shot, and chain-of-thought), the system extracts structured data (grantee names, dates, geographic locations) and identifies inconsistencies in existing records. Results showed effectiveness in objective fields (60% accuracy) but limitations in contextual analysis (e.g., justifications, observations). The research advances digital preservation of historical archives by reducing cataloging time and costs, while critically examining AI’s boundaries in processing non-standardized primary sources.
dc.description.resumoEste trabalho investiga a aplicação de Grandes Modelos de Linguagem (LLMs) na catalogação automatizada de cartas de sesmaria da Plataforma SILB, visando superar os desafios impostos pela linguagem arcaica, variações textuais e falta de padronização desses documentos coloniais. Utilizando o modelo GPT-4o e técnicas avançadas de engenharia de prompts (zero-shot, few-shot e chain-of-thought), o estudo desenvolveu um sistema capaz de extrair dados estruturados (nomes de sesmeiros, datas, localizações) e identificar inconsistências nos registros catalogados. Os resultados demonstraram eficácia em campos objetivos (60% de acurácia), mas limitações em análises contextuais complexas, como justificativas e observações. A pesquisa contribui para a preservação digital do acervo histórico, reduzindo custos e tempo de catalogação, enquanto discute os limites da IA no processamento de fontes primárias não padronizadas.
dc.identifier.citationCOSTA, Jose Victor de Sena. Uso de modelos de linguagem para catalogação automatizada de cartas de sesmaria: uma aplicação à plataforma SILB. 2025. 60 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Departamento de Engenharia da Computação e Automação, Universidade Federal do Rio Grande do Norte, Natal, 2025
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/64680
dc.language.isopt_BR
dc.publisherUniversidade Federal do Rio Grande do Norte
dc.publisher.countryBrazil
dc.publisher.departmentEngenharia de Computação e Automação
dc.publisher.initialsUFRN
dc.publisher.programEngenharia de Computação
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectDocumentos Históricos
dc.subjectEngenharia de Prompt
dc.subjectLLMs
dc.subjectCatalogação Automática
dc.subjectInteligência Artificial
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::SOFTWARE BASICO
dc.titleUso de modelos de linguagem para catalogação automatizada de cartas de sesmaria: uma aplicação à plataforma SILB
dc.typebachelorThesis

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
usoDeModelosDeLinguagem_costa_2025.pdf
Tamanho:
3.78 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.53 KB
Formato:
Item-specific license agreed upon to submission
Nenhuma Miniatura disponível
Baixar