Uso de modelos de linguagem para catalogação automatizada de cartas de sesmaria: uma aplicação à plataforma SILB
dc.contributor.advisor | Falcão, Eduardo de Lucena | |
dc.contributor.advisorID | https://orcid.org/0000-0003-3307-8798 | |
dc.contributor.advisorLattes | http://lattes.cnpq.br/8335184809043358 | |
dc.contributor.author | Costa, José Victor de Sena | |
dc.contributor.authorLattes | http://lattes.cnpq.br/6782219011252684 | |
dc.contributor.referees1 | Silva, Ivanovitch Medeiros Dantas da | |
dc.contributor.referees1ID | https://orcid.org/0000-0002-0116-6489 | |
dc.contributor.referees1Lattes | http://lattes.cnpq.br/3608440944832201 | |
dc.contributor.referees2 | Alveal, Carmen Margarida Oliveira | |
dc.contributor.referees2ID | https://orcid.org/0000-0002-1202-0231 | |
dc.contributor.referees2Lattes | http://lattes.cnpq.br/1118391491224309 | |
dc.date.accessioned | 2025-07-21T13:09:40Z | |
dc.date.available | 2025-07-21T13:09:40Z | |
dc.date.issued | 2025-07-08 | |
dc.description.abstract | This study investigates the application of Large Language Models (LLMs) to automate the cataloging of colonial land grant documents (sesmarias) from the SILB Platform, addressing challenges posed by archaic language, textual variations, and lack of standardization. Using GPT-4o and advanced prompt engineering techniques (zero-shot, few-shot, and chain-of-thought), the system extracts structured data (grantee names, dates, geographic locations) and identifies inconsistencies in existing records. Results showed effectiveness in objective fields (60% accuracy) but limitations in contextual analysis (e.g., justifications, observations). The research advances digital preservation of historical archives by reducing cataloging time and costs, while critically examining AI’s boundaries in processing non-standardized primary sources. | |
dc.description.resumo | Este trabalho investiga a aplicação de Grandes Modelos de Linguagem (LLMs) na catalogação automatizada de cartas de sesmaria da Plataforma SILB, visando superar os desafios impostos pela linguagem arcaica, variações textuais e falta de padronização desses documentos coloniais. Utilizando o modelo GPT-4o e técnicas avançadas de engenharia de prompts (zero-shot, few-shot e chain-of-thought), o estudo desenvolveu um sistema capaz de extrair dados estruturados (nomes de sesmeiros, datas, localizações) e identificar inconsistências nos registros catalogados. Os resultados demonstraram eficácia em campos objetivos (60% de acurácia), mas limitações em análises contextuais complexas, como justificativas e observações. A pesquisa contribui para a preservação digital do acervo histórico, reduzindo custos e tempo de catalogação, enquanto discute os limites da IA no processamento de fontes primárias não padronizadas. | |
dc.identifier.citation | COSTA, Jose Victor de Sena. Uso de modelos de linguagem para catalogação automatizada de cartas de sesmaria: uma aplicação à plataforma SILB. 2025. 60 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Departamento de Engenharia da Computação e Automação, Universidade Federal do Rio Grande do Norte, Natal, 2025 | |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/64680 | |
dc.language.iso | pt_BR | |
dc.publisher | Universidade Federal do Rio Grande do Norte | |
dc.publisher.country | Brazil | |
dc.publisher.department | Engenharia de Computação e Automação | |
dc.publisher.initials | UFRN | |
dc.publisher.program | Engenharia de Computação | |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
dc.subject | Documentos Históricos | |
dc.subject | Engenharia de Prompt | |
dc.subject | LLMs | |
dc.subject | Catalogação Automática | |
dc.subject | Inteligência Artificial | |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::SOFTWARE BASICO | |
dc.title | Uso de modelos de linguagem para catalogação automatizada de cartas de sesmaria: uma aplicação à plataforma SILB | |
dc.type | bachelorThesis |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- usoDeModelosDeLinguagem_costa_2025.pdf
- Tamanho:
- 3.78 MB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.53 KB
- Formato:
- Item-specific license agreed upon to submission
Nenhuma Miniatura disponível