AIMIR: assistente para recuperação de imagens médicas baseado em LLMs

dc.contributor.advisorOliveira, Luiz Afonso Henderson Guedes de
dc.contributor.advisor-co1Gendriz, Ignacio Sánchez
dc.contributor.authorMatias, Aryel Medeiros
dc.contributor.authorID0000-0001-5784-152X
dc.contributor.authorLatteshttp://lattes.cnpq.br/7650356283210154
dc.contributor.referees1Silva, Ivanovitch M. da
dc.contributor.referees2Valentim, Ricardo Alexsandro de Medeiros
dc.date.accessioned2025-07-18T13:52:54Z
dc.date.available2025-07-18T13:52:54Z
dc.date.issued2025-07-14
dc.description.abstractThis work describes the development and evaluation of a medical image retrieval as- sistant, named AIMIR (Artificial Intelligence-Based Medical Image Retriever), which uses Large Language Models (LLMs) to optimize healthcare professionals’ interaction with patient image exam data and contribute to building annotated datasets for AI. The application aims to facilitate the management and querying of this data, addressing the scarcity of annotated medical data, a significant challenge in developing AI models for healthcare. The system’s architecture integrates the ChromaDB vector database with the Ope- nAI Embeddings API (for semantic representation), the OpenAI Whisper API (for audio transcription), a hybrid query routing system (GPT models), and an intuitive Streamlit interface. The system operates in two main flows: user image addition (via text or audio descriptions) and user queries (by ID, semantic, description, or general). The system’s evaluation used 24 chest X-ray images from a public database, comple- mented by detailed audio descriptions generated by a medical imaging specialist. The tool’s responsiveness tests involved evaluating the entire application pipeline, from data insertion to responses to pre-designed user queries, comparing the system’s output with the expected correct answer. The results showed the effectiveness of data insertion and the importance of accuracy in classifying user intent. The GPT-4o model demonstrated 100% accuracy in query classification, outperforming GPT-3.5 Turbo, which achieved 70% accuracy. The quality of responses varied according to the query type and the LLM used. Re- sults for semantic query types showed lower accuracy rates, which can be explained by very similar image descriptions, suggesting the need for more robust embedding models. Description-based queries, however, benefited from the GPT-4o model. General queries yielded reasonable results with both models, while queries about the database demonstra- ted a notable performance difference, with GPT-4o responding with superior precision. The implementation of the Cache-Augmented Generation (CAG) strategy was crucial for optimizing resource usage and improving efficiency. The study concludes that the image retrieval assistant proposed in this work is a promising application and suggests future tests with other datasets and the possibility of fine-tuning for local execution.
dc.description.resumoEste trabalho descreve o desenvolvimento e avaliação de um assistente de recuperação de imagens médicas, denominado AIMIR Artificial Inteligence-Based Medical Image Re- triver, ou Recuperador de Imagens Médicas baseado em I.A., que utiliza Large Language Models (LLMs) para otimizar a interação de profissionais de saúde com dados de exames de imagens de pacientes e contribuir para a construção de conjuntos de dados anotados para IA. A aplicação visa facilitar o gerenciamento e consultas desses dados, abordando a escassez de dados médicos anotados, um desafio significativo no desenvolvimento de modelos de IA para a saúde. A arquitetura do sistema integra o banco de dados vetorial ChromaDB com API de Embeddings OpenAI (representação semântica), API Whisper OpenAI (transcrição de áudios), um sistema híbrido de roteamento de consultas (modelos GPT) e uma interface Streamlit. O sistema opera em fluxos de adição de imagens (texto/áudio) e consultas do usuário (por ID, semântica, descrição ou geral). A avaliação do sistema utilizou 24 imagens de radiografia de tórax de uma base de dados pública, complementadas por descrições detalhadas em áudio geradas por uma me- dica especialista em imagiologia. Os testes de responsividade da ferramenta consistiram em avaliando todo o pipeline da aplicação, desde a inserção de dados à respostas a consul- tas de usuários pre elaboras, comparando o resultado do sistema com a resposta correta esperada. Os resultados mostraram a eficácia da inserção de dados e a importância da precisão na classificação da intenção do usuário. O modelo GPT-4o demonstrou 100% de acerto na classificação de consultas, superando o GPT-3.5 Turbo, que apresentou 80% de acerto. A qualidade das respostas variou conforme o tipo de consulta e o modelo de LLM. Os resultados obtidos para os tipos de consulta semântica apresentaram taxas menores de acerto, o que pode ser explicado pelas descrições de imagens muito semelhantes, su- gerindo a necessidade de modelos de embeddings mais robustos. Já as consultas por descrição se beneficiaram do modelo GPT 4o. Consultas gerais tiveram resultados razoá- veis com ambos os modelos, enquanto consultas sobre o banco de dados demonstraram uma diferença notável de desempenho, com o GPT 4o respondendo com precisão supe- rior. A implementação da estratégia de Cache-Augmented Generation (CAG) foi crucial para otimizar o uso de recursos e melhorar a eficiência. O estudo conclui que o assis- tente de recuperação de imagens proposto neste trabalho é uma aplicação promissora e sugere testes futuros com outros conjuntos de dados e a possibilidade de fine-tuning para execução local.
dc.identifier.citationMATIAS, Aryel Medeiros. AIMIR: assistente para recuperação de imagens médicas baseado em LLMs. 2025. 34 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Departamento de Engenharia da Computação e Automação, Universidade Federal do Rio Grande do Norte, Natal, 2025.
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/64622
dc.language.isopt_BR
dc.publisherUniversidade Federal do Rio Grande do Norte
dc.publisher.countryBrazil
dc.publisher.departmentEngenharia de Computação e Automação
dc.publisher.initialsUFRN
dc.publisher.programEngenharia de Computação
dc.subjectLLM
dc.subjectNatural Language Processing
dc.subjectIntelligent Assistants
dc.subjectMedical Image Retrieval.
dc.subject.cnpqENGENHARIAS
dc.titleAIMIR: assistente para recuperação de imagens médicas baseado em LLMs
dc.title.alternativeAMIR: Artificial Intelligence-Based Medical Image Retriever
dc.typebachelorThesis

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
TCC_corrigido.pdf
Tamanho:
17.11 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.45 KB
Formato:
Item-specific license agreed upon to submission
Nenhuma Miniatura disponível
Baixar