Logo do repositório
  • Página Inicial(current)
  • Buscar
    Por Data de PublicaçãoPor AutorPor TítuloPor Assunto
  • Tutoriais
  • Documentos
  • Sobre o RI
  • Eventos
    Repositório Institucional da UFRN: 15 anos de conexão com o conhecimento
  • Padrão
  • Amarelo
  • Azul
  • Verde
  • English
  • Português do Brasil
Entrar

SIGAA

  1. Início
  2. Pesquisar por Autor

Navegando por Autor "Assis, Italo Augusto Souza de"

Filtrar resultados informando as primeiras letras
Agora exibindo 1 - 2 de 2
  • Resultados por página
  • Opções de Ordenação
  • Nenhuma Miniatura disponível
    TCC
    Extending the PaScal Analyzer for MPI Scalability Analysis: Design, Implementation, and Validation
    (Universidade Federal do Rio Grande do Norte, 2025-07-09) Gomes, Júlio Freire Peixoto; Souza , Samuel Xavier de; Assis, Italo Augusto Souza de; Silva, Kayo Gonçalves e
    A análise de desempenho é fundamental em Computação de Alto Desempenho (HPC), essencial para otimizar aplicações, bem como os recursos computacionais utilizados. Contudo, as ferramentas de análises existentes são complexas ou não estão direcionadas a análise de escalabilidade. Essa lacuna dificulta a identificação de tendências de desempenho de forma ágil e prática. A fim de preencher esse espaço faltante, foi criado o PaScal Analyzer, uma ferramenta de análise de desempenho e escalabilidade. O programa foi originalmente projetado para aplicações paralelas em sistemas de memória compartilhada. Este trabalho aprenseta um novo módulo para aplicações distribuídas baseadas em Message Passing Interface (MPI) com ambiente Slurm. A proposta inicial é uma arquitetura completa, utilizando processos auxiliares ("\textit{sidekicks}") para a coleta dos tempos de execução dos processos com baixo nível de intrusão. Entretanto, a versão até agora implementada usa uma arquitetura simplificada sem a utilização dos processos auxiliares, mas mantendo as características coleta com baixa intrusão. A validação experimental foi realizada com o benchmark NASA Advanced Supercomputing (NAS) Integer Sort (IS) em diferentes classes de tamanho de problema e número de processos, avaliando métricas como tempo de execução, speedup, eficiência e escalabilidade. Os resultados obtidos confirmam os modelos teóricos de Amdahl e Gustafson, demonstrando que a ferramenta é capaz de capturar com precisão o comportamento de desempenho em sistemas distribuídos, facilitando a tomada de decisões sobre alocação de recursos e dimensionamento.
  • Carregando...
    Imagem de Miniatura
    Tese
    Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing
    (2019-10-14) Assis, Italo Augusto Souza de; Souza, Samuel Xavier de; ; ; Araújo, João Medeiros de; ; Melo, Jorge Dantas de; ; Silveira, Luiz Felipe de Queiroz; ; Pestana, Reynam da Cruz;
    A modelagem sísmica, a migração reversa no tempo (RTM) e inversão de forma de onda multiescala (MFWI) são três das técnicas mais importantes no levantamento sísmico. A modelagem sísmica simula a propagação de ondas, a RTM gera uma imagem da subsuperfície e a MFWI produz um modelo de velocidades de propagação de ondas. Esses métodos possuem um alto custo computacional devido à grande quantidade de dados que eles processam e à complexidade de seus algoritmos. Por isso, na prática, eles são implementados apenas para sistemas paralelos. Embora existam implementações paralelas eficientes de modelagem, RTM e MFWI na literatura, melhorias podem ser feitas para melhor explorar o paralelismo nesses métodos e as características dos sistemas paralelos atuais. Esta pesquisa propõe a inversão de forma de onda multiescala acoplada (CMFWI), um método alternativo à MFWI, que melhora a escalabilidade paralela ao reduzir a dependência paralela entre o processamento de diferentes conteúdos de frequência dos dados. É apresentada uma implementação do CMFWI usando o método de minimizadores locais acoplados (CLM). Os resultados utilizando a norma L2 mostraram que a CMFWI teve desempenho inferior quando comparado ao MFWI. Esses testes indicam que mais pesquisa é necessária para implementar a CMFWI, pois ela compara dados com diferentes conteúdos de frequência. Este trabalho também apresenta uma estratégia de ajuste automático para escolher adequadamente o tamanho ideal dos blocos de carga de trabalho que reduz o tempo de execução de uma RTM 3D em sistemas de memória compartilhada. O método Coupled Simulated Annealing (CSA) é empregado para ajustar o tamanho dos blocos de carga de trabalho que os laços paralelos atribuem dinamicamente às threads. Testes mostram que o método proposto é consistentemente melhor do que dois agendamentos de laços padrão do OpenMP, sendo até 44% mais rápido. Esta tese também introduz o roubo de trabalho cíclico baseado em token (CTWS) para sistemas de memória distribuída. A nova abordagem de token cíclico reduz o número de falhas de roubo, reduz o overhead de comunicação e simplifica a seleção de vítimas e a estratégia de finalização. Os resultados obtidos com a aplicação da técnica proposta para equilibrar a carga de trabalho de uma RTM 3D apresentam um fator de 14,1% de aceleração e redução do desequilíbrio de carga de 78,4% quando comparadas à distribuição estática convencional. Por fim, é apresentada uma implementação de uma modelagem visco-acústica 2D.
Repositório Institucional - UFRN Campus Universitário Lagoa NovaCEP 59078-970 Caixa postal 1524 Natal/RN - BrasilUniversidade Federal do Rio Grande do Norte© Copyright 2025. Todos os direitos reservados.
Contato+55 (84) 3342-2260 - R232Setor de Repositórios Digitaisrepositorio@bczm.ufrn.br
DSpaceIBICT
OasisBR
LAReferencia
Customizado pela CAT - BCZM