Navegando por Autor "Assis, Italo Augusto Souza de"

Agora exibindo 1 - 2 de 2

Extending the PaScal Analyzer for MPI Scalability Analysis: Design, Implementation, and Validation
(Universidade Federal do Rio Grande do Norte, 2025-07-09) Gomes, Júlio Freire Peixoto; Souza , Samuel Xavier de; Assis, Italo Augusto Souza de; Silva, Kayo Gonçalves e
A análise de desempenho é fundamental em Computação de Alto Desempenho (HPC), essencial para otimizar aplicações, bem como os recursos computacionais utilizados. Contudo, as ferramentas de análises existentes são complexas ou não estão direcionadas a análise de escalabilidade. Essa lacuna dificulta a identificação de tendências de desempenho de forma ágil e prática. A fim de preencher esse espaço faltante, foi criado o PaScal Analyzer, uma ferramenta de análise de desempenho e escalabilidade. O programa foi originalmente projetado para aplicações paralelas em sistemas de memória compartilhada. Este trabalho aprenseta um novo módulo para aplicações distribuídas baseadas em Message Passing Interface (MPI) com ambiente Slurm. A proposta inicial é uma arquitetura completa, utilizando processos auxiliares ("\textit{sidekicks}") para a coleta dos tempos de execução dos processos com baixo nível de intrusão. Entretanto, a versão até agora implementada usa uma arquitetura simplificada sem a utilização dos processos auxiliares, mas mantendo as características coleta com baixa intrusão. A validação experimental foi realizada com o benchmark NASA Advanced Supercomputing (NAS) Integer Sort (IS) em diferentes classes de tamanho de problema e número de processos, avaliando métricas como tempo de execução, speedup, eficiência e escalabilidade. Os resultados obtidos confirmam os modelos teóricos de Amdahl e Gustafson, demonstrando que a ferramenta é capaz de capturar com precisão o comportamento de desempenho em sistemas distribuídos, facilitando a tomada de decisões sobre alocação de recursos e dimensionamento.
Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing
(2019-10-14) Assis, Italo Augusto Souza de; Souza, Samuel Xavier de; ; ; Araújo, João Medeiros de; ; Melo, Jorge Dantas de; ; Silveira, Luiz Felipe de Queiroz; ; Pestana, Reynam da Cruz;
A modelagem sísmica, a migração reversa no tempo (RTM) e inversão de forma de onda multiescala (MFWI) são três das técnicas mais importantes no levantamento sísmico. A modelagem sísmica simula a propagação de ondas, a RTM gera uma imagem da subsuperfície e a MFWI produz um modelo de velocidades de propagação de ondas. Esses métodos possuem um alto custo computacional devido à grande quantidade de dados que eles processam e à complexidade de seus algoritmos. Por isso, na prática, eles são implementados apenas para sistemas paralelos. Embora existam implementações paralelas eficientes de modelagem, RTM e MFWI na literatura, melhorias podem ser feitas para melhor explorar o paralelismo nesses métodos e as características dos sistemas paralelos atuais. Esta pesquisa propõe a inversão de forma de onda multiescala acoplada (CMFWI), um método alternativo à MFWI, que melhora a escalabilidade paralela ao reduzir a dependência paralela entre o processamento de diferentes conteúdos de frequência dos dados. É apresentada uma implementação do CMFWI usando o método de minimizadores locais acoplados (CLM). Os resultados utilizando a norma L2 mostraram que a CMFWI teve desempenho inferior quando comparado ao MFWI. Esses testes indicam que mais pesquisa é necessária para implementar a CMFWI, pois ela compara dados com diferentes conteúdos de frequência. Este trabalho também apresenta uma estratégia de ajuste automático para escolher adequadamente o tamanho ideal dos blocos de carga de trabalho que reduz o tempo de execução de uma RTM 3D em sistemas de memória compartilhada. O método Coupled Simulated Annealing (CSA) é empregado para ajustar o tamanho dos blocos de carga de trabalho que os laços paralelos atribuem dinamicamente às threads. Testes mostram que o método proposto é consistentemente melhor do que dois agendamentos de laços padrão do OpenMP, sendo até 44% mais rápido. Esta tese também introduz o roubo de trabalho cíclico baseado em token (CTWS) para sistemas de memória distribuída. A nova abordagem de token cíclico reduz o número de falhas de roubo, reduz o overhead de comunicação e simplifica a seleção de vítimas e a estratégia de finalização. Os resultados obtidos com a aplicação da técnica proposta para equilibrar a carga de trabalho de uma RTM 3D apresentam um fator de 14,1% de aceleração e redução do desequilíbrio de carga de 78,4% quando comparadas à distribuição estática convencional. Por fim, é apresentada uma implementação de uma modelagem visco-acústica 2D.

SIGAA

Navegando por Autor "Assis, Italo Augusto Souza de"