Navegando por Autor "Assis, Ítalo Augusto Souza de"
Agora exibindo 1 - 2 de 2
- Resultados por página
- Opções de Ordenação
Dissertação Um algoritmo paralelo eficiente de migração reversa no tempo (rtm) 3d com granularidade fina(Universidade Federal do Rio Grande do Norte, 2015-01-30) Assis, Ítalo Augusto Souza de; Souza, Samuel Xavier de; ; http://lattes.cnpq.br/9892239670106361; ; http://lattes.cnpq.br/1790664811439928; Aloise, Daniel; ; http://lattes.cnpq.br/5093210888872414; Maciel, Rosângela Correa; ; http://lattes.cnpq.br/3815748377917013; Pestana, Reynam da Cruz; ; http://lattes.cnpq.br/7927685281122435O algoritmo de migração reversa no tempo (RTM) tem sido amplamente utilizado na indústria sísmica para gerar imagens do subsolo e, assim, reduzir os riscos de exploração de petróleo e gás. Seu uso em larga escala é devido a sua alta qualidade no imageamento do subsolo. O RTM é também conhecido pelo seu alto custo computacional. Por essa razão, técnicas de computação paralela têm sido utilizadas em suas implementações. Em geral, as abordagens paralelas para o RTM utilizam uma granularidade grossa, dividindo o processamento de um subconjunto de tiros sísmicos entre nós de sistemas distribuí- dos. A abordagem paralela com granularidade grossa para o RTM tem se mostrado bastante eficiente uma vez que o processamento de cada tiro sísmico pode ser realizado de forma independente. Todavia, os nós dos sistemas distribuídos atuais são, em geral, equipamentos com diversos elementos de processamento sob uma arquitetura com memória compartilhada. Assim, o desempenho do algoritmo de RTM pode ser consideravelmente melhorado com a utilização de uma abordagem paralela com granularidade fina para o processamento designado a cada nó. Por essa razão, este trabalho apresenta um algoritmo paralelo eficiente de migração reversa no tempo em 3D com granularidade fina utilizando o padrão OpenMP como modelo de programação. O algoritmo de propagação da onda acústica 3D compõe grande parte do RTM. Foram analisados diferentes balanceamentos de carga a fim de minimizar possíveis perdas de desempenho paralelo nesta fase. Os resultados encontrados serviram como base para a implementação das outras fases do RTM: a retropropagação e a condição de imagem. O algoritmo proposto foi testado com dados sintéticos representando algumas das possíveis estruturas do subsolo. Métricas como speedup e eficiência foram utilizadas para analisar seu desempenho paralelo. As seções migradas mostram que o algoritmo obteve um desempenho satisfatório na identificação das estruturas da subsuperfície. Já as análises de desempenho paralelo explicitam a escalabilidade dos algoritmos alcançando um speedup de 22,46 para a propagação da onda e 16,95 para o RTM, ambos com 24 threads.TCC Estimação adaptativa baseada em acurácia para tempo de execução de aplicações paralelas(Universidade Federal do Rio Grande do Norte, 2025-01-17) Rodrigues, Matheus dos Santos Lopes; Souza, Samuel Xavier de; https://orcid.org/0000-0001-8747-4580; http://lattes.cnpq.br/9892239670106361; http://lattes.cnpq.br/3167736594130827; Silva, Vitor Ramos Gomes da; https://orcid.org/0000-0003-4582-9245; http://lattes.cnpq.br/6417136300042117; Assis, Ítalo Augusto Souza de; https://orcid.org/0000-0003-4122-3115; http://lattes.cnpq.br/1790664811439928A análise de escalabilidade permite a compreensão da eficiência com que um aplicativo paralelo utiliza os recursos de computação. Esse entendimento fornece informações sobre o comportamento do programa, permitindo otimizações, reduzindo o consumo de recursos e orientando as decisões de desenvolvimento para aplicativos de alto desempenho. O processo de análise consome muito tempo porque é necessário medir a execução do aplicativo em várias configurações. Estimar esses tempos de execução com precisão é um desafio devido às interações complexas entre o software e o hardware, o que pode levar a problemas como desequilíbrio de carga e contenção de recursos. Para lidar com esse problema, este documento propõe uma abordagem adaptativa usando a rede neural perceptron multicamada para prever o tempo de execução de algoritmos paralelos de forma iterativa, amostrando diferentes configurações de núcleos e tamanhos de entrada conforme necessário para garantir a precisão. O emprego da abordagem em três algoritmos paralelos diferentes (Matrix Multiplication, Raytrace e Busca em largura), em conjunto com três métodos diferentes de pré-processamento, validou a abordagem. A redução no tempo de execução da análise foi de até 88,2%, com um erro absoluto máximo de 7%. Integrado ao perfilador Pascal Analyzer, o modelo fornece previsões rápidas e precisas, otimizando o tempo de análise para pesquisadores e desenvolvedores. Ao acelerar a análise de escalabilidade e o cálculo de aceleração, o sistema torna o processo de avaliação do desempenho de aplicativos paralelos mais eficiente, contribuindo para avanços significativos na computação de alto desempenho.