Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing

dc.contributor.advisorSouza, Samuel Xavier de
dc.contributor.advisorIDpt_BR
dc.contributor.authorAssis, Italo Augusto Souza de
dc.contributor.authorIDpt_BR
dc.contributor.referees1Araújo, João Medeiros de
dc.contributor.referees1IDpt_BR
dc.contributor.referees2Melo, Jorge Dantas de
dc.contributor.referees2IDpt_BR
dc.contributor.referees3Silveira, Luiz Felipe de Queiroz
dc.contributor.referees3IDpt_BR
dc.contributor.referees4Pestana, Reynam da Cruz
dc.contributor.referees4IDpt_BR
dc.date.accessioned2020-01-23T17:19:29Z
dc.date.available2020-01-23T17:19:29Z
dc.date.issued2019-10-14
dc.description.abstractSeismic modeling, reverse time migration (RTM), and multi-scale waveform inversion (MFWI) are three of the most important techniques in seismic surveying. Seismic modeling simulates the wave propagation, RTM generates an image of the subsurface, and MFWI produces a wave propagation velocity model. These methods demand intensive computational cost due to a large amount of data they process and the complexity of their algorithms. Because of that, they are only implemented for parallel systems in practical. Although there are efficient parallel implementations of modeling, RTM, and MFWI in the literature, further improvement can be achieved by better exploring the parallelism in these methods and the characteristics of the current parallel systems. This research proposes coupled multi-scale waveform inversion (CMFWI), an alternative method to MFWI, which improves parallel scalability by reducing the parallel dependency between the processing of different frequency content of the data. An implementation of CMFWI using the coupled local minimizers method (CLM) is presented. L2-norm results showed that CMFWI had an inferior performance when compared to MFWI. These experiments indicate that further research is necessary to implement CMFWI as it compares data with different frequency contents. This work also introduces an auto-tuning strategy for properly choosing the optimal chunk size that reduces the runtime of a 3D RTM algorithm in shared memory systems. A coupled simulated annealing method (CSA) is employed to adjust the chunk size of work that parallel loops assign dynamically to worker threads. Experiments show that the proposed method is consistently better than two default OpenMP loop schedulers being up to 44% faster. This thesis also introduces the cyclic token-based work-stealing (CTWS) for distributed memory systems. The novel cyclic token approach reduces the number of failed steals, avoids communication overhead, and simplifies the victim selection and the termination strategy. Results obtained by applying the proposed technique to balance the workload of a 3D RTM present a factor of 14.1% speedup and reductions of the load imbalance of 78.4% when compared to the conventional static distribution. Finally, an implementation of a 2D visco-acoustic modeling is presented.pt_BR
dc.description.resumoA modelagem sísmica, a migração reversa no tempo (RTM) e inversão de forma de onda multiescala (MFWI) são três das técnicas mais importantes no levantamento sísmico. A modelagem sísmica simula a propagação de ondas, a RTM gera uma imagem da subsuperfície e a MFWI produz um modelo de velocidades de propagação de ondas. Esses métodos possuem um alto custo computacional devido à grande quantidade de dados que eles processam e à complexidade de seus algoritmos. Por isso, na prática, eles são implementados apenas para sistemas paralelos. Embora existam implementações paralelas eficientes de modelagem, RTM e MFWI na literatura, melhorias podem ser feitas para melhor explorar o paralelismo nesses métodos e as características dos sistemas paralelos atuais. Esta pesquisa propõe a inversão de forma de onda multiescala acoplada (CMFWI), um método alternativo à MFWI, que melhora a escalabilidade paralela ao reduzir a dependência paralela entre o processamento de diferentes conteúdos de frequência dos dados. É apresentada uma implementação do CMFWI usando o método de minimizadores locais acoplados (CLM). Os resultados utilizando a norma L2 mostraram que a CMFWI teve desempenho inferior quando comparado ao MFWI. Esses testes indicam que mais pesquisa é necessária para implementar a CMFWI, pois ela compara dados com diferentes conteúdos de frequência. Este trabalho também apresenta uma estratégia de ajuste automático para escolher adequadamente o tamanho ideal dos blocos de carga de trabalho que reduz o tempo de execução de uma RTM 3D em sistemas de memória compartilhada. O método Coupled Simulated Annealing (CSA) é empregado para ajustar o tamanho dos blocos de carga de trabalho que os laços paralelos atribuem dinamicamente às threads. Testes mostram que o método proposto é consistentemente melhor do que dois agendamentos de laços padrão do OpenMP, sendo até 44% mais rápido. Esta tese também introduz o roubo de trabalho cíclico baseado em token (CTWS) para sistemas de memória distribuída. A nova abordagem de token cíclico reduz o número de falhas de roubo, reduz o overhead de comunicação e simplifica a seleção de vítimas e a estratégia de finalização. Os resultados obtidos com a aplicação da técnica proposta para equilibrar a carga de trabalho de uma RTM 3D apresentam um fator de 14,1% de aceleração e redução do desequilíbrio de carga de 78,4% quando comparadas à distribuição estática convencional. Por fim, é apresentada uma implementação de uma modelagem visco-acústica 2D.pt_BR
dc.identifier.citationASSIS, Ítalo Augusto Souza de. Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing. 2019. 108f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2019.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/jspui/handle/123456789/28353
dc.languagept_BRpt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectInversão da Forma de Onda Multiescala (MFWI)pt_BR
dc.subjectMinimizadores Locais Acoplados (CLM)pt_BR
dc.subjectEficiênciapt_BR
dc.subjectEscalabilidadept_BR
dc.subjectAjuste automáticopt_BR
dc.subjectCoupled Simulated Annealing (CSA)pt_BR
dc.subjectMigração Reversa no Tempo (RTM)pt_BR
dc.subjectBalanceamento de cargapt_BR
dc.subjectRoubo de Trabalho Cíclico Baseado em Token (CTWS)pt_BR
dc.subjectComunicação unilateralpt_BR
dc.subjectMemória distribuídapt_BR
dc.subjectMemória compartilhadapt_BR
dc.subjectModelagem visco-acústicapt_BR
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICApt_BR
dc.titleIntra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processingpt_BR
dc.typedoctoralThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Intranodeinternode_Assis_2019.pdf
Tamanho:
1.1 MB
Formato:
Adobe Portable Document Format
Carregando...
Imagem de Miniatura
Baixar