Please use this identifier to cite or link to this item: https://repositorio.ufrn.br/handle/123456789/30252
Title: GPU support for automatic generation of finite-differences Stencil Kernels
Authors: Rodrigues, Vitor Hugo Mickus
Keywords: Linguagem de domínio específico;Diferenças finitas;Estêncil;Kernel;Arquiteturas paralelas;GPU;Devito e OPS
Issue Date: 16-Jan-2020
Publisher: Universidade Federal do Rio Grande do Norte
Citation: RODRIGUES, Vitor Hugo Mickus. GPU support for automatic generation of finite-differences Stencil Kernels. 2020. 56f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020.
Portuguese Abstract: A obtenção de soluções numéricas para algoritmos de inversão sísmica como Inversão Completa da Forma de Onda (FWI, do inglês Full-Waveform Inversion) e Migração Reversa no Tempo (RTM, do inglês Reverse Time Migration), pode ser acelerada por arquiteturas que possuem um alto grau de paralelismo, como unidades de processamento gráfico (GPU, do inglês Graphical Processing Units). Porém, o rápido desenvolvimento de novas arquiteturas e tecnologias dificultam a manutenção e atualização das soluções implementadas. Neste trabalho, o transpilador de código fonte aberto chamado Devito é estendido para habilitar conversão automática de kernels de diferenças finitas para arquiteturas GPU. O framework Oxford Parallel Domain Specific Language (OP-DSL) foi utilizado para construção de um novo backend para o Devito. A solução implementada fora validada nas GPUs NVIDIAR GTX Titan Z e NVIDIAR Tesla V100. O desempenho da implementação fora medido em termos de tempo de execução, e em termos de desempenho relativo através do modelo de roofline. Os testes foram feitos para diversos níveis de discretização de ordem espacial em um estêncil de propagação de onda acústica isotrópica 3D sobre uma malha de 2563. Os resultados demonstram que os kernels produzidos alcançaram aproximadamente 63% do desempenho máximo da V100 e cerca de 24% do desempenho máximo na GTX Titan Z. O estudo ainda revela que otimizar a transferência de dados entre CPU e GPU é um dos maiores desafios para alavancar o desempenho nas arquiteturas avaliadas.
Abstract: The growth of data to be processed in the Oil & Gas industry matches the requirements imposed by evolving algorithms based on stencil computations, such as Full Waveform Inversion and Reverse Time Migration. Graphical processing units (GPUs) are an attractive architectural target for stencil computations because of its high degree of data parallelism. However, the rapid architectural and technological progression makes it difficult for even the most proficient programmers to remain up-to-date with the technological advances at a micro-architectural level. This work presents an extension for an open source transpiler named Devito, designed to produce highly optimized finite difference kernels for inversion methods. Embedding it with the Oxford Parallel Domain Specific Language (OP-DSL) enabled the automatic code generation for GPU architectures from a high-level representation. This work aims to enable users coding in a symbolic representation level to effortlessly get their implementations leveraged by the processing capacities of GPU architectures. The implemented backend is evaluated on a NVIDIA R GTX Titan Z, and on a NVIDIAR Tesla V100 in terms of execution time and in terms of operational intensity through the roofline model. A 3D acoustic isotropic wave propagation was used as experiment with stencil kernels for varying space-order discretization levels over grids with 2563 points. It achieves approximately 63% of V100’s peak performance and 24% of Titan Z’s peak performance. This study indicates that improving memory usage should be the most efficient strategy for leveraging the performance of the implemented solution on the evaluated architectures.
URI: https://repositorio.ufrn.br/handle/123456789/30252
Appears in Collections:PPGEE - Mestrado em Engenharia Elétrica e de Computação

Files in This Item:
File Description SizeFormat 
GPUsupportfor_Rodrigues_2020.pdf4,54 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.