Logo do repositório
  • Página Inicial(current)
  • Buscar
    Por Data de PublicaçãoPor AutorPor TítuloPor Assunto
  • Tutoriais
  • Documentos
  • Sobre o RI
  • Eventos
    Repositório Institucional da UFRN: 15 anos de conexão com o conhecimento
  • Padrão
  • Amarelo
  • Azul
  • Verde
  • English
  • Português do Brasil
Entrar

SIGAA

  1. Início
  2. Pesquisar por Autor

Navegando por Autor "Rodrigues, Vitor Hugo Mickus"

Filtrar resultados informando as primeiras letras
Agora exibindo 1 - 2 de 2
  • Resultados por página
  • Opções de Ordenação
  • Nenhuma Miniatura disponível
    TCC
    Análise e comparação dos tipos escalonadores do OpenMP para propagação de onda
    (Universidade Federal do Rio Grande do Norte, 2021-09-15) Cunha Neto, Lourival Alexandre da; Souza, Samuel Xavier de; Rodrigues, Vitor Hugo Mickus; http://lattes.cnpq.br/8277877627875924; http://lattes.cnpq.br/9892239670106361; http://lattes.cnpq.br/9430651520026942; Assis, Ítalo A. Souza de
    O fenômeno de propagação de onda é importante para diversas aplicações físicas, como por exemplo: dinâmica de fluidos, elasticidade, propagação de calor, eletrostática, análise sísmica, entre outros. Um exemplo de uso em análise sísmica é no imageamento de uma região de interesse, com intuito de descobrir possíveis recursos de uma subsuperfície. Esta técnica envolve fazer uma simulação computacional de como uma onda é propagada no interior de uma área. Existem diferentes algoritmos que fazem esta simulação, dentre eles foi utilizado o Algoritmo da Esfera. Este algoritmo está em desenvolvimento no Laboratório de Arquiteturas Paralelas para Processamento de Sinais (LAPPS) da Universidade Federal do Rio Grande do Norte (UFRN). Para aprimorar e otimizar este método de análise sísmica, que faz uso do método de diferenças finitas e da paralelização em C++ utilizando a biblioteca OpenMP, foram feitos testes com diferentes tipos de escalonadores (static, dynamic, guided e auto) e tamanho de blocos de tarefas (chunksize). A pesquisa confirmou que o OpenMP atribui o escalonador static como default do sistema e demonstrou que auto, para este código, apresentou valores de tempo de execução aproximadamente iguais aos valores do tipo static. Onde o escalonador static com o chunksize default, que é o número de iterações dividido pelo número de threads, apresentou resultados de tempos de execução entre 95.56% à 194.47% mais rápidos que os outros.
  • Carregando...
    Imagem de Miniatura
    Dissertação
    GPU support for automatic generation of finite-differences Stencil Kernels
    (Universidade Federal do Rio Grande do Norte, 2020-01-16) Rodrigues, Vitor Hugo Mickus; Souza, Samuel Xavier de; Cavalcante, Lucas Costa Pereira; ; ; ; Peixoto, Pedro da Silva; ; Bianchini, Calebe de Paula; ; Gorman, Gerard John;
    A obtenção de soluções numéricas para algoritmos de inversão sísmica como Inversão Completa da Forma de Onda (FWI, do inglês Full-Waveform Inversion) e Migração Reversa no Tempo (RTM, do inglês Reverse Time Migration), pode ser acelerada por arquiteturas que possuem um alto grau de paralelismo, como unidades de processamento gráfico (GPU, do inglês Graphical Processing Units). Porém, o rápido desenvolvimento de novas arquiteturas e tecnologias dificultam a manutenção e atualização das soluções implementadas. Neste trabalho, o transpilador de código fonte aberto chamado Devito é estendido para habilitar conversão automática de kernels de diferenças finitas para arquiteturas GPU. O framework Oxford Parallel Domain Specific Language (OP-DSL) foi utilizado para construção de um novo backend para o Devito. A solução implementada fora validada nas GPUs NVIDIAR GTX Titan Z e NVIDIAR Tesla V100. O desempenho da implementação fora medido em termos de tempo de execução, e em termos de desempenho relativo através do modelo de roofline. Os testes foram feitos para diversos níveis de discretização de ordem espacial em um estêncil de propagação de onda acústica isotrópica 3D sobre uma malha de 2563. Os resultados demonstram que os kernels produzidos alcançaram aproximadamente 63% do desempenho máximo da V100 e cerca de 24% do desempenho máximo na GTX Titan Z. O estudo ainda revela que otimizar a transferência de dados entre CPU e GPU é um dos maiores desafios para alavancar o desempenho nas arquiteturas avaliadas.
Repositório Institucional - UFRN Campus Universitário Lagoa NovaCEP 59078-970 Caixa postal 1524 Natal/RN - BrasilUniversidade Federal do Rio Grande do Norte© Copyright 2025. Todos os direitos reservados.
Contato+55 (84) 3342-2260 - R232Setor de Repositórios Digitaisrepositorio@bczm.ufrn.br
DSpaceIBICT
OasisBR
LAReferencia
Customizado pela CAT - BCZM