EURYALE: fluxos de trabalho e reprodutibilidade em metagenômica

dc.contributor.advisorDalmolin, Rodrigo Juliani Siqueira
dc.contributor.advisorIDhttps://orcid.org/0000-0002-1688-6155pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/4065178015615979pt_BR
dc.contributor.authorCavalcante, João Vitor Ferreira
dc.contributor.authorIDhttps://orcid.org/0000-0001-7513-7376pt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/5714602163308583pt_BR
dc.contributor.referees1Lanza, Daniel Carlos Ferreira
dc.contributor.referees2Moioli, Renan Cipriano
dc.contributor.referees3Dantas, Marcel da Câmara Ribeiro
dc.date.accessioned2025-02-07T21:14:15Z
dc.date.available2025-02-07T21:14:15Z
dc.date.issued2024-12-06
dc.description.abstractThe past few years have seen significant advances in the study of complex microbial communities associated with the evolution of sequencing technologies and increasing adoption of whole genome shotgun sequencing methods over the once more traditional Amplicon-based methods. Through this evolution, these approaches have been built with associated computational strategies to tackle the data they generate. However, these computational methods have not been generally accompanied by thoughtful design strategies that prioritise long term support with low maintainability, high data accessibility and end-to-end automation. In this work, we first elaborate on the computational landscape in metagenomics, and how its methods can disregard fundamental software development principles that guide them towards improved reproducibility, principles such as dependency isolation, high parameterization, automatic report generation, with interactive figures that facilitate data exploration and, finally, descriptive and practical documentation. Following this, we tackle current limitations in metagenomic data processing by implementing a new data analysis workflow, EURYALE, based on a previous methodology, MEDUSA, that selected its tools through rigorous benchmarking. This new workflow, built with Nextflow, is adaptable to different scenarios and built with good software development practices as guiding principles, it serves to advance metagenomic data processing as a whole, and, additionally, make the data resulting from these analysis workflows accessible to a wider audience.pt_BR
dc.description.resumoOs últimos anos têm testemunhado avanços significativos no estudo de comunidades microbianas complexas, impulsionados pela evolução das tecnologias de sequenciamento e pela crescente adoção de métodos de sequenciamento total do genoma (whole genome shotgun) em detrimento dos métodos, antes mais tradicionais, baseados em amplicon. Com essa evolução, essas abordagens foram desenvolvidas com estratégias computacionais associadas para lidar com os dados que geram. No entanto, esses métodos computacionais geralmente não foram acompanhados por estratégias de design cuidadosas que priorizam o suporte a longo prazo, com baixa necessidade de manutenção, alta acessibilidade de dados e automação de ponta a ponta. Neste trabalho, elaboramos sobre o cenário computacional em metagenômica e como os métodos atuais negligenciam princípios fundamentais de desenvolvimento de software, que poderia os orientar para uma maior reprodutibilidade, tais como isolamento de dependências, alta parametrização, geração automática de relatórios com figuras interativas que facilitam a exploração de dados e, por fim, documentação descritiva e prática. Em seguida, abordamos as limitações atuais no processamento de dados metagenômicos ao implementar um novo fluxo de trabalho de análise de dados, o EURYALE, baseado em uma metodologia anterior, o MEDUSA, que selecionou suas ferramentas por meio de rigoroso benchmarking. Esse novo fluxo de trabalho, adaptável a diferentes cenários e construído com Nextflow, utiliza boas práticas de desenvolvimento de software como princípios norteadores e visa avançar o processamento de dados metagenômicos como um todo e, adicionalmente, tornar os dados resultantes desses workflows de análise acessíveis a um público mais amplo.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.identifier.citationCAVALCANTE, João Vitor Ferreira. EURYALE: fluxos de trabalho e reprodutibilidade em metagenômica. Orientador: Dr. Rodrigo Juliani Siqueira Dalmolin. 2024. 69f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2024.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/62599
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICApt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectMetagenômicapt_BR
dc.subjectFluxos de trabalhopt_BR
dc.subjectReprodutibilidadept_BR
dc.subjectDesenvolvimento de softwarept_BR
dc.subjectNextflowpt_BR
dc.subject.cnpqCNPQ::CIENCIAS BIOLOGICASpt_BR
dc.titleEURYALE: fluxos de trabalho e reprodutibilidade em metagenômicapt_BR
dc.typemasterThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
EURYALEfluxostrabalho_Cavalcante_2024.pdf
Tamanho:
2.24 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar