EURYALE: fluxos de trabalho e reprodutibilidade em metagenômica
dc.contributor.advisor | Dalmolin, Rodrigo Juliani Siqueira | |
dc.contributor.advisorID | https://orcid.org/0000-0002-1688-6155 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/4065178015615979 | pt_BR |
dc.contributor.author | Cavalcante, João Vitor Ferreira | |
dc.contributor.authorID | https://orcid.org/0000-0001-7513-7376 | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/5714602163308583 | pt_BR |
dc.contributor.referees1 | Lanza, Daniel Carlos Ferreira | |
dc.contributor.referees2 | Moioli, Renan Cipriano | |
dc.contributor.referees3 | Dantas, Marcel da Câmara Ribeiro | |
dc.date.accessioned | 2025-02-07T21:14:15Z | |
dc.date.available | 2025-02-07T21:14:15Z | |
dc.date.issued | 2024-12-06 | |
dc.description.abstract | The past few years have seen significant advances in the study of complex microbial communities associated with the evolution of sequencing technologies and increasing adoption of whole genome shotgun sequencing methods over the once more traditional Amplicon-based methods. Through this evolution, these approaches have been built with associated computational strategies to tackle the data they generate. However, these computational methods have not been generally accompanied by thoughtful design strategies that prioritise long term support with low maintainability, high data accessibility and end-to-end automation. In this work, we first elaborate on the computational landscape in metagenomics, and how its methods can disregard fundamental software development principles that guide them towards improved reproducibility, principles such as dependency isolation, high parameterization, automatic report generation, with interactive figures that facilitate data exploration and, finally, descriptive and practical documentation. Following this, we tackle current limitations in metagenomic data processing by implementing a new data analysis workflow, EURYALE, based on a previous methodology, MEDUSA, that selected its tools through rigorous benchmarking. This new workflow, built with Nextflow, is adaptable to different scenarios and built with good software development practices as guiding principles, it serves to advance metagenomic data processing as a whole, and, additionally, make the data resulting from these analysis workflows accessible to a wider audience. | pt_BR |
dc.description.resumo | Os últimos anos têm testemunhado avanços significativos no estudo de comunidades microbianas complexas, impulsionados pela evolução das tecnologias de sequenciamento e pela crescente adoção de métodos de sequenciamento total do genoma (whole genome shotgun) em detrimento dos métodos, antes mais tradicionais, baseados em amplicon. Com essa evolução, essas abordagens foram desenvolvidas com estratégias computacionais associadas para lidar com os dados que geram. No entanto, esses métodos computacionais geralmente não foram acompanhados por estratégias de design cuidadosas que priorizam o suporte a longo prazo, com baixa necessidade de manutenção, alta acessibilidade de dados e automação de ponta a ponta. Neste trabalho, elaboramos sobre o cenário computacional em metagenômica e como os métodos atuais negligenciam princípios fundamentais de desenvolvimento de software, que poderia os orientar para uma maior reprodutibilidade, tais como isolamento de dependências, alta parametrização, geração automática de relatórios com figuras interativas que facilitam a exploração de dados e, por fim, documentação descritiva e prática. Em seguida, abordamos as limitações atuais no processamento de dados metagenômicos ao implementar um novo fluxo de trabalho de análise de dados, o EURYALE, baseado em uma metodologia anterior, o MEDUSA, que selecionou suas ferramentas por meio de rigoroso benchmarking. Esse novo fluxo de trabalho, adaptável a diferentes cenários e construído com Nextflow, utiliza boas práticas de desenvolvimento de software como princípios norteadores e visa avançar o processamento de dados metagenômicos como um todo e, adicionalmente, tornar os dados resultantes desses workflows de análise acessíveis a um público mais amplo. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | pt_BR |
dc.identifier.citation | CAVALCANTE, João Vitor Ferreira. EURYALE: fluxos de trabalho e reprodutibilidade em metagenômica. Orientador: Dr. Rodrigo Juliani Siqueira Dalmolin. 2024. 69f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2024. | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/62599 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.publisher.program | PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Metagenômica | pt_BR |
dc.subject | Fluxos de trabalho | pt_BR |
dc.subject | Reprodutibilidade | pt_BR |
dc.subject | Desenvolvimento de software | pt_BR |
dc.subject | Nextflow | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS BIOLOGICAS | pt_BR |
dc.title | EURYALE: fluxos de trabalho e reprodutibilidade em metagenômica | pt_BR |
dc.type | masterThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- EURYALEfluxostrabalho_Cavalcante_2024.pdf
- Tamanho:
- 2.24 MB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível