Please use this identifier to cite or link to this item: https://repositorio.ufrn.br/jspui/handle/123456789/26359
Title: Implementação de funcionalidades para uma plataforma de análise de variantes e novos métodos para prover melhor acurácia na identificação de mutações patogênicas
Authors: Nascimento, Priscilla Machado do
Keywords: Bioinformática;Painéis genéticos;Mutação;Análise de variantes;ClinVar;Preditores;Árvore de decisão
Issue Date: 21-Sep-2018
Citation: NASCIMENTO, Priscilla Machado do. Implementação de funcionalidades para uma plataforma de análise de variantes e novos métodos para prover melhor acurácia na identificação de mutações patogênicas. 2018. 110f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2018.
Abstract: Current scientific advances in genomics have been provided due to increasing extraction of significant DNA information owing to use of new technologies available for the analysis of genetic data. A current challenge of precision medicine is identify which of the mutations detected by the sequencing process play a role in responding to a treatment, in tumorigenesis, or in diagnosis. Considering that one of current challenges of precision medicine is identify which mutations detected by sequencing process have a possible role in response to a treatment, in tumorigenesis or in diagnosis. We propose that through this study an improvement component of software product (ViVa) was implemented, responsible for providing assistance to data collected. It has been improved, in order to make analyzes more efficient and their visualization more accurately. This work proposes the implementation of new functionalities that add value to the product, contributing directly to automation and improvement of the processes performed by the analysis tools of variants available in the market. Aiming at a practical applicability about was developed, an analysis of public data used to annotate the variants from this system was proposed. For this, a study was carried out regarding the data of existing predictors, through which it was identified that mean accuracy of predictors turns around 85%. However, although this rate is considerably high, it was also possible to observe that there is a high degree of disagreement between the predictors regarding identification of the mutational impact and its pathogenicity. In order to improve this accuracy, we describe the creation of a decision tree, and the discretization of characteristics (attributes coming from the integration of databases). In tests performed, when we compared the results obtained in our decision tree with the predictors, our decision tree reached the highest precision in all tested variables: true neutral 87%, false neutral 6%, false pathogenic 13% and, true pathogenic 94%.
Portuguese Abstract: Os atuais avanços científicos, no âmbito da genômica, têm sido proporcionados devido à crescente extração de informações significativas do DNA, em virtude do uso das novas tecnologias disponibilizadas para realização da análise dos dados genéticos. Considerando que um dos desafios atuais da medicina de precisão é identificar quais das mutações detectadas pelo processo de sequenciamento têm um papel possível na resposta a um tratamento, na tumorigênese ou no diagnóstico, propomos que através desse estudo fosse implementado um componente de melhora de um produto de software (ViVa), responsável por oferecer assistência aos dados coletados. Foi aprimorado, com o intuito de tornar as análises mais eficientes e sua visualização mais precisa. Este trabalho propõe a implementação de novas funcionalidades que agreguem valor ao produto, contribuindo diretamente na automatização e aperfeiçoamento dos processos realizados pelas ferramentas de análise de variantes disponíveis no mercado. Visando uma aplicabilidade prática do que foi desenvolvido, foi proposta uma análise dos dados públicos utilizados para anotar os variantes desse sistema. Para isso, foi realizado um estudo referente aos dados dos preditores existentes, através do qual foi identificado que a acurácia média dos preditores gira em torno de 85%. Porém, apesar desta taxa ser consideravelmente alta, também foi possível observar que existe um alto grau de discordância entre os preditores em relação a identificação do impacto mutacional e sua patogenicidade. Com o intuito melhorar essa acurácia, descrevemos a criação de uma árvore de decisão, e a discretização de características (atributos provenientes de integração das bases de dados). Nos testes realizados, quando comparamos os resultados obtidos em nossa árvore de decisão com os preditores, a nossa árvore de decisão alcançou a maior precisão em todas as variáveis testadas: verdadeiros neutros 87%, falsos neutros 6%, falsos patogênicos 13%, verdadeiros patogênicos 94%.
URI: https://repositorio.ufrn.br/jspui/handle/123456789/26359
Appears in Collections:PPGBIONF - Mestrado em Bioinformática

Files in This Item:
File Description SizeFormat 
Implementaçãofuncionalidadesplataforma_Nascimento_2018.pdf5,74 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.