Please use this identifier to cite or link to this item: https://repositorio.ufrn.br/handle/123456789/44668
Title: 3D-QSARpy: Combinando estratégias de seleção de atributos e técnicas de aprendizado de máquina para construir modelos QSAR 3D
Authors: Silverio, Priscilla Suene de Santana Nogueira
Advisor: Barbosa, Euzébio Guimarães
Keywords: Modelos QSAR;QSAR-3D;Quimioinformática;Bioinformática estrutural;Atividade biológica;Predição;Regressão;Seleção de características
Issue Date: 4-Aug-2021
Publisher: Universidade Federal do Rio Grande do Norte
Citation: SILVERIO, Priscilla Suene de Santana Nogueira. 3D-QSARpy: Combinando estratégias de seleção de atributos e técnicas de aprendizado de máquina para construir modelos QSAR 3D. 2021. 96f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2021.
Portuguese Abstract: Quantitative Structure Activity Relationship (QSAR) é uma tecnologia da área da química medicinal que busca esclarecer as relações existentes entre estruturas moleculares e suas respectivas atividades biológicas. Para isso, são construídos modelos QSAR a partir dos dados estruturais (1D, 2D, 3D ou 4D) provenientes de uma série de moléculas já testadas para uma determinada atividade. Através de predições realizadas por esses modelos, objetiva-se identificar quais modificações na molécula podem influenciar, reforçando ou não a resposta biológica. Tal tecnologia permite acelerar o desenvolvimento de novos compostos, reduzindo os custos destinados ao planejamento de fármacos. Considerando o contexto brevemente exposto, o presente trabalho apresenta como objetivo geral desenvolver uma metodologia para predição de atividade biológica em moléculas bioativas. A metodologia foi validada com sucesso através da aplicação da ferramenta em dois conjuntos de dados com resultados superiores aos previamente publicados. O primeiro deles envolvendo o tratamento de diabetes, alcançando r2 pred = 0.91. O segundo conjunto referente ao tratamento de câncer, com r2 pred=0.98. Por fim, duas aplicações da ferramenta foram realizadas, contribuindo com a identificação de novas estruturas moleculares bioativas usando diferentes abordagens. Sendo a primeira delas destinada ao tratamento da doença de chagas, incluindo a construção de modelos QSAR híbridos para três séries, obtendo, r2 pred=0.8, 0.68 e 0.85. A segunda aplicação para construção de modelos QSAR-4D foi destinada ao tratamento da tuberculose com r2 pred=0.72. Todos os experimentos realizados, sejam para validação ou para identificação dessas novas moléculas demonstraram, não somente a eficiência da metodologia proposta e da ferramenta desenvolvida, como também a versatilidade de aplicações possíveis por meio dela, seja seguindo o seu pipeline geral, seja utilizando-o parcialmente de modo combinado com outras ferramentas existentes.
Abstract: Quantitative Structure Activity Relationship (QSAR) is a technology in the field of medicinal chemistry that seeks to clarify the relationships between molecular structures and their biological activities. For this, QSAR models are constructed from the structural data (1D, 2D, 3D or 4D) from a series of molecules already tested for a given activity. Through predictions made by these models, it is aimed to identify which modifications in the molecule can influence, reinforcing or not the biological response. Such technology allows accelerating the development of new compounds by reducing the costs for drug design. Considering the briefly exposed context, the present work aims to develop a methodology for predicting biological activity in bioactive molecules. The methodology was successfully validated through the application of the tool in two sets of data, which results outperformed those previously published. The first set involving diabetes treatment, it reached r2 pred=0.91. The second set referring to cancer treatment, with r2 pred=0.98. Finally, two applications of the tool were performed, contributing to the identification of new bioactive molecular structures using different approaches. The first of which is intended for the treatment of chagas disease, including the construction of hybrid QSAR models for three series, obtaining r2 pred = 0.8, 0.68 e 0.85. The second application was the construction of QSAR-4D for the tuberculosis treatment with r2 pred = 0.72. It doesn’t matter if the experiments were for validation or for the identification of these new molecules. All of them demonstrated not only the efficiency of the proposed methodology and the developed tool, but also the versatility of possible applications with this methodology, either following its general pipeline or using it in a partially way combined with other existing tools.
URI: https://repositorio.ufrn.br/handle/123456789/44668
Appears in Collections:PPGBIONF - Doutorado em Bioinformática

Files in This Item:
File SizeFormat 
3DQSARpy_Silverio_2021.pdf2.66 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.