Distribuição dos tamanhos de DNA humano codificante via teoria da informação

dc.contributor.advisorSilva Júnior, Raimundo
dc.contributor.advisorLatteshttp://lattes.cnpq.br/2680905746363331pt_BR
dc.contributor.authorCorreia, Jonathan Pessoa
dc.contributor.authorLatteshttp://lattes.cnpq.br/8759510435086814pt_BR
dc.contributor.referees1Anselmo, Dory Helio Aires de Lima
dc.contributor.referees1Latteshttp://lattes.cnpq.br/0554474279738500pt_BR
dc.contributor.referees2Macedo Filho, Antônio de
dc.contributor.referees2Latteshttp://lattes.cnpq.br/5432651695056904pt_BR
dc.date.accessioned2021-09-09T22:19:37Z
dc.date.available2021-09-09T22:19:37Z
dc.date.issued2021-02-12
dc.description.abstractWe analyze the coding sequence for the Homo Sapiens DNA via a model that naturally embraces correlations among the bases in DNA sequences of living organisms. The model is based on the Shannon entropy’s optimization, which is the core of all statistical arguments. On our work , we propose the double-exponential1 distribution function of the length of DNA measured in base pairs (bp). The results show that the ShortRange-Correlations (SRC), always present in coding DNA sequences, are appropriately captured through the double-exponential distribution and adequately describes the cumulative length distribution of DNA bases. Based on this model, we use an Empirical cumulative distribution function and the database of proteins compiled by the Ensembl Project to show consistency with the data.pt_BR
dc.description.resumoAnalisamos as sequências codificantes do DNA do Homo Sapiens por meio de um modelo que naturalmente envolve correlações entre as bases nas sequências de DNA dos organismos vivos. O modelo é baseado na otimização da entropia de Shannon, que é o centro de todos os argumentos estatísticos. No presente trabalho, propomos a função de distribuição de dupla exponencial dos comprimentos do DNA medido em pares de bases (pb). Os resultados mostram que as Correlações de Curto Alcance (CCA), sempre presentes nas sequências de DNA codificantes, são apropriadamente capturadas por meio da distribuição dupla exponencial e descreve adequadamente a distribuição de comprimentos cumulativos das bases de DNA. Com base neste modelo, usamos uma função de distribuição cumulativa empírica e o banco de dados de proteínas compilado pelo Projeto Ensembl para mostrar consistência com os dados.pt_BR
dc.identifier.citationCORREIA, Jonathan Pessoa. Distribuição dos tamanhos de DNA humano codificante via teoria da informação. 2021. 73f. Dissertação (Mestrado em Física) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2021.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/33330
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM FÍSICApt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectFísicapt_BR
dc.subjectTeoria da informaçãopt_BR
dc.subjectDNA humanopt_BR
dc.subjectEntropia Shannonpt_BR
dc.titleDistribuição dos tamanhos de DNA humano codificante via teoria da informaçãopt_BR
dc.typemasterThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
DistribuicaotamanhosDNA_Correia_2021.pdf
Tamanho:
1.99 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar