Meta-análise computacional de dados proteômicos de tecidos humanos para identificação de antígenos de câncer-testículo

dc.contributor.advisorSouza, Gustavo Antonio de
dc.contributor.authorMachado, Karla Cristina Tabosapt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/3371348709222085
dc.contributor.referees1Lima, João Paulo Matos Santos
dc.contributor.referees1IDhttps://orcid.org/0000-0002-6113-8834
dc.contributor.referees1Latteshttp://lattes.cnpq.br/3289758851760692
dc.contributor.referees2Faustino, André Luís Fonsecapt_BR
dc.contributor.referees2IDhttps://orcid.org/0000-0002-1821-0749
dc.contributor.referees2Latteshttp://lattes.cnpq.br/6111746041875692
dc.contributor.referees3Carniel, Anderson Chavespt_BR
dc.contributor.referees3IDhttps://orcid.org/0000-0002-8297-9894
dc.contributor.referees3Latteshttp://lattes.cnpq.br/6350698053529179
dc.contributor.referees4Negreiros, Marília Medeiros Fernandes de
dc.contributor.referees4IDhttps://orcid.org/0000-0002-5560-9687
dc.contributor.referees4Latteshttp://lattes.cnpq.br/8484266004921053
dc.date.accessioned2025-07-25T19:47:25Z
dc.date.available2025-07-25T19:47:25Z
dc.date.issued2025-04-04
dc.description.abstractThe proteins encoded by the genome constitute the proteome, which regulates various biological processes within an organism. However, the proteome is not limited to the sum of genome-encoded products, it also encompasses protein variations resulting from post-transcriptional and post-translational events. The study of the proteome has been termed proteomics, a promising approach that provides insights into protein levels in various biological and clinical models. In contrast to genomics, the availability of proteomic data remains limited, underscoring the need for consolidated practices for data storage in public repositories. Moreover, proteomic studies tend to be inherently more complex than their genomic. Although this challenge, the field has experienced substantial technological advancements in sensitivity and sequencing capacity. As a result, the volume of data generated by proteomics laboratories has increased significantly, enabling the integration of these datasets through meta-analysis techniques, an efficient strategy for combining data from different studies. Biomarkers are molecular markers found in clinical samples which may aid disease diagnosis or prognosis, including cancer. High-throughput techniques allow prospecting for such signature molecules by comparing gene expression between normal and tumor cells. Cancer-testis antigens (CTAs) are promising candidates for cancer biomarkers due to their limited expression to the testis in normal conditions versus their aberrant expression in various tumors. CTAs are routinely identified by transcriptomics, which limits biomarker characterization, as predictions based solely on the transcriptomic level do not correlate with protein abundance. Thus, it becomes essential to complement transcriptomic data with proteomic analyses in order to avoid false-positive predictions when relying solely on a single omics strategy. In this study, we ran a computational meta-analysis on several proteomic datasets from tumor and healthy human tissues, aiming to validate, at the protein level, the CTAs previously identified by transcriptomic studies, to investigate their abundance in the proteome layer, and evaluate their potential as biomarker candidates. The combined datasets present the expression patterns of 17,200 unique proteins, including 241 known CTAs previously described at the transcriptomic level. Those were further ranked as significantly enriched in tumor tissues (23 proteins), exclusive to tumor tissues (26 proteins) or abundant in healthy tissues (8 proteins). Our study illustrates the possibilities for tumor
dc.description.resumoAs proteínas codificadas pelo genoma constituem o proteoma, que controla diversos processos biológicos em um organismo. O proteoma, porém, não se limita à soma dos produtos codificados pelo genoma, mas inclui também variações proteicas decorrentes de eventos pós-transcricionais e pós-traducionais. O estudo do proteoma passou a ser denominado proteômica, uma abordagem promissora que oferece insights sobre os níveis proteicos em diferentes modelos biológicos e clínicos. Ao contrário da genômica, a disponibilização de dados em proteômica ainda é limitada, evidenciando a necessidade de práticas consolidadas de armazenamento em repositórios públicos. Estudos em proteômica tendem a ser mais complexos do que os equivalentes em genômica. Apesar desse desafio, a área tem experimentado grandes desenvolvimentos tecnológicos em termos de sensibilidade e capacidade de sequenciamento. Como resultado, o volume de dados gerados pelos laboratórios de proteômica tem aumentado significativamente, possibilitando a integração dessas informações por técnicas de meta-análise, uma estratégia eficiente para combinar dados provenientes de diferentes estudos. Biomarcadores são marcadores moleculares encontrados em amostras clínicas que podem auxiliar no diagnóstico ou prognóstico de doenças, incluindo o câncer. Técnicas ômicas de alto rendimento predizem biomarcadores comparando a expressão gênica entre amostras normais e tumorais para identificar alvos diferencialmente expressos. Antígenos de câncer/testículo (CTAs) são candidatos promissores para biomarcadores de câncer devido à sua expressão limitada no testículo em condições normais, em comparação com sua expressão aberrante em vários tumores. A identificação em larga escala dessas moléculas é rotineiramente realizada por transcriptômica, o que limita a caracterização do marcador, uma vez que as previsões baseadas apenas no nível transcriptômico podem não se correlacionar com a real abundância proteica. Assim, torna-se fundamental complementar os dados transcriptômicos com análises proteômicas, a fim de evitar previsões falso-positivas ao confiar exclusivamente em uma única abordagem ômica. Neste estudo, realizamos uma meta-análise computacional de conjuntos de dados proteômicos de tecidos humanos saudáveis e tumorais, com o objetivo de validar, em nível proteico, os CTAs previamente identificados por estudos transcriptômicos, investigar sua abundância na camada proteômica e avaliar seu potencial como candidatos a biomarcadores. Os conjuntos de dados combinados apresentam os padrões de expressão de 17.200 proteínas únicas, incluindo 241 CTAs conhecidas descritas anteriormente no nível transcriptômico. Essas foram ainda classificadas como significativamente enriquecidas em tecidos tumorais (23 proteínas), exclusivas de tecidos tumorais (26 proteínas) ou abundantes em tecidos saudáveis (8 proteínas). Nosso estudo ilustra as possibilidades de caracterização do proteoma tumoral e a consequente identificação de candidatos a biomarcadores e/ou alvos terapêuticos.
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES
dc.identifier.citationMACHADO, Karla Cristina Tabosa. Meta-análise computacional de dados proteômicos de tecidos humanos para identificação de antígenos de câncer-testículo. Orientador: Dr. Gustavo Antônio de Souza. 2025. 69f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2025.
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/64954
dc.language.isopt_BR
dc.publisherUniversidade Federal do Rio Grande do Norte
dc.publisher.countryBRpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICApt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAntígenos de câncer - testículo
dc.subjectBiomarcadores
dc.subjectMeta-análise
dc.subjectProteômica
dc.subject.cnpqCIENCIAS BIOLOGICAS
dc.titleMeta-análise computacional de dados proteômicos de tecidos humanos para identificação de antígenos de câncer-testículo
dc.typedoctoralThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Metaanalisecomputacional_Machado_2025.pdf
Tamanho:
5.7 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.53 KB
Formato:
Item-specific license agreed upon to submission
Nenhuma Miniatura disponível
Baixar