Meta-análise computacional de dados proteômicos de tecidos humanos para identificação de antígenos de câncer-testículo
dc.contributor.advisor | Souza, Gustavo Antonio de | |
dc.contributor.author | Machado, Karla Cristina Tabosa | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/3371348709222085 | |
dc.contributor.referees1 | Lima, João Paulo Matos Santos | |
dc.contributor.referees1ID | https://orcid.org/0000-0002-6113-8834 | |
dc.contributor.referees1Lattes | http://lattes.cnpq.br/3289758851760692 | |
dc.contributor.referees2 | Faustino, André Luís Fonseca | pt_BR |
dc.contributor.referees2ID | https://orcid.org/0000-0002-1821-0749 | |
dc.contributor.referees2Lattes | http://lattes.cnpq.br/6111746041875692 | |
dc.contributor.referees3 | Carniel, Anderson Chaves | pt_BR |
dc.contributor.referees3ID | https://orcid.org/0000-0002-8297-9894 | |
dc.contributor.referees3Lattes | http://lattes.cnpq.br/6350698053529179 | |
dc.contributor.referees4 | Negreiros, Marília Medeiros Fernandes de | |
dc.contributor.referees4ID | https://orcid.org/0000-0002-5560-9687 | |
dc.contributor.referees4Lattes | http://lattes.cnpq.br/8484266004921053 | |
dc.date.accessioned | 2025-07-25T19:47:25Z | |
dc.date.available | 2025-07-25T19:47:25Z | |
dc.date.issued | 2025-04-04 | |
dc.description.abstract | The proteins encoded by the genome constitute the proteome, which regulates various biological processes within an organism. However, the proteome is not limited to the sum of genome-encoded products, it also encompasses protein variations resulting from post-transcriptional and post-translational events. The study of the proteome has been termed proteomics, a promising approach that provides insights into protein levels in various biological and clinical models. In contrast to genomics, the availability of proteomic data remains limited, underscoring the need for consolidated practices for data storage in public repositories. Moreover, proteomic studies tend to be inherently more complex than their genomic. Although this challenge, the field has experienced substantial technological advancements in sensitivity and sequencing capacity. As a result, the volume of data generated by proteomics laboratories has increased significantly, enabling the integration of these datasets through meta-analysis techniques, an efficient strategy for combining data from different studies. Biomarkers are molecular markers found in clinical samples which may aid disease diagnosis or prognosis, including cancer. High-throughput techniques allow prospecting for such signature molecules by comparing gene expression between normal and tumor cells. Cancer-testis antigens (CTAs) are promising candidates for cancer biomarkers due to their limited expression to the testis in normal conditions versus their aberrant expression in various tumors. CTAs are routinely identified by transcriptomics, which limits biomarker characterization, as predictions based solely on the transcriptomic level do not correlate with protein abundance. Thus, it becomes essential to complement transcriptomic data with proteomic analyses in order to avoid false-positive predictions when relying solely on a single omics strategy. In this study, we ran a computational meta-analysis on several proteomic datasets from tumor and healthy human tissues, aiming to validate, at the protein level, the CTAs previously identified by transcriptomic studies, to investigate their abundance in the proteome layer, and evaluate their potential as biomarker candidates. The combined datasets present the expression patterns of 17,200 unique proteins, including 241 known CTAs previously described at the transcriptomic level. Those were further ranked as significantly enriched in tumor tissues (23 proteins), exclusive to tumor tissues (26 proteins) or abundant in healthy tissues (8 proteins). Our study illustrates the possibilities for tumor | |
dc.description.resumo | As proteínas codificadas pelo genoma constituem o proteoma, que controla diversos processos biológicos em um organismo. O proteoma, porém, não se limita à soma dos produtos codificados pelo genoma, mas inclui também variações proteicas decorrentes de eventos pós-transcricionais e pós-traducionais. O estudo do proteoma passou a ser denominado proteômica, uma abordagem promissora que oferece insights sobre os níveis proteicos em diferentes modelos biológicos e clínicos. Ao contrário da genômica, a disponibilização de dados em proteômica ainda é limitada, evidenciando a necessidade de práticas consolidadas de armazenamento em repositórios públicos. Estudos em proteômica tendem a ser mais complexos do que os equivalentes em genômica. Apesar desse desafio, a área tem experimentado grandes desenvolvimentos tecnológicos em termos de sensibilidade e capacidade de sequenciamento. Como resultado, o volume de dados gerados pelos laboratórios de proteômica tem aumentado significativamente, possibilitando a integração dessas informações por técnicas de meta-análise, uma estratégia eficiente para combinar dados provenientes de diferentes estudos. Biomarcadores são marcadores moleculares encontrados em amostras clínicas que podem auxiliar no diagnóstico ou prognóstico de doenças, incluindo o câncer. Técnicas ômicas de alto rendimento predizem biomarcadores comparando a expressão gênica entre amostras normais e tumorais para identificar alvos diferencialmente expressos. Antígenos de câncer/testículo (CTAs) são candidatos promissores para biomarcadores de câncer devido à sua expressão limitada no testículo em condições normais, em comparação com sua expressão aberrante em vários tumores. A identificação em larga escala dessas moléculas é rotineiramente realizada por transcriptômica, o que limita a caracterização do marcador, uma vez que as previsões baseadas apenas no nível transcriptômico podem não se correlacionar com a real abundância proteica. Assim, torna-se fundamental complementar os dados transcriptômicos com análises proteômicas, a fim de evitar previsões falso-positivas ao confiar exclusivamente em uma única abordagem ômica. Neste estudo, realizamos uma meta-análise computacional de conjuntos de dados proteômicos de tecidos humanos saudáveis e tumorais, com o objetivo de validar, em nível proteico, os CTAs previamente identificados por estudos transcriptômicos, investigar sua abundância na camada proteômica e avaliar seu potencial como candidatos a biomarcadores. Os conjuntos de dados combinados apresentam os padrões de expressão de 17.200 proteínas únicas, incluindo 241 CTAs conhecidas descritas anteriormente no nível transcriptômico. Essas foram ainda classificadas como significativamente enriquecidas em tecidos tumorais (23 proteínas), exclusivas de tecidos tumorais (26 proteínas) ou abundantes em tecidos saudáveis (8 proteínas). Nosso estudo ilustra as possibilidades de caracterização do proteoma tumoral e a consequente identificação de candidatos a biomarcadores e/ou alvos terapêuticos. | |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | |
dc.identifier.citation | MACHADO, Karla Cristina Tabosa. Meta-análise computacional de dados proteômicos de tecidos humanos para identificação de antígenos de câncer-testículo. Orientador: Dr. Gustavo Antônio de Souza. 2025. 69f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2025. | |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/64954 | |
dc.language.iso | pt_BR | |
dc.publisher | Universidade Federal do Rio Grande do Norte | |
dc.publisher.country | BR | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.publisher.program | PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Antígenos de câncer - testículo | |
dc.subject | Biomarcadores | |
dc.subject | Meta-análise | |
dc.subject | Proteômica | |
dc.subject.cnpq | CIENCIAS BIOLOGICAS | |
dc.title | Meta-análise computacional de dados proteômicos de tecidos humanos para identificação de antígenos de câncer-testículo | |
dc.type | doctoralThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Metaanalisecomputacional_Machado_2025.pdf
- Tamanho:
- 5.7 MB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.53 KB
- Formato:
- Item-specific license agreed upon to submission
Nenhuma Miniatura disponível