Use este identificador para citar ou linkar para este item: https://repositorio.ufrn.br/jspui/handle/123456789/22512
Título: Multivariate classification and Fourier-Transform Mid- Infrared Spectroscopy (FT-MIR) in cancer prostate tissue
Título(s) alternativo(s): Classificação multivariada e espectroscopia do infravermelho médio com transformada de fourier em tecidos de câncer de próstata
Autor(es): Siqueira, Laurinda Fernanda Saldanha
Palavras-chave: Câncer;Classificação multivariada;FT-MIR
Data do documento: 30-Jan-2017
Citação: SIQUEIRA, Laurinda Fernanda Saldanha. Multivariate classification and Fourier-Transform Mid- Infrared Spectroscopy (FT-MIR) in cancer prostate tissue. 2017. 200f. Tese (Doutorado em Química) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.
Resumo: This thesis is a theoretical-practical contribution for differentiation of prostate cancer stages through multivariate classification applied in MIR spectra from human tissues. The aim of this study was to identify spectral differences between prostate cancer stages, to determine potential biochemical markers responsible for differentiation, and to compare the performance of multivariate classification models from prostate tissue samples previously classified in Gleason II, III and IV for cancer. In a first study, the PCA-LDA, SPA-LDA and GA-LDA models were constructed aiming at a methodology to discriminate prostate cancer stages based on Gleason graduation criteria vs. the categorization of 'Low and High Degrees'; and, to identify potential spectral markers. The models performances were compared. GA-LDA produced the most satisfactory results, being better in the perspective of 'Low and High degrees', with correct classification rate of 83% and sensitivity and specificity values 100% and 80%, respectively. In a second study, PCA-LDA/QDA and GA-LDA/QDA had their performances compared in the classification of 'Low and High grades' of prostate cancer, considering linear or quadratic character in the differentiation. The QDA models obtained better results than the LDA, as well as variables selection method (GA) were better than the variables reduction method (PCA). GA-QDA obtained better performance with classification rates for calibration and prediction samples of 97% and 100%, respectively; and sensitivity and specificity of 75% and 100%, respectively. In a third study, independent SVM models (linear-, polynomial-, RBF- and quadratic-SVMs) and the PCA-SVM, SPA-SVM and GASVM algorithms were applied in order to evaluate the use of variables reduction and selection methods in a nonlinear approach for screening 'Low and High grades' of prostate cancer. Independent SVM models had lower performance than the others. The best model was GASVM with 100% and 90% of 'Low Grade' calibration and prediction samples correctly classified, respectively; and sensitivity and specificity of 90%. The potential spectral biomarkers identified by the studies were attributed to the regions of amides I, II, III and proteins (≈1,591–1,483 cm-1), DNA and RNA (≈1,000–1,490 cm-1) and protein phosphorylation (≈970 cm-1). The intensities variation was more pronounced in 'High degree' spectra. Changes in these regions may indicate metabolic changes caused by cancer advance. The proposed methods showed potentially better performance than traditional diagnostic methods. The results showed that the multivariate classification combined with FT-MIR can differentiate pathological states of tissues mainly in the early stages of cancer ('Low grade') with speed, accuracy, easy proceedings, independence of intra- and inter-observer variability, and high sensitivity and specificity; in comparison to traditional techniques (which suffer with operator-dependence, high intra- and inter-observer variability, high time consuming, difficult preparation and lower sensitivity and specificity). In addition, the methodologies proposed here may imply economic and social benefits based on early diagnosis and treatments, allowing improvement in quality of life and survival of patients.
metadata.dc.description.resumo: Esta tese é um aporte teórico-prático para a diferenciação dos tipos de câncer de próstata por meio de classificação multivariada aplicada em espectros MIR oriundos de tecidos humanos. Para isso, buscou-se identificar diferenças espectrais entre os graus de câncer de próstata, determinar potenciais marcadores bioquímicos responsáveis pela diferenciação e comparar os desempenhos dos modelos multivariados de classificação, a partir de amostras de tecidos de próstata previamente classificadas em Gleason II, III e IV para câncer. Em um primeiro estudo, os modelos PCA-LDA, SPA-LDA e GA-LDA foram construídos visando uma metodologia para discriminação dos estágios de câncer de próstata baseada na graduação de Gleason e na categorização de ‘Baixo e Alto Graus’; e, para identificação de potenciais marcadores espectrais. Os desempenhos dos modelos foram comparados. GA-LDA produziu os resultados mais satisfatórios, sendo melhor na perspectiva de ‘Baixo e Alto graus’, com taxas de acerto de 83% e valores de sensibilidade e especificidade 100% e 80%, respectivamente. Em um segundo estudo, PCA-LDA/QDA e GA-LDA/QDA tiveram seus desempenhos comparados na classificação de ‘Baixo e Alto graus’ de câncer de próstata, considerando caráter linear ou quadrático na diferenciação. Os modelos QDA obtiveram resultados superiores aos LDA, bem como métodos de seleção de variáveis (GA) foram melhores do que os de redução de variáveis (PCA). GA-QDA obteve melhor desempenho com taxas de acerto para amostras de calibração e de previsão de 97% e 100%, respectivamente; e sensibilidade e especificidade de 75% e 100%, respectivamente. Em um terceiro estudo, modelos SVM independentes (linear, polinomial, RBF e quadrático) e os algoritmos PCA-SVM, SPA-SVM e GA-SVM foram aplicados a fim de avaliar o uso de métodos de redução e seleção de variáveis em um enfoque não linear, para rastreamento de ‘Baixo e Alto graus’ do câncer de próstata. Os modelos SVM independentes obtiveram desempenhos inferiores aos dos demais. O melhor modelo foi GA-SVM com 100% e 90% das amostras de câncer ‘Baixo grau’ de calibração e previsão corretamente classificadas, respectivamente; e sensibilidade e especificidade de 90%. Os potenciais biomarcadores espectrais identificados pelos estudos foram atribuídos às regiões de amidas I, II, III e proteínas (≈1591–1483 cm-1), de DNA e RNA (≈1000–1490 cm−1) e de fosforização de proteínas (≈970 cm-1). A variação das respectivas intensidades foi mais acentuada nos espectros do ‘Alto grau’ de câncer. Alterações nessas regiões podem indicar modificações metabólicas provocadas pela progressão do câncer. Os métodos propostos mostraram que potencialmente podem ter melhores desempenhos que os métodos tradicionais de diagnóstico. Os resultados encontrados indicaram que a classificação multivariada combinada com FTMIR possibilitou diferenciar estados patológicos dos tecidos principalmente nos estados iniciais do câncer (‘Baixo grau’) com objetividade, rapidez, acurácia, fácil procedimento, independência de variabilidade intra e inter-observador, e alta sensibilidade e especificidade; em comparação às técnicas tradicionais que são operador-dependentes, tem elevada variabilidade intra- e inter-observador, são morosas, tem preparação difícil, e apresentam menores valores sensibilidade e especificidade. Ademais, as metodologias propostas aqui poderão implicar em ganho econômico e social provenientes do diagnóstico precoce e do tratamento nos estágios iniciais do câncer, possibilitando ganho em qualidade de vida e sobrevida dos pacientes.
URI: https://repositorio.ufrn.br/jspui/handle/123456789/22512
Aparece nas coleções:PPGQ - Doutorado em Química

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
LaurindaFernandaSaldanhaSiqueira_TESE.pdf7,4 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.