Please use this identifier to cite or link to this item: https://repositorio.ufrn.br/handle/123456789/15149
Title: Sistema inteligente para diagnóstico de patologias na laringe utilizando máquinas de vetor de suporte
Authors: Almeida, Náthalee Cavalcanti de
Advisor: Silva, Sandro Gonçalves da
Keywords: Patologias na voz;Análise acústica;Extração de características;Transformada wavelet packet, Máquinas de vetor de suporte;vocal pathologies;Acoustic analysis;Feature extraction;Wavelet opacket transform;Support vector machines
Issue Date: 23-Jul-2010
Publisher: Universidade Federal do Rio Grande do Norte
Citation: ALMEIDA, Náthalee Cavalcanti de. Sistema inteligente para diagnóstico de patologias na laringe utilizando máquinas de vetor de suporte. 2010. 119 f. Tese (Doutorado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2010.
Portuguese Abstract: A voz humana é uma importante ferramenta de comunicação e qualquer funcionamento inadequado da voz pode ter profundas implicações na vida social e profissional de um indivíduo. Técnicas de processamento digital de sinais têm sido utilizadas através da análise acústica de desordens vocais provocadas por patologias na laringe, devido à sua simplicidade e natureza não-invasiva. Este trabalho trata da análise acústica de sinais de vozes afetadas por patologias na laringe, especificamente, edemas e nódulos nas pregas vocais. A proposta deste trabalho é desenvolver um sistema de classificação de vozes para auxiliar no pré-diagnóstico de patologias na laringe, bem como no acompanhamento de tratamentos farmacológicos e pós-cirúrgicos. Os coeficientes de Predição Linear (LPC), Coeficientes Cepstrais de Freqüência Mel (MFCC) e os coeficientes obtidos através da Transformada Wavelet Packet (WPT) são aplicados para extração de características relevantes do sinal de voz. É utilizada para a tarefa de classificação Máquina de Vetor de Suporte (SVM), a qual tem como objetivo construir hiperplanos ótimos que maximizem a margem de separação entre as classes envolvidas. O hiperplano gerado é determinado pelos vetores de suporte, que são subconjuntos de pontos dessas classes. De acordo com o banco de dados utilizado neste trabalho, os resultados apresentaram um bom desempenho, com taxa de acerto de 98,46% para classificação de vozes normais e patológicas em geral, e 98,75% na classificação de patologias entre si: edemas e nódulos
Abstract: The human voice is an important communication tool and any disorder of the voice can have profound implications for social and professional life of an individual. Techniques of digital signal processing have been used by acoustic analysis of vocal disorders caused by pathologies in the larynx, due to its simplicity and noninvasive nature. This work deals with the acoustic analysis of voice signals affected by pathologies in the larynx, specifically, edema, and nodules on the vocal folds. The purpose of this work is to develop a classification system of voices to help pre-diagnosis of pathologies in the larynx, as well as monitoring pharmacological treatments and after surgery. Linear Prediction Coefficients (LPC), Mel Frequency cepstral coefficients (MFCC) and the coefficients obtained through the Wavelet Packet Transform (WPT) are applied to extract relevant characteristics of the voice signal. For the classification task is used the Support Vector Machine (SVM), which aims to build optimal hyperplanes that maximize the margin of separation between the classes involved. The hyperplane generated is determined by the support vectors, which are subsets of points in these classes. According to the database used in this work, the results showed a good performance, with a hit rate of 98.46% for classification of normal and pathological voices in general, and 98.75% in the classification of diseases together: edema and nodules
URI: https://repositorio.ufrn.br/jspui/handle/123456789/15149
Appears in Collections:PPGEE - Doutorado em Engenharia Elétrica e de Computação

Files in This Item:
File Description SizeFormat 
NathaleeCA_DISSERT.pdf1,29 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.