Please use this identifier to cite or link to this item: https://repositorio.ufrn.br/handle/123456789/15479
Title: Contribuições a técnicas de agrupamento e visualização de dados multivariados utilizando mapas auto-organizáveis
Authors: Silva, Leonardo Enzo Brito da
Advisor: Costa, José Alfredo Ferreira
Keywords: Mapas auto-organizáveis. Mineração de dados. Técnicas de visualização. Algoritmos de agrupamento;Data mining. Self-organizing maps. Visualization techniques. Clustering algorithms
Issue Date: 29-Jul-2013
Publisher: Universidade Federal do Rio Grande do Norte
Citation: SILVA, Leonardo Enzo Brito da. Contribuições a técnicas de agrupamento e visualização de dados multivariados utilizando mapas auto-organizáveis. 2013. 133 f. Dissertação (Mestrado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2013.
Portuguese Abstract: Os mapas auto-organizáveis (SOM) são redes neurais artificiais amplamente utilizadas no campo da mineração de dados, principalmente por se constituírem numa técnica de redução de dimensionalidade dada a grade fixa de neurônios associada à rede. A fim de particionar e visualizar adequadamente a rede SOM, os diversos métodos existentes na literatura devem ser aplicados em uma etapa de pós-processamento nos seus neurônios, visando inferir características relevantes do conjunto de dados. Em geral, tal processamento efetuado sobre os neurônios da rede, ao invés do conjunto de dados em sua totalidade, reduz o custo computacional, dada a quantização vetorial. Este trabalho propõe pós-processamentos dos neurônios da rede SOM nos espaços de entrada e de saída, aliando técnicas de visualização a algoritmos baseados na força gravitacional e na procura do menor caminho com maior recompensa. Tais métodos levam em consideração forças de ligação entre neurônios vizinhos e características de distâncias e densidade de padrões, ambas associadas a posição que o neurônio ocupa no espaço dos dados após o treinamento da rede. Dessa forma, busca-se definir mais nitidamente a disposição dos agrupamentos presentes nos dados. Experimentos foram realizados para avaliar os métodos propostos utilizando diversos conjuntos de dados gerados artificialmente, assim como conjuntos de dados do mundo real. Os resultados obtidos foram comparados com aqueles provenientes de alguns métodos bem conhecidos existentes na literatura
Abstract: Self-organizing maps (SOM) are artificial neural networks widely used in the data mining field, mainly because they constitute a dimensionality reduction technique given the fixed grid of neurons associated with the network. In order to properly the partition and visualize the SOM network, the various methods available in the literature must be applied in a post-processing stage, that consists of inferring, through its neurons, relevant characteristics of the data set. In general, such processing applied to the network neurons, instead of the entire database, reduces the computational costs due to vector quantization. This work proposes a post-processing of the SOM neurons in the input and output spaces, combining visualization techniques with algorithms based on gravitational forces and the search for the shortest path with the greatest reward. Such methods take into account the connection strength between neighbouring neurons and characteristics of pattern density and distances among neurons, both associated with the position that the neurons occupy in the data space after training the network. Thus, the goal consists of defining more clearly the arrangement of the clusters present in the data. Experiments were carried out so as to evaluate the proposed methods using various artificially generated data sets, as well as real world data sets. The results obtained were compared with those from a number of well-known methods existent in the literature
URI: https://repositorio.ufrn.br/jspui/handle/123456789/15479
Appears in Collections:PPGEE - Mestrado em Engenharia Elétrica e de Computação

Files in This Item:
File Description SizeFormat 
LeonardoEBS_DISSERT.pdf24,04 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.