Please use this identifier to cite or link to this item: https://repositorio.ufrn.br/handle/123456789/26768
Title: Comitê de agrupamentos hierárquicos que preserva a Ttransitividade
Other Titles: Hierarchical clustering ensemble that retain the T-transitivity
Authors: Moura, Ronildo Pinheiro de Araújo
Advisor: Bedregal, Benjamin Rene Callejas
Keywords: Agrupamento de dados;Agrupamento hierárquico;Dendrogramas;Operadores de agregação;T-transitividade
Issue Date: 5-Oct-2018
Citation: MOURA, Ronildo Pinheiro de Araújo. Comitê de agrupamentos hierárquicos que preserva a Ttransitividade. 2018. 188f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2018.
Portuguese Abstract: A ideia principal do aprendizado por comitês é aprimorar os resultados de métodos de aprendizagem de máquina combinando múltiplos modelos. Inicialmente aplicada a problemas de aprendizagem supervisionada, esta abordagem permite produzir resultados com qualidade superior em relação a um único modelo. Da mesma forma, aprendizagem de comitê aplicados ao aprendizado não supervisionado, ou consenso de agrupamento, produz agrupamentos de alta qualidade. A maioria dos métodos de comitê para agrupamento de dados são destinados a algoritmos particionais, e apresentam resultados de qualidade superior aos agrupamentos simples. Deste modo, é razoável esperar que a combinação de agrupamentos hierárquicos possa levar a um agrupamento hierárquico de melhor qualidade. Os estudos recentes não consideram as particularidades inerentes aos diferentes métodos de agrupamento hierárquico durante o processo do consenso. Este trabalho investiga a consistência dos resultados do consenso considerando diferentes métodos de agrupamento hierárquico utilizados para gerar o comitê. Uma abordagem é proposta para preservar um tipo de transitividade presente nos dendrogramas. Neste algoritmo, os dendrogramas representando os resultados individuais dos agrupamentos bases são convertidos em matrizes ultramétricas. Então, após um processo de fuzzificação, alguns operadores de agregação com a capacidade de preservar uma t-transitividade geram uma matriz consenso. O agrupamento hierárquico final é obtido a partir da matriz consenso. A análise de resultados dos experimentos realizados em conjuntos de dados conhecidos e a visualização da operação do algoritmo em conjunto de dados visuais (duas dimensões) indica que esta abordagem consegue melhorar a acurácia enquanto é consistente com o método gerador.
Abstract: The main idea of ensemble learning is improved machine learning results by combining several models. Initially applied to supervised learning, this approach usually produces better results in comparison with single methods. Similarly, unsupervised ensemble learning, or consensus clustering, create individual clustering that is more robust in comparison to unique methods. The most common methods are designed for flat clustering, and show superior in quality to clustering unique methods. Thus, it can be expected that consensus of hierarchical clustering could also lead to higher quality in creating hierarchical clustering. Recent studies not been taken to consider particularities inherent in the different methods of hierarchical grouping during the consensus process. This work investigates the impact of the ensemble consistency in the final consensual results. We propose a process that retains intermediate transitivity in dendrograms. In this algorithm, firstly, the dendrograms describing the base clustering are converted to an ultrametric matrix. Then, after one fuzzification process, the consensus functions based on aggregation operator with preserve transitivity property is applied to the matrices and form the final consensus matrix. The final clustering will be a dendrogram obtained from this aggregate matrix. Analyzing the results of the experiments performed on the known dataset and also visualizing algorithm’s process on the visual (two-dimensional) datasets shows this approach can significantly improve the accuracy performance while retaining the consistency property.
URI: https://repositorio.ufrn.br/jspui/handle/123456789/26768
Appears in Collections:PPGSC - Doutorado em Sistemas e Computação

Files in This Item:
File Description SizeFormat 
Comitêagrupamentoshierárquicos_Moura_2018.pdf7,52 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.