Please use this identifier to cite or link to this item: https://repositorio.ufrn.br/handle/123456789/22569
Title: Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado
Authors: Randel, Rodrigo Alves
Keywords: Agrupamento de dados semi-supervisionado;Mineração de dados;k-medianas
Issue Date: 12-Dec-2016
Citation: RANDEL, Rodrigo Alves. Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado. 2016. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2016.
Portuguese Abstract: Agrupamento de dados é uma poderosa ferramenta para análise automática de dados. Essa técnica se propõe a resolver o seguinte problema: dado um conjunto de entidades, encontrar subconjuntos, denominados clusters, que são homogêneos e/ou bem separados. O maior desafio do agrupamento de dados é encontrar um critério que apresente boa separação de dados em grupos homogêneos, e que estes agrupamentos possam trazer informações úteis ao usuário. Para resolver este problema, é sugerido que o usuário possa fornecer informações prévias a respeito do conjunto de dados que auxiliem/guiem o processo de agrupamento. Realizar o agrupamento de dados utilizando essas informações auxiliares é denominado de agrupamento de dados semi-supervisionado (ADSS). Este trabalho explora o problema de ADSS utilizando um novo modelo: os dados são agrupados através da resolução do problemas das k-medianas. Resultados mostram que essa abordagem foi capaz de agrupar os dados de forma eficiente para problemas de ADSS em diversos domínios diferentes.
Abstract: Clustering is a powerful tool for automated analysis of data. It addresses the following general problem: given a set of entities, find subsets, or clusters, which are homogeneous and/or well separated. The biggest challenge of data clustering is to find a criterion to present good separation of data into homogeneous groups, so that these groups bring useful information to the user. To solve this problem, it is suggested that the user can provide a priori information about the data set. Clustering under this assumption is called semi-supervised clustering. This work explores the semi-supervised clustering problem using a new model: the data is clustered by solving the k-medians problem. Results shows that this new approach was able to efficiently cluster the data in many different domains.
URI: https://repositorio.ufrn.br/jspui/handle/123456789/22569
Appears in Collections:PPGEE - Mestrado em Engenharia Elétrica e de Computação

Files in This Item:
File Description SizeFormat 
RodrigoAlvesRandel_DISSERT.pdf1.48 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.