Use este identificador para citar ou linkar para este item: https://repositorio.ufrn.br/handle/123456789/22569
Título: Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado
Autor(es): Randel, Rodrigo Alves
Orientador: Aloise, Daniel
Palavras-chave: Agrupamento de dados semi-supervisionado;Mineração de dados;k-medianas
Data do documento: 12-Dez-2016
Referência: RANDEL, Rodrigo Alves. Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado. 2016. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2016.
Resumo: Agrupamento de dados é uma poderosa ferramenta para análise automática de dados. Essa técnica se propõe a resolver o seguinte problema: dado um conjunto de entidades, encontrar subconjuntos, denominados clusters, que são homogêneos e/ou bem separados. O maior desafio do agrupamento de dados é encontrar um critério que apresente boa separação de dados em grupos homogêneos, e que estes agrupamentos possam trazer informações úteis ao usuário. Para resolver este problema, é sugerido que o usuário possa fornecer informações prévias a respeito do conjunto de dados que auxiliem/guiem o processo de agrupamento. Realizar o agrupamento de dados utilizando essas informações auxiliares é denominado de agrupamento de dados semi-supervisionado (ADSS). Este trabalho explora o problema de ADSS utilizando um novo modelo: os dados são agrupados através da resolução do problemas das k-medianas. Resultados mostram que essa abordagem foi capaz de agrupar os dados de forma eficiente para problemas de ADSS em diversos domínios diferentes.
Abstract: Clustering is a powerful tool for automated analysis of data. It addresses the following general problem: given a set of entities, find subsets, or clusters, which are homogeneous and/or well separated. The biggest challenge of data clustering is to find a criterion to present good separation of data into homogeneous groups, so that these groups bring useful information to the user. To solve this problem, it is suggested that the user can provide a priori information about the data set. Clustering under this assumption is called semi-supervised clustering. This work explores the semi-supervised clustering problem using a new model: the data is clustered by solving the k-medians problem. Results shows that this new approach was able to efficiently cluster the data in many different domains.
URI: https://repositorio.ufrn.br/jspui/handle/123456789/22569
Aparece nas coleções:PPGEE - Mestrado em Engenharia Elétrica e de Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
RodrigoAlvesRandel_DISSERT.pdf1,48 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.