Use este identificador para citar ou linkar para este item: https://repositorio.ufrn.br/jspui/handle/123456789/26092
Título: Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação
Autor(es): Dantas, Carine Azevedo
Palavras-chave: Comitês de classificadores;Seleção de atributos;Algoritmos de agrupamento
Data do documento: 10-Fev-2017
Citação: DANTAS, Carine Azevedo. Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação. 2017. 70f. Dissertação (Mestrado Em Sistemas E Computação) - Centro De Ciências Exatas E Da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.
Resumo: With the increase of the size on the data sets used in classi cation systems, selecting the most relevant attribute has become one of the main tasks in pre-processing phase. In a dataset, it is expected that all attributes are relevant. However, this is not always veri ed. Selecting a set of attributes of more relevance aids decreasing the size of the data without a ecting the performance, or even increase it, this way achieving better results when used in the data classi cation. The existing features selection methods elect the best attributes in the data base as a whole, without considering the particularities of each instance. The Unsupervised-based Feature Selection, proposed method, selects the relevant attributes for each instance individually, using clustering algorithms to group them accordingly with their similarities. This work performs an experimental analysis of di erent clustering techniques applied to this new feature selection approach. The clustering algorithms k-Means, DBSCAN and Expectation-Maximization (EM) were used as selection methods. Anaysis are performed to verify which of these clustering algorithms best ts to this new Feature Selection approach. Thus, the contribution of this study is to present a new approach for attribute selection, through a Semidynamic and a Dynamic version, and determine which of the clustering methods performs better selection and get a better performance in the construction of more accurate classi ers.
metadata.dc.description.resumo: Com o aumento do tamanho dos conjuntos de dados utilizados em sistemas de classicação, a seleção dos atributos mais relevantes se tornou uma das principais tarefas dafase de pré-processamento. Em um conjunto de dados é esperado que todos os atributosque o descreve sejam relevantes, porém isso nem sempre acontece. Selecionar o conjuntode atributos mais relevantes ajuda a reduzir a dimensionalidade dos dados sem afetaro desempenho, ou até mesmo melhorá-lo, para que se possa obter melhores resultadosquando utilizado na classicação de dados. Os métodos de seleção de características existentesselecionam os melhores atributos para uma base de dados como um todo, sem levarem consideração as particularidades de cada instância. A Seleção de atributos baseadaem algoritmos de agrupamento, método proposto deste trabalho, seleciona os atributosmais relevantes para cada grupo de instâncias, utilizando algoritmos de agrupamentopara agrupá-las de acordo com as suas semelhanças. Este trabalho efetua uma análiseexperimental de diferentes técnicas de agrupamento aplicadas a essa nova abordagem deseleção de atributos. Para isso, são utilizados os algoritmos de agrupamento k-Médias,DBscan e Expectation-Maximization(EM) como métodos de seleção. São efetuadas aná-lises de desempenho e estatísticas para vericar qual desses algoritmos de agrupamentomelhor se adequa a essa nova Seleção de Atributos. Assim, a contribuição deste trabalho éapresentar uma nova abordagem, através de uma versão Semidinâmica e outra Dinâmica,para seleção de atributos baseada em algoritmos de agrupamento e determinar qual dosmétodos de agrupamento realiza uma melhor seleção e obtém um melhor desempenho naconstrução de classicadores mais acurados.
URI: https://repositorio.ufrn.br/jspui/handle/123456789/26092
Aparece nas coleções:PPGSC - Mestrado em Sistemas e Computação

Arquivos associados a este item:
Arquivo TamanhoFormato 
AlgoritimoAgrupamento_Dantas_2017.pdf1,15 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.