Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado

Vale, Karliane Medeiros Ovidio

Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado

Página do item simplificado Estatísticas

dc.contributor.advisor	Canuto, Anne Magaly de Paula
dc.contributor.advisorID		pt_BR
dc.contributor.author	Vale, Karliane Medeiros Ovidio
dc.contributor.authorID		pt_BR
dc.contributor.referees1	Santos, Araken de Medeiros
dc.contributor.referees1ID		pt_BR
dc.contributor.referees2	Araújo, Daniel Sabino Amorim de
dc.contributor.referees2ID		pt_BR
dc.contributor.referees3	Nascimento, Diego Silveira Costa
dc.contributor.referees3ID		pt_BR
dc.contributor.referees4	Gorgônio, Flavius da Luz e
dc.contributor.referees4ID		pt_BR
dc.contributor.referees5	Abreu, Marjory Cristiany da Costa
dc.contributor.referees5ID		pt_BR
dc.date.accessioned	2020-02-11T16:39:59Z
dc.date.available	2020-02-11T16:39:59Z
dc.date.issued	2019-11-22
dc.description.abstract	Semi-supervised learning is a kind of machine learning that integrates supervised and unsupervised learning mechanisms. In this type of learning, most of training set labels are unknown, while there is a small part of data that has known labels. The semi-supervised learning is attractive because of its potential to use labeled and unlabeled data to perform better than supervised learning. This paper consists of a study in the field of semisupervised learning and implements changes on the self-training and co-training semisupervised learning algorithms. In the literature, it is common to develop researches that change the structure of such algorithms, however, none of them proposes automating the labeling process of unlabeled instances, which is the main purpose of this work. In order to achieve this goal, three methods are proposed: FlexCon-G, FlexCon e FlexCon-C. The main difference among these methods is how tje confidence rate is calculated and the strategy used to choose a label in each iteration, among them ensembles. In order to evaluate the proposed methods’ performance, we have carried out an empirical analysis, in which the performances of these methods have been evaluated on 30 datasets with diversified characteristics. The obtained results indicate that the three proposed methods perform better than original self-training and co-training methods in most cases.	pt_BR
dc.description.resumo	O aprendizado semissupervisionado é um tipo de aprendizado de máquina que integra os mecanismos de aprendizado supervisionado e não supervisionado. Nele, a maioria dos rótulos do conjunto de treinamento são desconhecidos, mas há uma pequena parcela que possui rótulo. Este tipo de aprendizado atrai atenção devido ao seu potencial de utilização de dados rotulados e não rotulados para alcançar melhor desempenho do que o aprendizado supervisionado. Este trabalho consiste em um estudo no campo da aprendizagem semissupervisionada e implementa mudanças na estrutura de dois algoritmos semissupervisionados, self-training e co-training. Na literatura, é comum o desenvolvimento de pesquisas que alteram a estrutura destes algoritmos, no entanto, nenhuma delas propõe a automatização no processo de rotulagem de instâncias não rotuladas, que é o principal propósito deste trabalho. Para atingir este objetivo, três métodos são propostos: FlexConG, FlexCon e FlexCon-C. As principais diferenças entre estes métodos são a forma de calcular o limiar de confiança e a estratégia para escolha dos rótulos a cada iteração, entre elas comitês de classificadores. Para avaliar a performance dos métodos propostos, foi realizada uma análise empírica em que o desempenho destes métodos foi avaliado em 30 conjuntos de dados com características diversificadas. Os resultados indicam que os três métodos propostos e suas versões apresentam melhor desempenho que os métodos self-training e co-training originais na maioria dos casos.	pt_BR
dc.identifier.citation	VALE, Karliane Medeiros Ovidio. Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado. 2019. 117f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2019.	pt_BR
dc.identifier.uri	https://repositorio.ufrn.br/jspui/handle/123456789/28464
dc.language	pt_BR	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.initials	UFRN	pt_BR
dc.publisher.program	PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Inteligência artificial	pt_BR
dc.subject	Aprendizado de máquina	pt_BR
dc.subject	Aprendizado Semissupervisionado	pt_BR
dc.subject	Self-training	pt_BR
dc.subject	Co-training	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO	pt_BR
dc.title	Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado	pt_BR
dc.title.alternative	A proposal for automating the instance labeling process in semi-supervised learning algorithms	pt_BR
dc.type	doctoralThesis	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: Propostaautomatizacaoprocesso_Vale_2019.pdf
Tamanho:: 1.87 MB
Formato:: Adobe Portable Document Format

Baixar

Coleções

PPGSC - Doutorado em Sistemas e Computação

SIGAA

Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado

Arquivos

Pacote Original

Coleções