Please use this identifier to cite or link to this item: https://repositorio.ufrn.br/handle/123456789/19393
Title: Estratégias de busca reativa utilizando aprendizagem por reforço e algoritmos de busca local
Authors: Santos, João Paulo Queiroz dos
Keywords: Aprendizagem por reforço;Busca reativa;Otimização combinatória;Busca local;Busca em vizinhança variável
Issue Date: 12-Sep-2014
Publisher: Universidade Federal do Rio Grande do Norte
Citation: SANTOS, João Paulo Queiroz dos. Estratégias de busca reativa utilizando aprendizagem por reforço e algoritmos de busca local. 2014. 111f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2014.
Portuguese Abstract: Técnicas de otimização conhecidas como as metaheurísticas tem conseguido resolversatisfatoriamente problemas conhecidos, mas desenvolvimento das metaheurísticas écaracterizado por escolha de parâmetros para sua execução, na qual a opção apropriadadestes parâmetros (valores). Onde o ajuste de parâmetro é essencial testa-se os parâmetrosaté que resultados viáveis sejam obtidos, normalmente feita pelo desenvolvedor que estaimplementando a metaheuristica. A qualidade dos resultados de uma instância1 de testenão será transferida para outras instâncias a serem testadas e seu feedback pode requererum processo lento de “tentativa e erro” onde o algoritmo têm que ser ajustado para umaaplicação especifica. Diante deste contexto das metaheurísticas surgiu a Busca Reativaque defende a integração entre o aprendizado de máquina dentro de buscas heurísticaspara solucionar problemas de otimização complexos. A partir da integração que a BuscaReativa propõe entre o aprendizado de máquina e as metaheurísticas, surgiu a ideia dese colocar a Aprendizagem por Reforço mais especificamente o algoritmo Q-learning deforma reativa, para selecionar qual busca local é a mais indicada em determinado instanteda busca, para suceder uma outra busca local que não pode mais melhorar a soluçãocorrente na metaheurística VNS. Assim, neste trabalho propomos uma implementação reativa,utilizando aprendizado por reforço para o auto-tuning do algoritmo implementado,aplicado ao problema do caixeiro viajante simétrico e ao problema escalonamento sondaspara manutenção de poços.
URI: https://repositorio.ufrn.br/jspui/handle/123456789/19393
Appears in Collections:PPGEE - Doutorado em Engenharia Elétrica e de Computação

Files in This Item:
File Description SizeFormat 
JoaoPauloQueirozDosSantos_TESE.pdf2.74 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.