DC Health: detecção de anomalias online em datacenters

dc.contributor.advisorBarroca Filho, Itamir de Morais
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1093675040121205pt_BR
dc.contributor.authorLopes Neto, Walter
dc.contributor.authorIDhttps://orcid.org/0000-0002-0483-7268pt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/0621147314421392pt_BR
dc.contributor.referees1Doria Neto, Adrião Duarte
dc.contributor.referees1IDhttps://orcid.org/0000-0002-5445-7327pt_BR
dc.contributor.referees1Latteshttp://lattes.cnpq.br/1987295209521433pt_BR
dc.contributor.referees2Almeida, André Gustavo Duarte de
dc.contributor.referees3Silva, Gustavo Girão Barreto da
dc.contributor.referees4Immich, Roger Kreutz
dc.date.accessioned2022-10-08T00:18:13Z
dc.date.available2022-10-08T00:18:13Z
dc.date.issued2022-08-30
dc.description.abstractDatacenters are critical environments for the availability of technology-based services. Aiming at the high availability of these services, performance metrics of nodes such as Virtual Machines (VM) or VM clusters are widely monitored. Metrics such as CPU and memory utilization can show anomalous patterns associated with failures and performance degradation, culminating in resource exhaustion and total node failure. Early detection of anomalies patterns in data can enable remediation measures, such as VM migration and resource reallocation, before losses occur. However, traditional monitoring tools often use fixed thresholds for detecting problems on nodes and lack automatic ways to detect anomalies at runtime. In this sense, machine learning techniques have been reported to detect anomalies in computational systems with online and offline approaches. This work proposes the application called DC Health, as an approach to anticipate the online detection of anomalies in datacenter nodes. The purpose of DC Health is to detect anomalies in the behavior of hosts and alert datacenter operators so that investigation and remediation measures can be taken. This research was conducted from i) Systematic Literature Mapping, ii) problem modeling from real VM data and iii) DC Health evaluation using the prequential method in 6 datasets from the real world. The results showed that DC Health excelled in constant memory usage when processing data and detection accuracy in between 75% and 90%. As future work, it is mainly expected to evaluate the detection tool in cloud computing scenarios and develop automated mechanisms for diagnosis and remediation.pt_BR
dc.description.resumoDatacenters são ambientes críticos para a disponibilidade de serviços baseados em tecnologia. Visando a alta disponibilidade desses serviços, métricas de performance dos nós, como Máquinas Virtuais (VM) ou clusters de VMs são amplamente monitoradas. Essas métricas, como nível de utilização de CPU e memória, podem apresentar padrões anômalos associados a falhas e a degradação de desempenho, culminando na exaustão de recursos e na falha total do nó. A detecção precoce de anomalias, isto é, de padrões em dados com comportamento diferente do esperado, pode possibilitar medidas de remediação, como migração de VMs e realocação de recursos, antes que perdas ocorram. Contudo, ferramentas de monitoramento tradicionais geralmente usam limites fixos para a detecção de problemas nos nós e carecem de maneiras automáticas para detectar anomalias em tempo de execução. Neste sentido, técnicas de aprendizado de máquina têm sido reportadas para detectar anomalias em sistemas computacionais com abordagens online e offline. Este trabalho propõe a aplicação denominada DC Health, como uma abordagem para antecipar a detecção online de anomalias em nós de datacenters. O objetivo do DC Health é detectar anomalias no comportamento de hosts e alertar aos operadores do datacenter, de forma que medidas de investigação e remediação possam ser tomadas. Para isso, esta pesquisa foi conduzida a partir de um i) Mapeamento Sistemático de Literatura, da ii) modelagem do problema a partir de dados reais de VMs e da iii) avaliação do DC Health usando o método prequential em 6 datasets do mundo real. Os resultados demonstraram que o DC Health se destacou em manter o consumo de memória constante enquanto processa os dados e na acurácia de detecção entre 75% e 90%. Como trabalhos futuros espera-se principalmente avaliar a ferramenta de detecção em cenários de computação em nuvem e desenvolver mecanismos automatizados de diagnóstico e remediação.pt_BR
dc.identifier.citationLOPES NETO, Walter. DC Health: detecção de anomalias online em datacenters. Orientador: Itamir de Morais Barroca Filho. 2022. 117f. Dissertação (Mestrado Profissional em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/49528
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM TECNOLOGIA DA INFORMAÇÃOpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectDetecção de anomaliaspt_BR
dc.subjectDatacenterpt_BR
dc.subjectHalf-space-treespt_BR
dc.subject.cnpqCNPQ::ENGENHARIASpt_BR
dc.titleDC Health: detecção de anomalias online em datacenterspt_BR
dc.title.alternativeDC Health: online anomaly detection in datacenterspt_BR
dc.typemasterThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
DCHealthdeteccao_LopesNeto_2022.pdf
Tamanho:
5.29 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar