DC Health: detecção de anomalias online em datacenters
dc.contributor.advisor | Barroca Filho, Itamir de Morais | |
dc.contributor.advisorLattes | http://lattes.cnpq.br/1093675040121205 | pt_BR |
dc.contributor.author | Lopes Neto, Walter | |
dc.contributor.authorID | https://orcid.org/0000-0002-0483-7268 | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/0621147314421392 | pt_BR |
dc.contributor.referees1 | Doria Neto, Adrião Duarte | |
dc.contributor.referees1ID | https://orcid.org/0000-0002-5445-7327 | pt_BR |
dc.contributor.referees1Lattes | http://lattes.cnpq.br/1987295209521433 | pt_BR |
dc.contributor.referees2 | Almeida, André Gustavo Duarte de | |
dc.contributor.referees3 | Silva, Gustavo Girão Barreto da | |
dc.contributor.referees4 | Immich, Roger Kreutz | |
dc.date.accessioned | 2022-10-08T00:18:13Z | |
dc.date.available | 2022-10-08T00:18:13Z | |
dc.date.issued | 2022-08-30 | |
dc.description.abstract | Datacenters are critical environments for the availability of technology-based services. Aiming at the high availability of these services, performance metrics of nodes such as Virtual Machines (VM) or VM clusters are widely monitored. Metrics such as CPU and memory utilization can show anomalous patterns associated with failures and performance degradation, culminating in resource exhaustion and total node failure. Early detection of anomalies patterns in data can enable remediation measures, such as VM migration and resource reallocation, before losses occur. However, traditional monitoring tools often use fixed thresholds for detecting problems on nodes and lack automatic ways to detect anomalies at runtime. In this sense, machine learning techniques have been reported to detect anomalies in computational systems with online and offline approaches. This work proposes the application called DC Health, as an approach to anticipate the online detection of anomalies in datacenter nodes. The purpose of DC Health is to detect anomalies in the behavior of hosts and alert datacenter operators so that investigation and remediation measures can be taken. This research was conducted from i) Systematic Literature Mapping, ii) problem modeling from real VM data and iii) DC Health evaluation using the prequential method in 6 datasets from the real world. The results showed that DC Health excelled in constant memory usage when processing data and detection accuracy in between 75% and 90%. As future work, it is mainly expected to evaluate the detection tool in cloud computing scenarios and develop automated mechanisms for diagnosis and remediation. | pt_BR |
dc.description.resumo | Datacenters são ambientes críticos para a disponibilidade de serviços baseados em tecnologia. Visando a alta disponibilidade desses serviços, métricas de performance dos nós, como Máquinas Virtuais (VM) ou clusters de VMs são amplamente monitoradas. Essas métricas, como nível de utilização de CPU e memória, podem apresentar padrões anômalos associados a falhas e a degradação de desempenho, culminando na exaustão de recursos e na falha total do nó. A detecção precoce de anomalias, isto é, de padrões em dados com comportamento diferente do esperado, pode possibilitar medidas de remediação, como migração de VMs e realocação de recursos, antes que perdas ocorram. Contudo, ferramentas de monitoramento tradicionais geralmente usam limites fixos para a detecção de problemas nos nós e carecem de maneiras automáticas para detectar anomalias em tempo de execução. Neste sentido, técnicas de aprendizado de máquina têm sido reportadas para detectar anomalias em sistemas computacionais com abordagens online e offline. Este trabalho propõe a aplicação denominada DC Health, como uma abordagem para antecipar a detecção online de anomalias em nós de datacenters. O objetivo do DC Health é detectar anomalias no comportamento de hosts e alertar aos operadores do datacenter, de forma que medidas de investigação e remediação possam ser tomadas. Para isso, esta pesquisa foi conduzida a partir de um i) Mapeamento Sistemático de Literatura, da ii) modelagem do problema a partir de dados reais de VMs e da iii) avaliação do DC Health usando o método prequential em 6 datasets do mundo real. Os resultados demonstraram que o DC Health se destacou em manter o consumo de memória constante enquanto processa os dados e na acurácia de detecção entre 75% e 90%. Como trabalhos futuros espera-se principalmente avaliar a ferramenta de detecção em cenários de computação em nuvem e desenvolver mecanismos automatizados de diagnóstico e remediação. | pt_BR |
dc.identifier.citation | LOPES NETO, Walter. DC Health: detecção de anomalias online em datacenters. Orientador: Itamir de Morais Barroca Filho. 2022. 117f. Dissertação (Mestrado Profissional em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022. | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/49528 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.publisher.program | PROGRAMA DE PÓS-GRADUAÇÃO EM TECNOLOGIA DA INFORMAÇÃO | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Detecção de anomalias | pt_BR |
dc.subject | Datacenter | pt_BR |
dc.subject | Half-space-trees | pt_BR |
dc.subject.cnpq | CNPQ::ENGENHARIAS | pt_BR |
dc.title | DC Health: detecção de anomalias online em datacenters | pt_BR |
dc.title.alternative | DC Health: online anomaly detection in datacenters | pt_BR |
dc.type | masterThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- DCHealthdeteccao_LopesNeto_2022.pdf
- Tamanho:
- 5.29 MB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível