Apache Kafka: implementação da técnica de replicação de banco de dados baseada em Middleware para o contexto de raspagem de dados

Benedito Neto, Manoel

Apache Kafka: implementação da técnica de replicação de banco de dados baseada em Middleware para o contexto de raspagem de dados

Página do item simplificado Estatísticas

dc.contributor.advisor	Viegas, Carlos Manuel Dias
dc.contributor.author	Benedito Neto, Manoel
dc.contributor.referees1	Oliveira, Luiz Affonso Henderson Guedes de
dc.contributor.referees2	Silva, Ivanovitch Medeiros Dantas da
dc.date.accessioned	2022-07-29T12:53:52Z
dc.date.available	2022-07-29T12:53:52Z
dc.date.issued	2022-07-26
dc.description.abstract	The demand for stability and availability of databases in the age of information and distributed computing is increasingly urgent. The recent Covid-19 'Data Blackout' case, which occurred in December 2021 in DataSUS systems, can be mentioned as an alarming occasion that could have been mitigated with the implementation of database replication techniques. Database replication techniques seek to increase consistency, performance and availability characteristics through a service architecture capable of fully copying the data present in a database. This paper has the general objective of implement the Middleware-based database replication technique using Apache Kafka tool to mediate the exchange of information between a database and its replica in a data scraping application context. The data are stored in a PostgreSQL database, stored by a Python application that, in turn, perform the data scraping of meteorological data referring to fire outbreaks, publicly provided by the National Institute for Space Research (INPE) through an Application Programming Interface (API). The concepts of service virtualization were used to instantiate the data scraping application, the database service and a Database Management System (DBMS), the Apache Kafka service architecture and a control panel for visualization of its performance. Thus, concluded that the methodology applied had resulted in a consistent database replica for the data scraping system developed.	pt_BR
dc.description.resumo	A demanda pela estabilidade e disponibilidade de bancos de dados na era da informação e computação distribuída é cada vez mais urgente. O recente caso de 'Apagão de Dados' de Covid-19, ocorrido em Dezembro de 2021 nos sistemas do DataSUS, pode ser mencionado como uma alarmante ocasião que poderia ter sido amenizada com a implementação de técnicas para replicação de banco de dados. As técnicas de replicação de banco de dados buscam incrementar características de consistência, desempenho e disponibilidade por meio de uma arquitetura de solução capaz de copiar integralmente os dados presentes em um banco. Este trabalho de conclusão de curso tem como objetivo geral implementar a técnica de replicação de banco de dados baseada em middleware com a utilização da ferramenta Apache Kafka para intermediar as trocas de informações entre um banco e sua réplica que, por sua vez, são alimentados por uma aplicação para raspagem de dados. Os dados são armazenados em um banco de dados PostgreSQL através de uma aplicação Python, a qual realiza a raspagem de dados meteorológicos referentes a focos de queimadas, cedidos publicamente pelo Instituto Nacional de Pesquisas Espaciais (INPE) por meio de uma Application Programming Interface (API). Foram utilizados os conceitos de virtualização de serviços para instanciar a aplicação de raspagem de dados, o serviço de banco de dados e um Sistema de Gerenciamento de Banco de Dados (SGBD), a arquitetura de serviços Apache Kafka e um painel de controle para visualização de seu desempenho. Com isso, constatou-se que a metodologia utilizada teve como resultado uma réplica de banco de dados consistente para o sistema de raspagem de dados desenvolvido.	pt_BR
dc.identifier.citation	BENEDITO NETO, Manoel. Apache Kafka: implementação da técnica de replicação de banco de dados baseada em Middleware para o contexto de raspagem de dados. 2022. 55f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022.	pt_BR
dc.identifier.uri	https://repositorio.ufrn.br/handle/123456789/48850
dc.language	pt_BR	pt_BR
dc.publisher	Universidade Federal do Rio Grande do Norte	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Engenharia de Computação e Automação	pt_BR
dc.publisher.initials	UFRN	pt_BR
dc.publisher.program	Engenharia de Computação	pt_BR
dc.rights	Attribution-NonCommercial 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc/3.0/br/	*
dc.subject	Apache Kafka	pt_BR
dc.subject	Sistemas distribuídos	pt_BR
dc.subject	Replicação de banco de dados	pt_BR
dc.subject	Raspagem de dados	pt_BR
dc.subject	Virtualização de serviços	pt_BR
dc.subject	Distributed systems	pt_BR
dc.subject	Database replication	pt_BR
dc.subject	Data scrapping	pt_BR
dc.subject	Service virtualization	pt_BR
dc.title	Apache Kafka: implementação da técnica de replicação de banco de dados baseada em Middleware para o contexto de raspagem de dados	pt_BR
dc.title.alternative	Apache Kafka: Implementation of Middleware-Based Database Replication Technique for Data Scraping Context	pt_BR
dc.type	bachelorThesis	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: TCC_Manoel_Benedito_Neto_Final.pdf
Tamanho:: 1.59 MB
Formato:: Adobe Portable Document Format

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.45 KB
Formato:: Item-specific license agreed upon to submission

Baixar

Coleções

CT - TCC - Engenharia de Computação

SIGAA

Apache Kafka: implementação da técnica de replicação de banco de dados baseada em Middleware para o contexto de raspagem de dados

Arquivos

Pacote Original

Licença do Pacote

Coleções