Parallel implementation proposal of clustering algorithms in hardware

dc.contributor.advisorFernandes, Marcelo Augusto Costa
dc.contributor.advisorIDpt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3475337353676349pt_BR
dc.contributor.authorDias, Leonardo Alves
dc.contributor.authorIDpt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/3328422790889056pt_BR
dc.contributor.referees1Silva, Ivanovitch Medeiros Dantas da
dc.contributor.referees1IDpt_BR
dc.contributor.referees1Latteshttp://lattes.cnpq.br/3608440944832201pt_BR
dc.contributor.referees2Araújo, Daniel Sabino Amorim de
dc.contributor.referees2IDpt_BR
dc.contributor.referees2Latteshttp://lattes.cnpq.br/4744754780165354pt_BR
dc.contributor.referees3Verba, Nandor
dc.contributor.referees3IDpt_BR
dc.contributor.referees4Sakuyama, Carlos Alberto Valderrama
dc.contributor.referees4IDpt_BR
dc.date.accessioned2020-12-15T18:19:49Z
dc.date.available2020-12-15T18:19:49Z
dc.date.issued2020-10-05
dc.description.abstractEste trabalho apresenta um estudo sob algoritmos de clusterização de dados implementados em hardware dedicado para aplicações em geral, objetivando aumentar a velocidade de processamento. Algoritmos de clusterização têm sido amplamente adotados para encontrar a padrões entre dados, em diferentes áreas. No entanto, estes algoritmos normalmente implicam em uma alta complexidade de processamento e, além disso, a quantidade de dados armazenados atualmente é massiva. Sendo assim, a necessidade de processamento de dados com alto throughput tornou-se ainda mais importante, especialmente para aplicações em tempo real. Uma solução que foi adotada para aumentar a velocidade de processamento é o uso de técnicas paralelas implementadas em hardware dedicado, que provou ser mais eficiente em comparação com sistemas sequenciais. Logo, este trabalho propõe a implementação totalmente paralela dos algoritmos de clusterização de dados em hardware para otimizar o tempo de processamento dos sistemas em diversas áreas, possibilitando aplicações para sistemas com quantidade massiva de dados. Uma nova proposta de implementação dos algoritmos de clusterização K-means e SelfOrganising Map são apresentadas, juntamente a análises dos resultados relacionados ao throughput e o recurso de hardware para diferentes parâmetros, mostrando um aumento na velocidade de processamento de milhões de pontos de dados e neurônios atualizados por segundo. As implementações apresentadas aqui apontam para uma nova direção associada a implementação de algoritmos de clusterização e poderá ser utilizada em outros algoritmos.pt_BR
dc.description.resumoThis work presents a study on data clustering algorithms implemented in dedicated hardware for applications in general, aiming to increase the processing speed. Clustering algorithms have been widely adopted to find patterns between data in different areas. However, these algorithms usually imply high processing complexity and, in addition, the amount of data currently stored is massive. Therefore, the need for high-throughput data processing has become even more critical, especially for real-time applications. One solution that has been adopted to increase processing speed is the use of parallel techniques implemented on dedicated hardware, which has proved to be more efficient compared to sequential systems. Therefore, this work proposes the fully parallel implementation of data clustering algorithms in hardware to optimize the processing time of systems in several areas, enabling applications for systems with a massive amount of data. A new proposal for implementations of the clustering algorithms K-means and Self-Organizing Maps are presented, together with an analysis of the results related to throughput and the hardware resource for different parameters, showing a speedup of millions of data points and connections updated per second. The implementations presented here point to a new direction associated with the implementation of clustering algorithms and can be used in other algorithms.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.identifier.citationDIAS, Leonardo Alves. Parallel implementation proposal of clustering algorithms in hardware. 2020. 90f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/31003
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectMassive Data setspt_BR
dc.subjectData Clusteringpt_BR
dc.subjectParallel Systemspt_BR
dc.subjectHardwarept_BR
dc.titleParallel implementation proposal of clustering algorithms in hardwarept_BR
dc.typedoctoralThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Parallelimplementationproposal_Dias_2020.pdf
Tamanho:
1.8 MB
Formato:
Adobe Portable Document Format
Carregando...
Imagem de Miniatura
Baixar