Please use this identifier to cite or link to this item: https://repositorio.ufrn.br/handle/123456789/29155
Title: Predspot: predicting crime hotspots with machine learning
Other Titles: Predspot: predizendo hotspots criminais com aprendizado de máquina
Authors: Araújo Júnior, Adelson Dias de
Advisor: Cacho, Nélio Alessandro Azevedo
Keywords: Predictive policing;Hotspot prediction;Machine learning;Crime forecasting
Issue Date: 24-Sep-2019
Citation: ARAÚJO JÚNIOR, Adelson Dias de. Predspot: predicting crime hotspots with machine learning. 2019. 80f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2019.
Portuguese Abstract: Smart cities are increasingly adopting data infrastructure and analysis to improve the decision-making process for public safety issues. Although traditional hotspot policing methods have shown benefits in reducing crime, previous studies suggest that the adoption of predictive techniques can produce more accurate estimates for future crime concentration. In previous work, we proposed a framework to generate near-future hotspots using spatiotemporal features. In this work, we redesign the framework to support (i) the widely used crime mapping method kernel density estimation (KDE); (ii) geographic feature extraction with data from OpenStreetMap; (iii) feature selection, and; (iv) gradient boosting regression. Furthermore, we have provided an open-source implementation of the framework to support efficient hotspot prediction for police departments that cannot afford proprietary solutions. To evaluate the framework, we consider data from two cities, namely Natal (Brazil) and Boston (US), comprising twelve crime scenarios. We take as baseline the common police prediction methodology also employed in Natal. Results indicate that our predictive approach estimates hotspots 1.6-3.1 times better than the baseline, depending on the crime mapping method and machine learning algorithm used. From a feature importance analysis, we found that features from trend and seasonality were the most essential components to achieve better predictions.
Abstract: As cidades inteligentes estão adotando cada vez mais infraestrutura e análise de dados para melhorar o processo de tomada de decisões em questões de segurança pública. Embora os métodos tradicionais de policiamento de hotspot tenham se mostrado eficazes na redução do crime, estudos anteriores sugerem que a adoção de técnicas preditivas pode produzir estimativas mais precisas para a concentração espacial de crimes de um futuro próximo. Em nossas pesquisas anteriores, propusemos uma metodologia para gerar hotspots do futuro usando variáveis espaço-temporais. Neste trabalho, redesenhamos a estrutura do framework para suportar (i) o método de mapeamento de crimes amplamente utilizado - estimativa de densidade de kernel (KDE); (ii) extração de características geográficas com dados do OpenStreetMap; (iii) seleção de atributos e; (iv) regressão com o algoritmo Gradient Boosting. Além disso, fornecemos uma implementação de código aberto da estrutura para suportar a predição eficiente de hotspots. Para avaliar nossa abordagem, consideramos dados de duas cidades, Natal (Brasil) e Boston (EUA), compreendendo doze divisões de tipo de crime. Tomamos como método base de comparação uma metodologia comumente utilizada e também empregada em Natal. Os resultados indicam que nossa abordagem preditiva estima hotspots em média 1,6 a 3,1 vezes melhor que a abordagem tradicional, dependendo do método de mapeamento do crime e do algoritmo de aprendizado de máquina usado. A partir de uma análise de importância de atributos, descobrimos que tendência e sazonalidade eram os componentes mais essenciais para obter melhores previsões.
URI: https://repositorio.ufrn.br/jspui/handle/123456789/29155
Appears in Collections:PPGSC - Mestrado em Sistemas e Computação

Files in This Item:
File Description SizeFormat 
Predspotpredictingcrime_AraujoJunior_2019.pdf5,2 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.