Usando Machine Learning para classificar acidentes de trânsito nas rodovias federais do Brasil

3 min

Recentemente eu fiz uma análise descritiva nos dados de ocorrências sobre acidentes ocorridos em rodovias federais do Brasil, usando machine learning para criar um classificador de acidentes de acordo com o nível de gravidade.

O sistema BR-Brasil, desenvolvido pelo Departamento de Polícia Rodoviária Federal (DPRF), cataloga todas os boletins de ocorrência registrados após algum acidente ter ocorrido em alguma rodovia federal. A ferramenta consolida diversos detalhes sobre os veículos e pessoas envolvidos, sobre as condições do local, a dinâmica do acidente, etc. Por meio do programa governamental de dados abertos, a PRF disponibiliza publicamente esses dados em formato legível, para que qualquer pessoa possa analisá-los.

Sabendo disso, resolvi pegar uma amostra desses dados, referente aos anos de 2017 e 2018, para fazer uma análise. O trabalho foi dividido em duas etapas. Na primeira, os dados passaram por um preprocessamento e algumas transformações. Em seguida, foi realizada uma análise exploratória e descritiva, para descoberta de conhecimento nesta base. Já na segunda etapa, foi desenvolvido um modelo para classificar os acidentes de acordo o nível de gravidade (leve, grave, gravíssimo). O modelo foi testado numa amostra com dados de 2019, com registros que vão de janeiro à maio e que não foram usados no conjunto de aprendizagem.

Quais perguntas a análise ajudou a responder?

Para obter algumas respostas latentes nos dados, realizei uma análise descritiva e testes estatísticos de hipótese. Várias perguntas foram respondidas e abaixo estão listadas uma parte delas:

Preview do código em Python (+ links)

O vídeo acima é apenas um preview do código desenvolvido em um notebook na plataforma Kaggle. Todos os detalhes sobre a análise desses dados, bem como os códigos em Python utilizados, podem ser encontrados neste link. Não se esqueça de dá um “up vote” no notebook para incentivar a produção de novos materiais similares.

Comenta aí em baixo, se você encontrou qualquer erro na metodologia ou no código, ou se ficou com alguma dúvida. Estou aqui para ajudar!

Leia também

  1. 7 livros essenciais para aprender machine learning

  2. Dicas para aprender Machine Learning

  3. Reconhecimento de Entidades Nomeadas (NER) — O que é? Quais são as aplicações?

  4. Classificando textos com Machine Learning

  5. Análise de sentimentos com redes neurais recorrentes LSTM