Utilizando um conjunto de dados de 200 imagens, o objetivo deste software é localizar e classificar 7 objetos diferentes em diversas imagens, utilizando o algoritmo ResNet. Os objetos utilizados no dataset disponilizado foram: 'T', 'Carregador', 'Controle de ar condicionado', 'Controle de TV', 'Calculadora', 'lapiseira', 'Moeda de 1 real'.
Para rotular todos os objetos utilizados em todas as imagens, utilizamos o site Makesense para a criação das labels. abaixo exemplos de como ficam algumas imagens depois da utilização do Makesense.
Utilizando um conjunto de treino com 140 imagens, e um conjunto de validação com 30 imagens, foi possívil atingir uma precisão de 94,79% utilizado-se de 26 epochs para treinamento.
Utilizei como threshold a confiança de 70% na predição do objeto, para avaliar a precisão do meu algoritmo acertando os objetos. Após ordenar todas as iamgens do conjunto de teste por score, cheguei no seguinte resultado para as 10 melhores imagens e as 10 piores imagens:
Após o tunning e treino alcançamos os seguintes resultados:
A precisão do modelo nos dados de teste é de: 97,89%
A precisão do modelo nos dados de validação é de: 94,79%
Alcançamos um resultado muito bom para a localização e classificação dos objetos, mesmo este sendo um dataset pequeno e com baixa qualidade. Então dá para se ter noção do quão poderoso o algoritmo é de quais resultados podemos alcançar com um dataset mais robusto. Abaixo algumas imagens com a localização e classificação feita pelo algoritmo:
- Faça um fork do projeto.
- Crie uma nova branch com as suas alterações:
git checkout -b my-feature
- Salve as alterações e crie uma mensagem de commit contando o que você fez:
git commit -m "feature: My new feature"
- Envie as suas alterações:
git push origin my-feature
Este projeto foi desenvolvido com o ❤️ por @Ícaro Coêlho 👋🏽 Entre em contato!
Este projeto esta sobe a licença MIT.