SlideShare uma empresa Scribd logo
1 de 23
Baixar para ler offline
Valéria Nunes dos Santos
Ciência da computação pela UTFPR - Medianeira em 2018
PPTIC - CELTAB
COMO USAR E APLICAR A YOLOv3
AGENDA
● O que é YOLO
● Como usar a CNN YOLOv3
● Como aplicar a CNN YOLOv3
YOLOv3
REDE NEURAL CONVOLUCIONAL (CNN)
● Reconhecimento de objetos em imagens;
● Pelo menos uma camada convolucional;
● Pode conter outras camadas como:
○ MaxPooling;
○ AVGPooling;
○ FullConnected;
○ Shortcut;
○ Dropout;
○ Softmax, entre outras.
FERRAMENTAS INDISPENSÁVEIS
● Placa de vídeo nvidia;
● CUDA Toolkit (8, 9, 10);
● Library cuDNN 6.0.
FERRAMENTAS OPCIONAIS
● Github;
● Opencv;
● BBox-label-tool.
BBox-label-tool
YOLO
( you only look once )
V1 (jun-2016) - V2(dez-2016) - V3(2018)
YOLO versão 1
Joseph Redmon, Santosh Divvala, Ross Girshick, Ali
Farhadi
PASCAL VOC 2012
● Person
● Bird, Cat, Cow, Dog, Horse, Sheep
● Aeroplane, Bicycle, Boat, Bus, Car, Motorbike, Train
● Bottle, Chair, Dining Table, Potted Plant, Sofa,
Tv/Monitor
YOLO versão 1
Real-Time Detectors Train mAP FPS
100Hz DPM 2007 16.0 100
30Hz DPM 2007 26.1 30
Fast YOLO 2007+2012 52.7 155
YOLO 2007+2012 63.4 45
YOLO versão 1
Less Than Real-Time Train mAP FPS
Fastest DPM 2007 30.4 15
R-CNN Minus R 2007 53.5 6
Fast R-CNN 2007+2012 70.0 0.5
Fast R-CNN VGG-16 2007+2012 73.2 7
Fast R-CNN ZF 2007+2012 62.1 18
YOLO VGG-16 2007+2012 66.4 21
YOLO v2
Detection Frameworks Train mAP FPS
Fast R-CNN 2007+2012 70.0 0.5
Faster R-CNN VGG-16 2007+2012 73.2 7
Faster R-CNN ResNet 2007+2012 76.4 5
YOLO 2007+2012 63.4 45
SSD300 2007+2012 74.3 46
SSD500 2007+2012 76.8 19
YOLOv2 288 x 288 2007+2012 69.0 91
YOLOv2 352 x 352 2007+2012 73.7 81
YOLOv2 416 x 416 2007+2012 76.8 67
YOLOv2 480 x 480 2007+2012 77.8 59
YOLOv2 544 x 544 2007+2012 78.6 40
YOLO v3
Method mAP-50 Tempo Treinamento
SSD321 45.4 61
DSSD321 46.1 85
R-FCN 51.9 85
SSD513 50.4 125
DSSD513 53.3 156
FPN FRCN 59.1 172
RetinaNet-50-500 50.9 73
RetinaNet-101-500 53.1 90
RetinaNet-50-800 57.5 198
YOLOv3-320 51.5 22
YOLOv3-416 55.3 29
YOLOv3-608 57.9 51
COMO USAR YOLOv3
MONTAR O DATASET
● Pascal VOC Dataset Mirror - 20 classes;
● Common Objects in Context vugo COCO - 80
classes;
● Imagenet (14,197,122 images);
● Criar o próprio Banco;
● Últimos casos no google;
SOBRE IMAGENS
● Rotação (x y z);
● Escala;
● Desfoque;
● Oclusão;
● Empilhamento;
● Iluminação, escala de cinza;
● Mudança de ambiente;
● Estado íntegro do objeto;
● Quantidade de objetos na mesma imagem.
SOBRE IMAGENS NEGATIVAS
=
PREPARANDO A YOLOv3 PARA TREINAMENTO
● batch;
● subdivisions;
● width;
● height;
● max_batches;
● filters (linha 603, 689, 776): (class + 5) * 3
● classes (linha 610, 696, 783)
● random.
TESTE E TREINAMENTO
● treinamento 75% teste 25%
● treinamento 80% teste 20%
● treinamento 70% teste 30%
COMO APLICAR A YOLOv3
DÚVIDAS?
valeria.valsnfw@gmail.com
valeria.santos@pti.org.br
Muito Obrigada pelo seu tempo!

Mais conteúdo relacionado

Mais de GDGFoz

Dart e Flutter do Server ao Client Side
Dart e Flutter do Server ao Client SideDart e Flutter do Server ao Client Side
Dart e Flutter do Server ao Client Side
GDGFoz
 

Mais de GDGFoz (20)

Apresentação GDG Foz 2023
Apresentação GDG Foz  2023Apresentação GDG Foz  2023
Apresentação GDG Foz 2023
 
Desenvolvimento de um Comedouro para cães com Acionamento Automático e Remoto
Desenvolvimento de um Comedouro para cães com Acionamento Automático e RemotoDesenvolvimento de um Comedouro para cães com Acionamento Automático e Remoto
Desenvolvimento de um Comedouro para cães com Acionamento Automático e Remoto
 
Introdução do DEVSECOPS
Introdução do DEVSECOPSIntrodução do DEVSECOPS
Introdução do DEVSECOPS
 
Aquisição de dados IoT com Event Sourcing e Microservices
Aquisição de dados IoT com Event Sourcing e MicroservicesAquisição de dados IoT com Event Sourcing e Microservices
Aquisição de dados IoT com Event Sourcing e Microservices
 
Robótica Sucational
Robótica SucationalRobótica Sucational
Robótica Sucational
 
A nova era do desenvolvimento mobile
A nova era do desenvolvimento mobile A nova era do desenvolvimento mobile
A nova era do desenvolvimento mobile
 
Qualidade em Testes de Software
Qualidade em Testes de SoftwareQualidade em Testes de Software
Qualidade em Testes de Software
 
WebAssembly além da Web - Casos de Uso em IoT
WebAssembly além da Web - Casos de Uso em IoTWebAssembly além da Web - Casos de Uso em IoT
WebAssembly além da Web - Casos de Uso em IoT
 
Dart e Flutter do Server ao Client Side
Dart e Flutter do Server ao Client SideDart e Flutter do Server ao Client Side
Dart e Flutter do Server ao Client Side
 
UX: O que é e como pode influenciar a vida do desenvolvedor?
UX: O que é e como pode influenciar a vida do desenvolvedor?UX: O que é e como pode influenciar a vida do desenvolvedor?
UX: O que é e como pode influenciar a vida do desenvolvedor?
 
Dicas de como entrar no mundo do DevSecOps
Dicas de como entrar no mundo do DevSecOpsDicas de como entrar no mundo do DevSecOps
Dicas de como entrar no mundo do DevSecOps
 
Angular >= 2 - One Framework Mobile & Desktop
Angular >= 2 - One Framework Mobile & DesktopAngular >= 2 - One Framework Mobile & Desktop
Angular >= 2 - One Framework Mobile & Desktop
 
Automação Residencial Extrema com Opensource
Automação Residencial Extrema com OpensourceAutomação Residencial Extrema com Opensource
Automação Residencial Extrema com Opensource
 
Brasil.IO COVID-19: Dados por Municípios. Quais os Desafios?
Brasil.IO COVID-19: Dados por Municípios. Quais os Desafios?Brasil.IO COVID-19: Dados por Municípios. Quais os Desafios?
Brasil.IO COVID-19: Dados por Municípios. Quais os Desafios?
 
Desmistificando a programação funcional
Desmistificando a programação funcionalDesmistificando a programação funcional
Desmistificando a programação funcional
 
Microsserviços com Kotlin
Microsserviços com KotlinMicrosserviços com Kotlin
Microsserviços com Kotlin
 
Autenticação de dois fatores
Autenticação de dois fatores Autenticação de dois fatores
Autenticação de dois fatores
 
Fique em casa seguro (ou tente)!
Fique em casa seguro (ou tente)!Fique em casa seguro (ou tente)!
Fique em casa seguro (ou tente)!
 
Hooks em React: o novo jeito de fazer componentes funcionais
Hooks em React: o novo jeito de fazer componentes funcionaisHooks em React: o novo jeito de fazer componentes funcionais
Hooks em React: o novo jeito de fazer componentes funcionais
 
Angular, React ou Vue? Comparando os favoritos do JS reativo
Angular, React ou Vue? Comparando os favoritos do JS reativoAngular, React ou Vue? Comparando os favoritos do JS reativo
Angular, React ou Vue? Comparando os favoritos do JS reativo
 

Como usar e aplicar a Yolov3.

  • 1. Valéria Nunes dos Santos Ciência da computação pela UTFPR - Medianeira em 2018 PPTIC - CELTAB
  • 2. COMO USAR E APLICAR A YOLOv3
  • 3. AGENDA ● O que é YOLO ● Como usar a CNN YOLOv3 ● Como aplicar a CNN YOLOv3
  • 5. REDE NEURAL CONVOLUCIONAL (CNN) ● Reconhecimento de objetos em imagens; ● Pelo menos uma camada convolucional; ● Pode conter outras camadas como: ○ MaxPooling; ○ AVGPooling; ○ FullConnected; ○ Shortcut; ○ Dropout; ○ Softmax, entre outras.
  • 6. FERRAMENTAS INDISPENSÁVEIS ● Placa de vídeo nvidia; ● CUDA Toolkit (8, 9, 10); ● Library cuDNN 6.0.
  • 7. FERRAMENTAS OPCIONAIS ● Github; ● Opencv; ● BBox-label-tool.
  • 9. YOLO ( you only look once ) V1 (jun-2016) - V2(dez-2016) - V3(2018)
  • 10. YOLO versão 1 Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi PASCAL VOC 2012 ● Person ● Bird, Cat, Cow, Dog, Horse, Sheep ● Aeroplane, Bicycle, Boat, Bus, Car, Motorbike, Train ● Bottle, Chair, Dining Table, Potted Plant, Sofa, Tv/Monitor
  • 11. YOLO versão 1 Real-Time Detectors Train mAP FPS 100Hz DPM 2007 16.0 100 30Hz DPM 2007 26.1 30 Fast YOLO 2007+2012 52.7 155 YOLO 2007+2012 63.4 45
  • 12. YOLO versão 1 Less Than Real-Time Train mAP FPS Fastest DPM 2007 30.4 15 R-CNN Minus R 2007 53.5 6 Fast R-CNN 2007+2012 70.0 0.5 Fast R-CNN VGG-16 2007+2012 73.2 7 Fast R-CNN ZF 2007+2012 62.1 18 YOLO VGG-16 2007+2012 66.4 21
  • 13. YOLO v2 Detection Frameworks Train mAP FPS Fast R-CNN 2007+2012 70.0 0.5 Faster R-CNN VGG-16 2007+2012 73.2 7 Faster R-CNN ResNet 2007+2012 76.4 5 YOLO 2007+2012 63.4 45 SSD300 2007+2012 74.3 46 SSD500 2007+2012 76.8 19 YOLOv2 288 x 288 2007+2012 69.0 91 YOLOv2 352 x 352 2007+2012 73.7 81 YOLOv2 416 x 416 2007+2012 76.8 67 YOLOv2 480 x 480 2007+2012 77.8 59 YOLOv2 544 x 544 2007+2012 78.6 40
  • 14. YOLO v3 Method mAP-50 Tempo Treinamento SSD321 45.4 61 DSSD321 46.1 85 R-FCN 51.9 85 SSD513 50.4 125 DSSD513 53.3 156 FPN FRCN 59.1 172 RetinaNet-50-500 50.9 73 RetinaNet-101-500 53.1 90 RetinaNet-50-800 57.5 198 YOLOv3-320 51.5 22 YOLOv3-416 55.3 29 YOLOv3-608 57.9 51
  • 16. MONTAR O DATASET ● Pascal VOC Dataset Mirror - 20 classes; ● Common Objects in Context vugo COCO - 80 classes; ● Imagenet (14,197,122 images); ● Criar o próprio Banco; ● Últimos casos no google;
  • 17. SOBRE IMAGENS ● Rotação (x y z); ● Escala; ● Desfoque; ● Oclusão; ● Empilhamento; ● Iluminação, escala de cinza; ● Mudança de ambiente; ● Estado íntegro do objeto; ● Quantidade de objetos na mesma imagem.
  • 19. PREPARANDO A YOLOv3 PARA TREINAMENTO ● batch; ● subdivisions; ● width; ● height; ● max_batches; ● filters (linha 603, 689, 776): (class + 5) * 3 ● classes (linha 610, 696, 783) ● random.
  • 20. TESTE E TREINAMENTO ● treinamento 75% teste 25% ● treinamento 80% teste 20% ● treinamento 70% teste 30%
  • 21. COMO APLICAR A YOLOv3