OMR com PHP

Optical Mark Recognition
with PHP

Quem sou eu?
👨‍💻 Developer since 2007
👶 Father of a boy
🌱 Organizer @phpmg
👔 Owner @supliutecnologia
🤠 Brazilian ten-string guitar player
🎓 Systems Analyst and Development - UNA - 2011
🎓 Interaction Design Specialist UX/UI - PUC Minas - 2016
https://github.com/jansenfelipe
@jansenfelipe
https://jansenfelipe.com.br

Contexto
Oferta cursos, palestras,
consultorias, workshops para
micro e pequenos
empreendedores.
Empresa que atende todos os
853 municípios do estado de
Minas Gerais.

Contexto
Nossos clientes estão gostando?

Contexto
Vamos aplicar um
questionário
para saber!

Contexto
● Tempo de digitação
● Erro de tabulação
● Tempo para conferir
● Dinheiro
● Demora na publicação
do resultado
● Baixa performance

Contexto
Em 2015: 3.308 cursos,
palestras, consultorias, etc.

Contexto
Em 2015: 3.308 cursos,
(Média de 10 participantes)
33.080 avaliações

Contexto
Em 2015: 3.308 cursos,
(Média de 10 participantes)
33.080 avaliações
(10 perguntas)
330.800 respostas

Contexto
Como resolver esses problemas?

Contexto
Depois
respondo..
Preguiça..
$
Esqueci..
Preguiça..
Spam..
Nao tenho
celular
Nao tenho
email..

Contexto
● O questionário em
papel já funciona bem
● As pessoas respondem
na hora
● A memória das pessoas
está fresca

Contexto
Precisamos automatizar a
tabulação dos dados!

Contexto
Precisamos automatizar a
tabulação dos dados!
OMR

O que é OMR?
Optical Mark Recognition é o processo de captura de dados
marcado por humanos a partir de formas de documentos, tais
como pesquisas e testes.
https://en.wikipedia.org/wiki/Optical_mark_recognition

O que é OMR?
● Coleta dados de
questionários
● Correção de
gabaritos de
provas

O que é OMR?
Analógico
Digital
false
false false
false
true
true

SDAPS
● Python
● Output CSV
● Linha de
comando
● LaTeX
http://sdaps.org

SDAPS - LaTeX
$ sdaps "/project01" setup_tex "/example.tex"

SDAPS - LaTeX
$ open /project01/example.pdf

SDAPS - Adequar
● Manter as
bordas
● Manter a
posição dos
quadrados

SDAPS PHP
● Classe com
métodos
estáticos
● Executa
comandos SDAPS
https://github.com/jansenfelipe/sdaps-php

SDAPS - Problemas
● Demora (.tif com 10 / ~2 min)
● Formato questionário engessado
● .CSV truncado
● Calibragem
● Output com erros

Aprendi como funciona
Vou fazer com o PHP!

OMR com PHP
● Reconhecer qualquer formato
● Rápido
● Output JSON

Como funciona?
Analisando pixels!

10 px
10 px
Definir uma
tolerância para
considerar se é uma
marcação válida
80 brancos
20 pretos

Como ser rápido?
?
?
?
?
?
?
?

Um mapa pode ser um
arquivo texto
Ele deve informar
as posições XY das
regiões que serão
analisadas.

Em relação aos extremos Exemplo JSON:

Output JSON:
false
false
false
false
true
true

Algoritmo
○ Carregar imagem
○ Carregar mapa JSON
○ Avaliar cada target o % de pixels (Pretos vs. Brancos)
○ SE maior que a tolerância:
■ Considerar TRUE
○ SENÃO
■ Considerar FALSO
○ Gerar output

Mole! Só
implementar!
Problemas comuns e falhas

Digitalização torta
Ajustar a bandeja
do scanner
Corrigir com uma
fórmula matemática

Descobrir o ângulo
de inclinação da
reta x em relação a
tangente y de uma
digitalização
correta
45º

45º - 35º = 10º
Valor positivo, a
imagem será
rotacionada no
sentido anti-horário
35º

Impressão em escala reduzida
Impressoras e
configurações
diferentes
Corrigir com uma
fórmula matemática

Descobrir a
distância entre os
dois pontos de uma
digitalização
correta
2.000 pixels

2.000px - 1.300px = 700px
Ampliar a imagem em 35%
1.300 pixels

Digitalização ao contrário
Nenhuma fórmula
matemática encontrada
Favor digitalizar
novamente

Atualização do algoritmo (antes)
○ Carregar imagem
■ Considerar TRUE
○ SENÃO
○ Gerar output

Atualização do algoritmo (depois)
○ Carregar imagem
○ Calcular distância entre os pontos.
○ Calcular ângulo de inclinação.
○ Encontrar a posição dos pixels extremos.
○ Calcular ângulo de inclinação.
○ Rotacionar a imagem de acordo com a diferença entre os ângulos.
○ Encontrar novamente a posição dos pixels extremos.
○ Calcular distância entre os pontos.
○ Ajustar tamanho da imagem de acordo com o percentual encontrado.
■ Considerar TRUE
○ SENÃO
○ Gerar output

Antes
● Tempo de digitação
● Erro de tabulação
● Tempo para conferir
● Dinheiro
● Demora na publicação
do resultado
● Baixa performance
(300/mês)

Depois
● Economia
(Tempo/Dinheiro)
● Resultado imediato
● Aumento da performance
(1.837/mês) 6x mais

Inspiração de
biblioteca PHP
github.com/jansenfelipe/omr

ImageMagick
src/Commands/ScanCommand.php

Obrigado!
github.com/jansenfelipe
jansen.felipe@gmail.com
@jansenfelipe

OMR com PHP

Recomendados

Recomendados

Mais conteúdo relacionado

Semelhante a OMR com PHP

Semelhante a OMR com PHP (20)

OMR com PHP