1) O documento apresenta um Objeto de Aprendizagem chamado IMAGINE para facilitar o ensino de Processamento Digital de Imagens.
2) O IMAGINE utiliza tecnologias como Flash e MATLAB para permitir que os usuários apliquem filtros e transformações em imagens de forma interativa.
3) O documento descreve as principais etapas do processamento de imagens como aquisição, segmentação, representação e reconhecimento.
OBJETOS DE APRENDIZAGEM NO ENSINO DE PROCESSAMENTO DIGITAL DE IMAGENS
1. OBJETOS DE APRENDIZAGEM NO ENSINO DE PROCESSAMENTO DIGITAL DE
IMAGENS
Pedro Henrique Cacique Braga, Alexandre Cardoso
Universidade Federal de Uberlândia, Faculdade de Engenharia Elétrica,
Uberlândia – MG, phcacique@gmail.com, alexandre@ufu.br
Resumo - O objetivo deste documento é apresentar o de resignificar as formas de aprender e ensinar dentro e fora
Objeto de Aprendizagem IMAGINE, que tem como da escola.
objetivo facilitar o ensino de Processamento Digital de A aprendizagem é um processo tão antigo quanto a
Imagens em cursos presenciais e a distância, bem como própria existência humana e se desenvolve constantemente
apresentar a tecnologia utilizada na construção do mediante as contribuições de pesquisadores e educadores.
mesmo e os parâmetros padronizados pelo IEEE Nesse contexto, destaca-se a busca de metodologias de
Learning Technology Standards Comitee ensino mais adequadas ao contexto social e aos avanços que
a sociedade da informação e do conhecimento apresentam.
Palavras-Chave – Objetos de Aprendizagem, Diante desse cenário é possível dizer que Educação e
Processamento Digital de Imagens, IEEE Learning Tecnologia se conectam, interagem no processo educacional
Technology Standards Comitee, Flash, Actionscript evidenciando a necessidade de desenvolvimento de
ferramentas compatíveis as novas exigências.
LEARNING OBJECTS FOR DIGITAL Diante desse quadro destacam-se os Objetos de
IMAGE PROCESSING STUDIES Aprendizagem. Chamamos de Objetos de Aprendizagem
(OA), a junção tecnologia/educação, ou seja, "qualquer
Abstract - The purpose of this paper is to present the entidade, digital ou não digital, que possa ser utilizada,
learning object IMAGINE, which objective is to make the reutilizada ou referenciada durante o aprendizado suportado
teaching technique of Digital Image Processing easier in por tecnologias" [1].
distance and attendance courses, as well as presenting Os Objetos de Aprendizagem são ferramentas criadas para
the technology used for its development and standard atender públicos e conteúdos específicos, por isso, atendem
IEEE Learning Technology Standards Committee as propostas da alfabetização ao ensino superior.
parameters. O Ministério da Educação [2] disponibiliza um Banco
1 Internacional de Objetos Educacionais e incentiva a criação
Keywords - learning objects, digital image processing, de novos projetos. Segundo esta mesma fonte, a distribuição
IEEE Learning Technology Standards Committee, Flash, dos OA não é uniforme, tendendo ao crescimento
Actionscript. principalmente nas áreas de Ensino Superior (na nova
modalidade, EAD) e nos Ensinos Fundamental e Médio, em
NOMENCLATURA detrimento das demais áreas, como a educação profissional e
o Ensino Superior Regular, por exemplo.
AS ActionScript A Fig. 1 reflete o crescimento do uso da tecnologia como
EAD Ensino a Distância instrumento educacional. Percebemos que o uso de OA no
MATLAB Matrix Laboratory ensino superior regular ainda está aquém da sua real
OA Objetos de Aprendizagem capacidade.
RA Realidade Aumentada
PDI Processamento Digital de Imagens
POO Programação Orientada a Objetos
I. INTRODUÇÃO
As novas tecnologias da informação e do conhecimento
emergem com visibilidade no cenário educacional. Diversas
pesquisas e ferramentas são desenvolvidas com o propósito
Fig. 1. Distribuição dos Objetos de Aprendizagem cadastrados no
Banco Internacional de Objetos de Ensino, do MEC, de acordo com
o nível de ensino.
2. O processo cognitivo do ser humano pode beneficiar-se são dependentes da base de conhecimento gerada em cada
com a associação de todos os seus sentidos na construção de uma delas, conforme mostra a Fig. 2.
um conceito. E os OA proporcionam de certa forma maiores A base de conhecimentos é incrementada a cada etapa do
possibilidades interativas e desafiadoras para aqueles que os processo, por isso pode ser considerada uma base dinâmica
utilizam. [4].
Na grande área das Engenharias, percebe-se muitos
conceitos e teorias que seriam melhor apresentados se
utilizadas as ferramentas dos OA promovendo uma domínio do problema
aprendizagem mais interativa, estimulando os sentidos e as
formas de pensar dos alunos. O Processamento Digital de Aquisição
Imagens também se encontra entre as áreas e/ou conteúdos
que podem ser dinamizados [3].
Este artigo apresenta o projeto IMAGINE, que se refere a Pré-Processamento
um Objeto de Aprendizado baseado na interação entre
software e usuário de maneira a possibilitar o Base
Segmentação
desenvolvimento de conceitos. de
Para apresentar o projeto serão abordados nos próximos Conhecimento
tópicos deste documento as etapas do processamento de Representação e Descrição
imagens e como elas são aplicadas na construção e utilização
do IMAGINE, tendo em vista as normas e padrões do IEEE.
Reconhecimento e
Interpretação
II. PROCESSAMENTOS DE IMAGEM
Os sistemas de processamento de imagens são resultado
constituídos de um conjunto de etapas que levam um
elemento do domínio do problema a um resultado plausível.
Um processo para tratamento de uma imagem deve seguir Fig. 2. Etapas de um sistema de processamento de imagens.
alguns passos para a geração de um resultado. São eles:
É importante observar que um sistema de PDI contém
todas estas etapas, mesmo que elas façam uso de tecnologias
1. Aquisição
diferentes e sejam realizadas por softwares e/ou hardwares
Trata-se da captura da imagem por um sensor ou
diferentes em cada etapa.
dispositivo e a conversão da mesma em um modelo capaz de
ser representado digitalmente.
A. Modelo de imagem
2. Pré-processamento
A aquisição de uma imagem geralmente traz consigo Uma imagem, durante seu processamento, é vista como
imperfeições, originadas por diversos fatores, como a um arquivo que contém informações sobre os valores de
iluminação do ambiente ou outras características do cores de cada pixel da imagem. O pixel é a menor unidade de
dispositivo de captura. A melhora da imagem através de medida de uma imagem. Resolução é a densidade de pixels
suavização, correção de brilho e contraste e atenuação do da imagem, isto é, a quantidade de pixels de uma imagem
ruído é realizada nesta etapa do processamento. por sua dimensão. Tais valores estão dispostos em matrizes
que contém geralmente os valores RGBA (red, Green, blue,
3. Segmentação alpha), que são os valores de tons vermelhos, verdes, azuis e
Esta é a etapa na qual são extraídas as porções da transparência. A combinação destes valores nos dá a
imagem que têm relativo interesse no tratamento. A intensidade luminosa de determinado pixel.
segmentação pode ser feita por diferentes métodos e pode A análise e transformação pictórica são feitas mediante
selecionar regiões, bordas e/ou preenchimentos da imagem. análise e transformação de pixels de maneira individual e/ou
coletiva. Muitos métodos se dão a partir da análise da
4. Representação e Descrição conectividade entre pixels. Nos filtros de convolução e de
O armazenamento e a manipulação de dados pictóricos correlação, por exemplo são analisados os 8 pixels ao redor
são realizados na representação e a descrição é responsável do pixel original.
pela extração de propriedades e características do objeto.
B. Métodos matemáticos
5. Reconhecimento e Interpretação
Reconhecimento é o ato de atribuir um identificador a As transformações pictóricas podem ser realizadas de
determinada informação e Interpretação consiste em atribuir diferentes maneiras. Existem métodos de transformação da
significado ao conjunto de dados reconhecidos. imagem bastante diferentes, entretanto, é possível destacar os
métodos de filtragem no domínio espacial e os métodos no
Observa-se que estas etapas formam um roteiro para o domínio da freqüência.
processo de tratamento pictórico, estão interligados entre si e
3. Os métodos de filtragem no domínio espacial se referem bibliotecas virtuais existentes. A tecnologia Flash foi
ao plano da imagem, ou seja, ao conjunto de pixels que escolhida para que esta seja difundida ainda mais no meio
compõem uma imagem. acadêmico, mostrando que é possível usar a animação
Neste domínio, o processo de filtragem é realizado a partir bidimensional, bastante explorada no entretenimento, para a
de máscaras, que são matrizes quadradas com valores formação de profissionais com eficiência e eficácia.
específicos em cada elemento, que servem como peso para o O Processamento Digital de Imagens vem sendo ensinado
valor de cada pixel vizinho ao central. A Fig. 3 mostra como de maneira teórica, através de material impresso e muitas
uma imagem é vista no domínio espacial, bem como uma vezes desatualizado. Acredita-se que o contato com a prática
máscara é analisada. é um dos métodos mais eficientes neste processo educativo
[3]. A criação de OA para tais fins faz com que as práticas
x
educativas avancem um passo mais rumo ao equilíbrio com a
M tecnologia atual.
y
x x x IV. APRESENTAÇÃO DO IMAGINE
n W(i,j)
N x . x A. Linguagens De Programação
x x x
As diferentes linguagens de programação existentes nos
m imagem
fornecem meios diferentes para chegar ao mesmo fim, sendo
este o processo de transformação pictórica e aqueles os
Fig. 3. Filtragem no domínio espacial diferentes algoritmos utilizados.
Dentre as diferentes linguagens, adotaram-se como
A correlação da imagem f com um filtro w pode ser principais o Actionscript, em suas versões 2.0 e 3.0,
expressa através da equação 1. utilizadas em momentos distintos e agrupadas em um
documento principal elaborado na versão 2.0 e a linguagem
de programação MATLAB. O Actionscript (AS) é a
(1) linguagem de programação orientada a objetos do software
Adobe Flash, que hoje encontra-se na versão CS4. O Flash é
Onde: uma das mais poderosas ferramentas de edição de animações
bidimensionais, mas não se restringe a este campo de
f(x,y) - Imagem atuação, podendo ser utilizado para diferentes fins que
w(x,y) - Matriz quadrada – máscara envolvam POO.
m - Número de colunas da imagem Simultaneamente ao software principal geraram-se
n - Número de linhas da imagem algoritmos em MATLAB, software produzido pela
Mathworks, voltado principalmente para o cálculo numérico,
A convolução por sua vez, pode ser expressa através da que apresenta métodos de visualização de gráficos e criação
equação 2. de aplicações gráficas.
(2)
B. Design E Funcionalidade
Onde: Explorando ao máximo as funcionalidades de animação
por interpolações de movimento e de forma e quadro a
f(x,y) - Imagem quadro disponíveis no Flash, desenvolveu-se um layout
w(x,y) - Matriz quadrada – máscara prático e dinâmico. O menu superior contempla todas as
m - Número de colunas da imagem ferramentas disponíveis ao usuário, contempladas
n - Número de linhas da imagem separadamente em cada menu suspenso.
O menu Arquivo apresenta as ferramentas de abertura de
Para a aplicação de filtros como este, são necessárias m*n uma imagem, captura através de câmera, bem como os
iterações aplicando as máscaras determinadas nas recursos de manipulação do software.
conectividades estabelecidas. O menu Filtros apresenta atalhos para os filtros pré-
A base das técnicas de filtragem no domínio da freqüência definidos de cores, brilho, contraste e algumas máscaras pré-
é o teorema da convolução. [5] determinadas.
No menu Transformadas estão localizadas as
transformadas de primeira e segunda derivada como a de
III. MOTIVAÇÃO
Fourier e a de Haar, por exemplo.
Para superar as deficiências do modelo formal de ensino é Existem ainda os menus Ajuda e Contato que apresentam
necessário sair do lugar comum em que se encontram os tópicos de ajuda sobre cada tela e sobre a teoria apresentada
atuais programas de ensino universitário e atualizar as e formulários de contato com os autores respectivamente.
4. A Fig. 4 é uma impressão da tela do software quando etapas de Aquisição, Representação e Descrição,
carregada uma imagem de exemplo. A barra lateral direita Reconhecimento e Interpretação.
apresenta uma série de operadores que permitem ao usuário a Utilizando-se das clases BitimapClass[9], Papervision[11]
criação de novos filtros e transformadas. e Flartoolkit[8], criou-se uma aplicação na área de realidade
aumentada. Esta aplicação utiliza como dispositivo de
captura uma webcam. Criou-se, também, um marcador
impresso, como o apresentado na Fig. 6, com o qual o
usuário é capaz de interagir com o software.
Fig. 5. Exemplo de marcador para aplicação de reconhecimento e
interpretação em Realidade Aumentada
A aplicação de RA é bastante simples e utiliza a câmera
do usuário para reconhecer o marcador impresso e mostrar
Fig. 4. Software Imagine, com imagem carregada e função sobre ele um modelo tridimensional do personagem Yoshi,
Chroma- Key adicionada. criado por Shigefumi Hino, designer gráfico da Nintendo.
O usuário pode movimentar o marcador, realizando
Existem ainda, na barra inferior, atalhos para as principais movimentos de translação e rotação do mesmo para que
funções realizadas. A saber: carregamento de uma nova visualize por completo o modelo apresentado.
imagem, geração de códigos em MATLAB e apresentação Quando o dispositivo captura a imagem é iniciado um
dos histogramas da imagem. processo de reconhecimento de padrões, baseado na
É importante ressaltar que o histograma estará acessível conectividade entre pixels. É feita uma detecção de padrões
ao usuário sempre e quando haja uma imagem carregada. através da segmentação de regiões. Quando reconhecidos os
Este gráfico é alterado de acordo com cada filtro aplicado. padrões, através da classe Flartoolkit, rótulos são criados em
Os códigos em MATLAB são gerados ao pressionar o cada região da imagem. Estes rótulos são comparados com os
botão abaixo com o logotipo do software. Uma janela de existentes na base de conhecimentos do software. Quando
exemplificação dos filtros e transformadas é aberta, como ambas informações são equivalentes, a classe Papervision é
exemplificado na Fig. 5, e o usuário pode verificar a acionada e o modelo tridimensional é apresentado no monitor
consistência da informação fornecida. junto ao usuário.[6]
Todas as classes utilizadas neste material são de domínio
público ou licenciadas por seus criadores, reservando os
direitos de alteração, com livre utilização, desde que os
mesmos sejam referenciados nos códigos-fonte.
V. LICENÇAS DE USO DO SOFTWARE
Por se tratar de um software educacional, o Imagine deve
ser licenciado junto a um órgão oficial. Dentre as diferentes
licenças existentes, o selo Creative Commons se adéqua aos
princípios deste projeto por se tratar de uma licença
reconhecida mundialmente. [7]
Foram escolhidos os seguintes critérios de licenciamento
para esta obra:
Fig. 5. Janela MATLAB com aplicação da binarização de uma
imagem inicial.
1. Permitido o uso comercial
2. Alterações de código apenas com autorização dos
Além do tratamento de imagens fixas, o software Imagine autores
proporciona experiências de aplicação em PDI, sobretudo nas
5. O selo da licença deve estar presente nos sites [9] Adobe Help. Bitmap. Acedido em 13 de Janeiro de
relacionados ao projeto, no software desenvolvido e nos 2010, em:
guias do usuário e do programador impressos e/ou virtuais. http://www.adobe.com/livedocs/flash/9.0/ActionScriptL
angRefV3/flash/display/Bitmap.html
[10] Papervision. Papervision3d. Acedido em 10 de janeiro
VI. CONCLUSÕES de 2010, em: http://blog.papervision3d.org/
A partir do desenvolvimento do OA Imagine e das
investigações sobre o uso destas ferramentas no ensino
superior constatou-se a sua validade e eficiência. O resultado
final deste projeto foi apresentado a professores que
ministram a disciplina de PDI na Faculdade de Engenharia
Elétrica de Uberlândia e a professores ligados à Faculdade de
Educação da mesma instituição. Foram feitos estudos
juntamente a estes professores selecionados, que verificaram
a eficiência do método adotado junto aos padrões de ensino
adotados pela instituição.
Para o Processamento Digital de Imagens é possível criar
ambientes interativos que favorecem a aprendizagem,
explorando os distintos métodos e linguagens de
programação, bem como a interação entre elas para a melhor
compreensão do estudante da disciplina.
As ferramentas de animação, já existentes no mercado,
também são eficazes para sistemas de PDI, capazes de criar a
interação entre software e usuário de maneira atrativa e
funcional.
VII. AGRADECIMENTOS
Os autores agradecem ao professor Mestre em Engenharia
de Computação Francisco Eduardo Martínez Pérez, da
Universidad Autónoma de San Luis Potosí - México, pela
colaboração neste trabalho.
VIII. REFERÊNCIAS BIBLIOGRÁFICAS
[1] Learning Technology Standards Commitee. WG12:
Learning Object Metadata. Acedido em 13 de Fevereiro
de 2010, em: http://ltsc.ieee.org.
[2] Banco Internacional de Objetos Educacionais (2010).
Estatísticas. Acedido em 21 de Abril de 2010, em:
http://objetoseducacionais2.mec.gov.br.
[3] R. V. Belhot, J. D. O. Neto. A solução de Problemas no
ensino de engenharia. XIII Simpósio de Engenharia de
Produção, 2006. Bauru
[4] R.C. González, R.E.Woods, “Digital Image
Processing”, Edgard Blucher, 3ª Edição, 2000.
[5] H. Pedrini, W.R. Schwartz, “Análise De Imagens
Digitais - Princípios, Algoritmos E Aplicações”,
Pioneira Thomson, 1ª Edição, 2008.
[6] Adobe Developer Connection. ActionScript Technology
Center. Acedido em 09 de Março de 2010, em
http://www.adobe.com.
[7] Creative Commons. License your work. Acedido em 22
de Abril de 2010, em:
http://www.creativecommons.org.br/.
[8] Saqoosha. Flartoolkit. Acedido em 19 de Fevereiro de
2010,em: http://saqoosha.net/en/