Este documento descreve o desenvolvimento de um classificador baseado em inteligência artificial para determinar a susceptibilidade de folhas de café ao fungo H. O método processa digitalmente imagens de folhas para obter histograma de cores usando lógica fuzzy. Uma rede neural é treinada com esses dados para classificar amostras. Os resultados mostram acerto médio de 83,3%, o que não é satisfatório para definir regiões afetadas pelo fungo. Melhorias no processamento de imagem e aumento da base de dados são necessários.
Money Market and its objectives, importance its Instruments,
Classificador de padrões de folhas de café baseado em IA
1. Desenvolvimento de um classificador de padrões para
determinar susceptibilidade ao fungo H em folhas de
café baseado em inteligência artificial
OCHOA, J. P. BONATO, L.
UFSJ – Universidade Federal de São João del Rei - Departamento de Engenharia Elétrica – DEPEL
PPGEL – Programa de Pós-Graduação em Engenharia Elétrica - São João del Rei/MG, Brasil
juanochoaaviles@gmail.com, leobonato@ufv.edu.br
Resumo – A pesquisa desenvolvida neste estudo detalha uma
ferramenta computacional para obter uma classificação das
plantas do café, considerando a resistência ou susceptibilidade da
mesma ao fungo H (HEMILEIA VASTATRIX), que produz uma
doença foliar, causando, inicialmente, manchas translúcidas
cloróticas na face inferior do limbo, com 1 a 3 mm de diâmetro.
Em pouco tempo, alcançam 1 a 2 cm de diâmetro, e desenvolve
massas pulverulentas de coloração amarelo-laranja, envolvidas
por uma auréola mais ou menos descolorida. Com o tempo, o
centro da lesão fica necrótico, tornando-se visível na face superior
da folha. A doença avança por grande extensão do limbo foliar. O
fungo pode atacar a extremidade dos ramos em desenvolvimento
e frutos verdes. Através das ferramentas de inteligência
computacional, desenvolveu-se uma rede neural que analisa
imagens de folhas de café e a partir de um processamento digital
da imagem, obtém-se uma classificação baseada na escala de
Tamayo [1], para o cafeeiro.
Palavras-Chave –Fungo H, rede neural, inoculação, classificação
de padrões, processamento digital de imagens.
I. INTRODUÇÃO
O café ocupa o segundo lugar na lista de produtos naturais
mais importantes no mercado internacional, logo depois do
petróleo, e representa uma importante fonte de receitas para a
economia dos países produtores. O cultivo, processamento,
transporte e comercialização do café são responsáveis por
milhões de postos de trabalho em todo o mundo. Desta forma,
a produção de café ajuda ao crescimento da economia de países
em desenvolvimento e pode servir para lançar a economia de
outras regiões.
No séc. XX, verificou-se um aumento da produção e consumo
do café, destacando-se como principal área de produção a
América do Sul, em grande parte devido ao Brasil e à
Colômbia, que são os principais produtores mundiais de café.
Uma das doenças mais importantes que afeta a principal
espécie de cafeeiro cultivado (Coffea arábica L.) é a ferrugem
alaranjada, provocada pelo fungo Hemileia vastatrix Berkeley
& Broome. Na ausência de medidas de controle da doença, a
ferrugem alaranjada pode ser responsável por grandes perdas
de produção, podendo afetar plantações inteiras, limitando o
crescimento e desenvolvimento dos cafeeiros. As quebras na
produção de café podem atingir valores entre os 10-40% e os
prejuízos na economia global são estimados entre 1 a 2 bilhões
de dólares anualmente [2].
Com as premissas expostas, é muito importante
implementar uma ferramenta baseada em inteligência
computacional capaz de analisar imagens de folhas de café e
determinar a susceptibilidade das mesmas à ação erosiva do
fungo Hemileia vastatrix.
II. DESCRIÇÃO DOS PROCESOS ENVOLVIDOS
Processamento digital da Imagem: As imagens digitais
das folhas de café contém 16 discos de 1,5 cm de diâmetro cada
uma, dispostos em uma tela de nylon branca, tendo
aproximadamente uma resolução de 1200 x 1080 pixels, figura
(1), requerendo um elevado custo computacional para obter os
dados necessários para a identificação do padrão.
Fig.1 Formato da Imagem Coletada 1200 x 1080 pixels
2. O primeiro passo é atenuar a resolução da imagem,
sendo reduzido em até 11.000 pixels (100 x 110). É sabido que
o formato padrão das imagens digitalizadas é RGB, sendo
representado por uma matriz tridimensional (100x110x3),
formada pelas componentes vermelha, verde e azul,
respectivamente.
Optou-se pela transformação da base da cor para o
formato CIE L*a*b [3], já que nesta base a cor é somente
representada pelos valores contido nas variáveis “a” e “b”,
sendo que a variável “L” determina a luminosidade de cada
pixel. Figura (2)
Fig.2 Imagem na Base CIE L*a*b 100 x 110 pixels
Após a estandardização das imagens para o formato CIE
L*a*b, é preciso a supressão do fundo das mesmas, etapa
muito importante, pois assim consegue-se discriminar muita
informação irrelevante, pois o background é igual para todas
as imagens.
O objetivo da eliminação do background foi conseguido
através da segmentação da cor usando agrupamento pelo
algoritmo K-means [4]. O objetivo do algoritmo é classificar
um conjunto de dados em um certo número de agrupamentos
(K), definido, a priori, através da análise de suas similaridades.
O algoritmo utiliza um método estatístico não-supervisionado
para a classificação, que trabalha geralmente com dados
gerados de distribuições Gaussianas.
Existem diversas áreas que utilizam o classificador K-
Means, como por exemplo, aplicações de aprendizagem não-
supervisionada, reconhecimento de padrões, análises
classificatórias, inteligência artificial, processamento de
imagens, visão computacional, entre outras. [5].
A representação obtida da etapa de processamento digital
da imagem é apresentada na figura 3. É simples observar que
contém só a informação necessária para a identificação da
variável analisada, que são, exclusivamente, as folhas de café.
Fig.3 Imagem sem background 100 x 110 pixels
Obtenção do histograma da imagem: Este ponto do trabalho
é a parte que envolve a inteligência computacional
propriamente. A maneira mais simples de determinar a
característica da imagem é obtendo seu histograma da cor,
onde é possível quantificar a presença de cada uma das cores
pré-estabelecidas, sabendo que, para o caso específico, tem
importância as cores amarela, verde e marrom.
O histograma das imagens foi obtido através de lógica fuzzy,
sendo desenvolvido na tolbox do MATLAB®. Para o
propósito, foram declaradas três variáveis de entrada: LabL,
Laba, Labb, para cada uma das magnitudes do CIE L*a*b,
respectivamente. As funções de pertinência para cada uma das
variáveis de entrada se detalha na figura 4.
Fig.4a Funções de pertinência para a variável L
Fig.4b Funções de pertinência para a variável a
Fig.4c Funções de pertinência para a variável c
3. De modo similar, foram estabelecidas as funções de
pertinência para a saída que foi nomeada histograma,
considerando uma gama de 10 cores, como se observa na
figura 5.
Fig.5 Funções de pertinência para a saída
A função de inferência utilizada foi MAMANDI, e o método
de defuzzificação que obteve um melhor desempenho foi o do
centroide.
Finalmente a etapa Fuzzy entregou uma matriz bidimensional
que contém o histograma de cada imagem, graficamente
observado na figura 6.
Fig.6 Histograma da cor da imagem da figura 3
O eixo horizontal representa as cores, sendo as
estabelecidas nas funções de pertinência da saída.
O modelo FUZZY desenvolvido tem 70 regras declaradas para
cada uma das combinações possíveis nas entradas, e que foram
definidas pelos operadores lógicos and e not.
Rede Neural multicamada para o reconhecimento de
padrões: Com os dados do histograma das imagens e suas
respectivas saídas, foi treinada uma rede neural utilizando a
tolbox de MATLAB ®. A configuração da rede multicamada
para o reconhecimento de padrões é observada na figura 7,
sendo que possui uma camada escondida com 10 neurônios e
uma saída que determina a susceptibilidade ou a resistência ao
fungo Hemileia vastatrix.
Fig.7 Estrutura da Rede Neural
Sabendo-se que 60% das amostras foram para a etapa de treino,
20% para a etapa de teste e o restante para a etapa de avaliação,
a resposta da rede, após o melhor desempenho conseguido, é
armazenada em uma função nomeada net_cafe.mat.
III. RESULTADOS
Uma interface gráfica para a avaliação dos resultados foi
implementada no GUIDE de MATLAB ®, figura 8. O usuário
tem que selecionar a imagem e esperar que o programa defina
se a amostra é ou não susceptível ao fungo.
Fig.7 Estrutura da Rede Neural
A partir do desempenho da rede neural, formam obtidos os
gráficos da confusão e performance, apresentados nas figuras
8a e 8b, respectivamente.
Além disso, foram selecionadas 6 imagens aleatórias que não
foram consideradas para o treino, conseguindo, assim, uma
estimativa do rendimento da rede.
O resultado obtido para as imagens aleatoriamente
selecionadas foi 100% satisfatório, conseguindo um alto
desempenho da rede, sabendo-se que existe uma faixa de
confusão que gera respostas erradas na saída, principalmente
entre as imagens com nota 3 e nota 4.
preto cinza vermelho marrom amarelo verde azul ciano
0
1000
2000
3000
4000
5000
6000
7000
8000
4. Fig.8a Indicadores de confusão da rede
Fig.8b Indicadores de desempenho da rede
0 1
0
1
30
48.4%
0
0.0%
100%
0.0%
0
0.0%
32
51.6%
100%
0.0%
100%
0.0%
100%
0.0%
100%
0.0%
Target Class
OutputClass
Training Confusion Matrix
0 1
0
1
8
40.0%
1
5.0%
88.9%
11.1%
3
15.0%
8
40.0%
72.7%
27.3%
72.7%
27.3%
88.9%
11.1%
80.0%
20.0%
Target Class
OutputClass
Validation Confusion Matrix
0 1
0
1
3
15.0%
9
45.0%
25.0%
75.0%
4
20.0%
4
20.0%
50.0%
50.0%
42.9%
57.1%
30.8%
69.2%
35.0%
65.0%
Target Class
OutputClass
Test Confusion Matrix
0 1
0
1
41
40.2%
10
9.8%
80.4%
19.6%
7
6.9%
44
43.1%
86.3%
13.7%
85.4%
14.6%
81.5%
18.5%
83.3%
16.7%
Target Class
OutputClass
All Confusion Matrix
0 2 4 6 8 10 12 14 16 18 20 22
10
-3
10
-2
10
-1
10
0
Best Validation Performance is 0.19617 at epoch 16
MeanSquaredError(mse)
22 Epochs
Train
Validation
Test
Best
5. IV. CONCLUSÃO
O objetivo principal do método proposto é
segmentar regiões com diferentes cores e
identificar padrões nas folhas de café. Porém,
apresenta uma média de acertos de 83.3%, o que
não é considerado satisfatório para definir com
exatidão regiões que apresentam alterações pelo
fungo H. As limitações do método encontram-se
no processo de aquisição das imagens e no
processamento digital, pois perde-se a qualidade
da imagem, o que complica o trabalho atingido
pela etapa de Inteligência Computacional.
Foi criado um método de segmentação não-
parametrizado que considera apenas informações
de cores dos pixels. O método utiliza o algoritmo
de classificação K-Means, que utiliza em seu
espaço de características os valores dos pixels das
imagens, que são convertidas nos componentes do
modelo da cor CIE LAB. Apenas o uso destes
valores como características foi insuficiente para
classificar as regiões das imagens, pois apresentou
resultados com descontinuidades de pixels. As
descontinuidades foram notadas principalmente
em regiões com diferentes cores em pontos
próximos. Estas descontinuidades são justificadas
pela ausência de informações no espaço de
características referentes às posições espaciais e
relacionamentos de vizinhança dos pixels. Porém,
são justificadas principalmente pelo fato de
agrupar valores de frequências muito próximas,
fazendo com que regiões com pigmentos
diferentes tenham a mesma representação no
histograma de cores.
O método proposto apresenta resultados que não
são suficientes para serem utilizados na prática.
Porém, como o método proposto não requer
parâmetros, os resultados obtidos indicam que o
caminho seguido é promissor, possibilitando a
continuidade das pesquisas para aperfeiçoamento
do mesmo.
V. AGRADECIMENTOS
O autor agradece à CAPES (Coordenação de
Aperfeiçoamento de Pessoal de Nível Superior) e à UFSJ
pelo auxílio financeiro concedido na forma de bolsas de
mestrado ao PPGEL.
VI. REFERÊNCIAS
[1] Alexandre Sandri CAPUCHO. Método de
inoculação de Hemileia vastarix Berk. Et. Br. Em
folhas destacadas de cafeeiro. Universidade
Federal de Viçosa/MG.
[2] Braz Opinião ANA ISABEL. Caracterização
cariológica do fungo Hemileia Vastatrix
responsável pela ferrugem alaranjada do cafeeiro.
Universidade de Nova Lisboa. Lisboa/Pt.2012.
[3] http://www.gusgsm.com/espacio_color_cie_lab
[4] http://www.mathworks.com/help/images/example
s/color-based-segmentation-using-k-means-
clustering.html
[5] KRISTIAN CAPELINE. Análise de tintas de
canetas utilizando segmentação por cor. Pontifícia
Universidade Católica do Paraná. Curitiba 2005.
[6] Patrick Marchand. Graphics and GUIs with
MATLAB. 1999 USA.
[7] Rafael C. Gonzalez. Richard E. Woods. Digital
Image Processing. 2008 Pearson Education Inc.
USA