4734 16435-1-pb

51
Semina: Ciências Exatas e Tecnológicas, Londrina, v. 30, n. 1, p. 51-62, jan./jun. 2009
Uma implementação do algoritmo Levenberg-Marquardt dividido
para aplicações em visão computacional
An implementation of the partitioned Levenberg-Marquardt
algorithm for applications in computer vision
José Alexandre de França1
; Maria Bernadete de Morais França2
;
Marcela Hitomi Koyama3
; Tiago Polizer da Silva4
Resumo
Em diversas aplicações da visão computacional, é necessário estimar-se, em um modelo, os parâmetros
quemelhorseajustamaumconjuntodedadosexperimentais.Nessescasos,umalgoritmodeminimização
pode ser utilizado. Dentre estes, um dos mais conhecidos é o Levenberg-Marquardt. Apesar de diversas
implementações de tal algoritmo estarem disponíveis livremente, nenhuma delas leva em consideração
quando a solução do problema conduz a uma matriz jacobiana esparsa. Nesses casos, é possível reduzir
significativamente a complexidade do algoritmo. Neste trabalho, apresenta-se uma implementação
do algoritmo Levenberg-Marquardt para os casos em que a matriz jacobiana do problema é esparsa.
Além disso, para ilustrar a aplicação do algoritmo, ele é aplicado a solução do problema de calibração
monocular com gabaritos de uma única dimensão. Resultados empíricos mostram que o método converge
satisfatoriamente em apenas algumas poucas iterações, mesmo na presença de ruído.
Palavras-chave: Algoritmo Levenberg-Marquardt. Calibração Monocular. Algoritmo de Newton.
Abstract
At several applications of computer vision is necessary to estimate parameters for a specific model
which best fits an experimental data set. For these cases, a minimization algorithm might be used and
one of the most popular is the Levenberg-Marquardt algorithm. Although several free applies from this
algorithm are available, any of them has great features when the resolution of problem has a sparse
Jacobian matrix . In this case, it is possible to have a great reduce in the algorithm’s complexity. This
work presents a Levenberg-Marquardt algorithm implemented in cases which has a sparse Jacobian
matrix. To illustrate this algorithm application, the camera calibration with 1D pattern is applied to
solve the problem. Empirical results show that this method is able to figure out satisfactorily with few
iterations, even with noise presence.
Key words: Levenberg-Marquardt algorithm. Monocular Calibration. Newton-type algorithm.
1
Departamento de Engenharia Elétrica, Universidade Estadual de Londrina; E-mail: josealexandre@eeol.org
2
Departamento de Engenharia Elétrica, Universidade Estadual de Londrina; E-mail: bernadete@eeol.org
3
Departamento de Engenharia Elétrica, Universidade Estadual de Londrina; E-mail: markoyama@yahoo.com.br
4
Departamento de Engenharia Elétrica, Universidade Estadual de Londrina; E-mail: tiagopolizer@gmail.com.

52
França, J. A. de et al.
Introdução
Em diversas aplicações da visão computacional,
comoocálculodamatrizfundamental(ARMANGUE´;
SALVI, 2003), a calibração de câmeras (SALVI;
ARMANGUE´; BATLLE, 2002; ZHANG, 2000),
a retificação de imagens (LOOP; ZHANG, 1999)
e a estimação da transformação entre pontos
(HORAUD; CSURKA; DEMIRDIJIAN, 2000), é
necessário estimar os parâmetros de um determinado
modelo que melhor se ajustam a um conjunto de
dados experimentais. Normalmente, para uma
melhor exatidão, um algoritmo de minimização
não-linear deve ser utilizado. A maioria dos
algoritmos utilizados são baseados no método de
Newton (PRESS et al., 1992). Entre eles, salienta-
se o método Levenberg-Marquardt (LEVENBERG,
1944; MARQUARDT, 1963), bastante utilizado na
visão computacional sempre que deseja-se ajustar
um modelo a um conjunto de dados experimentais.
Como exemplo, pode-se citar os trabalhos de
(KONEN; TOMBROCK; SCHOLZ, 2007), (SUN
et al., 2006) e (LERASLE; RIVES; DHOME,
1999). Este método é uma derivação do método de
Newton que é de convergência mais rápida.
Um dos motivos da popularidade do algoritmo
Levenberg-Marquardt é a existência de diversas
implementações disponíveis (LOURAKIS, 2004;
MORÉet al., 1984; PRESS et al., 1992; SHEARER;
WOLFE, 1985). Contudo, apenas uma dessas
(LOURAKIS;ARGYROS, 2004) toma vantagem de
uma estrutura, muito comum em problemas da visão
computacional, que faz com que a minimização não-
linear produza uma matriz Jacobiana esparsa. Se isso
for levado em consideração, para a estimação de N
parâmetros, a complexidade do algoritmo reduz-se
de N 3 para apenas N.
Neste trabalho, apresenta-se uma implementação
do Levenberg-Marquardt, chamada Levenberg-
Marquardt Dividido, que pode ser aplicada em
problemas que apresentam a matriz Jacobiana
esparsa. Nesse caso, o laço de iteração é dividido em
vários problemas menores que possuem apenas uma
fração da complexidade e são resolvidos muito mais
rapidamente. Essa implementação foi codificada em
linguagem do MATLAB®
e pode ser executado sem
modificações tanto no MATLAB®
quanto no Scilab®
e no Octave®
.
Para exemplificar o uso do algoritmo Levenberg-
Marquardt Dividido, aplicou-se a implementação
proposta ao problema de calibração de câmeras com
auxílio de um gabarito 1D (ZHANG, 2004). Nesse
caso, o método é utilizado para, dado um conjunto
de projeções do gabarito em diversas imagens,
estimar-se os parâmetros intrínsecos da câmera e
a localização da cada ponto do gabarito no espaço
tridimensional. Resultados experimentais mostram
que o método é capaz de realizar a estimação de
forma satisfatória e em poucas iterações, mesmo na
presença de ruído.
Notação
No decorrer do texto, matrizes e vetores são
representados por letras, números ou símbolos em
negrito. As constantes são expressas por letras,
números ou símbolos em itálico. Além disso,
adotou-se a prática notação A-T
= (A-1
)T
= (A-T
)1
para
toda matriz quadrada e inversível.
Considerando o modelo de câmera pinhole
(FAUGERAS; LUONG, 2001), as coordenadas
de um ponto 3D no sistema de coordenadas
do ambiente de uma câmera são apresentadas
como M = [x,y,z] T
e a projeção correspondente
no plano de imagem I, como m = [u,v]T
. Além
disso, as coordenadas homogêneas de um ponto
m = [u,v,...]T
são representadas por
DE FRANÇA, J.; FRANÇA, M.; KOYAMA, M. & DA SILVA, T.
SCHOLZ, 2007), (SUN et al., 2006) e (LERASLE; RI-
VES; DHOME, 1999). Este método é uma derivação do
método de Newton que é de convergência mais rápida.
Um dos motivos da popularidade do algo-
ritmo Levenberg-Marquardt é a existência de diversas
implementações dispon´ıveis (LOURAKIS, Jul. 2004;
MORé et al., 1984; PRESS et al., 1992; SHEARER;
WOLFE, 1985). Contudo, apenas uma dessas (LOU-
RAKIS; ARGYROS, 2004) toma vantagem de uma es-
trutura, muito comum em problemas da visão computa-
cional, que faz com que a minimização não-linear pro-
duza uma matriz Jacobiana esparsa. Se isso for levado
em consideração, para a estimação de N parâmetros, a
complexidade do algoritmo reduz-se de N3 para apenas
N.
Neste trabalho, apresenta-se uma implementação
problemas que apresentam a matriz Jacobiana esparsa.
Neste caso, o laço de iteração é dividido em vários
problemas menores que possuem apenas uma fração da
Considerando o modelo de
GERAS; LUONG, 2001), as coo
3D no sistema de coordenadas
câmera são apresentadas como
projeção correspondente no plan
m = [u, v]T . Além disso, as coo
de um ponto m = [u, v, ...]T são
isto é, �m = [u, v, ..., 1]T . De
ponto qualquer em coordenadas
sentado por �m = [u, v, ..., t]T .
indica a posição do ponto em um
Com a notação adotada, a r
3D, M, e sua projeção, m, em
dada por
�m � A
�
I3 03
com
A =


α 0 u
0 β
0 0
onde “�” indica que os dois lados
ferir por uma constante, α e β dã
, isto
é,
N.
problemas que apresentam a matriz Jacobiana esparsa.
Neste caso, o laço de iteração é dividido em vários
Considerando o modelo de câmera pinhole (FAU-
GERAS; LUONG, 2001), as coordenadas de um ponto
3D no sistema de coordenadas do ambiente de uma
câmera são apresentadas como M = [x, y, z]T e a
projeção correspondente no plano de imagem I, como
m = [u, v]T . Além disso, as coordenadas homogêneas
de um ponto m = [u, v, ...]T são representadas por �m,
isto é, �m = [u, v, ..., 1]T . De forma mais geral, um
ponto qualquer em coordenadas homogêneas é repre-
sentado por �m = [u, v, ..., t]T . Um ´ındice, se houver,
indica a posição do ponto em um conjunto de pontos.
Com a notação adotada, a relação entre um ponto
3D, M, e sua projeção, m, em uma câmera pinhole é
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
onde “�” indica que os dois lados da equação podem di-
=[u,v,..., 1]T
. De forma mais geral, um
ponto qualquer em coordenadas homogêneas é
representado por
N.
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0

 , (2)
= [u,v,...,t]T
. Um índice,
se houver, indica a posição do ponto em um
conjunto de pontos.
Com a notação adotada, a relação entre um ponto
3D, M, e sua projeção, m, em uma câmera pinhole
é dada por

53
Uma implementação do algoritmo Levenberg-Marquardt dividido para aplicações em visão computacional
ão computa-
o-linear pro-
o for levado
arâmetros, a
para apenas
plementação
Levenberg-
plicada em
ana esparsa.
o em vários
ma fração da
apidamente.
nguagem do
modificações
no Octave R�.
Levenberg-
entação pro-
âmeras com
04). Neste
conjunto de
s, estimar-se
calização da
onal. Resul-
o é capaz de
e em poucas
ores são re-
olos em ne-
números ou
-se a prática
toda matriz
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
ferir por uma constante, α e β dão a relação entre pixels
da imagem e distâncias no ambiente da câmera, respec-
tivamente, nas direções horizontal e vertical. Já o ponto
m0 = [u0, v0]T são as coordenadas do ponto central
da câmera. Sendo assim, há apenas quatro parâmetros
intr´ınsecos a serem estimados durante a calibração, ou
seja, α, β, u0 e v0.
3 Algoritmo Levenberg-Marquardt
Considerando a seguinte função não-linear
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
são vetores e M ≥ N.
Freqüentemente, é necessário estimar o vetor �Y que me-
lhor ajusta-se a um vetor �X medido. Esse problema
pode ser reformulado como, dado o vetor �X, encontrar
�Y que minimiza ��, sujeito a �X = F( �Y) + �.
Dada uma estimação inicial �Y, o método de New-
ton (PRESS et al., 1992) a refina assumindo que F( �Y+
∆) = F( �Y) + J∆, onde J é a matriz jacobiana, ou
seja, J = ∂X/∂Y, e ∆ é um que indica um “pequeno”
incremento de �Y. Dessa forma, minimizar �� equivale
a minimizar
�� − J∆�, (4)
cnológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
(1)
com
0
0
0
0
0 0 1
u
A v
α
β
 
 =  
  
, (2)
onde “
-
o
-
s
;
;
-
-
-
-
o
a
s
o
-
m
.
s
a
.
o
s
.
-
-
m
e
e
e
a
-
e
s
-
-
u
a
z
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
ondrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
” indica que os dois lados da equação
podem diferir por uma constante, α e β dão a relação
entre pixels da imagem e distâncias no ambiente da
câmera, respectivamente, nas direções horizontal
e vertical. Já o ponto
es dispon´ıveis (LOURAKIS, Jul. 2004;
1984; PRESS et al., 1992; SHEARER;
5). Contudo, apenas uma dessas (LOU-
YROS, 2004) toma vantagem de uma es-
comum em problemas da visão computa-
z com que a minimização não-linear pro-
triz Jacobiana esparsa. Se isso for levado
ção, para a estimação de N parâmetros, a
do algoritmo reduz-se de N3 para apenas
balho, apresenta-se uma implementação
rg-Marquardt, chamada Levenberg-
Dividido, que pode ser aplicada em
e apresentam a matriz Jacobiana esparsa.
o laço de iteração é dividido em vários
nores que possuem apenas uma fração da
e são resolvidos muito mais rapidamente.
ntação foi codificada em linguagem do
e pode ser executada sem modificações
LAB R� quanto no Scilab R� e no Octave R�.
mplificar o uso do algoritmo Levenberg-
vidido, aplicou-se a implementação pro-
blema de calibração de câmeras com
m gabarito 1D (ZHANG, 2004). Neste
do é utilizado para, dado um conjunto de
gabarito em diversas imagens, estimar-se
intr´ınsecos da câmera e a localização da
gabarito no espaço tridimensional. Resul-
entais mostram que o método é capaz de
mação de forma satisfatória e em poucas
mo na presença de ru´ıdo.
ão
rer do texto, matrizes e vetores são re-
or letras, números ou s´ımbolos em ne-
ntes são expressas por letras, números ou
itálico. Além disso, adotou-se a prática
= (A−1)T = (AT )−1 para toda matriz
vers´ıvel.
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
Semina: Ciências Exatas e Tecnológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
são as
coordenadas do ponto central da câmera. Sendo
assim, há apenas quatro parâmetros intrínsecos a
serem estimados durante a calibração, ou seja, α, β,
0u e 0v .
Algoritmo Levenberg-Marquardt
Considerando a seguinte função não-linear
do algo-
de diversas
Jul. 2004;
HEARER;
sas (LOU-
de uma es-
o computa-
linear pro-
for levado
râmetros, a
para apenas
ementação
Levenberg-
licada em
na esparsa.
em vários
a fração da
pidamente.
guagem do
odificações
o Octave R�.
Levenberg-
ntação pro-
meras com
4). Neste
onjunto de
estimar-se
alização da
nal. Resul-
é capaz de
em poucas
res são re-
os em ne-
úmeros ou
e a prática
oda matriz
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
nológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
(3)
onde X∈
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
ndrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
M
e Y∈
is rápida.
do algo-
e diversas
ul. 2004;
HEARER;
sas (LOU-
de uma es-
computa-
linear pro-
for levado
âmetros, a
ara apenas
ementação
Levenberg-
icada em
na esparsa.
em vários
a fração da
pidamente.
uagem do
odificações
Octave R�.
Levenberg-
tação pro-
meras com
4). Neste
onjunto de
estimar-se
lização da
nal. Resul-
é capaz de
em poucas
es são re-
os em ne-
úmeros ou
e a prática
oda matriz
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
ológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
N
são vetores e M≥N .
Freqüentemente, é necessário estimar o vetor
ESS et al., 1992; SHEARER;
do, apenas uma dessas (LOU-
04) toma vantagem de uma es-
m problemas da visão computa-
a minimização não-linear pro-
na esparsa. Se isso for levado
estimação de N parâmetros, a
mo reduz-se de N3 para apenas
esenta-se uma implementação
rdt, chamada Levenberg-
que pode ser aplicada em
m a matriz Jacobiana esparsa.
teração é dividido em vários
possuem apenas uma fração da
vidos muito mais rapidamente.
codificada em linguagem do
executada sem modificações
anto no Scilab R� e no Octave R�.
uso do algoritmo Levenberg-
icou-se a implementação pro-
calibração de câmeras com
1D (ZHANG, 2004). Neste
do para, dado um conjunto de
m diversas imagens, estimar-se
s da câmera e a localização da
o espaço tridimensional. Resul-
tram que o método é capaz de
orma satisfatória e em poucas
ença de ru´ıdo.
to, matrizes e vetores são re-
números ou s´ımbolos em ne-
pressas por letras, números ou
lém disso, adotou-se a prática
T = (AT )−1 para toda matriz
de um ponto m = [u, v, ...] são representadas por �m,
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
Ciências Exatas e Tecnológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
que melhor se ajusta a um vetor
rgência mais rápida.
ularidade do algo-
existência de diversas
URAKIS, Jul. 2004;
., 1992; SHEARER;
s uma dessas (LOU-
vantagem de uma es-
mas da visão computa-
zação não-linear pro-
sa. Se isso for levado
o de N parâmetros, a
se de N3 para apenas
uma implementação
hamada Levenberg-
e ser aplicada em
iz Jacobiana esparsa.
é dividido em vários
apenas uma fração da
ito mais rapidamente.
a em linguagem do
da sem modificações
cilab R� e no Octave R�.
algoritmo Levenberg-
implementação pro-
ão de câmeras com
ANG, 2004). Neste
dado um conjunto de
s imagens, estimar-se
era e a localização da
ridimensional. Resul-
o método é capaz de
isfatória e em poucas
u´ıdo.
zes e vetores são re-
ou s´ımbolos em ne-
or letras, números ou
, adotou-se a prática
)−1 para toda matriz
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
xatas e Tecnológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
medido. Esse
problema pode ser reformulado como, dado o vetor
derando o modelo de câmera pinhole (FAU-
LUONG, 2001), as coordenadas de um ponto
tema de coordenadas do ambiente de uma
o apresentadas como M = [x, y, z]T e a
orrespondente no plano de imagem I, como
]T . Além disso, as coordenadas homogêneas
nto m = [u, v, ...]T são representadas por �m,
= [u, v, ..., 1]T . De forma mais geral, um
lquer em coordenadas homogêneas é repre-
or �m = [u, v, ..., t]T . Um ´ındice, se houver,
osição do ponto em um conjunto de pontos.
a notação adotada, a relação entre um ponto
sua projeção, m, em uma câmera pinhole é
�m � A
�
I3 03
�
�M, (1)
A =


α 0 u0
0 β v0
0 0 1

 , (2)
indica que os dois lados da equação podem di-
ma constante, α e β dão a relação entre pixels
m e distâncias no ambiente da câmera, respec-
nas direções horizontal e vertical. Já o ponto
0, v0]T são as coordenadas do ponto central
. Sendo assim, há apenas quatro parâmetros
s a serem estimados durante a calibração, ou
u0 e v0.
oritmo Levenberg-Marquardt
derando a seguinte função não-linear
F(Y) = X, (3)
∈ IRM
e Y ∈ IRN
mente, é necessário estimar o vetor �Y que me-
a-se a um vetor �X medido. Esse problema
eformulado como, dado o vetor �X, encontrar
nimiza ��, sujeito a �X = F( �Y) + �.
uma estimação inicial �Y, o método de New-
S et al., 1992) a refina assumindo que F( �Y+
( �Y) + J∆, onde J é a matriz jacobiana, ou
∂X/∂Y, e ∆ é um que indica um “pequeno”
o de �Y. Dessa forma, minimizar �� equivale
ar
�� − J∆�, (4)
, n. 2, p. 195-203, jul./dez. 2005
, encontrar
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
drina, v. 26, n. 2, p. 195-203, jul./dez. 2005
que minimiza ||
apida.
algo-
iversas
2004;
ARER;
(LOU-
ma es-
mputa-
ar pro-
levado
tros, a
apenas
ntação
nberg-
a em
sparsa.
vários
ção da
mente.
em do
cações
tave R�.
nberg-
o pro-
s com
Neste
nto de
mar-se
ção da
Resul-
paz de
poucas
ão re-
m ne-
ros ou
prática
matriz
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
icas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
||, sujeito a
ando o modelo de camera pinhole (FAU-
ONG, 2001), as coordenadas de um ponto
a de coordenadas do ambiente de uma
presentadas como M = [x, y, z]T e a
spondente no plano de imagem I, como
Além disso, as coordenadas homogêneas
m = [u, v, ...]T são representadas por �m,
[u, v, ..., 1]T . De forma mais geral, um
er em coordenadas homogêneas é repre-
m = [u, v, ..., t]T . Um ´ındice, se houver,
ão do ponto em um conjunto de pontos.
otação adotada, a relação entre um ponto
projeção, m, em uma câmera pinhole é
�m � A
�
I3 03
�
�M, (1)
A =


α 0 u0
0 β v0
0 0 1

 , (2)
ca que os dois lados da equação podem di-
constante, α e β dão a relação entre pixels
distâncias no ambiente da câmera, respec-
direções horizontal e vertical. Já o ponto
0]T são as coordenadas do ponto central
endo assim, há apenas quatro parâmetros
erem estimados durante a calibração, ou
e v0.
tmo Levenberg-Marquardt
ando a seguinte função não-linear
F(Y) = X, (3)
M
e Y ∈ IRN
te, é necessário estimar o vetor �Y que me-
a um vetor �X medido. Esse problema
mulado como, dado o vetor �X, encontrar
za ��, sujeito a �X = F( �Y) + �.
a estimação inicial �Y, o método de New-
al., 1992) a refina assumindo que F( �Y+
+ J∆, onde J é a matriz jacobiana, ou
/∂Y, e ∆ é um que indica um “pequeno”
�Y. Dessa forma, minimizar �� equivale
�� − J∆�, (4)
2, p. 195-203, jul./dez. 2005
Dada uma estimação inicial
LERASLE; RI-
ma derivação do
a mais rápida.
ade do algo-
cia de diversas
KIS, Jul. 2004;
2; SHEARER;
a dessas (LOU-
gem de uma es-
visão computa-
não-linear pro-
isso for levado
N parâmetros, a
N3 para apenas
implementação
a Levenberg-
aplicada em
obiana esparsa.
dido em vários
s uma fração da
is rapidamente.
linguagem do
m modificações
e no Octave R�.
mo Levenberg-
ementação pro-
câmeras com
2004). Neste
um conjunto de
gens, estimar-se
localização da
nsional. Resul-
odo é capaz de
ia e em poucas
vetores são re-
mbolos em ne-
as, números ou
ou-se a prática
ara toda matriz
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
Tecnológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
, o método de
Newton (PRESS et al., 1992) a refina assumindo
que
al., 2006) e (LERASLE; RI-
e método é uma derivação do
e convergência mais rápida.
da popularidade do algo-
dt é a existência de diversas
is (LOURAKIS, Jul. 2004;
SS et al., 1992; SHEARER;
, apenas uma dessas (LOU-
) toma vantagem de uma es-
problemas da visão computa-
minimização não-linear pro-
a esparsa. Se isso for levado
timação de N parâmetros, a
o reduz-se de N3 para apenas
enta-se uma implementação
t, chamada Levenberg-
e pode ser aplicada em
a matriz Jacobiana esparsa.
ração é dividido em vários
ssuem apenas uma fração da
dos muito mais rapidamente.
odificada em linguagem do
xecutada sem modificações
o no Scilab R� e no Octave R�.
so do algoritmo Levenberg-
ou-se a implementação pro-
alibração de câmeras com
D (ZHANG, 2004). Neste
para, dado um conjunto de
diversas imagens, estimar-se
da câmera e a localização da
spaço tridimensional. Resul-
am que o método é capaz de
ma satisfatória e em poucas
nça de ru´ıdo.
matrizes e vetores são re-
meros ou s´ımbolos em ne-
essas por letras, números ou
m disso, adotou-se a prática
= (AT )−1 para toda matriz
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
ências Exatas e Tecnológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
elo de câmera pinhole (FAU-
, as coordenadas de um ponto
enadas do ambiente de uma
como M = [x, y, z]T e a
no plano de imagem I, como
, as coordenadas homogêneas
..]T são representadas por �m,
T . De forma mais geral, um
denadas homogêneas é repre-
.., t]T . Um ´ındice, se houver,
em um conjunto de pontos.
ada, a relação entre um ponto
m, em uma câmera pinhole é
A
�
I3 03
�
�M, (1)
α 0 u0
0 β v0
0 0 1

 , (2)
is lados da equação podem di-
e β dão a relação entre pixels
o ambiente da câmera, respec-
orizontal e vertical. Já o ponto
coordenadas do ponto central
há apenas quatro parâmetros
ados durante a calibração, ou
enberg-Marquardt
nte função não-linear
Y) = X, (3)
IRN
ário estimar o vetor �Y que me-
r �X medido. Esse problema
mo, dado o vetor �X, encontrar
eito a �X = F( �Y) + �.
inicial �Y, o método de New-
refina assumindo que F( �Y+
de J é a matriz jacobiana, ou
um que indica um “pequeno”
orma, minimizar �� equivale
− J∆�, (4)
, jul./dez. 2005
, onde J é a
matriz jacobiana, ou seja,
SUN et al., 2006) e (LERASLE; RI-
99). Este método é uma derivação do
que é de convergência mais rápida.
tivos da popularidade do algo-
Marquardt é a existência de diversas
spon´ıveis (LOURAKIS, Jul. 2004;
4; PRESS et al., 1992; SHEARER;
Contudo, apenas uma dessas (LOU-
S, 2004) toma vantagem de uma es-
um em problemas da visão computa-
m que a minimização não-linear pro-
acobiana esparsa. Se isso for levado
ara a estimação de N parâmetros, a
goritmo reduz-se de N3 para apenas
, apresenta-se uma implementação
arquardt, chamada Levenberg-
do, que pode ser aplicada em
esentam a matriz Jacobiana esparsa.
o de iteração é dividido em vários
que possuem apenas uma fração da
resolvidos muito mais rapidamente.
o foi codificada em linguagem do
e ser executada sem modificações
R� quanto no Scilab R� e no Octave R�.
car o uso do algoritmo Levenberg-
o, aplicou-se a implementação pro-
a de calibração de câmeras com
barito 1D (ZHANG, 2004). Neste
utilizado para, dado um conjunto de
ito em diversas imagens, estimar-se
nsecos da câmera e a localização da
rito no espaço tridimensional. Resul-
s mostram que o método é capaz de
o de forma satisfatória e em poucas
a presença de ru´ıdo.
o texto, matrizes e vetores são re-
tras, números ou s´ımbolos em ne-
ão expressas por letras, números ou
o. Além disso, adotou-se a prática
A−1)T = (AT )−1 para toda matriz
el.
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
mina: Ciências Exatas e Tecnológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
, e ∆ é um
que indica um “pequeno” incremento de
E FRANÇA, J.; FRANÇA, M.; KOYAMA, M. & DA SILVA, T.
006) e (LERASLE; RI-
odo é uma derivação do
vergência mais rápida.
opularidade do algo-
existência de diversas
OURAKIS, Jul. 2004;
al., 1992; SHEARER;
nas uma dessas (LOU-
a vantagem de uma es-
emas da visão computa-
mização não-linear pro-
arsa. Se isso for levado
ção de N parâmetros, a
z-se de N3 para apenas
se uma implementação
chamada Levenberg-
ode ser aplicada em
atriz Jacobiana esparsa.
é dividido em vários
m apenas uma fração da
muito mais rapidamente.
ada em linguagem do
ada sem modificações
Scilab R� e no Octave R�.
algoritmo Levenberg-
a implementação pro-
ção de câmeras com
HANG, 2004). Neste
, dado um conjunto de
sas imagens, estimar-se
mera e a localização da
o tridimensional. Resul-
ue o método é capaz de
atisfatória e em poucas
e ru´ıdo.
rizes e vetores são re-
s ou s´ımbolos em ne-
por letras, números ou
so, adotou-se a prática
AT )−1 para toda matriz
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
Exatas e Tecnológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
. Dessa
forma, minimizar ||
M. & DA SILVA, T.
iderando o modelo de câmera pinhole (FAU-
LUONG, 2001), as coordenadas de um ponto
stema de coordenadas do ambiente de uma
ão apresentadas como M = [x, y, z]T e a
correspondente no plano de imagem I, como
v]T . Além disso, as coordenadas homogêneas
nto m = [u, v, ...]T são representadas por �m,
= [u, v, ..., 1]T . De forma mais geral, um
alquer em coordenadas homogêneas é repre-
or �m = [u, v, ..., t]T . Um ´ındice, se houver,
osição do ponto em um conjunto de pontos.
a notação adotada, a relação entre um ponto
e sua projeção, m, em uma câmera pinhole é
�m � A
�
I3 03
�
�M, (1)
A =


α 0 u0
0 β v0
0 0 1

 , (2)
indica que os dois lados da equação podem di-
uma constante, α e β dão a relação entre pixels
m e distâncias no ambiente da câmera, respec-
, nas direções horizontal e vertical. Já o ponto
u0, v0]T são as coordenadas do ponto central
a. Sendo assim, há apenas quatro parâmetros
os a serem estimados durante a calibração, ou
, u0 e v0.
goritmo Levenberg-Marquardt
iderando a seguinte função não-linear
F(Y) = X, (3)
∈ IRM
e Y ∈ IRN
emente, é necessário estimar o vetor �Y que me-
a-se a um vetor �X medido. Esse problema
reformulado como, dado o vetor �X, encontrar
nimiza ��, sujeito a �X = F( �Y) + �.
uma estimação inicial �Y, o método de New-
SS et al., 1992) a refina assumindo que F( �Y+
( �Y) + J∆, onde J é a matriz jacobiana, ou
∂X/∂Y, e ∆ é um que indica um “pequeno”
to de �Y. Dessa forma, minimizar �� equivale
zar
�� − J∆�, (4)
|| equivale a minimizar
FRANÇA, M.; KOYAMA, M. & DA SILVA, T.
ASLE; RI-
rivação do
is rápida.
do algo-
e diversas
ul. 2004;
HEARER;
sas (LOU-
de uma es-
computa-
linear pro-
for levado
âmetros, a
ara apenas
ementação
Levenberg-
icada em
na esparsa.
em vários
a fração da
pidamente.
uagem do
odificações
Octave R�.
Levenberg-
tação pro-
meras com
4). Neste
onjunto de
estimar-se
lização da
nal. Resul-
é capaz de
em poucas
es são re-
os em ne-
úmeros ou
e a prática
oda matriz
dada por
�m � A
�
I3 03
�
�M, (1)
com
A =


α 0 u0
0 β v0
0 0 1

 , (2)
F(Y) = X, (3)
onde X ∈ IRM
e Y ∈ IRN
a minimizar
�� − J∆�, (4)
ológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
(4)
que é o mesmo que resolver
UMA IMPLEMENTAÇ ÃO DO ALGORITMO LEVENBERG-MARQUARDT D
que é o mesmo que resolver
JT
J∆ = JT
�. (5)
Além disso, a solução refinada, �Yr, é dada por
�Yr = �Y + ∆ (6)
e pode ser melhorada iterativamente.
Levenberg (LEVENBERG, 1944) propôs uma
alteração no algoritmo de Newton para acelerar sua con-
vergência, ou seja, a equação (5) é substitu´ıda por
�
JT
J + Iλ
�
∆ = JT
�. (7)
Tipicamente, λ é feito igual a 10−4 inicialmente.
Contudo, a cada iteração o valor de λ é alterado. Se
a solução da equação (5) conduzir a uma redução do
res´ıduo, λ é dividido por 10. Caso contrário, este é mul-
tiplicado por 10.
O método de Levenberg possui instabilidades
numéricas quando λ cresce. Em vista disso, al-
gum tempo depois, Marquardt (MARQUARDT, 1963)
propôs uma pequena alteração no algoritmo de Leven-
berg, ou seja, cada componente do gradiente é pon-
derada de acordo com sua curvatura. Assim, há uma
grande tendência de convergência na direção na qual o
gradiente é menor. Na prática, tal alteração é implemen-
tada substituindo a equação (7) por
�
JT
J + diag(JT
J)λ
�
∆ = JT
�. (8)
Assim, nos dias de hoje, o algoritmo resultante é conhe-
cido como Levenberg-Marquardt.
A complexidade do algoritmo Levenberg-
Marquardt aumenta com o número de variáveis.
Contudo, como se discute a seguir, algumas carac-
ter´ısticas de muitos dos problemas encontrados na
visão computacional podem ser utilizadas para reduzir
a complexidade do método significativamente. Isso é
obtido como segue.
Considerando que Y na equação (3) pode ser divi-
dido, ou seja,
Y = [cT
, dT
]T
, (9)
a matriz jacobiana, J, da equação (4) pode ser divi-
dida em dois blocos, ou seja, J = [C|D], onde C =
[∂X/∂c] e
se
onde ∆ =
Após a
terior pode
�
U − G
GT
onde U =
e �D = DT
A solu
em duas e
resolvendo
(U −
e, em segu
Agora
equação (9
n partes m
X = [XT
1
que, cada
c, na equa
caso, ∂Xi/
suposição
com que a
estrutura es
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−
onde Ci =
F(�c, �d) =
Uma i
passo do a
complexid
quanto o n
Uma v
ana com a
solvido co
Semina: Ciências Exatas e Tecnológicas, Londrina, v. 26,
(5)
Além disso, a solução refinada,
UMA IMPLEMENTAÇ ÃO DO ALGORITMO LEVENBERG-MARQ
JT
J∆ = JT
�. (5)
�Yr = �Y + ∆ (6)
�
JT
J + Iλ
�
∆ = JT
�. (7)
tiplicado por 10.
�
JT
J + diag(JT
J)λ
�
∆ = JT
�. (8)
obtido como segue.
dido, ou seja,
Y = [cT
, dT
]T
, (9)
[∂X
se
ond
teri
�
ond
e �D
em
reso
e, e
equ
n p
X
que
c, n
cas
sup
com
estr
�
�
�
�
�
�
�
�
�





ond
F(�c
pas
com
qua
ana
solv
, é dada por
JT
J∆ = JT
�. (5)
�Yr = �Y + ∆ (6)
�
JT
J + Iλ
�
∆ = JT
�. (7)
tiplicado por 10.
�
JT
J + diag(JT
J)λ
�
∆ = JT
�. (8)
obtido como segue.
dido, ou seja,
Y = [cT
, dT
]T
, (9)
[∂X/∂c] e
se �
onde ∆ = [
Após a
terior pode
�
U − GV
GT
onde U = C
e �D = DT
A soluc
em duas eta
resolvendo
(U −
e, em seguid
Agora,
equação (9
n partes me
X = [XT
1 ,
que, cada o
c, na equaç
caso, ∂Xi/∂
suposição p
com que a m
estrutura esp
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−
onde Ci =
F(�c, �d) = [
Uma im
passo do alg
complexida
quanto o nã
Uma ve
ana com a e
solvido com
(6)
Levenberg (1944) propôs uma alteração no
algoritmodeNewtonparaacelerarsuaconvergência,
ou seja, a equação (5) é substituída por
JT
J∆ = JT
�. (5)
�Yr = �Y + ∆ (6)
�
JT
J + Iλ
�
∆ = JT
�. (7)
tiplicado por 10.
�
JT
J + diag(JT
J)λ
�
∆ = JT
�. (8)
obtido como segue.
dido, ou seja,
Y = [cT
, dT
]T
, (9)
[∂X/∂c] e D
se �
onde ∆ = [
Após al
terior pode s
�
U − GV
GT
onde U = C
e �D = DT
A soluç
em duas eta
resolvendo
(U −
e, em seguid
Agora,
equação (9)
n partes me
X = [XT
1 ,
que, cada o
c, na equaç
caso, ∂Xi/∂
suposição p
com que a m
estrutura esp
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−
onde Ci =
F(�c, �d) = [
Uma im
passo do alg
complexidad
quanto o nã
Uma ve
(7)
Tipicamente, λ é feito igual a 10-4
inicialmente.
Contudo, a cada iteração o valor de λ é alterado.
Se a solução da equação (5) conduzir a uma redução
do resíduo, λ é dividido por 10. Em caso contrário,
este é multiplicado por 10.
O método de Levenberg possui instabilidades
numéricas quando λ cresce. Em vista disso, algum
tempo depois, Marquardt (MARQUARDT, 1963)
propôs uma pequena alteração no algoritmo de
Levenberg, ou seja, cada componente do gradiente é
ponderada de acordo com sua curvatura. Assim, há
uma grande tendência de convergência na direção
na qual o gradiente é menor. Na prática, tal alteração
é implementada substituindo a equação (7) por
UMA IMPLEMENTAÇ ÃO DO ALGORITMO LEVENBERG-MARQUARDT
JT
J∆ = JT
�. (5)
�Yr = �Y + ∆ (6)
�
JT
J + Iλ
�
∆ = JT
�. (7)
tiplicado por 10.
�
JT
J + diag(JT
J)λ
�
∆ = JT
�. (8)
obtido como segue.
[∂X/∂c] e
se
onde ∆ =
Após
terior pode
�
U − G
GT
onde U =
e �D = D
A solu
em duas e
resolvendo
(U −
e, em segu
Agora
equação (
n partes m
X = [XT
1
que, cada
c, na equa
caso, ∂Xi/
suposição
com que a
estrutura e
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−
onde Ci =
F(�c, �d) =
Uma
passo do a
(8)
Assim, nos dias de hoje, o algoritmo resultante é
conhecido como Levenberg-Marquardt.
Marquardt aumenta com o número de variáveis.

54
França, J. A. de et al.
Contudo, como se discute a seguir, algumas
características de muitos dos problemas
encontrados na visão computacional podem ser
utilizadas para reduzir a complexidade do método
significativamente. Isso é obtido como segue.
Considerando que Y na equação (3) pode ser
dividido, ou seja,
�
JT
J + diag(JT
J)λ
�
∆ = JT
�. (8)
obtido como segue.
dido, ou seja,
Y = [cT
, dT
]T
, (9)
com que a matriz jacobiana, J = ∂X/∂Y, tenha uma
estrutura esparsa. Assim, a equação (4) torna-se
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−





C1 D1
C2 D2
...
...
Cn Dn










δc
δd1
...
δdn





�
�
�
�
�
�
�
�
�
, (14)
onde Ci = [∂Xi/∂c] e Di = [∂Xi/∂di] e � = �X −
F(�c, �d) = [�T
1 , �T
2 , . . . , �T
n ]T .
Uma importante observação a ser feita é que cada
passo do algoritmo Levenberg-Marguardt Dividido tem
complexidade linear em N (número de incógnitas), en-
quanto o não-dividido tem complexidade N3.
Uma vez que o problema gera uma matriz Jacobi-
ana com a estrutura da equação (14), este pode ser re-
solvido com o laço de iteração resumido no algoritmo
197
(9)
a matriz jacobiana, J, da equação (4) pode ser
dividida em dois blocos, ou seja, J = [C | D], onde
C = [∂X / ∂c] e D = [∂X / ∂d]. Logo, a equação (5)
torna-se
ENBERG-MARQUARDT DIVIDIDO PARA APLICAÇ ÕES EM ...
(5)
(6)
ôs uma
sua con-
or
(7)
lmente.
do. Se
ução do
e é mul-
ilidades
sso, al-
T, 1963)
Leven-
é pon-
há uma
a qual o
plemen-
(8)
conhe-
[∂X/∂c] e D = [∂X/∂d]. Logo, a equação (5) torna-
se �
CT C CT D
DT C DT D
� �
δc
δd
�
=
�
CT �
DT �
�
, (10)
onde ∆ = [δT
c , δT
d ]T .
Após alguma manipulação algébrica, a equação an-
terior pode ser reescrita como sendo
�
U − GV−1
0
GT V
� �
δc
δd
�
=
�
�C − GV−1
�D
�D
�
, (11)
onde U = CT C, G = CT D, V = DT D, �C = CT �
e �D = DT �.
A solução do problema anterior pode ser dividida
em duas etapas. A primeira consiste em encontrar δc
resolvendo
(U − GV−1
GT
)δc = �C − GV−1
�D (12)
e, em seguida, δd pode ser encontrado resolvendo
Vδd = �D − GT
δc. (13)
Agora, considera-se ainda que os vetores d, na
equação (9), e X também possam ser divididos em
n partes menores, ou seja, d = [dT
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
n ]T . Além disso, cabe ressaltar
que, cada observação Xi depende apenas dos vetores
c, na equação (9), di e de nenhum outro dk. Neste
caso, ∂Xi/∂dk = 0 para i �= k, enquanto que nenhuma
suposição pode ser feita a respeito de ∂Xi/∂c. Isso faz
�
�
�
�


�1
�




C1 D1
C D




δc
δ


�
�
�
�
(10)
onde
LEVENBERG-MARQUARDT DIVIDIDO PARA APLICAÇ ÕES EM ...
(5)
or
(6)
ropôs uma
rar sua con-
a por
(7)
icialmente.
terado. Se
redução do
este é mul-
stabilidades
disso, al-
RDT, 1963)
de Leven-
nte é pon-
m, há uma
o na qual o
implemen-
(8)
nte é conhe-
se �
CT C CT D
DT C DT D
� �
δc
δd
�
=
�
CT �
DT �
�
, (10)
onde ∆ = [δT
c , δT
d ]T .
�
U − GV−1
0
GT V
� �
δc
δd
�
=
�
�C − GV−1
�D
�D
�
, (11)
e �D = DT �.
resolvendo
(U − GV−1
GT
)δc = �C − GV−1
�D (12)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
�
�

�
 
C D
 
δ
�
�
Após alguma manipulação algébrica, a equação
anterior pode ser reescrita como sendo
EVENBERG-MARQUARDT DIVIDIDO PARA APLICAÇ ÕES EM ...
(5)
or
(6)
opôs uma
ar sua con-
a por
(7)
cialmente.
erado. Se
edução do
este é mul-
abilidades
disso, al-
DT, 1963)
de Leven-
nte é pon-
m, há uma
na qual o
mplemen-
(8)
se �
CT C CT D
DT C DT D
� �
δc
δd
�
=
�
CT �
DT �
�
, (10)
onde ∆ = [δT
c , δT
d ]T .
�
U − GV−1
0
GT V
� �
δc
δd
�
=
�
�C − GV−1
�D
�D
�
, (11)
e �D = DT �.
resolvendo
(U − GV−1
GT
)δc = �C − GV−1
�D (12)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
(11)
onde U = CT
C, G = CT
D, V = DT
D,
NBERG-MARQUARDT DIVIDIDO PARA APLICAÇ ÕES EM ...
(5)
(6)
uma
a con-
(7)
mente.
o. Se
cão do
é mul-
idades
o, al-
1963)
Leven-
é pon-
á uma
qual o
emen-
se �
CT C CT D
DT C DT D
� �
δc
δd
�
=
�
CT �
DT �
�
, (10)
onde ∆ = [δT
c , δT
d ]T .
�
U − GV−1
0
GT V
� �
δc
δd
�
=
�
�C − GV−1
�D
�D
�
, (11)
e �D = DT �.
resolvendo
(U − GV−1
GT
)δc = �C − GV−1
�D (12)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
e
LEVENBERG-MARQUARDT DIVIDIDO PARA APLICAÇ ÕES EM ...
(5)
por
(6)
ropôs uma
rar sua con-
da por
(7)
nicialmente.
terado. Se
redução do
este é mul-
stabilidades
disso, al-
RDT, 1963)
o de Leven-
ente é pon-
m, há uma
o na qual o
implemen-
se �
CT C CT D
DT C DT D
� �
δc
δd
�
=
�
CT �
DT �
�
, (10)
onde ∆ = [δT
c , δT
d ]T .
�
U − GV−1
0
GT V
� �
δc
δd
�
=
�
�C − GV−1
�D
�D
�
, (11)
e �D = DT �.
resolvendo
(U − GV−1
GT
)δc = �C − GV−1
�D (12)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
suposição pode ser feita a respeito de ∂X /∂c. Isso faz
Asolução do problema anterior pode ser dividida
em duas etapas. A primeira consiste em encontrar
Cδ resolvendo
VENBERG-MARQUARDT DIVIDIDO PARA APLICAÇ ÕES EM ...
(5)
(6)
pôs uma
sua con-
por
(7)
ialmente.
rado. Se
dução do
te é mul-
bilidades
isso, al-
DT, 1963)
e Leven-
e é pon-
há uma
se �
CT C CT D
DT C DT D
� �
δc
δd
�
=
�
CT �
DT �
�
, (10)
onde ∆ = [δT
c , δT
d ]T .
�
U − GV−1
0
GT V
� �
δc
δd
�
=
�
�C − GV−1
�D
�D
�
, (11)
e �D = DT �.
resolvendo
(U − GV−1
GT
)δc = �C − GV−1
�D (12)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
que, cada observação X depende apenas dos vetores
(12)
e, em seguida, dδ pode ser encontrado resolvendo
NBERG-MARQUARDT DIVIDIDO PARA APLICAÇ ÕES EM ...
(5)
(6)
uma
a con-
(7)
mente.
o. Se
cão do
é mul-
idades
o, al-
1963)
Leven-
é pon-
se �
CT C CT D
DT C DT D
� �
δc
δd
�
=
�
CT �
DT �
�
, (10)
onde ∆ = [δT
c , δT
d ]T .
�
U − GV−1
0
GT V
� �
δc
δd
�
=
�
�C − GV−1
�D
�D
�
, (11)
e �D = DT �.
resolvendo
(U − GV−1
GT
)δc = �C − GV−1
�D (12)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
T T T T
(13)
equação (9), e X também possam ser divididos em
n partes menores, ou seja,
tiplicado por 10.
�
JT
J + diag(JT
J)λ
�
∆ = JT
�. (8)
obtido como segue.
dido, ou seja,
Y = [cT
, dT
]T
, (9)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−





C1 D1
C2 D2
...
...
Cn Dn










δc
δd1
...
δdn





�
�
�
�
�
�
�
�
�
, (14)
F(�c, �d) = [�T
1 , �T
2 , . . . , �T
n ]T .
197
e
tiplicado por 10.
�
JT
J + diag(JT
J)λ
�
∆ = JT
�. (8)
obtido como segue.
dido, ou seja,
Y = [cT
, dT
]T
, (9)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−





C1 D1
C2 D2
...
...
Cn Dn










δc
δd1
...
δdn





�
�
�
�
�
�
�
�
�
, (14)
F(�c, �d) = [�T
1 , �T
2 , . . . , �T
n ]T .
197
. Além disso, cabe
ressaltar que, cada observação Xi depende apenas
dos vetores c, na equação (9), di e de nenhum outro
dk. Neste caso,
tiplicado por 10.
�
JT
J + diag(JT
J)λ
�
∆ = JT
�. (8)
obtido como segue.
dido, ou seja,
Y = [cT
, dT
]T
, (9)
c C D
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−





C1 D1
C2 D2
...
...
Cn Dn










δc
δd1
...
δdn





�
�
�
�
�
�
�
�
�
, (14)
F(�c, �d) = [�T
1 , �T
2 , . . . , �T
n ]T .
197
para i ≠ k, enquanto
que nenhuma suposição pode ser feita a respeito
de
ão o valor de λ é alterado. Se
(5) conduzir a uma redução do
r 10. Caso contrário, este é mul-
evenberg possui instabilidades
cresce. Em vista disso, al-
arquardt (MARQUARDT, 1963)
teração no algoritmo de Leven-
omponente do gradiente é pon-
sua curvatura. Assim, há uma
nvergência na direção na qual o
prática, tal alteração é implemen-
ação (7) por
g(JT
J)λ
�
∆ = JT
�. (8)
, o algoritmo resultante é conhe-
Marquardt.
do algoritmo Levenberg-
com o número de variáveis.
scute a seguir, algumas carac-
dos problemas encontrados na
odem ser utilizadas para reduzir
todo significativamente. Isso é
Y na equação (3) pode ser divi-
= [cT
, dT
]T
, (9)
da equação (4) pode ser divi-
u seja, J = [C|D], onde C =
(U − GV−1
GT
)δc = �C − GV−1
�D (12)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−





C1 D1
C2 D2
...
...
Cn Dn










δc
δd1
...
δdn





�
�
�
�
�
�
�
�
�
, (14)
F(�c, �d) = [�T
1 , �T
2 , . . . , �T
n ]T .
Ciências Exatas e Tecnológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
197
. Isso faz com que a matriz jacobiana,
teração o valor de λ é alterado. Se
ção (5) conduzir a uma redução do
do por 10. Caso contrário, este é mul-
e Levenberg possui instabilidades
o λ cresce. Em vista disso, al-
, Marquardt (MARQUARDT, 1963)
na alteração no algoritmo de Leven-
da componente do gradiente é pon-
com sua curvatura. Assim, há uma
de convergência na direção na qual o
Na prática, tal alteração é implemen-
equação (7) por
+ diag(JT
J)λ
�
∆ = JT
�. (8)
hoje, o algoritmo resultante é conhe-
erg-Marquardt.
dade do algoritmo Levenberg-
ta com o número de variáveis.
e discute a seguir, algumas carac-
os dos problemas encontrados na
al podem ser utilizadas para reduzir
o método significativamente. Isso é
.
que Y na equação (3) pode ser divi-
Y = [cT
, dT
]T
, (9)
a, J, da equação (4) pode ser divi-
os, ou seja, J = [C|D], onde C =
(U − GV−1
GT
)δc = �C − GV−1
�D (12)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−





C1 D1
C2 D2
...
...
Cn Dn










δc
δd1
...
δdn





�
�
�
�
�
�
�
�
�
, (14)
F(�c, �d) = [�T
1 , �T
2 , . . . , �T
n ]T .
mina: Ciências Exatas e Tecnológicas, Londrina, v. 26, n. 2, p. 195-203, jul./dez. 2005
197
, tenha uma estrutura esparsa. Assim,
a equação (4) torna-se
tiplicado por 10.
�
JT
J + diag(JT
J)λ
�
∆ = JT
�. (8)
obtido como segue.
dido, ou seja,
Y = [cT
, dT
]T
, (9)
resolvendo
(U − GV−1
GT
)δc = �C − GV−1
�D (12)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−





C1 D1
C2 D2
...
...
Cn Dn










δc
δd1
...
δdn





�
�
�
�
�
�
�
�
�
, (14)
F(�c, �d) = [�T
1 , �T
2 , . . . , �T
n ]T .
197
(14)
J J + Iλ ∆ = J �. (7)
tiplicado por 10.
�
JT
J + diag(JT
J)λ
�
∆ = JT
�. (8)
obtido como segue.
dido, ou seja,
Y = [cT
, dT
]T
, (9)
resolvendo
(U − GV−1
GT
)δc = �C − GV−1
�D (12)
Vδd = �D − GT
δc. (13)
1 , dT
2 , . . . , dT
n ]T e
X = [XT
1 , XT
1 , . . . , XT
�
�
�
�
�
�
�
�
�





�1
�2
...
�n





−





C1 D1
C2 D2
...
...
Cn Dn










δc
δd1
...
δdn





�
�
�
�
�
�
�
�
�
, (14)
F(�c, �d) = [�T
1 , �T
2 , . . . , �T
n ]T .
197
Uma importante observação a ser feita é que
cada passo do algoritmo Levenberg-Marguardt
Dividido tem complexidade linear em N (número
de incógnitas), enquanto o não-dividido tem
complexidade N3
.
Uma vez que o problema gera uma matriz
Jacobiana com a estrutura da equação (14) este
pode ser resolvido com o laço de iteração resumido
no algoritmo 1. Tal algoritmo descreve em
pormenores a solução do problema e torna possível
a sua codificação em linguagem computacional. No
apêndice A, apresenta-se a codificação utilizada
neste trabalho.
Diversos problemas de otimização encontrados
na visão computacional, por exemplo, os que
envolvem as coordenadas de pontos no espaço
projetivo 2D ou 3D (ARMANGUÉ; SALVI, 2003;
HORAUD; CSURKA; DEMIRDIJIAN, 2000;
LOOP; ZHANG, 1999; SALVI; ARMANGUÉ;
BATLLE, 2002; ZHANG, 2000), podem ser
formulados como um problema com a estrutura
da equação (14). Na próxima seção, é dado um
exemplo de aplicação que se encaixa perfeitamente
nesta categoria de problemas.

4734 16435-1-pb

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (6)

Destaque

Destaque (10)

Semelhante a 4734 16435-1-pb

Semelhante a 4734 16435-1-pb (20)

Último

Último (7)

4734 16435-1-pb