Computer Vision is an interdisciplinary field of study that develops theory and technology for building artificial systems capable of analyzing visual inputs. This document gathered some notes and comments used in the presentation entitled: "Introduction to Computer Vision".
O guia definitivo para conquistar a aprovação em concurso público.pdf
Visão Computacional - Inteligência Artificial
1. Inteligência Artificial I - Visão Computacional
Michel Alves dos Santos ∗
07 de Junho de 2011
1 Percebendo o Mundo
Como podemos perceber o mundo a nossa volta? Resposta: através de nossos sentidos.
E o mais importante deles é a visão. Nesse momento faz-se juízo a celebre frase ‘uma
imagem vale mais do que mil palavras’.
2 Anatomia do Olho Humano e Processo de Visão
O globo ocular, com cerca de 25 milímetros de diâmetro, é o responsável pela captação
da luz refletida pelos objetos à nossa volta. Essa luz atinge em primeiro lugar nossa córnea,
que é um tecido transparente que cobre nossa íris como o vidro de um relógio. Em seu
caminho, a luz agora passa através do humor aquoso, penetrando no globo ocular pela
pupila, atingindo imediatamente o cristalino que funciona como uma lente de focalização,
convergindo então os raios luminosos para um ponto focal sobre a retina. Na retina, mais
de cem milhões de células fotossensíveis transformam a luz em impulsos eletroquímicos, que
são enviados ao cérebro pelo nervo óptico. No cérebro, mais precisamente no córtex visual
ocorre o processamento das imagens recebidas pelo olho direito e esquerdo completando
então nossa sensação visual.
O olho humano é um órgão da visão, no qual uma imagem óptica do mundo externo é
produzida e transformada em impulsos nervosos e conduzida ao cérebro.
3 Visão Computacional
Campo da Computação Gráfica que desenvolve teoria e tecnologia para a construção
de sistemas artificiais capazes de analisar entradas visuais.
∗
Bacharelando em Ciência da Computação, Universidade Federal do Estado de Alagoas(UFAL), Bol-
sista do Laboratório de Modelagem Geométrica e Visão Computacional do Centro de Pesquisa em Ma-
temática Computacional(CPMAT), Brasil - Maceió/AL, Tel: 8805-0582 E-mail: michel.mas@gmail.com,
michelalvessantos@hotmail.com
1
2. 4 Máquinas e Percepção
Percepção de máquina é a habilidade de usar a entrada de sensores (como câmeras, mi-
crofones, sonar e outrs aparelhos) para deduzir aspectos do mundo. Visão Computacional
é a habilidade de analisar entradas visuais. Alguns subproblemas da área de percepção de
máquina são o reconhecimento de linguagem(fala ou discurso), o reconhecimento facial e o
reconhecimento de objetos.
http://en.wikipedia.org/wiki/Artificial_intelligence
5 Harry Porter’s Collection of Robot Videos
http://web.cecs.pdx.edu/~harry/Robots/index.html
6 Kismet
O Robô-babá, que toma conta de bebês enquanto os pais trabalham ou vão jantar fora,
por enquanto só existe em desenho animados. Mas a situação oposta já é realidade - um
robô-bebê, paparicado o tempo todo por uma babá humana. Kismet, uma cabeça metá-
lica de 3,6 quilos acoplada a um computador, é o projeto mais recente do Laboratório de
Inteligência Artificial do MIT, o Instituto de Tecnologia de Massachusetts, nos Estados
Unidos. Ele sorri e arregala doces olhos azuis quando tem um companheiro para brincar.
Se está sozinho, fica triste e entediado. Kismet é o irmão caçula de Cog, o robô do MIT que
está sendo desenvolvido há quatro anos para "aprender"por conta própria - quando algum
de seus movimentos dá errado, seu computador apaga as conexões elétricas responsáveis
pelo fracasso. No estágio atual, o Cog já tem a inteligência de um gatinho recém-nascido.
Para avançar mais, terá de aprender a se comunicar com os humanos. A cabeça robótica
interativa surgiu para ajudar na tarefa. No futuro, as duas engenhocas deverão ser fun-
didas numa só. "Queremos construir sistemas capazes de interagir com seres humanos",
explica a cientista da computação Cynthia Breazeal, a "mãe"do Kismet. Por enquanto,
suas habilidades se limitam a um repertório de nove expressões faciais, que ele manifesta
em reação aos estímulos recebidos de fora. Quando Cynthia agita na sua frente um ursinho
de pelúcia ou qualquer outro objeto, ele sorri, satisfeito. Se a pesquisadora fica imóvel,
Kismet faz cara de triste; e fica irritado quando o brinquedo é chacoalhado num ritmo
rápido. Essa é a sua maneira de sinalizar se o estímulo recebido é adequado, insuficente
ou excessivo. Kismet não ouve, não fala e é incapaz de perceber o que significam os gestos
captados pela sua visão. Para os seus criadores, tudo bem. O bebê-robô não veio ao mundo
para ser um Einstein - basta conseguir se expressar. Cynthia acredita que, com o tempo,
seus recursos se tornarão mais sofisticados. "Nós também não nascemos com a capacidade
de nos relacionar com o mundo", observa. "Se os seres humanos podem aprender, nada
impede que um dia as máquinas também desenvolvam essa habilidade", diz a mãe coruja.
Se a sua criatura não chegar tão longe, servirá ao menos como inspiração para as fábricas
de brinquedos eletrônicos.
2
3. 7 Curiosidades sobre o Kismet
Rodney Brooks, que dirigia até recentemente o Laboratório de Ciência da Computação e
Inteligência Artificial do MIT, decidiu em 1993 que desenvolveria um novo robô, invertendo
o processo dominante nas pesquisas da época. Ele abandonou a idéia de que as máquinas
deveriam dispor de um sistema cognitivo, e se concentrou em equipá-las com sentidos e
torná-las capazes de ação. O Cog, criado em 1993 e desenvolvido nos 11 anos posteriores,
foi criado para aprender como se fosse uma criança, com base em impulsos sensórios e
motores.
Já Cynthia Breazal, que começou a trabalhar com Brooks como aluna de pós-graduação,
em 1990, depois de cuidar de boa parte do trabalho básico de computação do Cog, decidiu
que seu projeto de doutorado seria a criação de um novo robô sociável. O projeto ganhou
o nome de Kismet, e se tornou o mais expressivo dos robôs sociáveis construídos até então,
dada sua capacidade de expressar algumas emoções básicas por meio de mudanças em
sua expressão facial - ou seja, posição dos olhos, lábios, sobrancelhas e orelhas de papel
cor-de-rosa.
Acionado por 15 computadores funcionando em paralelo, o Kismet funcionava mais
por aprendizado social do que em modo cognitivo. O robô foi dotado da capacidade de
reconhecer objetos de cores brilhantes, e de reagir à presença deles com uma expressão
entusiasmada. Na ausência de estímulos, ele assumia uma expressão entediada. Quando
os cientistas começaram a acenar com objetos coloridos para o aparelho, surgiu um des-
dobramento inesperado: o robô reconhecia os objetos e demonstrava entusiasmo; os seres
humanos, animados com a reação, redobravam seus esforços de exibição do objeto. Com
isso, era estabelecido um loop de retroalimentação social semelhante ao que surge quando
uma pessoa brinca com um bebê.
8 Site com Alguns Trabalhos Interessantes
http://www.math.tau.ac.il/~dcor/
3