Inteligência Artificial I - Visão Computacional
Michel Alves dos Santos ∗
07 de Junho de 2011
1 Percebendo o Mundo
Como pod...
4 Máquinas e Percepção
Percepção de máquina é a habilidade de usar a entrada de sensores (como câmeras, mi-
crofones, sona...
7 Curiosidades sobre o Kismet
Rodney Brooks, que dirigia até recentemente o Laboratório de Ciência da Computação e
Intelig...
Próximos SlideShares
Carregando em…5
×

Computer Vision - Presentation Notes

178 visualizações

Publicada em

Computer Vision is an interdisciplinary field of study that develops theory and technology for building artificial systems capable of analyzing visual inputs. This document gathered some notes and comments used in the presentation entitled: "Introduction to Computer Vision".

Publicada em: Educação
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
178
No SlideShare
0
A partir de incorporações
0
Número de incorporações
2
Ações
Compartilhamentos
0
Downloads
1
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Computer Vision - Presentation Notes

  1. 1. Inteligência Artificial I - Visão Computacional Michel Alves dos Santos ∗ 07 de Junho de 2011 1 Percebendo o Mundo Como podemos perceber o mundo a nossa volta? Resposta: através de nossos sentidos. E o mais importante deles é a visão. Nesse momento faz-se juízo a celebre frase ‘uma imagem vale mais do que mil palavras’. 2 Anatomia do Olho Humano e Processo de Visão O globo ocular, com cerca de 25 milímetros de diâmetro, é o responsável pela captação da luz refletida pelos objetos à nossa volta. Essa luz atinge em primeiro lugar nossa córnea, que é um tecido transparente que cobre nossa íris como o vidro de um relógio. Em seu caminho, a luz agora passa através do humor aquoso, penetrando no globo ocular pela pupila, atingindo imediatamente o cristalino que funciona como uma lente de focalização, convergindo então os raios luminosos para um ponto focal sobre a retina. Na retina, mais de cem milhões de células fotossensíveis transformam a luz em impulsos eletroquímicos, que são enviados ao cérebro pelo nervo óptico. No cérebro, mais precisamente no córtex visual ocorre o processamento das imagens recebidas pelo olho direito e esquerdo completando então nossa sensação visual. O olho humano é um órgão da visão, no qual uma imagem óptica do mundo externo é produzida e transformada em impulsos nervosos e conduzida ao cérebro. 3 Visão Computacional Campo da Computação Gráfica que desenvolve teoria e tecnologia para a construção de sistemas artificiais capazes de analisar entradas visuais. ∗ Bacharelando em Ciência da Computação, Universidade Federal do Estado de Alagoas(UFAL), Bol- sista do Laboratório de Modelagem Geométrica e Visão Computacional do Centro de Pesquisa em Ma- temática Computacional(CPMAT), Brasil - Maceió/AL, Tel: 8805-0582 E-mail: michel.mas@gmail.com, michelalvessantos@hotmail.com 1
  2. 2. 4 Máquinas e Percepção Percepção de máquina é a habilidade de usar a entrada de sensores (como câmeras, mi- crofones, sonar e outrs aparelhos) para deduzir aspectos do mundo. Visão Computacional é a habilidade de analisar entradas visuais. Alguns subproblemas da área de percepção de máquina são o reconhecimento de linguagem(fala ou discurso), o reconhecimento facial e o reconhecimento de objetos. http://en.wikipedia.org/wiki/Artificial_intelligence 5 Harry Porter’s Collection of Robot Videos http://web.cecs.pdx.edu/~harry/Robots/index.html 6 Kismet O Robô-babá, que toma conta de bebês enquanto os pais trabalham ou vão jantar fora, por enquanto só existe em desenho animados. Mas a situação oposta já é realidade - um robô-bebê, paparicado o tempo todo por uma babá humana. Kismet, uma cabeça metá- lica de 3,6 quilos acoplada a um computador, é o projeto mais recente do Laboratório de Inteligência Artificial do MIT, o Instituto de Tecnologia de Massachusetts, nos Estados Unidos. Ele sorri e arregala doces olhos azuis quando tem um companheiro para brincar. Se está sozinho, fica triste e entediado. Kismet é o irmão caçula de Cog, o robô do MIT que está sendo desenvolvido há quatro anos para "aprender"por conta própria - quando algum de seus movimentos dá errado, seu computador apaga as conexões elétricas responsáveis pelo fracasso. No estágio atual, o Cog já tem a inteligência de um gatinho recém-nascido. Para avançar mais, terá de aprender a se comunicar com os humanos. A cabeça robótica interativa surgiu para ajudar na tarefa. No futuro, as duas engenhocas deverão ser fun- didas numa só. "Queremos construir sistemas capazes de interagir com seres humanos", explica a cientista da computação Cynthia Breazeal, a "mãe"do Kismet. Por enquanto, suas habilidades se limitam a um repertório de nove expressões faciais, que ele manifesta em reação aos estímulos recebidos de fora. Quando Cynthia agita na sua frente um ursinho de pelúcia ou qualquer outro objeto, ele sorri, satisfeito. Se a pesquisadora fica imóvel, Kismet faz cara de triste; e fica irritado quando o brinquedo é chacoalhado num ritmo rápido. Essa é a sua maneira de sinalizar se o estímulo recebido é adequado, insuficente ou excessivo. Kismet não ouve, não fala e é incapaz de perceber o que significam os gestos captados pela sua visão. Para os seus criadores, tudo bem. O bebê-robô não veio ao mundo para ser um Einstein - basta conseguir se expressar. Cynthia acredita que, com o tempo, seus recursos se tornarão mais sofisticados. "Nós também não nascemos com a capacidade de nos relacionar com o mundo", observa. "Se os seres humanos podem aprender, nada impede que um dia as máquinas também desenvolvam essa habilidade", diz a mãe coruja. Se a sua criatura não chegar tão longe, servirá ao menos como inspiração para as fábricas de brinquedos eletrônicos. 2
  3. 3. 7 Curiosidades sobre o Kismet Rodney Brooks, que dirigia até recentemente o Laboratório de Ciência da Computação e Inteligência Artificial do MIT, decidiu em 1993 que desenvolveria um novo robô, invertendo o processo dominante nas pesquisas da época. Ele abandonou a idéia de que as máquinas deveriam dispor de um sistema cognitivo, e se concentrou em equipá-las com sentidos e torná-las capazes de ação. O Cog, criado em 1993 e desenvolvido nos 11 anos posteriores, foi criado para aprender como se fosse uma criança, com base em impulsos sensórios e motores. Já Cynthia Breazal, que começou a trabalhar com Brooks como aluna de pós-graduação, em 1990, depois de cuidar de boa parte do trabalho básico de computação do Cog, decidiu que seu projeto de doutorado seria a criação de um novo robô sociável. O projeto ganhou o nome de Kismet, e se tornou o mais expressivo dos robôs sociáveis construídos até então, dada sua capacidade de expressar algumas emoções básicas por meio de mudanças em sua expressão facial - ou seja, posição dos olhos, lábios, sobrancelhas e orelhas de papel cor-de-rosa. Acionado por 15 computadores funcionando em paralelo, o Kismet funcionava mais por aprendizado social do que em modo cognitivo. O robô foi dotado da capacidade de reconhecer objetos de cores brilhantes, e de reagir à presença deles com uma expressão entusiasmada. Na ausência de estímulos, ele assumia uma expressão entediada. Quando os cientistas começaram a acenar com objetos coloridos para o aparelho, surgiu um des- dobramento inesperado: o robô reconhecia os objetos e demonstrava entusiasmo; os seres humanos, animados com a reação, redobravam seus esforços de exibição do objeto. Com isso, era estabelecido um loop de retroalimentação social semelhante ao que surge quando uma pessoa brinca com um bebê. 8 Site com Alguns Trabalhos Interessantes http://www.math.tau.ac.il/~dcor/ 3

×