MINERAÇÃO DE DADOS PARA CLASSIFICAÇÃO FOTOGRÁFICA
Cristina Amazonas Cabral
DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DA COORD...
CABRAL, CRISTINA AMAZONAS
Mineração de Dados para Classificação
Fotográfica [Rio de Janeiro] 2006
VIII,161p. 29,7 cm (COPP...
Ao Antonio,
iii
AGRADECIMENTOS
Ao prof. Nelson F.F. Ebecken, por sua sua sabedoria e leveza ao orientar; e por
acreditar nesta pesquisa me...
Resumo da Dissertação apresentada à COPPE/UFRJ como parte dos requisitos
necessários para a obtenção do grau de Mestre em ...
Abstract of Dissertation presented to COPPE/UFRJ as a partial fullfillment of the
requirements for the degree of Master of...
ÍNDICE
I) INTRODUÇÃO
I.1) SINOPSE............................................................................................
V) APROFUNDANDO O PROGRAMA EXIFTOOL
V.1) COMO ALTERAR OS METADADOS DA IMAGEM ?......................................... 50...
I ) INTRODUÇÃO
I.1) SINOPSE
O presente trabalho irá aplicar a técnica de mineração de dados num conjunto de
fotografias se...
UMA IMAGEM VALE MAIS QUE MIL PALAVRAS X UMA PALAVRA PODE VALER MIL IMAGENS
Entender a imagem e “absorver” a informação nel...
Incorporar fotografias digitais contemporâneas às coleções antigas ainda é um desafio,
e neste sentido toda padronização q...
A categoria de RELAÇÕES ESPACIAIS lida com uma classe de consultas baseada nas
relações espaciais e topológicas entre os o...
Podemos citar alguns exemplos que usam estas classes de consulta em Bancos de dados
de fotografias :
- Em [4] foi desenvol...
Como a maioria das fotos cadastradas não exibe texto acoplado, acredita-se que isto
inviabilizou a pesquisa pelo campo “Se...
Uma proposta para formalizar a subjetividade da imagem é apresentada em [53]. A
partir de um conjunto de 135 (cento e trin...
EM FOTOGRAFIA
Há alguns anos, quando o universo da fotografia ainda se limitava ao uso da película,
um dos exercícios inic...
I.7) QUESTÕES LEVANTADAS PARA PESQUISA
- É possível determinar automaticamente quais fotografias são retratos ou paisagens...
II ) CARACTERIZAÇÃO DAS FOTOGRAFIAS
II.1) CATALOGAÇÃO EM ARQUIVOS FOTOGRÁFICOS
Segundo o Manual para catalogação de docume...
Através de enquetes em fóruns de fotografia [51] foi constatado que cada fotógrafo
divide seu arquivo conforme o seu uso e...
complexidade da hierarquia de termos destes dicionários inviabiliza a aplicação de
algoritmos de IA.
Este ponto de vista q...
detalhes de uma paisagem, feitas ao nível do solo como por exemplo, de uma árvore.
Termos mais específicos para paisagem –...
OBJETIVA DISTÂNCIA FOCAL
Olho-de-Peixe 4 a 8 mm
Grande Angular 14 a 35 mm
Normal 50 mm
Meia-Tele 70 a 135 mm
Tele-Objetiva...
O valor da abertura do diafragma é medido por uma escala de valores que se chama
números f [1], variando de 1.0 (Canon 50m...
Figura 3 : Tempo de exposição de 1 hora
A técnica sugere valores-padrão para se obter imagens nítidas de determinados
assu...
Filmes “rápidos” são aqueles com grãos grandes, absorvem facilmente a luz e por isso
se adequam a situações de pouca lumin...
A cor com que determinado objeto se apresenta na fotografia está intimamente ligada à
luz que incide sobre ela. A luz cons...
TEMPERATURA FONTE DE LUZ
25.000 K Céu de dia no polo Norte
13.000 K Céu ligeiramente encoberto
9.000 a 12.000 K Céu azul a...
Na fotografia não existe “certo” ou “errado”, e é aí que entra a intuição e experiência
do fotógrafo que, espera-se, deva ...
II.4) A MATEMÁTICA E A TÉCNICA FOTOGRÁFICA
Assim como na música e em tantas outras artes, a fotografia se baseia numa técn...
GPS19
, data e hora, etc. A versão atual e mais utizada é a 2.2, criada em abril de 2.002
pela JEITA20
[38].
Em fóruns int...
que muitas vezes quando se abre um arquivo de imagem digital, mesmo sem se alterar
nada, ao se fechar aparece uma mensagem...
disso a fabricante ADOBE introduziu a opção de ignorar os dados EXIF, impondo um
outro padrão que nem sempre é compatível ...
EXIFREADER [18] é também um software gratuito para plataforma Windows, cuja
proposta é avaliar e analisar arquivos de imag...
III) COMPOSIÇÃO DA AMOSTRA
Foram selecionadas e classificadas mais de quinhentas fotografias da Internet, com
atenção para...
Figura 5 : Contact Press Images Figura 6: Contact Press Images
A World Press Photo [59] não permite que se copie a foto in...
Dada a dificuldade enfrentada em recolher metadados neste universo fotojornalístico,
foi colhida para compor a amostra fot...
universo de fotos variado. Ficou assim configurada uma razoável diversidade de
enfoques dadas as distintas personalidades ...
A experiência é sem dúvida o mais importante critério de escolha dos fotógrafos, e
nesta amostra se destacam os trabalhos ...
arquivo de dados desta pesquisa devido à sua facilidade de obtenção neste depósitorio
de fotografias na Internet, que valo...
III.4) VARIÁVEIS PARA ANÁLISE : O QUE FOI ESCOLHIDO DO EXIF
Os EXIF foram obtidos a partir dos campos detalhados no Pbase ...
RETRATO pois enfoca e exibe uma única “coisa” (planta ou animal). Vale ressaltar que
historicamente este ponto de vista é ...
FABRICANTE
Nome do fabricante da câmera. String com domínio discreto.
Na amostra = Canon, Nikon, Fujifilm, Konica Minolta ...
MEDIÇÃO DA LUZ
É a forma como o fotômetro da câmera deve medir a luz. Os valores variam de acordo
com o Fabricante e Model...
III.5) VALIDAÇÃO DA AMOSTRA : LIMPEZA, CAMPOS NULOS
A variável FLASH não se encontra bem documentada aqui. O Flash externo...
acontece quando se encontra o valor “manual” : significa que o fotógrafo faz esta
medição segundo seus critérios.
Outro pr...
IV ) MINERAÇÃO DE DADOS
IV.1) INTRODUÇÃO À IA
O ser humano possui a habilidade de fazer generalizações precisas a partir d...
Diante da dificuldade em gerar manualmente uma amostra consistente e íntegra, optou-
se por adaptá-la da maneira mais simp...
Atributo Min Max Média
Desvio
Padrão
Desvio
Padrão /
Média
Comprimento_Focal(mm) 7,2 500 97,75 86,70 0,8870
Velocidade_seg...
ATRIBUTO / GINI DISTRIBUIÇÃO
Valores Qtd Percent Histograma
Nikon 106 20,38 %
Canon 338 65,00 %
FujiFilm 60 11,54 %
Konica...
ATRIBUTO / GINI DISTRIBUIÇÃO
Valores Qtd Percent Histograma
indefinido(9) 4 0,77 %
indefinido(11) 23 4,42 %
indefinido(4) ...
IV.3) MÉTODO DE CLASSIFICAÇÃO PROPOSTO
O método de Mineração de Dados escolhido para estudo são as árvores de decisão [50]...
Classificação Validaçãoe
x
p
Atributos Qtd
nós
Qtd
folhas Retrato Paisagem Retrato Paisagem
1
Comprimento_Focal(mm)
Veloci...
Classificação Validaçãoe
x
p
Atributos Qtd
nós
Qtd
folhas Retrato Paisagem Retrato Paisagem
1
Comprimento_Focal(mm)
Veloci...
Classificação Validaçãoe
x
p
Atributos Qtd
nós
Qtd
folhas Retrato Paisagem Retrato Paisagem
7
Comprimento_Focal(mm)
Veloci...
As variáveis Fabricante, Modelo e Fotógrafo não foram utilizadas nesta classificação
pois exibiriam um resultado tendencio...
A principal vantagem deste método é sua fácil visualização, e podem-se perceber
embutidos alguns conceitos fotográficos :
...
necessitaria de uma amostra mais enriquecida que então ajudaria o especialista a
elucidar esta questão.
Vale ressaltar aqu...
V ) APROFUNDANDO O PROGRAMA EXIFTOOL [20]
V.1) COMO ALTERAR OS METADADOS DA IMAGEM ?
Gravar e modificar metadados em arqui...
O código do programa que executa a gravação foi concebido sem utilizar as rotinas de
leitura, facilitando o processo de te...
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Cristina Amazonas Cabral
Próximos SlideShares
Carregando em…5
×

Cristina Amazonas Cabral

365 visualizações

Publicada em

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
365
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
1
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Cristina Amazonas Cabral

  1. 1. MINERAÇÃO DE DADOS PARA CLASSIFICAÇÃO FOTOGRÁFICA Cristina Amazonas Cabral DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS PROGRAMAS DE PÓS-GRADUAÇÃO DE ENGENHARIA DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE MESTRE EM CIÊNCIAS EM ENGENHARIA CIVIL. Aprovada por: ________________________________________________ Prof. Nelson Francisco Favila Ebecken, D. Sc. ________________________________________________ Profa. Beatriz de Souza Leite Pires de Lima, D. Sc. ________________________________________________ Prof. André de Souza Parente, Ph. D. RIO DE JANEIRO, RJ - BRASIL SETEMBRO DE 2006
  2. 2. CABRAL, CRISTINA AMAZONAS Mineração de Dados para Classificação Fotográfica [Rio de Janeiro] 2006 VIII,161p. 29,7 cm (COPPE/UFRJ, M.Sc., Engenharia Civil, 2006) Dissertação - Universidade Federal do Rio de Janeiro, COPPE 1- Formato EXIF 2- Mineração de Dados 3- Classificação Fotográfica I. COPPE/UFRJ II. Título (série) ii
  3. 3. Ao Antonio, iii
  4. 4. AGRADECIMENTOS Ao prof. Nelson F.F. Ebecken, por sua sua sabedoria e leveza ao orientar; e por acreditar nesta pesquisa me oferecendo esta oportunidade. Ao prof. Dr. André Parente por tão gentilmente abrir mão de compromissos e me dar a honra da sua participação na banca. Ao programador Phil Harvey, por toda a sua atenção comigo e dedicação em instituir o formato de arquivo padrão EXIF. Ao prof. Ricco Rakotomalala, pela gentileza no suporte acerca do programa Tanagra. Ao prof. Joaquim Marçal, por acreditar nesta pesquisa desde o início e ser um incansável pesquisador buscando novos caminhos para agilizar a catalogação de documentos e imagens. Aos fotógrafos Alex Ferro, Maurício Andrade e Roberto Costa Pinto pelo interesse em compartilhar o conhecimento acerca de equipamentos fotográficos e técnica aplicada. À Maria Isabel , Fernanda e todo o pessoal da escola Amanhecendo por todo apoio, suporte e carinho dispensado ao Antonio e a mim. Ao Mario, pelo apoio e carinho, sem os quais este trabalho não seria possível. Ao Antonio, que nasceu com este trabalho e ilumina o meu caminho. Aos amigos Vane e Marcelo, por toda a força e crença no meu potencial. À Elisângela, fiel parceira e amiga, pela estrutura e apoio para tocar esta empreitada. iv
  5. 5. Resumo da Dissertação apresentada à COPPE/UFRJ como parte dos requisitos necessários para a obtenção do grau de Mestre em Ciências (M. Sc.) MINERAÇÃO DE DADOS PARA CLASSIFICAÇÃO FOTOGRÁFICA Cristina Amazonas Cabral Setembro/2006 Orientador: Nelson Francisco Favila Ebecken Programa: Engenharia Civil Este trabalho estuda a viabilidade da aplicação de métodos de classificação supervisionada com base nos metadados de fotografias digitais selecionadas e classificadas pela autora segundo um critério subjetivo. As fotografias foram extraídas da Internet e generalizadas como retrato ou paisagem, compondo uma amostra com quantidades equivalentes nas duas classes propostas. A massa de dados foi construída a partir das informações pré-gravadas por câmeras fotográficas digitais no arquivo EXIF (Exchangeable Image File Format for Digital Still Cameras), um padrão para formatos de arquivos de imagem digital mantido pela JEITA (Japan Electronics and Information Technology Industries Association). Os metadados discriminados neste arquivo acerca da técnica utilizada no ato fotográfico sugerem a possibilidade de criação de um modelo para classificação fotográfica. v
  6. 6. Abstract of Dissertation presented to COPPE/UFRJ as a partial fullfillment of the requirements for the degree of Master of Science (M. Sc.). DATA MINING FOR PHOTOGRAPHIC CLASSIFICATION Cristina Amazonas Cabral September/2006 Advisor: Nelson Francisco Favila Ebecken Department: Civil Engineering This work studies the feasible of supervising classified methods applied to digital photography metadata. The photos were selected and classified by the author according to a subjective criteria. The sample was extracted from the Internet and is composed of equitative quantities on the two proposed classes : landscape or portrait. The input data was built based on the information recorded by digital cameras at the EXIF file format (Exchangeable Image File Format for Digital Still Cameras), a standard for the digital image file supported by JEITA(Japan Electronics and Information Technology Industries Association). The metadata stamped in this file concerning the technique applied at the moment of taking pictures do suggest the making of a model for photo classification. vi
  7. 7. ÍNDICE I) INTRODUÇÃO I.1) SINOPSE...................................................................................................... 1 I.2) OBJETIVO................................................................................................... 1 I.3) RELEVÂNCIA.............................................................................................. 1 I.4) A PROBLEMÁTICA DA INDEXAÇÃO DE IMAGENS......................................... 3 I.5) ESTADO DA ARTE....................................................................................... 5 I.6) MOTIVAÇÃO............................................................................................... 7 I.7) QUESTÕES LEVANTADAS PARA PESQUISA................................................... 9 I.8) RESULTADOS ESPERADOS.......................................................................... 9 I.9) DESCRIÇÃO DOS DEMAIS CAPÍTULOS.......................................................... 9 II) CARACTERIZAÇÃO DAS FOTOGRAFIAS II.1) CATALOGAÇÃO EM ARQUIVOS FOTOGRÁFICOS......................................... 10 II.2) AS CATEGORIAS FOTOGRÁFICAS.............................................................. 10 II.3) A TÉCNICA FOTOGRÁFICA........................................................................ 13 II.4) A MATEMÁTICA E A TÉCNICA FOTOGRÁFICA............................................ 21 II.5) O ARQUIVO EXIF......................................................... ............................ 21 II.6) PROGRAMAS QUE EDITAM E/OU MANIPULAM O EXIF................................ 23 III) COMPOSIÇÃO DA AMOSTRA III.1) BUSCA DAS FOTOGRAFIAS : QUAIS SITES DE FOTOS : ONDE ?.................. 26 III.2) FOTÓGRAFOS ESCOLHIDOS...................................................................... 28 III.3) DETALHAMENTO DO EXIF NO DEPOSITÓRIO DE FOTOS PBASE................ 30 III.4) VARIÁVEIS PARA ANÁLISE : O QUE FOI ESCOLHIDO DO EXIF................... 32 III.5) VALIDAÇÃO DA AMOSTRA : LIMPEZA, CAMPOS NULOS............................ 36 IV) MINERAÇÃO DE DADOS IV.1) INTRODUÇÃO À IA................................................................................... 38 IV.2) VISUALIZAÇÃO DA AMOSTRA.................................................................. 39 IV.3) MÉTODO DE CLASSIFICAÇÃO PROPOSTO................................................. 43 IV.4) ANÁLISE DOS RESULTADOS..................................................................... 46 IV.5) CONCLUSÕES ACERCA DO MÉTODO......................................................... 49 vii
  8. 8. V) APROFUNDANDO O PROGRAMA EXIFTOOL V.1) COMO ALTERAR OS METADADOS DA IMAGEM ?......................................... 50 V.2) CAMPOS OBRIGATÓRIOS DOS FORMATOS.................................................. 51 V.3) CARACTERÍSTICAS DO PROGRAMA............................................................ 52 V.4) O PROGRAMA............................................................................................ 52 V.5) GRUPOS.................................................................................................... 56 V.6) PRIORIDADES DE GRUPOS......................................................................... 57 V.7) SINTAXE................................................................................................... 57 V.8) PROBLEMAS CONHECIDOS DO JPEG.......................................................... 58 V.9) EXEMPLOS DE APLICAÇÕES FEITAS A PARTIR DO EXIFTOOL..................... 59 VI) QUESTÕES LEVANTADAS E PESQUISA FUTURA VI.1) A IMPORTÂNCIA DOWORKFLOW DE TRABALHO DO FOTÓGRAFO............. 61 VI.2) GERAÇÃO AUTOMÁTICA DA MASSA DE DADOS....................................... 62 VI.3) PROVER AUTOMATICAMENTE ÍNDICES DE CONSULTA.............................. 62 VI.4) A AUTENTICIDADE DO REGISTRO FOTOGRÁFICO...................................... 63 VI.5) OUTRAS VARIÁVEIS DO EXIF QUE PODEM INFERIR CONHECIMENTO ....... 65 VII) CONCLUSÕES FINAIS.......................................................................................... 67 VIII) REFERÊNCIAS BIBLIOGRÁFICAS....................................................................... 69 IX) ANEXO I : FOTÓGRAFOS........................................................................................ 75 X) ANEXO II : AMOSTRA DE FOTOS (METADADOS)...................................................... 83 XI) ANEXO III : RETRATOS.......................................................................................... 120 XII) ANEXO IV : PAISAGENS....................................................................................... 128 XIII) ANEXO V : EXIF TAGS....................................................................................... 136 viii
  9. 9. I ) INTRODUÇÃO I.1) SINOPSE O presente trabalho irá aplicar a técnica de mineração de dados num conjunto de fotografias selecionadas e classificadas segundo um critério subjetivo. A massa de dados será formada a partir dos metadados de fotografias digitais extraídos do arquivo EXIF (Exchangeable Image File Format for Digital Still Cameras), um padrão mantido pela JEITA (Japan Electronics and Information Technology Industries Association) para formatos de arquivos de imagem digital. Todas as fotografias foram selecionadas da Internet. I.2) OBJETIVO O objetivo deste trabalho é identificar padrões que possam ser extraídos a partir da análise detalhada da técnica utilizada no ato fotográfico e estabelecer modelos e/ou estudos para classificação automática de fotografias digitais. I.3) RELEVÂNCIA A fotografia vem sendo cada vez melhor aceita como fonte de informação para pesquisa em diversas áreas1 por expressar melhor do que um texto escrito determinados conceitos2 . Embora a imagem não elimine a necessidade do texto acoplado, muitas vezes ela é mais importante do que ele, e para que seja melhor aceita academicamente, a fotografia técnica deve ser feita de tal forma que não altere a essência do objeto fotografado. Ela deve ser nítida e ter proporções e cores fiéis à realidade. Padronizar, formular e/ou estruturar a técnica deste tipo de fotografia é sem dúvida bastante desejável, pois pode formar laços de união no polêmico confronto entre imagem e palavra : 1 Antropologia, Sociologia, Botânica, Biologia, Psicologia, Psiquiatria, Medicina, etc. 2 Exemplos de fotografias usadas como instrumento de pesquisa : cocar de índio com penas coloridas, retrato de um psicótico, panorâmica de casas de uma favela, crianças vivendo na rua, insetos, plantas, etc. 1
  10. 10. UMA IMAGEM VALE MAIS QUE MIL PALAVRAS X UMA PALAVRA PODE VALER MIL IMAGENS Entender a imagem e “absorver” a informação nela contida é sem dúvida um processo bastante subjetivo e muita pesquisa interdisciplinar vem sendo desenvolvida neste sentido. “A imaginação é a capacidade de codificar fenômenos de quatro dimensões em símbolos planos e descodificar as mensagens assim codificadas. Imaginação é a capacidade de fazer e decifrar imagens” [31] Esta natureza mágica e subjetiva das imagens pode ser definida como não estruturada3 [43] no léxico informata. Isto significa que ela está diretamente ligada à percepção humana do que está sendo representado. O crescente volume de imagens digitais demanda um arquivamento cada vez mais eficiente, e será de grande valia qualquer tipo de formalização que permita a automação deste processo interpretativo da fotografia digital. É curioso notar que o processo de manipulação e edição fotográfica se acelerou muito com o advento digital, mas a classificação não acompanhou este progresso. Instituições Públicas e Privadas que administram acervos fotográficos para pesquisa enfrentam grande dificuldade de gerenciar e acoplar metadados às fotografias de forma padronizada e eficiente. A Divisão de Iconografia da Fundação Biblioteca Nacional administra um acervo de aproximadamente 25.000 fotografias do Séc. XIX4 ; o Instituto Moreira Salles (IMS) construiu no Rio de Janeiro uma Reserva Fotográfica e incorpora cada vez mais Coleções de Fotografia ao seu acervo5 , estimado em cerca de 30.000 documentos fotográficos. A tecnologia digital aplicada nesta área é recente especialmente aqui no Brasil, e há pouco vêm-se descobrindo a importância da técnica de Banco de Dados neste processo. 3 Difícil padronização 4 Coleção Theresa Christina Maria, que incorpora fotografias colecionadas pelo Imperador D.Pedro II. 5 Coleção Gilberto Ferrez, José de Medeiros, Marcel Gautherot, etc. 2
  11. 11. Incorporar fotografias digitais contemporâneas às coleções antigas ainda é um desafio, e neste sentido toda padronização que puder ser instituída é bastante desejável. I.4) A PROBLEMÁTICA DA INDEXAÇÃO DE IMAGENS A partir da digitalização das imagens e audio houve uma grande ruptura no conceito de DADO ou INFORMAÇÃO. O que antes se resumia a textos e números, hoje é também constituído por imagens, audio, e suas combinações. O grande boom da digitalização das imagens ocorreu devido à enorme facilidade de manipulação destas. Com este novo instrumento ficou muito mais fácil criar sobreposições, colagens, cortes, efeitos de textura, cor, etc; com uma precisão bastante satisfatória. Houve uma popularização da manipulação das imagens, e particularmente na fotografia isto implicou numa calorosa discussão sobre o seu conceito de representação da realidade. À margem desta discussão, a questão que instiga esta pesquisa é o conteúdo interpretativo das fotografias utilizadas como instrumento de pesquisa e os conceitos e informações envolvidos. É crescente a necessidade de técnicas eficientes de armazenamento, indexação e recuperação deste novo tipo de informação. Existe uma enorme brecha entre as descrições valoradas dadas pelo computador e as conceituais fornecidas pelos usuários para encontrar as imagens desejadas. Podemos generalizar as classes de consulta a imagens em bancos de dados como sendo : cor, textura, esboço, forma, volume, relações espaciais, browsing, atributos objetivos, atributos subjetivos, movimento, texto, e domínios conceituais [36]. Consultas por COR, TEXTURA e ESBOÇO permitem que usuários identifiquem estas características dentro da imagem que desejam selecionar, e o casamento deve ser definido com graus de semelhança. A classe de consultas por FORMA tem uma contra- partida nas imagens 3D referenciadas como recuperação pelo VOLUME. 3
  12. 12. A categoria de RELAÇÕES ESPACIAIS lida com uma classe de consultas baseada nas relações espaciais e topológicas entre os objetos da imagem. Estas relações podem estender-se sobre um vasto espectro desde relações direcionais até adjacências, superposições e relações do tipo “está contido em” envolvendo vários (ou um par de) objetos. Consultas por BROWSING são executadas quando os usuários estão incertos quanto ao que desejam ou não estão familiarizados com a estrutura e tipos de informação disponíveis. A consulta por ATRIBUTOS OBJETIVOS é semelhante às linguagens de consulta estruturadas utilizadas para recuperação em BD’s alfanuméricos e se baseia no casamento exato destes valores. Ao contrário, a consulta por ATRIBUTOS SUBJETIVOS é caracterizada pela presença de atributos que podem ser interpretados de maneira diferente por cada usuário. Por exemplo, num BD de rostos de pessoas onde o atributo “sombrancelha” assume três valores : normal, arqueada ou reta. O conceito não muda, mas os valores associados ao conceito dependem da interpretação do usuário. Uma pessoa pode definir uma sombrancelha como “arqueada”, enquanto outra considera a mesma “normal”. Consultas por MOVIMENTO recuperam sequências espaço-temporais de imagens representando um fenômeno dominante que varie no tempo ou num espaço geográfico. A recuperação de imagens baseada num TEXTO associado envolve técnicas de recuperação da informação e processamento de linguagem natural. Todas as classes de consulta acima podem ser usadas como operadores fundamentais para formular uma classe de consultas complexa, a que chamamos de recuperação por DOMÍNIOS CONCEITUAIS. Um exemplo desta classe seria recuperar imagens de “montanhas cobertas de neve” (esboço + cor + textura). A consulta pelo domínio conceitual deve ser expressa como uma composição dos principais operadores sem envolvimento do usuário, empregando-se sinergeticamente as várias classes de consultas genéricas de forma transparente. 4
  13. 13. Podemos citar alguns exemplos que usam estas classes de consulta em Bancos de dados de fotografias : - Em [4] foi desenvolvido um sistema que recupera rostos de pessoas a partir de um retrato falado descrito por testemunhas confrontado com fotografias padronizadas catalogadas num Banco de Imagens (fotos de criminosos feitas num mesmo local, com iluminação e equipamento conhecido, compondo um mesmo quadro e ângulo de visão). Utilizam para tanto graus de semelhança em esboço e cor; e conceitos associados a atributos subjetivos. - Em [29] foram criados domínios conceituais para definir situações como “jogos de futebol” com o objetivo de localizar estações de TV que pudessem estar exibindo programas neste domínio. Para tanto é definido que a imagem deve conter determinado percentual da cor verde (correspondendo ao gramado), ao menos um objeto com graus de semelhança a um círculo ligeiramente branco (bola de futebol), e muitos objetos em movimento (jogadores correndo em campo). Observa-se que a fotografia como se apresenta para pesquisa não segue padrões que possam ser determinados por estas classes de consulta, e portanto aplicar algoritmos neste sentido se mostra pouco produtivo devido ao processamento pesado que evocam. I.5) ESTADO DA ARTE Ainda não foi encontrada nenhuma aplicação propondo a classificação de fotografias a partir de metadados interpretados e confrontados frente a padrões técnicos fotográficos. Um exemplo de aplicação do EXIF em consultas a imagens é encontrado na plataforma de busca na Internet ALEXA [47] um ambicioso projeto de Mineração de Dados que propõe o armazenamento e gerenciamento de documentos na grande rede. A interface de consulta a imagens (Figura 1) por eles proposta inclui campos extraídos do EXIF, mas sem interpretação ou abstração de categorias. Apesar de bastante interessante e inovadora, esta proposta ainda não atende às necessidades de consulta do usuário que dificilmente encontrará as fotografias desejadas a partir da informação “crua” do EXIF. 5
  14. 14. Como a maioria das fotos cadastradas não exibe texto acoplado, acredita-se que isto inviabilizou a pesquisa pelo campo “Search Image Text”. Figura 1 : Interface de Consulta a imagens do projeto ALEXA No universo acadêmico existem várias propostas de interpretação da imagem, mas estas comumente são baseadas na imagem em si, não em seus metadados. A recuperação da imagem a partir do seu conteúdo é sem dúvida um dos grandes desafios atuais em Bancos de Dados, e muita pesquisa vem sendo desenvolvida neste sentido [43]. 6
  15. 15. Uma proposta para formalizar a subjetividade da imagem é apresentada em [53]. A partir de um conjunto de 135 (cento e trinta e cinco) imagens interpretadas por 8 (oito) pessoas os autores geram um modelo baseado em Lógica Fuzzy que supostamente “captura a subjetividade da percepção visual humana”. A proposta por si só já soa bastante pretenciosa e intangível diante da amostra considerada; mas também o conceito de subjetividade é tendencioso e se limita apenas à percepção visual do olho humano no sentido da direção (horizontal e vertical). I.6) MOTIVAÇÃO EM INTELIGÊNCIA ARTIFICIAL A tendência da área de Inteligência Artificial (IA) é de utilizar cálculos complexos6 para transformar imagem num conjunto numérico para processamento e interpretação automática. Os algoritmos são comumente aplicados na matriz de pixels, tornando o processamento bastante pesado e inviável diante de grandes volumes de imagens. Apesar de compreensível o desejo de se transformar qualquer tipo de informação num conjunto numérico processável no computador, também é fato que a imagem, e em especial a fotografia, apresenta conceitos que não podem ser abstraídos a partir de fórmulas matemáticas, mas apenas pela interpretação humana. “O significado da imagem é mágico e encontra-se na sua superfície podendo ser captado num golpe de vista.” [31] Ainda não foi encontrada nenhuma proposta de aplicação de algoritmos de IA nos METADADOS da imagem. Esta proposta se diferencia das demais porque se aplica aos metadados da fotografia digital, que são informações ESSENCIALMENTE MATEMÁTICAS e se referem a questões TÉCNICAS da fotografia. Mesmo com um APELO SUBJETIVO, o universo aqui explicitado é OBJETIVO. 6 Diagramas de frequências, Transformada Fourier, Histogramas de cores, Segmentação da imagem, etc. 7
  16. 16. EM FOTOGRAFIA Há alguns anos, quando o universo da fotografia ainda se limitava ao uso da película, um dos exercícios iniciais era sair para fotografar com um filme e um caderninho onde se anotavam os dados técnicos referentes a cada foto feita (abertura, velocidade, objetiva, filtros, etc). O processo era totalmente manual e apenas após a revelação do filme era possível avaliar os resultados confrontando a foto com as anotações. Desta forma aprendia-se a perceber as diferenças imagéticas, visualizando o que era registrado e como funcionava a técnica fotográfica e as limitações da objetiva e câmera. Como o advento digital, além de não ser necessário esperar o tempo de revelação do filme, estas anotações são feitas automaticamente pela câmera e registradas no arquivo EXIF. O aprendizado da fotografia apresenta-se assim mais prático e rápido e a intenção deste trabalho é incentivar o aprimoramento da técnica fotográfica e promover a arte digital, fazendo uso de uma informação comumente desprezada e cada vez mais desconhecida. Além disso, estudar a fundo a técnica fotográfica pode talvez indicar a presença de uma “gramática” 7 aplicável à fotografia, legitimando um conceito polêmico relacionado à “linguagem fotográfica” 8 . Note que uma linguagem fotográfica não implica no domínio da técnica, mas de alguma forma faz uso dela. De forma análoga, grandes escritores não necessariamente dominam as regras impostas pela literatura, mas fazem uso da gramática mesmo que intuitivamente. Um grande desafio seria tentar definir uma gramática aplicável à fotografia onde estariam estabelecidas as relações entre o fotógrafo, a imagem e os instrumentos de construção relacionados (composição, enquadramento, luz e foco). 7 É sabido que a gramática em todas as línguas faladas no mundo segue sempre um mesmo padrão estrutural composto por : sujeito + ação + objeto. Estes três conceitos podem ser mais ou menos valorizados conforme a cultura, mas sempre seguem esta formação sintática [40]. 8 “Podemos identificar como instrumentos de construção de uma linguagem fotográfica a composição, o enquadramento, a luz e sombra, o foco, o diafragma, a velocidade do obturador e as objetivas (determinam o ângulo de visão); bem como a articulação destes instrumentos no ato de fotografar. Mesmo sendo eminentemente sensorial e sensitiva, há no processo de produção da linguagem fotográfica uma certa racionalidade para a construção, leitura e absorção da imagem. Talvez por isso a fotografia, mais do que o discurso escrito, induza o receptor a uma imediata associação de idéias e sentimentos recorrentes à informação apresentada” [37] 8
  17. 17. I.7) QUESTÕES LEVANTADAS PARA PESQUISA - É possível determinar automaticamente quais fotografias são retratos ou paisagens ? - Como formalizar (mesmo que de forma inexata) “gêneros” de fotografia ? - O que pode ser identificado automaticamente de fato a partir dos metadados ? - Como confrontar padrões matemáticos com conceitos subjetivos ? - A autoria da imagem é identificável a partir da técnica utilizada ? - Existe uma “Linguagem Fotográfica” particular a cada fotógrafo ? I.8) RESULTADOS ESPERADOS - Avaliar o formato EXIF e de que maneiras ele pode ser estendido para incorporar outras informações pertinentes à classificação fotográfica; - Identificar novas categorias fotográficas e/ou legitimar as propostas inicialmente; - Propor padrões para implementação de filtros de classificação automática; - Verificar se existem padrões técnicos associados ao estilo de fotografar e/ou às categorias de classificação. I.9) DESCRIÇÃO DOS DEMAIS CAPÍTULOS O próximo capítulo abordará as questões envolvidas na caracterização das fotografias. Primeiramente indicará a forma atual de catalogação de fotografias em arquivos de museus e instituições, depois estabelecerá as categorias fotográficas abordadas, discriminará a técnica fotográfica e seus conceitos e em seguida descreve o arquivo EXIF e como ele é editado e visualizado. O terceiro capítulo descreve os critérios usados para formar a amostra, que será visualizada e classificada e avaliada a partir da Mineração de Dados no quarto capítulo. No quinto capítulo será detalhado um programa que se mostrou bastante valioso durante a pesquisa, para enfim levantar questões recorrentes e poss´veispesquisas futuras. Ao final é concluído o trabalho e apresentada bibliografia. Em anexo os detalhamentos dos fotógrafos, da planilha gerada como amostra, as fotografias selecionadas (retratos e paisagens), além dos campos detalhados dos metadados do arquivo digital EXIF. 9
  18. 18. II ) CARACTERIZAÇÃO DAS FOTOGRAFIAS II.1) CATALOGAÇÃO EM ARQUIVOS FOTOGRÁFICOS Segundo o Manual para catalogação de documentos fotográficos desenvolvido pela FUNARTE em parceria com a Biblioteca Nacional [57], a indexação dos documentos deve fazer uso de vocabulário controlado por especialistas e se compõe basicamente de quatro grandes conjuntos de termos que irão descrever : 1º) Personalidades : nomes próprios (quem ?) 2º) Logradouros ou Instituições : nomes próprios (onde ?) 3º) Descritores de Conteúdo : correspondem aos termos genéricos e hierárquicos utilizados em dicionarios de Tesauro e indicam qual a informação exibida. 4º) Descritores de Forma : indicam forma ou “tipo” de imagem que se apresenta. Ex.: retrato, paisagem, caricatura, abstração, etc. (como / de que forma ?) Este processo é totalmente manual e exaustivo, e aqui neste trabalho o modelo proposto irá sugerir dois descritores de forma para fotografias, que serão referenciados como categorias fotográficas e detalhados na próxima seção. Note que este manual propõe padrões que incorporam todo e qualquer tipo de documento imagético : fotografias do século XIX, daguerreótipos, impressões fotomecânicas, pinturas, gravuras, xilogravuras, desenhos, etc. Como o universo aqui explorado é apenas de fotografias contemporâneas digitais, foram também pesquisadas as formas de organização nos acervos particulares de profissionais da área. II.2) AS CATEGORIAS FOTOGRÁFICAS A primeira questão desta pesquisa será definir as categorias do conjunto de fotografias escolhido para formar a massa de dados. Esta padronização pode ser tão complexa quanto desejarmos. Definir “categorias de alto nível” é o que é proposto aqui, mesmo com o risco de não incorporar todo o universo fotográfico desejado. 10
  19. 19. Através de enquetes em fóruns de fotografia [51] foi constatado que cada fotógrafo divide seu arquivo conforme o seu uso e/ou o tipo de cena que a foto exibe. A seguir alguns exemplos de divisão em categorias citados : - Retrato / Paisagem / Macro; - Submarinas / Aéreas / Terrestres / Abstrato; - Fotojornalismo / Esporte / Publicidade / Eventos / Ciência / Perícia; - Moda / Produto / Urbano; - Insetos / Animais / Flores / Plantas Fotógrafos tendem a ser um tanto desorganizados, e os que se propõe um método de organização o fazem a partir de softwares comerciais9 , utilizando-se de pouco ou nenhum conhecimento da técnica de Banco de Dados. Foi constatado que aqui no Brasil são MUITO RAROS os fotógrafos que conhecem o EXIF, e mesmo estes não fazem uso desta informação na catalogação dos seus arquivos. Diante do que foi exposto até agora, parece razável avaliar o problema de categorização por três pontos de vista : 1º ) TIPO DE ENQUADRO : Retrato / Paisagem / Macro 2º ) MEIO ONDE FOI FEITA A FOTO : Aérea / Terrestre / Submarina 3º ) APLICAÇÃO : Jornalismo / Esporte / Publicidade / Eventos / Ciência / Abstrato / etc. A idéia é que dividindo o problema em três, consideram-se combinações entre as categorias para arquivamento10 e possibilitam-se soluções parciais ao problema de classificação. Esta divisão possivelmente engloba grande parte do universo fotográfico desejado na pesquisa. Grandes Bancos de Dados de Imagens (BI) se utilizam de ferramentas como o Thesaurus [52], hierarquizados numa BD paralela associada ao BI para cobrir o enfoque dado no terceiro ponto de vista aqui proposto. Infelizmente a quantidade e 9 Cumulus, Portfolio, Photo Organizer, Photo Album, etc. 10 Por exemplo de uma fotografia de peixe impressa num livro de ciências seria arquivada como (Retrato, Submarina, Ciência). 11
  20. 20. complexidade da hierarquia de termos destes dicionários inviabiliza a aplicação de algoritmos de IA. Este ponto de vista que engloba o que chamamos de “Aplicação da foto” não será abordado nesta pesquisa pois, além de ter um domínio extenso e complexo de se formalizar, não parece ter ligação alguma com as informações do EXIF, mas sim com outros formatos de arquivo de imagem bastante utilizados na catalogação, como o IPTC (International Press Telecommunications Council) e o XMP (eXtensible Metadata Platform). Vale mencionar que neste sentido existe intensa pesquisa interdisciplinar onde destaca- se o trabalho desenvolvido pelo DUBLIN CORE METADATA INITIATIVE (DCMI) [13], um fórum aberto engajado no desenvolvimento de padrões de interoperabilidade online para atender a uma ampla gama de propostas e modelos de negócios. O DCMI é uma organização internacional, independente e aberta dedicada a promover a adoção global de padrões de metadados que facilitem a busca, compartilhamento e gerenciamento da informação. Há neste grupo museólogos, historiadores, arquivólogos, (etc.) dedicando- se exclusivamente à catalogação de imagens digitais para atender a um objetivo global. Um outro exemplo de enfoque é o adotado pela Divisão de Iconografia da Fundação Biblioteca Nacional, que elaborou um Tesauro de gêneros de documentos fotográficos, onde encontramos os seguintes conceitos : RETRATO – Representação gráfica, em especial do rosto, de pessoas ou animais, geralmente posadas, vivas ou mortas. Imagens cujo objetivo primordial é retratar um indivíduo ou grupo de indivíduos – e não aquelas onde os indivíduos são apenas parte de uma cena ou evento. Termos mais específicos para retrato – retrato de grupo, retrato post-mortem, etc. [6] PAISAGEM – Vista geral ou ampla de cenários naturais; pode incluir pessoas, animais ou objetos feitos pelo homem – mas estes devem ter importância secundária na composição. Normalmente, as paisagens são realizadas a partir de um ponto de vista elevado ou distante, tal como uma vista a partir de um morro. Não inclui imagens de 12
  21. 21. detalhes de uma paisagem, feitas ao nível do solo como por exemplo, de uma árvore. Termos mais específicos para paisagem – paisagem rural, paisagem urbana, etc. [7] Nesta pesquisa serão explorados apenas os dois primeiros pontos de vista propostos principalmente porque apresentam um domínio pequeno e conhecido; e ainda porque podem ter relação direta com a técnica fotográfica utilizada e detalhada no EXIF. Vale ressaltar que estas categorias sugeridas são baseadas em experiência pessoal bem como em enquetes feitas em fóruns de fotografia [51]. A intenção aqui é uma abordagem mais ampla, num nível conceitual mais alto. Serão considerados como retratos e paisagens um universo fotográfico mais amplo do que o comumente adotado para estes termos em dicionários de Tesauro. II.3) A TÉCNICA FOTOGRÁFICA A primeira questão em relação ao ato fotográfico [12] diz respeito à composição do quadro. Para registrar a cena vislumbrada, a variável é o ângulo de visão obtido a partir de uma distância determinada pelo posicionamento do fotógrafo. Assim dá-se a escolha da objetiva mais adequada para compor a fotografia imaginada ou escolhida. Este ângulo de visão e sua profundidade de campo11 são baseados em Física Ótica e podem ser calculados a partir de especificações da objetiva e do plano da foto [1]. A distância focal da objetiva é expressa em milímetros e determina o ângulo de visão coberto pela lente. Seus valores são numéricos variando de 4 até 1200mm aproximadamente. A distância focal é sempre relativa às dimensões do plano que é sensibilizado pela luz. Nas câmeras digitais [55] este valor é dado pelo tamanho do sensor. Na Tabela 1 estão descritos valores e conceitos associados com base nas dimensões do filme fotográfico padrão 35 mm. 11 É a extensão da área da imagem que aparece totalmente em foco. Relaciona-se com a distância de focalização (1/3 para frente e 2/3 para trás), ao tipo de objetiva (quanto mais aberta e luminosa, maior a profundidade de campo) e à abertura do diafragma (quanto mais fechado, maior a profundidade de campo). 13
  22. 22. OBJETIVA DISTÂNCIA FOCAL Olho-de-Peixe 4 a 8 mm Grande Angular 14 a 35 mm Normal 50 mm Meia-Tele 70 a 135 mm Tele-Objetiva Acima de 200 mm Tabela 1 : Tipos de Objetivas para filmes 35mm Quanto menor a distância focal da objetiva, maior o ângulo coberto no enquadramento, mais luminosidade entra pela lente, podendo haver distorção nos primeiros planos e “achatamento” do plano no infinito. Nas Olho-de-Peixe há extrema distorção nos primeiros planos, gerando imagens bastante diferenciadas da realidade. Já as objetivas Grande Angulares aumentam um pouco a realidade em primeiro plano mas não causam tanta estranheza e são comumente utilizadas em fotojornalismo por serem rápidas, terem boa profundidade de campo e amplo enquadramento. A objetiva Normal12 apresenta um enquadramento semelhante ao visualizado pelo olho humano, sem distorções. Conforme se aumenta a distância focal, fecha-se o ângulo de visão enquadrado e menos luz entra pela objetiva. As Tele-Objetivas são lentes lentas, pesadas, com pequena profundidade de campo e comumente usadas para “recortes” da realidade pois “buscam” objetos distantes e os trazem para perto respeitando e valorizando suas dimensões e características. São portanto bastante adequadas para compor retratos de um modo geral; sendo bastante utilizadas por fotógrafos papparazzi, registro de jogos de futebol, astrofotografia, etc. A experiência fotográfica mostra que valoriza-se um objeto mantendo foco exclusivo nele e desfocando o restante da imagem. A técnica para isso é abrir o diafragma13 e forçar uma profundidade de campo pequena, caracterizando um retrato clássico. Para paisagens, a técnica sugere o contrário : fecha-se o diafragma para que exista foco em toda a imagem. 12 São objetivas que apresentam o mesmo comprimento focal da dimensão do plano fotográfico (sensor digital ou filme). Nos negativos 6x6 a lente normal equivale a 75mm, no 6x9 equivale a 105mm, e em algumas câmeras digitais Canon a lente normal equivale a 30mm. 13 Orifício por onde passa a luz da objetiva para o filme ou sensor da câmera 14
  23. 23. O valor da abertura do diafragma é medido por uma escala de valores que se chama números f [1], variando de 1.0 (Canon 50mm) a 90 (Hasselblad 500mm). Quanto maior este valor, mais fechado está o diafragma, menos luz passa pela objetiva e maior a profundidade de campo. A relação entre os números f é proporcionalmente decrescente. Tomando por exemplo a escala da exposta na Figura 2, a abertura determinada por um número f posterior deixa passar a metade da luz do f anterior : 1.2 1.4 2 2.8 4 5.6 8 11 16 22 32 Obs.: A partir dos sistemas eletrônicos temos números f intermediários a esta escala, sempre proporcionais entre si, mas na relação de até 1/3, exibindo valores como 3.2, 6.1, 7.3, 9.5, etc. Figura 2 : Escala de números f (valores de abertura de diafragma) Aqui tambem se aplicam conceitos como “Abertura mediana”, considerada o valor f 5.6; e diagragma “aberto” ou “fechado” os valores menores e maiores a este na escala, respectivamente. A quantidade de luz que sensibiliza o filme é então determinada pela combinação desta abertura com a velocidade do obturador14 . É desta forma que trabalham os fotômetros das câmeras, medindo a quantidade exata de luz e traduzindo-a numa abertura e velocidade, calculadas em função da sensibilidade15 do filme ou sensor da câmera. É sabido que para “congelar” objetos em movimento devem ser usadas velocidades altas; e para obter efeitos borrados ou riscados usam-se baixas velocidades. Este valor varia normalmente dentro de uma fração de segundo, podendo ser tão rápido quanto 1/8.000seg; e tão lento quanto se deseje a partir da opção “bulb” (longas exposições sem limite de tempo). A foto da Figura 3 foi feita numa noite de lua cheia com filme Fuji Velvia 50 asa, 1hora de exposição e diafragma 4.0 (crédito fotógrafo I). 14 É o tempo em que o obturador da câmera permanece aberto, deixando a luz que passa pelo diafragma atingir o filme ou sensor da câmera digital. Também chamado de Tempo de Exposição. 15 Medida pelo padrão ISO, em asa. Será descrito mais adiante nesta seção. 15
  24. 24. Figura 3 : Tempo de exposição de 1 hora A técnica sugere valores-padrão para se obter imagens nítidas de determinados assuntos16 . Em contrapartida uma imagem “borrada” e sem foco pode ser “esteticamente desejável” e caracterizar melhor o movimento. Muitos leigos em fotografia podem se surpreender ao vislumbrar fotos de uma mesma cena de cachoeira feita com velocidades extremas do obturador. Outra questão técnica diz respeito ao tipo de luz ambiente e artificial que será usada no ato fotográfico. A partir do conhecimento do tipo de luz que se “enfrenta”, escolhe-se o tipo de filme adequado e filtros de correção e ajuste. Para tanto usam-se dois conceitos : a intensidade da luz e a temperatura de cor. A intensidade da luz é medida pelo padrão ISO (International Organization for Standardization), numa escala de valores denominada “asa”. Quanto menor o valor da asa, mais fino o grão do filme, a capacidade de absorção de luz é menor, em compensação o detalhamento da imagem é semelhante ao de um desenho com ponta fina pois a quantidade de grãos é demasiada. São os filmes ditos “lentos”, comumente usados com velocidades baixas e auxílio do tripé para fotografar com precisão de detalhes objetos estáticos. Existiram filmes não pancromáticos17 com sensibilidade ISO 5 asa e filmes negativos 35mm pancromáticos de 25 asa, comercializados até menos de uma década atrás. 16 Carro em movimento : 1/500seg., pedestre em movimento : 1/125seg., retrato de criança : 1/250seg. Para se disparar com câmera na mão sem tremer e sem apoio do tripé recomenda-se utilizar velocidade mínima de 1/60seg., sendo 1/125seg. o ideal. Profissionais experientes chegam a conseguir imagens nítidas com 1/4seg. 17 Filmes que não eram sensíveis à luz verde e vermelha, usados na fotografia anterior a 1875. 16
  25. 25. Filmes “rápidos” são aqueles com grãos grandes, absorvem facilmente a luz e por isso se adequam a situações de pouca luminosidade. A imagem apresenta um “traçado” mais grosseiro, mas em compensação ganha-se agilidade e discrição ao se fotografar sem tripé e sem uso do flash. Os filmes de “asa” mais alta18 quando bem manipulados registram imagens com contraste excepcional, exibindo tons e nuances que encantam os estetas da luz. Neste sentido que existe muita polêmica quanto ao uso da tecnologia fotográfica digital e os mais puristas insistem no uso do filme como uma possibilidade de registro única e insubstituível. Aqui não se pretende defender ou atacar nenhum ponto de vista, mas apenas pontuar e esclarecer questões acerca da técnica fotográfica. Ao usar asa alta não é raro as fotografias digitais apresentarem alto índice do que se denomina por “ruído”; e superá-los vem sendo talvez o maior desafio desta tecnologia. Quanto maior a asa, mais alto o ruído da foto. A cada novo modelo de câmera os fabricantes buscam aprimorar a resolução dos sensores para eliminar ou minimizar os ruídos em asa alta. Atualmente o ISO comportado pelos sensores das câmeras digitais varia de 50 a 6400 asa. Existe ainda o que se chama por compensação, que nada mais é do que um ajuste para sub ou super-expor a foto, “enganando” o fotômetro da câmera em até três pontos, dependendo do modelo da câmera. Desta forma um filme de 3.200 asa super-exposto em 1 ponto mede a luz como 6400 asa. Apesar das câmeras digitais incorporarem a compensação, este conceito não parece ter muito sentido nesta tecnologia já que o ajuste do ISO pode ser feito foto a foto e independe da colocação de um filme na máquina. É comum fotógrafos profissionais trabalharem com compensação de +1/3 para que entre mais luz pelo diafragma. Trata-se de uma medida de segurança para que a cena registre melhor as luzes baixas (sombras). “Estourar” um pouco a luz alta (o branco) não faz muita diferença, mas obter mais detalhes na sombra sim. 18 Os mais velozes são os que registram em preto e branco, como por exemplo o TMAX 3200 asa 17
  26. 26. A cor com que determinado objeto se apresenta na fotografia está intimamente ligada à luz que incide sobre ela. A luz considerada de cor branca é na verdade uma mistura de todas as cores básicas presentes no arco-íris. Como nem sempre a proporção destas cores é a mesma, o resultado final da foto pode tender a tonalidades avermelhadas, azuis ou intermediárias. O físico Lord Kelvin criou uma forma de medir os desvios de proporção na composiçaõ da luz branca, gerando uma escala que associa cor e temperatura, exibida na Figura 4 [5]. Figura 4 : Escala Kelvin de Temperatura de Cor Para registrar com fidelidade as cores em fotografia é necessário conhecer esta escala Kelvin e escolher os filmes adequados à temperatura de cor da cena. Quando não é possível fazer uso do filme ideal aplicam-se os filtros de correção para ajuste de cores e contraste [42]. O contexto digital segue este mesmo critério, mas no lugar do filme fotográfico e filtros temos um sensor digital e a ele indicamos o “valor da cor branca”. A partir daí a câmera faz todo o cálculo e propõe os ajustes e filtragens necessários. Neste sentido a tecnologia digital supera de longe o filme convencional pois possibilita uma filtragem de luz exata, perfeita e com uma praticidade incomparável. Quanto maior a temperatura na escala Kelvin, mais tendendo para o azul é a cor, ou seja, mais “fria” ela é. Desta forma explica-se o porquê do tal “azul de céu de brigadeiro”, comum em fotografias feitas sob intenso Sol e portanto temperatura de cor extremamente alta. Quanto mais “quente” é a cor, mais tende ao vermelho e menor é a sua temperatura. A Tabela 2 [5] relaciona diversas fontes de luz e suas temperaturas em escala decrescente de valores. 18
  27. 27. TEMPERATURA FONTE DE LUZ 25.000 K Céu de dia no polo Norte 13.000 K Céu ligeiramente encoberto 9.000 a 12.000 K Céu azul aberto 6.500 a 7.500 K Céu encoberto 6.500 K Lâmpada fluorescente do tipo “luz do dia” 6.000 K Lâmpada de mercúrio 5.500 a 6.000 K Luz do Sol durante a maior parte do dia 5.500 a 5.600 K Flash eletrônico 5.500 K “Luz branca” 5.000 a 5.500 K Luz do Sol ao amanhecer ou entardecer 5.000 K Lâmpada de xenônio (projetores atuais de cinema) 4.500 K Lâmpada fluorescente do tipo “branca fria” 4.100 K Luz do luar em noite de lua cheia 4.000 K Lâmpada de flash do tipo bulbo 3.500 K Lâmpada fluorescente do tipo “branca quente” 3.400 K Lâmpada de estúdio photoflood tipo B (halógena), usada em video 3.200 K Nascer / Pôr do Sol 3.000 K Lâmpada incandescente comum (tungstênio) de 200W 2.680 K Lâmpada incandescente comum (tungstênio) de 40W 2.000 K Lâmpada de vapor de sódio (iluminação pública) 1.700 K Candeeiro/ luz de vela 1.200 K Luz do fogo Tabela 2 : Temperatura de Cor das Fontes de Luz Baseado nestas premissas básicas os fabricantes constroem modelos e os implementam nos programas automáticos tão comumente encontrados nas câmeras fotográficas atuais, profissionais ou amadoras. Infelizmente estes modelos não são de domínio público, e o que observamos com cada vez maior frequência é que a técnica fotográfica vem sendo substituída por estes “desconhecidos modelos”. Não há interesse comercial em divulgar e disseminar esta técnica, e muitas vezes o profissional é preterido por um “curioso” que possui um bom equipamento automático. 19
  28. 28. Na fotografia não existe “certo” ou “errado”, e é aí que entra a intuição e experiência do fotógrafo que, espera-se, deva conhecer a fundo a técnica e saber exatamente o que estará sendo registrado em sua câmera. E não podemos esquecer que tudo isso acontece num instante, “aquele instante precioso” ao qual se refere o grande mestre da fotografia do século XX, Henri Cartier-Bresson. "Para mim, a fotografia é um reconhecimento simultâneo, numa fração de segundo, do significado do acontecimento, bem como da precisa organização das formas que dá ao acontecimento sua exata expressão'' [9] O fotógrafo é um artista e profissional que imprime o seu estilo a partir do conhecimento e domínio da técnica fotográfica. Ele adequa esta técnica à sua percepção da realidade e ao tipo de imagem que deseja registrar. ''Fotografar é colocar sobre a mesma linha de mira a cabeça, o olho e o coração” [9] Um estudo detalhado da técnica fotográfica usada por profissionais pode talvez indicar um ESTILO de fotografia, ou quem sabe até mesmo sugerir a autoria de uma foto. O interesse aqui é valorizar esta técnica, que deve permanecer no domínio público, evitando-se que este conhecimento “se perca” nos modelos automáticos comerciais. Acredita-se que a técnica fotográfica digital deva ser cada vez melhor explorada pois ela viabiliza A APLICAÇÃO PRECISA DOS CONCEITOS EM FOTOGRAFIA, nem sempre alcançada da forma convencional. Há uma infinidade de estilos e possibilidades vislumbrada por poucos. Mesmo com todo “purismo e romantismo” que envolve o uso do filme fotográfico, a tecnologia de sensores digitais não pára de se desenvolver e hoje já alcançou qualidade suficiente para ser reconhecida como arte em museus, galerias de arte e afins. Acrescenta-se aí a qualidade hoje já alcançada pelas impressoras jatos de tinta, que produzem imagens de altíssima qualidade gráfica, superando muitas vezes as cópias fotográficas convencionais e já aceita no mercado de colecionadores, incluindo museus do porte do MOMA (Museum of Modern Art) em Nova Iorque. 20
  29. 29. II.4) A MATEMÁTICA E A TÉCNICA FOTOGRÁFICA Assim como na música e em tantas outras artes, a fotografia se baseia numa técnica extremamente exata e simétrica. Como visto na seção II.3, vários de seus preceitos podem ser expressos por formulações matemáticas que, se bem interpretados e discriminados podem exprimir conceitos preciosos para a catalogação e generalização de fotografias. Fazendo uma analogia à citação de Cartier-Bresson poderíamos dizer que este trabalho irá tentar discriminar o que se passa na “cabeça” do fotógrafo durante o instante que dura o ato fotográfico, isto é, a TÉCNICA APLICADA; já que o “olho” se refere à percepção e o “coração” ao sentimento, e ambos não sugerem nenhum tipo de comportamento previsível, padronizado ou genérico. O interesse de pesquisa aqui exposto considera um universo de fotografias feitas a partir de equipamentos fotográficos de controle MANUAL, mas outra questão que pode ainda ser explorada em outra pesquisa é tentar identificar os modelos que regem o fuincionamento dos programas automáticos das câmeras digitais. O que eles fazem na verdade é calcular qual abertura e velocidade usar diante de parâmetros dados (objetiva, ISO, flash, etc), a partir de padrões pré-estabelecidos para determinados “tipos” de fotografia (geralmente retrato, paisagem, macro e movimento). Estes programas definem conceitos padronizados relacionados à técnica fotográfica e funcionam de acordo com o que cada fabricante define. Eles fazem parte de um universo comercial fechado, não acadêmico; mas que produz uma infinidade de imagens contemporâneas aptas a serem utilizadas em pesquisa. II.5) O ARQUIVO EXIF O EXIF [17] foi proposto pela JEIDA (Japan Electronic Industries Development and Association) em 1995 e definido pela ISO 12234-1 como o formato primário para câmeras fotográficas digitais. Nele são armazenados os metadados da imagem digital, e no caso da fotografia são registradas informações técnicas tais como : abertura do diafragma, velocidade do obturador, ISO, câmera, distância focal (objetiva), Sistema 21
  30. 30. GPS19 , data e hora, etc. A versão atual e mais utizada é a 2.2, criada em abril de 2.002 pela JEITA20 [38]. Em fóruns internacionais de fotografia [41] o EXIF é bem conhecido e utilizado pelos usuários (na maioria fotógrafos) a partir de softwares freeware e comerciais. Nos fóruns brasileiros [51] a grande maioria dos fotógrafos apenas “ouviu falar” sobre este arquivo e não faz uso desta informação. Com frequência o EXIF é desprezado e descartado21 . Apresenta-se aqui outro grande desafio que é o de entender e identificar o padrão EXIF. Estamos diante de um universo comercial, onde há segredos e cada fabricante de câmera digital tenta impor as suas necessidades ao padrão. O EXIF foi criado para ser único, mas como tudo em Banco de Dados ele teve que ser flexível a ponto de poder ser alterado, e com um campo livre chamado de “Nota do Fabricante” (MAKERNOTE IFD) onde cada fabricante registra a sua informação não padronizada e interpretada apenas pelos softwares de sua autoria. A Canon registra neste campo o número de série de sua câmera, propondo assim uma forma de reconhecimento da autoria da foto e garantia de direitos autorais. Embora poucos saibam ou usem, o EXIF pode incorporar informação customizada criando novos rótulos IFD (Image File Directory). A flexibilidade do formato permite que qualquer informação não compreendida pelo software de edição que lê o EXIF seja facilmente ignorada. Desta forma é possível anexar ao arquivo de imagem digital informações pertinentes à catalogação, identificação customizada, etc. O problema é que alguns dos softwares de edição, incluindo o ADOBE PHOTOSHOP 22 , quando não conseguem interpretar a informação contida no IFD, simplesmente descartam todo o segmento IFD desconhecido, regravando a imagem sem a informação original. Por isso 19 O GPS (Global Positioning System, ou Sistema de Posicionamento Global), é um sistema de posicionamento geográfico que nos dá as coordenadas de um lugar na Terra, desde que tenhamos um receptor de sinais de GPS. Este sistema foi desenvolvido pelo Departamento de Defesa Americano para ser utilizado com fins civis e militares. É muito utilizado hoje principalmente em navegação. 20 A JEITA foi criada em novembro de 2.000, pela união da JEIDA com a EIAJ (Electronic Industries Association of Japan) 21 A opção “save for web” do software Adobe Photoshop descarta o EXIF para reduzir ao máximo o tamanho do arquivo de imagem digital. Na média os metadados digitais ocupam 30Kbytes. 22 Nesta pesquisa foi usado o Adobe Photoshop CS2 versão 9.0.2; mas como alguns fotógrafos ainda usam versões anteriores do programa (Adobe Photoshop 7.0), optou-se por não especificar a versão no texto. 22
  31. 31. que muitas vezes quando se abre um arquivo de imagem digital, mesmo sem se alterar nada, ao se fechar aparece uma mensagem do tipo : “Deseja salvar as alterações ?” As especificações do padrão EXIF encontradas gratuitamente na Internet [15] são bastante complexas já que o padrão abrange não somente fotografias, mas também video e audio, dificultando bastante o entendimento. A CIPA (Camera & Imaging Products Association) [10] incentiva o uso do padrão EXIF e no seu site hoje oferece links para a JEITA, mas há um ano atrás oferecia um padrão para venda. Não se sabe se este seria mais inteligível por ser indicado a fotográfos ou ainda mais complexo por ser supostamente mais completo. A versão atual do formato é a 2.2, incluindo alguns estudos para incorporar o GPS (GPS IFD), que identifica com exatidão o local onde a foto foi feita. II.6) PROGRAMAS QUE EDITAM E/OU MANIPULAM O EXIF Há uma enorme variedade de softwares no mercado que exibem o EXIF, e muitos deles ainda incorporam e editam outros formatos, especialmente o IPTC. Os softwares que são desenvolvidos por fabricantes de câmeras se propõe tão somente a exibir, gerenciar e modificar o EXIF em seus campos específicos (MAKERNOTES), muitas vezes até ignorando o padrão proposto pela JEITA. A seguir alguns exemplos de softwares de gerenciamento de imagens identificando suas propostas e atuação no mercado. ADOBE PHOTOSHOP [2] [14] [32] [39] é o software comercial de manipulação de imagens mais difundido e utilizado por fotógrafos e especialistas em imagem digital. A partir da Opção “File Info” do menu “File” o programa exibe o EXIF, permite que se altere o ISO Speed Rating23 e propõe a inclusão de metadados formando o cabeçalho IPTC, além de reconhecer e exibir outros formatos (XMP, TIFF, Dublin Core, etc) numa interface não muito amigável (avançado). Ele se transforma no grande “vilão” dos metadados quando apresenta a opção “salvar para a web”, que apaga por completo o EXIF de arquivos de imagens justificando-se pela economia de espaço necessária para trafegar na Internet. Também causa confusão ao trabalhar com gerenciamento de cor, não sendo raro haver incompatibilidade entre o PHOTOSHOP e o EXIF, e diante 23 Padrão internacional adotado para medir a velocidade do filme fotográfico (100 asa, 200 asa, 400 asa, etc). No âmbito digital indica a sensibilidade à luz adotada pelo sensor da câmera. 23
  32. 32. disso a fabricante ADOBE introduziu a opção de ignorar os dados EXIF, impondo um outro padrão que nem sempre é compatível com o DCF (Design rule for Camera File system) japonês. Note que o objetivo principal do programa é a manipulação de imagens, e não o gerenciamento de metadados. NIKONVIEWER [44] é o programa desenvolvido pela Nikon para baixar e gerenciar as fotos das suas câmeras digitais. Não é específico para edição do EXIF, apenas visualiza as informações de captura da câmera permitindo alteração de campos avulsos como a Data / Hora 24 ; e edição do cabeçalho IPTC. ZOOMBROWSER [60] é o programa desenvolvido pela Canon para baixar as fotos das suas câmeras digitais, classificando-as e organizando em pastas. Permite a visualização do EXIF e a edição de poucos campos, como por exemplo a Data / Hora14 . Também oferece edição do cabeçalho IPTC. VIEWEXIF [58] é um plugin gratuito desenvolvido para o Internet Explorer e Firefox que exibe o EXIF de arquivos imagens a partir do menu oferecido com o click direito do mouse. É simples, rápido, prático e leve (734 K). Sua proposta é simplesmente exibir os metadados do EXIF sem que seja necessário reabrir a imagem num outro programa de edição. Sua interface é bem simples e pequena e configura-se apenas a seleção e ordenação dos campos de interesse para exibição. PHOTO STUDIO [46] é um software gratuito desenvolvido por John Hawkins25 , e permite a visualização dos dados EXIF, incluindo algumas notas específicas (Maker Note) de fabricantes conhecidos. Possui interface simples e algumas funções de edição. É bastante completo e se propõe a gerenciar imagens oriundas de câmeras fotográficas digitais de diversos modelos e fabricantes. Foi um dos primeiros softwares desenvolvidos nesta linha, e teve seu projeto abandonado por alguns anos, sendo retomado em 2.003 com oito versões implementadas, e agora reaparece com sua mais recente versão 2.67, lançada em agosto/2006. 24 É bastante comum fotojornalistas não checarem se seu equipamento está marcando a data e hora correta antes da saída. Trata-se com certeza de um hábito novo pertinente ao contexto digital da fotografia, ainda não totalmente incorporado pelos usuários. Ter um workflow de trabalho bem definido e executado é fundamental no ato fotográfico digital. 25 Foi um dos participantes do grupo que criou o padrão EXIF. 24
  33. 33. EXIFREADER [18] é também um software gratuito para plataforma Windows, cuja proposta é avaliar e analisar arquivos de imagens. É capaz de exibir dados EXIF em todas as versões, e em vários formatos diferentes de arquivos de imagens tais como : *.JPG, *.JPEG, *.TIF, *.TIFF, *.NEF (Nikon CCDRAW), *.CRW (Canon CCDRAW), *.ORF (Olympus CCDRAW), *.MRW(Minolta CCDRAW), *.PSD(Adobe Photoshop images), *.RAF. Comporta ainda a exibição de algumas notas específicas de fabricantes de câmeras digitais (MAKERNOTES). EXIFTOOL [28] é uma aplicação Perl (biblioteca e código fonte) desenvolvida por Phil Harvey26 que permite a edição de vários tipos de metadados, incluindo o EXIF e seus MAKERNOTES. O EXIF está comumente associado a formatos de imagem JPEG e TIFF, mas também é encontrado em vários formatos de imagem RAW (CR2, DNG, MOS, NEF, ORF, PEF, RAF e SRF), e ainda em MIFF, PNG, PSD, EPS e PDF. Esta aplicação roda em várias plataformas, é poderosa, flexível e fácil de usar. Possui ainda uma biblioteca para programadores [19] que queiram desenvolver ferramentas de uso específico. É o programa mais completo de edição, gravação e visualização de metadados de imagens digitais. Há grande aceitação no mercado e interesse em divulgar e aprimorar o programa, que enfoca o uso do padrão EXIF, indo contra a corrente comercial dos fabricantes que evoca padrão próprio. Ao final da pesquisa este programa é usado como base para pontuar considerações importantes acerca do EXIF. 26 É o moderador do fórum de discussão [16] sobre o padrão. Atualmente quem mais conhece e trabalha no formato EXIF. 25
  34. 34. III) COMPOSIÇÃO DA AMOSTRA Foram selecionadas e classificadas mais de quinhentas fotografias da Internet, com atenção para que a amostra possuísse a mesma quantidade de fotografias dentro das duas classes propostas (Retrato e Paisagem). III.1) BUSCA DAS FOTOGRAFIAS : QUAIS SITES DE FOTOS : ONDE ? Inicialmente pensou-se em buscar trabalhos de fotógrafos que fizeram a história, aqueles que nos inspiravam a aprender fotografia há quinze anos atrás27 . Mesmo que alguns deles ainda estejam “na ativa”, seu material disponibilizado na Internet encontra-se num formato de arquivo fechado, comumente uma apresentação em Flash Player, aparentemente uma forte tendência atual para exibição de um conjunto de imagens na Internet. O universo de interesse de pesquisa é justamente este, o de fotos que são alvo de busca e pesquisa, mas o que se percebeu neste trabalho foi que estas fotos, amplamente comercializadas na Internet por Bancos de Imagens e Agências de Notícias, se apresentam num formato bem distante do original, sem informação alguma sobre o processo como foram registradas. Há um extremo cuidado em protegê-las de cópias e usos não autorizados e o EXIF é a “primeira” informação descartada devido a este receio. Algumas fotografias aparecem no formato de publicação como as exibidas nas Figuras 5 e 6, da Agência Contact Press Images [11] que disponibiliza os portfolios apenas com fotos das publicações, num formato já muito manipulado e sem informação alguma do EXIF. 27 Henri Cartier-Bresson, Robert Doisneau, Robert Capa, William Klein, Eugene Weegee, Edward Weston, Philip Jones Griffiths, Sebastião Salgado, Leni Riefenstahl, Mary Helen Mark, Letizia Battaglia, Claudia Andujar, Seydou Keita, Annie Leibovitz, Robert Mapplethorpe, Lee Friedlander, Duane Michals, Cindy Sheerman , Howard Schatz, David de La Chapelle, etc. 26
  35. 35. Figura 5 : Contact Press Images Figura 6: Contact Press Images A World Press Photo [59] não permite que se copie a foto inibindo o click com o botão direito do mouse. A Reuters [49] compila suas melhores fotos na linguagem de programação Flash Player e disponibiliza fotos avulsas em baixa resolução e sem EXIF, mesma escolha da sua concorrente AP, The Associated Press [3]. A Sipa Press [54] disponibiliza as fotos em baixa resolução e inclui nelas uma tarja com alguns metadados (logotipo e contato da agência, crédito do fotógrafo, legenda e número da foto) como na Figura 8. O curioso é que o arquivo salvo no computador diretamente do site fica protegido e não pode ser aberto em programas de edição de imagens. Outra proteção frequentemente adotada por fotógrafos free-lancer e Bancos de Imagens é a inclusão de uma marca d’água na imagem, como no exemplo da Getty Images [34] (Figura 7). Figura 7 : Getty Images Figura 8: Sipa Press 27
  36. 36. Dada a dificuldade enfrentada em recolher metadados neste universo fotojornalístico, foi colhida para compor a amostra fotografias de Depositórios de fotos e Fotoblogs, onde são comumente expostos trabalhos pessoais de fotógrafos profissionais e amadores. Ainda neste novo domínio houve dificuldade em encontrar a informação do EXIF intacta, pois a esmagadora maioria das fotos expostas é salva dentro da opção “Save for Web” do software ADOBE PHOTOSHOP, que apaga totalmente o EXIF para reduzir o tamanho do arquivo de imagem. É curioso observar que o excesso de zelo dificulta mas na verdade não impede os mal intencionados de copiarem a imagem. Eles podem usar a tecla “printscreen” e copiar a fotografia. Normalmente estas pessoas não se incomodam com a baixa resolução oferecida e mesmo que sim ainda podem usar softwares que geram novos pixels na imagem e melhoram sua resolução para impressão. O que se deseja expor aqui é que este excesso de cuidados acaba por destruir os metadados, e não é esta a informação desejada pelos “piratas”, muito pelo contrário .... O depositório PBase [45] foi onde colheu-se a maior parte da amostra (75%) pois ao contrário da maioria, ele valoriza e exibe o EXIF das fotos. O restante da amostra foi obtido num site que ensina e discute a técnica fotográfica [41], no FotoBlog Flickr [30] e a partir de emails recebidos pela mala direta de uma agência fotográfica carioca28 . Esta amostra se compõe por fotografias feitas a partir de câmeras digitais profissionais, com opção de regulagem manual. Foram escolhidas as fotos mais populares (mais visitadas) e as prediletas dos fotógrafos mais experientes. Procurou-se abranger a maior gama possível de gêneros de fotografias num número reduzido de nove fotógrafos (Tabela 3). III.2) FOTÓGRAFOS ESCOLHIDOS A escolha dos fotógrafos aconteceu primeiramente pela disponibilidade de imagens na web. Depois foram priorizados os mais experientes na fotografia e na técnica digital. A partir daí buscou-se um equilíbrio entre retratos e paisagens, e procurando abranger um 28 Fotógrafo I (Tabela 3 e Anexo I) 28
  37. 37. universo de fotos variado. Ficou assim configurada uma razoável diversidade de enfoques dadas as distintas personalidades e especializações dos profissionais. Qtd fotos Formação Profissional em foto ? Fotografa desde Digital desde Tipo de foto A 52 Informática + Mergulhador Duas atividades 1994 2004 Subaquática B 51 Engenharia + Consultoria Sim ? ? Professor, Site Fotojornalismo C 100 Economia + Jornalismo Duas atividades 2003 2003 Fotojornalismo (prêmios), Macro D 21 Consultoria + Fotografia Sim 1966 1991 Workshops Viagens, Site E 132 Design Gráfico Sim 1951 1998 Documentação Viagens F 60 Medicina + Artes Visuais Sim 1995 2004 Natureza Retratos,Viage ns G 38 OrtoDentista Duas atividades 1984 2001 Micro / Macro Aéreas H 17 Artes Gráficas Sim 1990 2002 Natureza, Manipulação I 49 Comunicação Sim 1993 2005 Fotojornalismo Tabela 3 : Fotógrafos selecionados para a amostra A idéia inicial era obter uma amostra com fotógrafos com experiência de 20, 30 anos; mas dentro do universo fotográfico digital disponível na web conseguiu-se apenas três, e os outros apresentam pelo menos doze anos de experiência profissional. Abriu-se uma exceção ao fotógrafo C, pois ele apresentou excelente material apesar de pouca experiência fotográfica, tendo sido consagrado por prêmios e pelo público internauta. Como iniciou sua carreira no domínio digital, mostrou-se um diferencial bastante interessante, destacando-se nesta nova técnica frente a fotógrafos mais experientes. 29
  38. 38. A experiência é sem dúvida o mais importante critério de escolha dos fotógrafos, e nesta amostra se destacam os trabalhos dos fotógrafos D e E, indiscutivelmente estetas da luz. Infelizmente a maior parte do material disponível do D não exibe EXIF, mas conseguiu-se selecionar um material extremamente difícil de ser produzido devido à excessiva luminosidade local (fotos da Antártida). Foi percebido que os fotógrafos que se dedicam exclusivamente a esta profissão comumente não fazem trabalho técnico específico (por exemplo Macrofotografia e Subaquáticas). Isto se justifica porque o equipamento necessário para tanto é bastante diferenciado e com custos elevados. O que percebeu-se nesta amostra é que estes “profissionais específicos” desenvolveram esta atividade para incorporar a fotografia à uma necessidade do seu trabalho original, e por isso se dedicam a duas atividades. Apenas o fotógrafo C foge a esta regra por ser um talento que ainda não conseguiu estruturar sua nova profissão a ponto de abandonar sua atividade primária, mas sua formação de Economista o coloca numa perspectiva de carreira de renomados fotógrafos como Sebastião Salgado. Outro ponto que chamou atenção foi o domínio da marca Canon no universo da fotografia digital. A grande maioria das fotos profissionais visitadas na web foram registradas a partir deste equipamento. No universo da fotografia em película, a Nikon dominava este mercado. Nesta amostra apenas os fotógrafos A e I usam equipamento Nikon, e ambos o fazem porque já possuíam extenso material em lentes e acessórios desta marca, e o segundo deles conseguiu um bom acordo comercial com o revendedor Nikon. No Anexo I auto-retrato, breve currículo (o que dizem de si mesmos), contato e endereço do site dos fotógrafos. III.3) DETALHAMENTO DO EXIF NO DEPOSITÓRIO DE FOTOS PBASE O exemplo exposto na Figura 9 foi retirado da galeria “Best Shots” do fotógrafo E em [45]. Estas informações do EXIF foram as previamente escolhidas para formar o 30
  39. 39. arquivo de dados desta pesquisa devido à sua facilidade de obtenção neste depósitorio de fotografias na Internet, que valoriza e exibe o EXIF. Figura 9: Exemplo de fotografia exibida no depositório de fotos Pbase 31
  40. 40. III.4) VARIÁVEIS PARA ANÁLISE : O QUE FOI ESCOLHIDO DO EXIF Os EXIF foram obtidos a partir dos campos detalhados no Pbase (Figura 9); e nos outros sites os mesmos campos foram visualizados a partir do plugin VIEWEXIF versão 1.9. Em alguns casos foi utilizado o ADOBE PHOTOSHOP CS2, NIKON VIEWER versão 6.2.7 e ZOOMBROWSER versão 2.2.0.16 para conferir, confrontar e padronizar as informações dos diferentes fabricantes e modelos de câmeras. Em toda a amostra, a QUALIDADE JPEG exibida era igual a 6, que parece corresponder ao padrão de resolução adequado para exibição em monitor de computador (72dpi). Por se manter constante, campo foi retirado da massa de dados. A DISTÂNCIAFOCAL foi também excluída da análise pois a quantidade de registros da amostra com valores informados (treze) é desprezível. Ao que tudo indica ela é normalmente descartada por programas de edição de imagem. Apenas as fotos feitas com a câmera DiImage A2 do fabricante Konica Minolta usada pelo fotógrafo E exibiram esta informação que indica a distância em metros entre a câmera e o ponto de foco da foto. Esta seria uma informação preciosa a tratar, especialmente para indicar se a foto é do gênero Macro (distância focal < 1m). Se avaliada juntamente com o COMPRIMENTO FOCAL da objetiva poderia ainda sugerir o tipo de enquadramento adotado. O MICROSOFT EXCEL 2003 foi utilizado para gerar uma planilha com os campos do EXIF, as identificações da foto e do fotógrafo; e o gênero e ambiência da foto. A massa de dados ficou então composta por 520 (quinhentas e vinte) fotografias, sendo metade delas (duzentos e sessenta) classificadas como RETRATO, e a outra metade como PAISAGEM. Optou-se por retirar o gênero de fotografia Macro nesta avaliação pois além dos campos específicos do EXIF que poderiam sugerir este gênero não estarem bem representados na amostra, a quantidade de fotos desta classe se mostrou desprezível frente à quantidade de Retratos e Paisagens. As Macro selecionadas foram avaliadas a partir do seu enfoque no enquadramento, e a maioria delas foi classificada como 32
  41. 41. RETRATO pois enfoca e exibe uma única “coisa” (planta ou animal). Vale ressaltar que historicamente este ponto de vista é equivocado já que não existe nenhum “Retrato de Rosa” ou “Retrato de Cobra” conhecido na História da Representação Iconográfica [33]. As quantidades referentes a cada classe da ambiência da foto são bem distintas já que a amostra foi feita baseada no gênero da foto. O que se deseja verificar aqui são os padrões da técnica de fotografia subaquática, que parecem ser bem distintos devido à densidade da água produzir um “branco” bastante diferenciado. Apenas10% da amostra pertence a esta ambiência, e 5% à ambiência Aérea. Houve IMENSA dificuldade em obter EXIF destes dois tipos específicos de fotografia. A descrição e domínio de valores de cada coluna da planilha gerada serão descritos a seguir : AMBIÊNCIA DA FOTO Terra, Submarina ou Aérea GÊNERO DA FOTO Retrato ou Paisagem. FOTO Chave ou Identificador da fotografia. É o nome do arquivo de imagem, com extensão *.JPG. Estes arquivos estão gravados em duas pastas de acordo com o gênero da foto. FOTÓGRAFO Nome do Fotógrafo, segundo os valores da Tabela 3 DATA Data em que foi feita a foto DD/MM/AAAA. HORA Hora em que foi feita a foto HH:MM:SS 33
  42. 42. FABRICANTE Nome do fabricante da câmera. String com domínio discreto. Na amostra = Canon, Nikon, Fujifilm, Konica Minolta e Sony. MODELO Modelo de câmera fotográfica. Nome diretamente ligado ao fabricante, de domínio discreto. FLASH Sim ou Não COMPRIMENTO FOCAL (mm) Distância focal da Objetiva, em milímetros. Os valores são numéricos de 4 até 1200mm aproximadamente podendo apresentar valores fracionados (Ex:10,5 mm) VELOCIDADE (seg) É o tempo de exposição do sensor digital. Varia normalmente dentro de uma fração de segundo, podendo ser tão rápida quanto 1/8.000seg. e tão lenta quanto se deseje. ABERTURA Discrimina a abertura do diafragma, medida pela escala f [1]. Valor numérico com um campo decimal variando entre 1 e 90. EQUIVALÊNCIA ISO Valor da medida “asa” do padrão ISO. Numérico Inteiro variando de 50 a 6400. COMPENSAÇÃO É a dita “puxada” que o fotógrafo usa para compensar a medida de luz dada no ISO. Numérico fracionário, varia de -3 a +3, de 1/3 em 1/3 ou de 1/2 em 1/2 ponto. BALANÇO DE BRANCO Indica para a câmera o “valor” da cor branca. A forma como este valor é descrito varia MUITO entre os fabricantes e em modelos de câmeras. Domínio discreto de valores. Na amostra = Auto, Manual, Daylight, Sunny, Flash, Unknown e Undefined. 34
  43. 43. MEDIÇÃO DA LUZ É a forma como o fotômetro da câmera deve medir a luz. Os valores variam de acordo com o Fabricante e Modelo da câmera, que usam nomes diferentes para definir a porção do quadro da foto que será considerada na medição de luz. Existem basicamente três formas : - Average, Matrix ou Pattern : mede a luz no quadro todo da foto calculando a média mais apropriada segundo critérios do fabricante considerando o modelo de câmera. - Centro Ponderado : mede a luz em todo quadro mas atribui maior preponderância à área central da foto, 8mmm de diâmetro no visor (9%). Muito usado em retrato clássico - Parcial : apenas a área central do quadro, 8mm de diâmetro no visor (9%) será considerada para medição de luz. Muito usado quando o fundo é muito mais luminoso que o foco da foto - (Multi) Spot : apenas um (até três) pequeno ponto, 3mm de diâmetro no visor (2%) será considerado para medição da luz. Semelhante ao Parcial, mas cobrindo uma área menor. PROGRAMA DE EXPOSIÇÃO Determina a abertura do diafragma e a velocidade do obturador de acordo com a quantidade de luz medida pelo fotômetro da câmera para compor a cena. No EXIF esta informação continha também um número entre parênteses, que foi descartado pois provavelmente significa apenas a posição onde esta seleção se localiza na câmera. - Program : o fotômetro da câmera calcula a abertura e velocidade mais adequadas de acordo com o ponto de foco, a luminosidade e o movimento da cena - Manual : o fotógrafo seleciona a abertura e a velocidade que quiser, independente do que indicar o fotômetro - Aperture priority : o fotógrafo determina a abertura e o fotômetro calcula a velocidade adequada - Shutter priority : o fotógrafo determina a velocidade e o fotômetro calcula a abertura adequada 35
  44. 44. III.5) VALIDAÇÃO DA AMOSTRA : LIMPEZA, CAMPOS NULOS A variável FLASH não se encontra bem documentada aqui. O Flash externo à câmera é o comumente utilizado por fotógrafos profissionais que, muito raramente usam o flash embutido na câmera. Infelizmente este campo não é 100% confiável nesta amostra. O fotógrafo A confirmou que 100% de suas fotografias são feitas com Flash, mas por esquecer de ligar o “pino ready”, esta informação não foi registrada no EXIF. As fotos do fotógrafo D também não exibiam esta informação no EXIF, mas foi confirmada como “Não” pelo ADOBE PHOTOSHOP. O tema abordado (Antártida) já sugeria que o uso do flash não é aplicável devido à excessiva luminosidade natural. A EQUIVALÊNCIA ISO também não é exibida no EXIF do fotógrafo A, que informou utilizar o valor 200 asa na quase totalidade de suas fotos subaquáticas. A COMPENSAÇÃO aparecia como não informada em muitos registros, e nestes casos o valor considerado foi igual a zero. O BALANÇO DE BRANCO é sem dúvida a variável mais complexa da amostra. A forma como cada fabricante descreve o “valor da cor branca” difere em sua ESTRUTURA 29 , dificultando bastante o entendimento dos seus valores. Foi difícil determinar um critério que pudesse englobar todas as formas de apresentação deste valor. Foram usadas as informações do EXIF descritas no Pbase; o plugin VIEWEXIF e o programa PHOTOSTUDIO para confrontar valores exibidos e alcançar algum tipo de “consistência” neste campo. Conceitualmente o valor aqui apresentado deve ter relação com a escala Kelvin (Figura 4), remetendo valores a cada tipo de iluminação como os expostos na Tabela 2. Em alguns registros da amostra são exibidos os valores daylight, incandescent, flash e sunny, sempre acompanhados de um número. Ao que tudo indica, cada modelo de câmera usa um padrão de numeração para definir as diferentes temperaturas de cor. Quando a medida do branco é automática : o campo recebe o valor “auto” e isto significa que a câmera calcula a média da temperatura de cor do branco, mas o valor de fato (calculado) desta temperatura de cor não está explícito nesta variável. O mesmo 29 Um estudo aprofundado do EXIF feito por Phil Harvey constatou que este valor está armazenado em até 19 (dezenove) diferentes locais (ver no capítulo V “Aprofundando o programa ExifTool”). 36
  45. 45. acontece quando se encontra o valor “manual” : significa que o fotógrafo faz esta medição segundo seus critérios. Outro problema é identificar o que representam os valores numéricos da amostra (4, 9, 10, 11), exibidos como “undefined”. Optou-se por manter esta numeração e incluir o termo “indefinido” antes dos valores. Em alguns registros da amostra simplesmente não existia esta variável no EXIF, e neste caso foi assumido o valor “desconhecido” e portanto a variável recebeu este conteúdo. Optou-se por manter esta variável na avaliação mesmo ciente que seus valores não estão muito bem definidos em relação à temperatura de cor propriamente dita, mas ainda assim exprimem informação valiosa sobre a luz da foto e a forma como cada fotógrafo a conhece e domina. Diferentes fabricantes usam diferentes nomes a funções semelhantes para a MEDIÇÃO DA LUZ, mas toda amostra apresentou valores válidos neste campo. Uma sugestão para análise é transformar estes nomes em valores numéricos numa escala onde as semelhanças se aproximem numericamente. Algumas fotos do fotógrafo C não continham valores em PROGRAMA DE EXPOSIÇÃO. Considerou-se “Shutter priority” baseado em outras fotos do mesmo ensaio (macros de água) que apresentavam EXIF completo. Isso se confirmou também porque fotos de movimento precisam ter uma velocidade mínima para congelá-lo e por isso é bastante usual medir a luz fixando um valor de velocidade para obter o diafragma necessário. Foi usado o mesmo critério de avaliação para ajustar cinco fotos do fotógrafo G, que também não exibiam esta informação e receberam valores “Aperture priority” e “Manual”. DATA, HORA, FABRICANTE, MODELO, COMPRIMENTO FOCAL, VELOCIDADE e ABERTURA não apresentaram valores nulos ou aparentemente incorretos em nenhum registro da amostra. 37
  46. 46. IV ) MINERAÇÃO DE DADOS IV.1) INTRODUÇÃO À IA O ser humano possui a habilidade de fazer generalizações precisas a partir de fatos. Ele encontra estruturas ou padrões apenas observando um processo (aparentemente caótico) do mundo real. Em ciência da computação esta habilidade pode ser obtida a partir de um conjunto de exemplos fornecido pelo usuário ou por um processo do mundo real ou por meio da Inferência indutiva, a qual, mesmo sendo o recurso mais utilizado pelo cérebro na produção de conhecimento novo, deve ser utilizada cuidadosamente [50]. Neste trabalho serão utilizadas técnicas simbólicas de Aprendizado de Máquina que enfatizam indutores com linguagens de representação de hipóteses baseadas em Árvores de decisão. Para tanto foi empregado o programa TANAGRA [56] no arquivo excel produzido, indicando resultados a partir da aplicação de diversas técnicas de Mineração de Dados (classificação supervisionada). O primeiro passo foi adaptar o arquivo EXCEL para entrada no programa. O TANAGRA apresenta restrições quanto aos tipos de campos aceitos : ele não interpreta valores de data e hora e tampouco aceita strings com valor ‘ ’ (branco) no meio. Quando se aplica a vírgula como separador de casas decimais aparecem algumas incompatibilidades; e os nomes de atributos não devem conter brancos ‘ ’ e parênteses pois impossibilitam a transformação das variáveis. Por estes motivos foram excluídos da avaliação os campos de data e hora e o identificador da foto. A data e hora poderiam ser desmembradas em dia/mês/ano e hora/minuto/segundo, mas como nesta primeira avaliação trataremos apenas de descritores de forma, estes campos foram descartados da amostra. Também os ‘ ’ (brancos) do identificador poderiam ser facilmente trocados por ‘_’ (underscore) na planilha, mas fazê-lo nas pastas mudando nomes de arquivo manualmente seria um trabalho bastante exaustivo e custoso; e o TANAGRA não exibiria as imagens das fotografias classificadas como seria desejável. 38
  47. 47. Diante da dificuldade em gerar manualmente uma amostra consistente e íntegra, optou- se por adaptá-la da maneira mais simples ao programa TANAGRA e dali extrair todas as restrições para num momento futuro estudar formas automáticas de geração e adaptação da massa de dados ao contexto de Mineração de Dados escolhido. Vale também pontuar que o TANAGRA é um programa genérico que permite um estudo preliminar aplicando técnicas básicas de Mineração de Dados. Ideal mesmo seria ter a possibilidade de avaliar não somente a data e hora, mas também usar o thumbnail como referência e identificação da foto, sendo eles apresentados no resultado do classificador. IV.2) VISUALIZAÇÃO DA AMOSTRA As Tabelas 4 e 5 apresentam um resumo dos atributos discretose contínuos da amostra, respectivamente. Na Tabela 6 30 são exibidas as distribuições das variáveis discretas da amostra. ATRIBUTO CATEGORIA INFORMAÇÃO Ambiência Discreto 3 valores Gênero Discreto 2 valores Fotógrafo Discreto 9 valores Fabricante Discreto 5 valores Modelo Discreto 13 valores Flash Discreto 2 valores Comprimento_Focal(mm) Contínuo - Velocidade(seg) Contínuo - Abertura(f) Contínuo - ISO Contínuo - Compensação Contínuo - Balanço_de_Branco Discreto 11 valores Medição_ da_Luz Discreto 6 valores Programa_de_Exposição Discreto 4 valores Tabela 4 : Descrição dos atributos discretos 30 Esta tabela foi desmembrada em três para se adaptar ao tamanho de folha A4 padrão da dissertação. 39
  48. 48. Atributo Min Max Média Desvio Padrão Desvio Padrão / Média Comprimento_Focal(mm) 7,2 500 97,75 86,70 0,8870 Velocidade_seg 1 / 4000 25 1 / 2 2,19 4,3278 Abertura(f) 2 54 9.7 8,40 0,8652 ISO 64 3200 330 355,40 1,0779 Compensação - 4 / 3 2 / 3 - 1 /6 0,47 -3,0900 Tabela 5 : Distribuição dos atributos contínuos ATRIBUTO / GINI DISTRIBUIÇÃO Valores Qtd Percent Histograma Submarina 49 9,42 % Terra 452 86,92 % Ambiência 0,2342 Aérea 19 3,65 % Valores Qtd Percent Histograma Retrato 260 50,00 % Gênero 0,5000 Paisagem 260 50,00 % Valores Qtd Percent Histograma A 52 10,00 % B 51 9,81 % C 100 19,23 % H 17 3,27 % D 21 4,04 % F 60 11,54 % E 132 25,38 % G 38 7,31 % Fotógrafo 0,8487 I 49 9,42 % Tabela 6.1 : Distribuição dos atributos discretos 40
  49. 49. ATRIBUTO / GINI DISTRIBUIÇÃO Valores Qtd Percent Histograma Nikon 106 20,38 % Canon 338 65,00 % FujiFilm 60 11,54 % Konica_Minolta 13 2,50% Fabricante 0,5221 Sony 3 0,58 % Valores Qtd Percent Histograma D100 54 10,38 % EOS_10D 54 10,38 % EOS_1D_Mark_II 32 6,15 % EOS_300D_Digital 32 6,15 % EOS_350D_Digital 15 2,88 % EOS_20D 176 33,85 % EOS_1Ds_Mark_II 22 4,23 % EOS_5D 7 1,35 % FinePix_S2_Pro 60 11,54 % DIMAGE_A2 13 2,50 % Cybershot 3 0,58 % D2H 3 0,58 % Modelo 0,8306 D200 49 9,42 % Valores Qtd Percent Histograma Sim 76 14,62 % Flash 0,2496 Não 444 85,38 % Tabela 6.2 : Distribuição dos atributos discretos 41
  50. 50. ATRIBUTO / GINI DISTRIBUIÇÃO Valores Qtd Percent Histograma indefinido(9) 4 0,77 % indefinido(11) 23 4,42 % indefinido(4) 41 7,88 % auto 368 70,77 % flash(10) 3 0,58 % sunny(1) 18 3,46 % indefinido(10) 2 0,38 % incandescent(3) 1 0,19 % daylight(1) 4 0,77 % desconhecido 31 5,96 % Balanço_de_Branco 0,4838 manual 25 4,81 % Valores Qtd Percent Histograma Matrix 363 69,81 % Centro_Ponderado 51 9,81 % Multi_Spot 16 3,08 % Parcial 11 2,12 % Average 27 5,19 % Medição_ da_Luz 0,4890 Pattern 52 10,00 % Valores Qtd Percent Histograma Manual 91 17,50 % Aperture_priority 352 67,69 % Shutter_priority 16 3,08 % Programa_de_Exposição 0,4964 Program 61 11,73 % Tabela 6.3 : Distribuição dos atributos discretos 42
  51. 51. IV.3) MÉTODO DE CLASSIFICAÇÃO PROPOSTO O método de Mineração de Dados escolhido para estudo são as árvores de decisão [50] pela sua simplicidade, escalabilidade e fácil interpretação31 . O programa TANAGRA implementa algoritmos básicos e faz a poda da árvore para ela não ficar super- especializada. Deseja-se avaliar apenas a classe Gênero em função de algumas ou todas as variáveis. O grande problema da classificação é o justamente “overfitness”, que significa especializar exageradamente o modelo para uma determinada massa de dados, como oocorrido com o algoritmo de Árvore Randômica, o RNDTREE 32 (Tabela 7). Ao executar o classificador percebeu-se que o modelo, além de extremamente complexo em sua estrutura, gerou resultados espantosos. Mas ... ao executar uma validação cruzada os resultados obtidos foram bem diferentes e bastante insatisfatórios. Fica clara a grande importância da validação do modelo, e a técnica aqui utilizada é a da validação cruzada, com 10 (dez) repetições na amostra dividida aleatoriamente em 3 (três) partes. Desta forma pode-se avaliar o grau de generalização do modelo. O algoritmo que exibiu melhor resultado para a amostra foi o de Árvore de Decisão C4.5 proposto por Quinlan [48], gerando modelos simples, fáceis de visualizar e com resultados constantes na validação da amostra (Tabela 833 ). Os parâmetros considerados foram : - Tamanho mínimo das folhas = 12 - Nível de confiança = 0,25 % 31 Segundo o postulado da compreensibilidade de Michalski : “Os resultados da indução por computador devem ser descrições simbólicas das entidades fornecidas, sendo semântica e estruturalmente similares àquelas que um especialista humano poderia produzir observando as mesmas entidades. Os componentes dessas descrições devem ser compreensíveis como simples “pedaços” de informação, diretamente interpretáveis em linguagem natural, bem como reportar conceitos quantitativos e qualitativos de maneira integrada” [50] 32 Árvore randômica usando Bagging (Meta Spv), para Random Forest [8]. 33 Esta tabela foi desmembrada em duas para se adaptar ao tamanho de folha A4 padrão da dissertação 43
  52. 52. Classificação Validaçãoe x p Atributos Qtd nós Qtd folhas Retrato Paisagem Retrato Paisagem 1 Comprimento_Focal(mm) Velocidade_seg Abertura(f) ISO Compensacao Medição_da_Luz 305 153 99,23 % 98,85 % 71,29 % 69,13 % 2 Comprimento_Focal(mm) Abertura(f) ISO Flash Medição_da_Luz Balanço_de_Branco Programa_de_Exposição 219 138 86,92 % 88,85 % 74,87 % 71,33 % 3 Comprimento_Focal(mm) Abertura(f) ISO Flash 301 151 95,77 % 93,46 % 73,14 % 70,29 % 4 Comprimento_Focal(mm) Velocidade_seg Abertura(f) ISO Flash 299 150 99,23 % 98,46 % 72,76 % 72,25 % 5 Comprimento_Focal(mm) Velocidade_seg Abertura(f) Flash 267 134 100 % 96,15 % 72,83 % 72,25 % 6 Comprimento_Focal(mm) Velocidade_seg Abertura(f) ISO 293 147 100 % 98,08 % 70,17 % 68,86 % Tabela 7 : Resultados obtidos com o algoritmo de Árvore Randômica (RND TREE) 44
  53. 53. Classificação Validaçãoe x p Atributos Qtd nós Qtd folhas Retrato Paisagem Retrato Paisagem 1 Comprimento_Focal(mm) Velocidade_seg Abertura(f) ISO Compensacao Medição_da_Luz 23 12 78,08 % 82,69 % 73,64 % 73,37 % 2 Comprimento_Focal(mm) Abertura(f) ISO Flash Medição_da_Luz Balanço_de_Branco Programa_de_Exposição 15 8 75,77 % 85,77 % 70,98 % 80,73 % 3 Comprimento_Focal(mm) Abertura(f) ISO Flash 15 8 75,77 % 85,77 % 70,02 % 81,93 % 4 Comprimento_Focal(mm) Velocidade_seg Abertura(f) ISO Flash 23 12 86,92 % 77,69 % 75,92 % 76,11 % 5 Comprimento_Focal(mm) Velocidade_seg Abertura(f) Flash 17 9 83,46 % 79,62 % 75,38% 76,07 % 6 Comprimento_Focal(mm) Velocidade_seg Abertura(f) ISO 19 10 83,85 % 76,54% 74,80 % 72,02 % Tabela 8.1 : Resultados obtidos com o algoritmo de Árvore de Decisão (C4.5) 45
  54. 54. Classificação Validaçãoe x p Atributos Qtd nós Qtd folhas Retrato Paisagem Retrato Paisagem 7 Comprimento_Focal(mm) Velocidade_seg Abertura(f) 17 9 80,38 % 77,31 % 72,87 % 73,60 % 8 Comprimento_Focal(mm) Velocidade_seg Flash 13 7 83,46 % 65,38 % 71,60 % 69,63 % 9 Abertura(f) Velocidade_seg Flash 15 8 72,69 % 83,85 % 78,00 % 72,83 % Tabela 8.2 : Resultados obtidos com o algoritmo de Árvore de Decisão (C4.5) IV.4) ANÁLISE DOS RESULTADOS Avaliando a Tabela 8, observa-se que ao incluir a Velocidade_seg no Classificador (experimento 4), a classe Retrato, que mostrava-se desprivilegiada no experimento 3 foi privilegiada, equilibrando a distribuição das classes. Em contrapartida o classificador ficou mais complexo (mais nós e folhas). Já nos experimentos 3, 4 e 5 percebe-se que a variável ISO privilegia a classe Paisagem. Ao retirá-la (exp. 5) as classes se equilibram melhor, e ainda o classificador fica menos complexo. Flash divide bem as classes e como apresenta apenas dois valores discretos não aumenta a complexidade do classificador (exp. 5 e 7). Abertura(f) privilegia a classe paisagem pois quando retirada do classificador a classe retrato foi bastante privilegiada (exp. 8), embora na validação esta diferença tende a diminuir. Comprimento_Focal(mm) tem um comportamento peculiar pois a princípio privilegia a classe retrato, mas na validação da amostra acontece o oposto (exp. 9). As variáveis Medição_de_Luz, Balanço_de_Branco e Programa_de_Exposiçao mostraram não dividir as classes e apesar de incluídas na análise no exp. 2, nem foram utilizadas na classificação, exibindo a mesma estrutura de árvore do exp. 3. 46
  55. 55. As variáveis Fabricante, Modelo e Fotógrafo não foram utilizadas nesta classificação pois exibiriam um resultado tendencioso. Diante da amostra recolhida seria um equívoco avaliar o gênero de uma fotografia frente a estes parâmetros. Da mesma forma optou-se por não incluir as variáveis Ambiência e Fotógrafo, que na verdade fazem parte da amostra com a intenção de serem avaliadas posteriormente como classes. O classificador que apresentou melhor resultado foi o grifado na Tabela 8 (exp. 5), com a seguinte Árvore de Decisão : • Velocidade_seg < 0,2917 o Flash in [sim] then Gênero = retrato (94,59 % of 74 examples) o Flash in [nao] Abertura(f) < 7,5500 Velocidade_seg < 0,0008 then Gênero = paisagem (77,27 % of 22 examples) Velocidade_seg >= 0,0008 Comprimento_Focal(mm) < 43,2500 Velocidade_seg < 0,0146 then Gênero = paisagem (82,76 % of 29 examples) Velocidade_seg >= 0,0146 then Gênero = retrato (57,69 % of 26 examples) Comprimento_Focal(mm) >= 43,2500 then Gênero = retrato (80,67 % of 150 examples) Abertura(f) >= 7,5500 Comprimento_Focal(mm) < 71,0000 then Gênero = paisagem (86,05 % of 86 examples) Comprimento_Focal(mm) >= 71,0000 Abertura(f) < 9,2500 then Gênero = paisagem (65,57 % of 61 examples) Abertura(f) >= 9,2500 then Gênero = retrato (55,00 % of 20 examples) • Velocidade_seg >= 0,2917 then Gênero = paisagem (100,00 % of 52 examples) 47
  56. 56. A principal vantagem deste método é sua fácil visualização, e podem-se perceber embutidos alguns conceitos fotográficos : 1º) velocidades lentas (valores altos) sugerem que a fotografia seja de paisagem já que o retrato a princípio deve “congelar” a imagem de uma pessoa; 2º) O uso do flash não faz mesmo muito sentido diante de uma paisagem; 3º) Diafragmas fechados (abertura(f) >=7,5) e objetivas mais luminosas podem sugerir o gênero paisagem já que retratos tendem a ser compostos a partir de Tele-Objetivas (Comprimento_Focal >70 mm) Após a avaliação especialista, a árvore proposta automaticamente poderia ser reescrita e podada da seguinte forma : • Velocidade_seg < 1/5 *** velocidade média a alta o Flash in [sim] then Gênero = retrato o Flash in [nao] Abertura(f) < 7.5 *** diafragma aberto ou mediano Comprimento_Focal(mm) < 43 then Gênero = paisagem *** objetiva grande angular Comprimento_Focal(mm) >= 43 then Gênero = retrato *** objetiva normal, meia-tele e tele Abertura(f) >= 7.5 *** diafragma fechado Comprimento_Focal(mm) < 71 then Gênero = paisagem *** objetiva grande angular a normal Comprimento_Focal(mm) >= 71 then Gênero = retrato *** objetiva meia-tele e tele • Velocidade_seg >= 1/5 then Gênero = paisagem *** velocidade lenta Esta árvore é ainda mais genérica e simples, eliminando alguns testes de velocidade que parecem ser apenas circunstanciais da amostra. Não se sabe dizer se este novo modelo traria resultados melhores que o anterior pois ele não foi implementado. Ainda não se sabe ao certo qual dos dois testes teria mais peso na classificação : o da abertura ou do comprimento focal. A decisão de onde colocar (em qual nível da árvore) 48
  57. 57. necessitaria de uma amostra mais enriquecida que então ajudaria o especialista a elucidar esta questão. Vale ressaltar aqui que o especialista em técnica fotográfica dificilmente construiria sozinho um modelo destes, mas muito facilmente o compreende, valida e adapta. IV.5) CONCLUSÕES ACERCA DO MÉTODO A partir de um modelo extremamente simples, com poucas variáveis e alguns conceitos fotográficos embutidos foi possível acertar o gênero das fotografias em 75% dos casos. A árvore de decisão se mostrou genérica e estável frente às validações impostas. Depois de eliminar tantas variáveis importantes por inconsistência e ainda se ter ciência de que a amostra é apenas um pequeno pedaço do universo fotográfico, os resultados se mostram bastante animadores indicando o potencial de uso desta ferramenta na classificação fotográfica. A maior problemática na construção da amostra foi lidar com tantos programas diferentes de edição do EXIF e decidir sobre qual informação seria a verdadeira. Apareceram muitas inconsistências e validá-las manualmente foi extremamente desgastante. Obviamente não é a intenção propor um método que dependa tanto de uma validação manual dos dados. Durante o processo de pesquisa foram sendo desenvolvidas novas possibilidades de alteração do EXIF propostas pelo programa EXIFTOOL, que acho por bem destacar aqui antes de concluir o trabalho. 49
  58. 58. V ) APROFUNDANDO O PROGRAMA EXIFTOOL [20] V.1) COMO ALTERAR OS METADADOS DA IMAGEM ? Gravar e modificar metadados em arquivos de imagens é mais complexo do que pode parecer, e por isso existem tão poucas aplicações que se propõe a tanto. O EXIFTOOL usa rótulos (tags) para identificar diferentes partes dos metadados que podem ser extraídos de um arquivo de imagem. No Anexo IV estão listados os diferentes rótulos que o programa reconhece; sendo vários deles comuns a diferentes formatos de metadados (o White Balance34 por exemplo é o pior “infrator” do padrão, podendo ser encontrado em 19 locais diferentes), e às vezes até podendo estar armazenados em diferentes locais dentro de um mesmo formato. Visto que a maioria dos fabricantes grava informações em formatos não documentados e embute neles seus “truques particulares”, é necessária uma “engenharia ao reverso” para discriminar estes metadados. O EXIFTOOL se propõe a simplificar este contexto ao máximo possível tomando decisões razoáveis sobre onde gravar a informação especificada. Permanece flexível ao permitir que se configurem prioridades quando necessário, podendo até ignorar completamente o processo de tomada de decisão proposto e acatar a demanda do usuário. Segundo o desenvolvedor do software, o canadense Phil Harvey, implementar a capacidade de gravar informações no EXIF foi quase como criar um novo aplicativo. Muitos usuários pediam esta possibilidade, mas isso complicava MUITO a interface e o código do programa, gerando um tempo de resposta maior para o uso normal de visualização. Foi bastante trabalhoso implementar esta opção de gravação, e para tanto foi criada uma interface simples de usar que não detalhasse tanto a estrutura do arquivo para usuários que não desejassem se aprofundar, e ao mesmo tempo mantendo-se poderosa o suficiente para permitir que outros fizessem ações bem específicas no EXIF. 34 Balanço de branco ou Temperatura de cor, indica “o valor” da cor branca que a câmera deve registrar. 50
  59. 59. O código do programa que executa a gravação foi concebido sem utilizar as rotinas de leitura, facilitando o processo de testes e otimizações. Além disso, foi estruturado e isolado ao máximo em arquivos separados que são carregados em memória conforme sejam necessários. Embora com um custo bastante elevado, esta implementação manteve a compilação rápida para aqueles que não desejam gravar nada no EXIF e, ao mesmo tempo possibilitou um rápido e eficiente processamento batch de múltiplas imagens. Atualmente o programa pode escrever e gravar quase todos os campos IFD do EXIF que se deseje (alguns destes são protegidos porque descrevem características físicas da imagem que devem permanecer inalteradas, como por exemplo, a Compressão). Todas as informações sobre GPS, IPTC e XMP, bem como as notas específicas do fabricante (MAKERNOTES) podem ser editadas. Temos aqui um ganho em poder de uso do EXIF extraordinário, mas com ciência da extrema responsabilidade que este poder evoca .... É possível gravar inconsistências no arquivo, e isso pode acarretar problemas de leitura em outros softwares de edição de imagens. Como prevenção e segurança, aconselha-se trabalhar sempre com cópias dos arquivos originais. O programa gera automaticamente um backup do arquivo com extensão ‘_original’. V.2) CAMPOS OBRIGATÓRIOS DOS FORMATOS Os padrões EXIF e IPTC especificam algumas informações padrão. O EXIFTOOL irá criar vários destes campos obrigatórios automaticamente como forma de exigência para gravação de informações novas. Entretanto, alguns destes campos obrigatórios não podem ser facilmente gerados automaticamente (especialmente os do IPTC), e então estes são deixados para que o usuário cadastre. Vale ressaltar que o conceito de obrigatoriedade adotado no formato é meio “furado”. Ao invés de propor campos obrigatórios o padrão EXIF deveria adotar valores default para estes campos. Um bom programa de edição normalmente faz isso. É claro que esta 51

×