Incorporar apresentação
Baixar para ler offline














![Sistema de Rastreamento da Mão Humana Utilizando
Visão Computacional
Rodrigo Fernandes Freitas, Paulo César Cortez, Rodrigo C. S. Costa, Antônio C. da S. Barros
Laboratório de Engenharia de Sistemas de Computação
Campus do Pici S/N, Bloco 723,
rodrigo@gihm.info, cortez@gihm.info
RESUMO
O mercado de dispositivos portáteis tem crescido muito nos
últimos anos, o que os tornou parte importante da vida
diária da maioria da população. Porém, a interação
usuário com eles ainda é baseada em teclados pequenos e
incômodos. Com o avanço do poder
desses dispositivos, eles agora conseguem executar pesados
aplicativos como navegadores de internet e manipuladores
de imagens, os quais se beneficiariam bastante de novas
formas de interação. Este trabalho propõe um sistema de
interação para dispositivos portáteis através do rastreamento
da mão baseado em Visão Computacional. Os resultados
obtidos demonstram que este sistema apresenta uma boa
taxa de processamento, bem como é invariante à rotação da
mão e consegue reconhecer todos os gest
Author Keywords
Rastreamento da Mão, Dispositivos Portáteis
Interação.
ACM Classification Keywords
I.4.9. I.4.9. Image processing and computer vision:
Applications.
INTRODUÇÃO
O mercado dos dispositivos portáteis, como os telefones
celulares e smartphones, tem tido um grande crescimento
nos últimos anos. Tanto a diminuição dos custos e do
volume de hardware quanto o aumento da capacidade de
processamento e armazenamento ajudaram
tipo de dispositivo mais popular, fazendo deles parte
indispensável da rotina diária da maioria
cada geração são desenvolvidos dispositivos cada vez
menores e com maior poder computacional, como visto na
Figura 1 [28].
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA.
Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Sistema de Rastreamento da Mão Humana Utilizando
Computacional para Aplicações Embarcadas
, Paulo César Cortez, Rodrigo C. S. Costa, Antônio C. da S. Barros
Laboratório de Engenharia de Sistemas de Computação, Universidade Federal do Ceará
, Bloco 723, Cx. Postal 6015, CEP 60455-970 – Fortaleza
cortez@gihm.info, rodcosta@gimh.info, carlos@gimh.info
O mercado de dispositivos portáteis tem crescido muito nos
últimos anos, o que os tornou parte importante da vida
da população. Porém, a interação do
ainda é baseada em teclados pequenos e
de processamento
desses dispositivos, eles agora conseguem executar pesados
aplicativos como navegadores de internet e manipuladores
de imagens, os quais se beneficiariam bastante de novas
. Este trabalho propõe um sistema de
para dispositivos portáteis através do rastreamento
da mão baseado em Visão Computacional. Os resultados
obtidos demonstram que este sistema apresenta uma boa
taxa de processamento, bem como é invariante à rotação da
mão e consegue reconhecer todos os gestos propostos.
Dispositivos Portáteis, Sistemas de
Image processing and computer vision:
O mercado dos dispositivos portáteis, como os telefones
, tem tido um grande crescimento
nos últimos anos. Tanto a diminuição dos custos e do
quanto o aumento da capacidade de
processamento e armazenamento ajudaram a tornar este
tipo de dispositivo mais popular, fazendo deles parte
maioria da população. A
cada geração são desenvolvidos dispositivos cada vez
menores e com maior poder computacional, como visto na
Figura 1. Evolução dos celulares.
Apesar do avanço significativo na performance e nas
capacidades dos dispositivos portáteis, as interfaces com os
usuários ainda são largamente baseadas no conjunto
pequena e teclado. O uso
pode às vezes ser incômodo, pois o número de botões é
limitado e deve-se pressionar as teclas várias vezes para se
obter o resultado desejado [13
suficiente para modos mais simples de interação, como
originar e receber chamadas telefônicas; aplicações mais
complexas exigem técnicas de interação mais intuitivas
Por causa do seu aumento de capacidade computacional, os
dispositivos portáteis são agora capazes de processar
aplicações que antes somente
plataformas de maior poder computacional, como os
Computadores Pessoais (PCs) e
gráficos como jogos, navegadores de internet e
manipuladores de imagens são cada vez mais comuns em
dispositivos portáteis. Muitas dess
beneficiar largamente da presença de um dispositivo de
entrada mais intuitivo [28].
Nas últimas décadas tem havido uma pesquisa muito
intensa para o desenvolvimento de novas formas de
interação com dispositivos portáteis, com vários
tecnologias sendo propostas, tais como telas de toque,
reconhecimento de voz e sensores de movimento
como visto na Figura 2.
Permission to make digital or hard copies of all or part of this work for
classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
istribute to lists, requires prior
9, 2009, Boston, Massachusetts, USA.
7/09/04...$5.00.
Sistema de Rastreamento da Mão Humana Utilizando
para Aplicações Embarcadas
, Paulo César Cortez, Rodrigo C. S. Costa, Antônio C. da S. Barros
Federal do Ceará - UFC
Fortaleza - CE
carlos@gimh.info
. Evolução dos celulares.
Apesar do avanço significativo na performance e nas
capacidades dos dispositivos portáteis, as interfaces com os
usuários ainda são largamente baseadas no conjunto tela
pequena e teclado. O uso de teclados não-ergonômicos
pode às vezes ser incômodo, pois o número de botões é
se pressionar as teclas várias vezes para se
[13]. Esse tipo de abordagem é
suficiente para modos mais simples de interação, como
riginar e receber chamadas telefônicas; aplicações mais
complexas exigem técnicas de interação mais intuitivas [3].
Por causa do seu aumento de capacidade computacional, os
dispositivos portáteis são agora capazes de processar
aplicações que antes somente eram possíveis em
plataformas de maior poder computacional, como os
Computadores Pessoais (PCs) e notebooks. Aplicativos
gráficos como jogos, navegadores de internet e
manipuladores de imagens são cada vez mais comuns em
dispositivos portáteis. Muitas dessas aplicações podem se
beneficiar largamente da presença de um dispositivo de
Nas últimas décadas tem havido uma pesquisa muito
intensa para o desenvolvimento de novas formas de
interação com dispositivos portáteis, com vários tipos de
tecnologias sendo propostas, tais como telas de toque,
reconhecimento de voz e sensores de movimento [15],
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 9](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-15-320.jpg)
![Figura 2. Exemplos de novas formas de interação com
dispositivos portáteis: (a) Exemplo de utilização através de tela
de toque. (b) Exemplo de utilização através de sensor de
movimento.
Contudo, essas soluções apresentam várias limitações. Com
as caras telas de toque é necessário que o usuário opere o
aparelho com ambas as mãos. O reconhecimento de voz
peca às vezes pela falta de confiabilidade. Já para os
sensores de movimento, precisa-se da inclusão de hardware
extra no dispositivo móvel, o que acarreta em um acréscimo
no custo do aparelho [12].
Hoje em dia câmeras digitais de baixa resolução vêm
integradas à maioria dos dispositivos portáteis produzidos
com o objetivo de obter-se fotografias e vídeos [25].
Dessa forma é interessante o desenvolvimento de formas de
interação com dispositivos móveis baseados em Visão
Computacional, os quais não sofrem das limitações
apresentadas anteriormente e utilizam as câmeras já
embutidas nos aparelhos, evitando aumento de custo do
produto pela adição de hardware extra [1].
Com a capacidade de processamento atual dos dispositivos
portáteis, é possível processar as imagens capturadas pelo
aparelho e oferecer novas formas de interação ao usuário
através de técnicas de detecção de movimento, detecção de
cores e reconhecimento de gestos, dentre outras [2].
Dentre as formas de interação citadas anteriormente, a área
de reconhecimento de gestos e rastreamento da mão
humana tem sido bastante pesquisada nos últimos anos para
o desenvolvimento de aplicações para computadores
pessoais [26, 8, 18] e recentemente também tem sido
estudada para o desenvolvimento de interações com
dispositivos portáteis [12, 10, 27].
O objetivo geral deste trabalho é descrever o
desenvolvimento de um sistema de rastreamento da mão
humana, possibilitando o uso da câmera como dispositivo
sensor para interação com sistemas embarcados.
FUNDAMENTAÇÃO TEÓRICA
Esta seção descreve alguns fundamentos da área de
processamento de imagens necessários para um melhor
entendimento deste trabalho e também descreve as etapas
que constituem um sistema de Visão Computacional.
Figura 3. Etapas constituintes de um Sistema de Visão
Computacional.
Um sistema de Visão Computacional é composto pelas
etapas mostradas na Figura 3, descritas em maiores detalhes
a seguir.
A etapa de aquisição consiste na captura das imagens por
um elemento sensor, gerando uma matriz com valores
discretos à qual podem ser aplicadas diversas operações. O
processo de aquisição pode ser realizado através de uma
ampla gama de dispositivos, tais como webcams, câmeras
de infra-vermelho, câmeras digitais, dentre outros [11].
As imagens fornecidas pelos dispositivos sensores citados
na seção anterior tendem a apresentar uma degradação da
sua qualidade pela introdução de ruído, deformação
geométrica ou borramento devido ao movimento do objeto.
A etapa de pré-processamento consiste na aplicação de
métodos para melhorar a qualidade da imagem e reduzir as
degradações introduzidas pelos elementos sensores [24].
A etapa de pré-processamento pode se dar através de dois
tipos de técnicas: restauração e realce. As técnicas de
restauração preocupam-se principalmente com a
reconstrução ou recuperação de uma imagem que foi
degradada e um conhecimento prévio sobre o fenômeno de
degradação pode ser utilizado para este propósito. As
técnicas de realce melhoram a qualidade subjetiva das
imagens aguçando certos atributos delas, tais como bordas e
contraste, e reduzindo o ruído [11].
Tanto as operações de restauração quanto as de realce
podem ser vistas como filtros digitais bidimensionais.
Dentre as diversas técnicas disponíveis na literatura, uma
das técnicas de restauração no domínio espacial mais
utilizada é a aplicação do filtro da média, o qual consiste
em uma janela deslizante de tamanho 2N+1 x 2N+1, em
que o pixel (x,y) da imagem (I) em que a janela está
centrada é substituído na imagem filtrada (J) através de:
, = ∑ ∑ + , +
(2)
A segmentação de uma imagem consiste em dividí-la em
um certo número de regiões, em que cada região tem um
alto grau de uniformidade em algum parâmetro específico,
tal como brilho, cor, textura ou mesmo movimento [7].
O nível de detalhes no qual essa sub-divisão da imagem se
baseia depende do problema a ser resolvido. A acurácia da
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 10](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-16-320.jpg)
![Figura 4. Exemplo da aplicação do processo de limiarização
sobre um histograma.
segmentação determina o eventual sucesso ou fracasso do
sistema de processamento de imagens, de forma que deve-
se dedicar considerável cuidado para aumentar a
probabilidade de segmentação correta [11].
Dentre as diversas técnicas de segmentação existentes, a
limiarização é muito utilizada na literatura devido às suas
propriedades intuitivas, facilidade de implementação e
baixo custo computacional [11]. O funcionamento deste
método pode ser entendido através da Figura 4.
Considere o histograma da Figura 4 como correspondendo
ao histograma de uma imagem qualquer, composta de
objetos claros e um fundo escuro. Uma maneira fácil de
extrair os objetos do fundo é selecionar um limiar T que
separe os dois agrupamentos. Assim, qualquer ponto (x,y)
na imagem tal que f(x,y) T é chamado de um ponto do
objeto; caso contrário, o ponto é chamado de ponto do
fundo [8]. Dessa forma, a imagem segmentada g(x,y) é dada
por:
, =
1, , ≥
0, ,
(3)
Após a segmentação de uma imagem em suas regiões
componentes, o conjunto resultante de pixels deve ser
representado e descrito de forma adequada para o
processamento computacional subsequente. Basicamente, a
representação de uma região pode ser realizada de duas
maneiras: a primeira é representar a região em termos de
suas características externas (seu contorno); a segunda é
representar a região em termos de suas características
internas (os pixels que compreendem a região) [11].
Escolhe-se uma representação externa quando o foco
principal do problema reside nas características da forma,
tais como cantos e inflexões. A representação interna é
escolhida quando se deseja observar as propriedades locais
do objeto, tais como cor e textura [21].
Na categoria de representação externa, o algoritmo de
código em cadeia é uma abordagem muito utilizada. Uma
região geralmente descreve um conteúdo (ou pontos
internos) rodeado por uma borda, chamada de contorno.
Um ponto é definido como estando no contorno se ele faz
parte da região e se há pelo menos um pixel na sua
vizinhança que não é parte da região [22].
Figura 5. Principais tipos de análise de conectividade: (a)
conectividade-4; (b) conectividade-8.
Figura 6. Conectividade no código em cadeia.
Dessa forma, o código em cadeia é formado concatenando-
se o número que designa a direção do próximo pixel. Isto é
repetido para cada ponto do contorno até se alcançar o
ponto inicial [24]. O código em cadeia pode ser realizado
com base em conectividades do tipo 4 e 8 (como visto na
Figura 5). As direções tanto na conectividade-4 que na
conectividade-8 podem ser atribuídas como mostrado na
Figura 6.
Após o processo de representação de um objeto, a tarefa
seguinte é a de descrição ou seleção de atributos, de forma
a extrair atributos dos dados representados que resultem em
alguma informação quantitativa de interesse ou que sejam
básicos para diferenciar uma classe de objetos de outra;
essa diferenciação ocorre na fase seguinte de
reconhecimento [14].
De modo a terem utilidade para a etapa de reconhecimento,
os descritores selecionados devem possuir um conjunto de
importantes propriedades: dois objetos devem ter os
mesmos descritores apenas se eles tiverem as mesmas
características; objetos similares devem ter descritores com
valores similares; os descritores devem ser invariantes a
mudanças no objeto como escala, rotação, translação e
perspectiva; e os descritores devem representar a essência
de um objeto de forma eficiente, contendo informações
apenas sobre o que torna aquela objeto único ou diferente
dos outros objetos [22].
A partir da representação do contorno originada pelo código
em cadeia, um descritor que pode-se extrair dele são os seus
pontos críticos. Pontos críticos ou cantos são pontos muito
importantes de um objeto, visto que a informação sobre
uma forma se concentra em seus cantos [20]. Pontos
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 11](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-17-320.jpg)
![críticos são definidos como pontos em que a linha do
contorno da região apresenta uma variação brusca na sua
direção, ou seja, é um ponto com alto valor de amplitude no
sinal de curvatura [23].
A curvatura k(t) de uma curva paramétrica c(t) = (x(t), y(t))
é definida como:
=
!#!#!!
!$%!$
$
'
(4)
Fica claro pela equação que para estimar a curvatura é
necessário o cálculo das derivadas de x(t) e y(t). Devido ao
fato do contorno ter natureza discreta (ou seja,
espacialmente amostrado) o cálculo das derivadas se torna
um problema computacional, dificultando a utilização
direta desta fórmula [6].
Uma abordagem básica que evita o cálculo da fórmula é a
definição de medidas de curvatura alternativas baseadas nos
ângulos entre vetores definidos em termos dos elementos
discretos do contorno. Considere c(n) = (x(n), y(n)) como
sendo uma curva discreta. Os seguintes vetores podem ser
definidos [6]:
() = ) − ) − , ) − ) − (5)
+) = ) − ) + , ) − ) + (6)
Esses vetores são definidos entre o atual ponto do contorno
e os vizinhos para a direita e para a esquerda, como
mostrado na Figura 7.
O modelo digital de pontos de alta curvatura proposto por
Johnston e Rosenfeld (1973) [17] é definido pela seguinte
equação:
,) =
-./0./
||-./||||0./||
(7)
em que ,) é o cosseno do ângulo entre os vetores ()
e +). Dessa forma, temos que −1 ≤ ,) ≤ 1, com
,) = −1 para linhas retas e ,) = 1 quando o ângulo
se torna 0° (o menor ângulo possível). Neste sentido, ,)
pode ser utilizado como uma medida capaz de localizar
pontos de curvatura alta, ou seja, maiores que um certo
limiar.
Finalmente, a etapa de reconhecimento consiste do
processo de atribuir um rótulo para um objeto baseado em
seus descritores [11].
Figura 7. Indicação da curvatura baseada no ângulo.
METODOLOGIA
Nesta seção são apresentados, inicialmente, os
equipamentos e os ambientes de simulação e
desenvolvimento utilizados neste trabalho e, em seguida, o
algoritmo de interação proposto.
Equipamentos Utilizados
No desenvolvimento deste trabalho os algoritmos são
inicialmente desenvolvidos em um Computador Pessoal
(PC) e, em seguida, adaptados e embarcados em um
dispositivo portátil. Os equipamentos utilizados no
desenvolvimento deste trabalho são resumidamente
descritos na Tabela 1.
Para a realização dos experimentos foram utilizados um PC
e um aparelho celular. O computador possui como
acessório uma câmera Microsoft NX-3000. O aparelho
celular não possui Unidade de Ponto Flutuante (FPU).
Todos os cálculos em ponto flutuante são feitos através de
software no processador de ponto fixo (inteiro). O uso de
ponto flutuante aumenta o custo computacional,
necessitando a adaptação do código para ponto fixo.
Simulação
As simulações realizadas seguem a estrutura ilustrada na
Figura 8. O primeiro passo, a aquisição, é realizado pelo
pacote de aquisição de imagens presentes no Simulink.
O último passo, a exibição dos resultados, é realizado pelo
pacote de processamento de vídeo e imagens do Simulink,
Computador Pessoal
Telefone
Celular
Fabricante IBM Samsung
Modelo MT-M 8212-G4P SGH-A706
Processador Intel Pentium D
ARM9 à
143MHz
RAM 2GB -
OS
Windows XP com
SP2
Qualcomm
REX
Câmera
1.3 MPix Microsoft
NX-3000 2MPix
Tabela 1. Equipamentos utilizados no desenvolvimento do
trabalho.
Figura 8. Etapas na simulação do processo de Visão
Computacional.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 12](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-18-320.jpg)
![exibindo no monitor ou salvando em arquivo a saída do
sistema.
Os processamentos intermediários são implementados
utilizando os blocos padrões de operações diversas
Desenvolvimento
O diagrama da implementação em C ANSI dos métodos de
interação baseados em visão é mostrado na Figura 9. Nesta
figura, as setas representam o acesso de informações. Os
algoritmos de VC desenvolvidos neste trabalho possuem
um acesso indireto ao hardware, devido à necessidade de
utilização do método proposto em várias plataformas
(Windows e REX). Os códigos desenvolvidos são
implementados em C ANSI e utilizam apenas comandos
presentes nas bibliotecas padrões.
Após as simulações, os algoritmos são implementados em
C ANSI e em seguida embarcados e testados no dispositivo
portátil. Para cada plataforma, é desenvolvido um conjunto
de comandos de acesso ao meio físico dependente de cada
plataforma. Por exemplo, para os testes realizados no PC, a
interface de acesso ao hardware da câmera é feita utilizando
comandos existentes na Interface de Programação de
Aplicativos (API) do OpenCV que, ao fim do
processamento, converte os frames adquiridos em um vetor
em ponto fixo (inteiro) [16].
Para testar os algoritmos, foi desenvolvida uma aplicação
em C++ que realiza a execução do código. Esta aplicação
inicia os algoritmos de rastreamento da mão e entra em um
laço que adquire um frame da câmera, executa o algoritmo
proposto e exibe os resultados até que uma tecla seja
pressionada. Após sair do laço, a aplicação fecha os
algoritmos de VC.
No ambiente REX, os algoritmo são compilados em C
ANSI e enviados para o grupo de desenvolvedores do
Samsung Instituto de Desenvolvimento para Informática
(SIDI). Os desenvolvedores implementaram a interface de
acesso ao hardware e integram o algoritmo em uma
aplicação nativa do sistema operacional, deixando
disponível o conjunto de algoritmos para serem testados e
avaliados.
Figura 9. Diagrama da implementação em C dos algoritmos.
Método Proposto de Interação para Dispositivos
Portáteis
Este trabalho propõe um método com baixo esforço
computacional capaz de identificar um conjunto de gestos
padronizados para formar um sistema de interação com
dispositivos portáteis através do rastreamento da mão
humana.
O sistema proposto segue o processo de um Sistema de
Visão Computacional descrito na seção de Fundamentação
Teórica. A seguir são detalhadas as técnicas utilizadas em
cada uma das etapas que formam o sistema proposto.
A etapa de aquisição do método proposto é realizada pela
câmera embutida do dispositivo móvel. A imagem
fornecida pelo telefone celular para a realização dos testes
encontra-se no espaço de cores YCbCr.
Para a realização da etapa de pré-processamento foi
escolhida a aplicação do Filtro da Média sobre a imagem
adquirida pela câmera. O objetivo com isso é atenuar o
ruído presente na imagem, de forma a melhorar a etapa
seguinte de segmentação.
Vários testes foram realizados e foi observado que a
utilização de uma janela 5x5 para o Filtro da Média
apresenta o melhor equilíbrio entre custo computacional e
desempenho de filtragem.
O objetivo da etapa de segmentação é identificar a região
da imagem filtrada que corresponde à mão do usuário. Para
realizar essa segmentação, é utilizada a técnica de
limiarização no espaço de cores YCbCr.
A técnica de limiarização foi escolhida devido ao seu baixo
custo computacional. Ela é realizada no espaço de cores
YCbCr para evitar o processo de conversão da imagem para
outros espaços de cores, o que acarretaria em
processamento adicional.
Os limiares utilizados para a segmentação da pele são
propostos por Chai e Ngan (1999) [4], em que são
classificados como pele os pixels da imagem cujas
intensidades se encontrem na faixa de valores 77 a 127 para
o canal Cb e na faixa de valores 133 a 173 para o canal Cr.
O restante dos pixels da imagem é classificado como sendo
fundo da imagem. O processo de limiarização de pele
utilizado pode ser representado pela seguinte expressão:
, =
1, 77 45 127 8 133 4, 173
0, :;= :=),á, =
(7)
onde g(x,y) é a imagem segmentada e Cb e Cr são os
valores nos canais Cb e Cr, respectivamente, dos pixels
(x,y) da imagem filtrada.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 13](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-19-320.jpg)
![Figura 10. (a) Imagem filtrada na etapa anterior de pré-
processamento. (b) Imagem segmentada de acordo com a
equação 7.
Na Figura 10 é representado o processo de limiarização. Na
Figura 10(a) é mostrada a imagem filtrada obtida na etapa
anterior, composta da mão do usuário, um objeto circular de
cor semelhante à da pele e um fundo cinza. Na Figura 10(b)
é mostrado o resultado da limiarização, com a mão e o
objeto circular tendo sido segmentados.
Para a representação dos dados da imagem segmentada na
etapa anterior, utiliza-se a representação através do
algoritmo de código em cadeia, a qual é uma representação
baseada no contorno do objeto, visto que se deseja obter
informações sobre as inflexões deste contorno para
identificar as pontas dos dedos da mão usuário.
O primeiro passo é a extração do contorno. Um ponto P é
definido como um ponto de contorno (c(x,y) = 1) quando
este é um ponto de fundo (g(x,y) = 0) e pelo menos um
ponto do objeto de interesse pertence à sua vizinhança
g(x,y) = 1. Na Figura 11(a) é mostrada a imagem
segmentada obtida na etapa anterior e na Figura 11(b) é
mostrada o resultado da extração do contorno da imagem.
O algoritmo de código em cadeia é então aplicado sobre a
imagem do contorno. Descarta-se os menores contornos da
imagem e preserva-se apenas o maior contorno encontrado
pelo código em cadeia, armazenando-se as suas
coordenadas x e y.
Na Figura 12(a) é mostrado a imagem de contorno obtida
na etapa anterior e na Figura 12(b) é mostrado o resultado
da aplicação do algoritmo de código em cadeia na imagem
do contorno, em que restou apenas o maior contorno (o
contorno da mão) e foi descartado o menor contorno (o
contorno do objeto circular).
Figura 11. (a) Imagem segmentada na etapa anterior do
sistema. (b) Imagem com o contorno extraído das regiões
segmentadas da imagem.
Figura 12. (a) Imagem do contorno obtida anteriormente. (b)
Imagem com o maior contorno armazenado na lista encadeada
gerada pelo algoritmo de código em cadeia.
Para a descrição dos dados representados, utiliza-se como
atributos a curvatura e os pontos críticos do contorno da
mão do usuário, os quais podem ser utilizados para localizar
as pontas dos dedos da mão, como proposto no trabalho de
Leal et al. (2009) [19]. O cálculo da curvatura é realizado
sobre o contorno da região da mão seguindo a abordagem
mostrada na seção de Fundamentação Teórica.
Na Figura 13(a) é mostrado o contorno representado pela
lista do algoritmo de código em cadeia. Na Figura 13(b) são
mostradas em cor cinza escuro as regiões de alta curvatura
encontradas, que correspondem às regiões ao redor das
pontas dos dedos e dos vales entre os dedos da mão.
Dentro de cada uma dessas regiões de alta curvatura,
seleciona-se o ponto central de cada uma delas como sendo
o ponto crítico representado a ponta dos dedos e dos vales.
Apenas as pontas dos dedos são interessantes para o
método, por isso deve-se eliminar os pontos críticos que
representam os vales. Isso é feito identificando o ponto
médio do segmento de reta formado pelos dois pontos
extremos da região de alta curvatura.
Caso esse ponto se encontre sobre uma região de pele, o
ponto crítico corresponde a uma ponta de dedo. Caso
contrário, o ponto crítico corresponde a um vale e é
descartado do processamento.
O resultado dessa etapa de descrição é representado na
Figura 14. Na Figura 14(a) são mostradas as regiões de alta
curvatura encontradas e na Figura 14(b) os pontos críticos
definidos a partir dessas regiões de alta curvatura, os quais
correspondem às pontas dos dedos da mão do usuário.
Figura 13. (a) Imagem com o maior contorno da imagem. (b)
Imagem com as regiões de alta curvatura do contorno em
cinza escuro.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 14](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-20-320.jpg)
![Figura 14. (a) Imagem com as regiões de alta curvatura do
contorno em cinza escuro. (b) Imagem com os pontos críticos
(pontas dos dedos) do contorno localizados.
A etapa de reconhecimento consiste em
que o usuário está realizando para a câmera. O sistema
desenvolvido reconhece gestos para seis ações pré
definidas: Apontamento (Figura 15(a)),
15(b)), Zoom-out (Figura 15(c)), Rotação Horária (Figura
15(d)), Rotação Anti-Horária (Figura
(Figura 15(f)). O fluxograma do processo de
reconhecimento é mostrado na Figura 16
Primeiramente o sistema verifica a quantidade de pontas de
dedos identificados na etapa anterior de descrição. Caso o
número de dedos reconhecidos seja igual a 1, o sistema
identifica o gesto do usuário como sendo de apontamento e
armazena a posição x-y da ponta de dedo encontrada.
Caso o número de dedos reconhecidos seja igual a 2, o
sistema pode identificar dois tipos de gestos: gesto p
ação de zoom ou de rotação. Para diferenciar entre os dois,
verifica-se o ângulo da reta formada pelas pontas dos dois
dedos reconhecidos.
Caso o ângulo da reta formada pelas pontas dos dedos seja
de aproximadamente 90°, o sistema identifica o gesto
realizado como sendo de zoom. Caso o ângulo seja de
aproximadamente 45° ou 125°, o sistema identifica o gesto
realizado como sendo de rotação. Caso o ângulo assuma
quaisquer outros valores, o sistema identifica o gesto como
sendo inválido.
Caso o gesto realizado seja de zoom, deve
referente a zoom in ou zoom out. Isso é feito calculando
o tamanho do segmento de reta formado pelas pontas dos
dois dedos do usuário. Se essa distância for maior que um
certo limiar, o gesto é de zoom in; se essa distância for
menor que um certo limiar, o gesto é de
Caso o gesto realizado seja de rotação, deve
se ele é referente à rotação horária ou anti
feito verificando-se o ângulo da reta formada pelas pontas
dos dois dedos do usuário. Caso o ângulo seja de
aproximadamente 45°, o gesto é de rotação horária; caso o
ângulo seja de aproximadamente 125°, o gesto é de
anti-horária.
Caso o número de dedos reconhecidos seja igual a 3, o
sistema identifica o gesto como sendo de Arrastar e
armazena a coordenada da ponta do dedo central.
(a) Imagem com as regiões de alta curvatura do
contorno em cinza escuro. (b) Imagem com os pontos críticos
(pontas dos dedos) do contorno localizados.
em identificar o gesto
que o usuário está realizando para a câmera. O sistema
desenvolvido reconhece gestos para seis ações pré-
), Zoom-in (Figura
), Rotação Horária (Figura
Horária (Figura 15(e)) e Arrastar
). O fluxograma do processo de
6.
Primeiramente o sistema verifica a quantidade de pontas de
dedos identificados na etapa anterior de descrição. Caso o
econhecidos seja igual a 1, o sistema
identifica o gesto do usuário como sendo de apontamento e
y da ponta de dedo encontrada.
Caso o número de dedos reconhecidos seja igual a 2, o
sistema pode identificar dois tipos de gestos: gesto para a
ou de rotação. Para diferenciar entre os dois,
se o ângulo da reta formada pelas pontas dos dois
Caso o ângulo da reta formada pelas pontas dos dedos seja
de aproximadamente 90°, o sistema identifica o gesto
. Caso o ângulo seja de
aproximadamente 45° ou 125°, o sistema identifica o gesto
realizado como sendo de rotação. Caso o ângulo assuma
quaisquer outros valores, o sistema identifica o gesto como
, deve-se identificar se é
. Isso é feito calculando-se
o tamanho do segmento de reta formado pelas pontas dos
dois dedos do usuário. Se essa distância for maior que um
se essa distância for
menor que um certo limiar, o gesto é de zoom out.
Caso o gesto realizado seja de rotação, deve-se identificar
rotação horária ou anti-horária. Isso é
se o ângulo da reta formada pelas pontas
dos dois dedos do usuário. Caso o ângulo seja de
aproximadamente 45°, o gesto é de rotação horária; caso o
ângulo seja de aproximadamente 125°, o gesto é de rotação
Caso o número de dedos reconhecidos seja igual a 3, o
sistema identifica o gesto como sendo de Arrastar e
armazena a coordenada da ponta do dedo central. Caso o
Figura 15. Gestos suportados pelo sistema. (a) Gesto de ação
de apontamento. (b) Gesto de ação de
ação de zoom out. (d) Gesto de ação de rotação horária. (e)
Gesto de ação de rotação anti
arrastar.
Figura 16. Fluxograma do processo de reconhecimento dos
gestos.
número de dedos reconhecidos seja algum outro que não
1,2 ou 3, o sistema não reconhece nenhum gesto válido.
O método de interação para dispositivos portáteis baseado
em rastreamento da mão descrito
no sistema proposto no trabalho
Formas de Avaliação
O algoritmo proposto neste trabalho será avaliado em três
critérios distintos: custo computacional, quantidade de
Gestos suportados pelo sistema. (a) Gesto de ação
apontamento. (b) Gesto de ação de zoom in. (c) Gesto de
. (d) Gesto de ação de rotação horária. (e)
Gesto de ação de rotação anti-horária. (f) Gesto de ação de
arrastar.
Fluxograma do processo de reconhecimento dos
gestos.
número de dedos reconhecidos seja algum outro que não
1,2 ou 3, o sistema não reconhece nenhum gesto válido.
para dispositivos portáteis baseado
em rastreamento da mão descrito neste trabalho é baseado
no sistema proposto no trabalho de Cortez et al. (2008) [5].
O algoritmo proposto neste trabalho será avaliado em três
: custo computacional, quantidade de
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 15](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-21-320.jpg)



![Virtual Wheel: Proposta de Um Método de Interação
Gestual para Jogos de Corrida
Rodrigo Fernandes Freitas, Paulo César Cortez, Rodrigo C. S. Costa, Antônio C. da S. Barros
Laboratório de Engenharia de Sistemas de Computação, Universidade Federal do Ceará - UFC
Campus do Pici S/N, Bloco 723, Cx. Postal 6015, CEP 60455-970 – Fortaleza - CE
rodrigo@gihm.info, cortez@gihm.info, rodcosta@gimh.info, carlos@gimh.info
RESUMO
A indústria de jogos eletrônicos ou video games é hoje uma
das maiores indústrias do mundo, com lucros anuais da
ordem de dezoito bilhões de dólares. Tradicionalmente, a
forma de interação do ser humano com os video games é
realizada através de dispositivos físicos como joysticks,
mouse e teclado. Contudo, existe uma tendência de
mercado em criar formas mais intuitivas para realizar esta
interação, como por exemplo através de métodos de visão
computacional. Este artigo apresenta o Virtual Wheel, um
método de reconhecimento de gestos para interação com
jogos de corrida. O método proposto consiste na localização
e reconhecimento das mãos do usuário, o qual simula o uso
de um volante real e realiza movimentos para a esquerda e a
direita, além de poder acionar comandos especiais erguendo
os polegares. Os resultados mostram que o sistema é
possível de ser utilizado em conjunto com jogos de corrida.
Author Keywords
Interação por gestos, Segmentação de pele,
Reconhecimento de gestos.
ACM Classification Keywords
I.4.9. Image processing and computer vision: Applications.
INTRODUÇÃO
Atualmente, a indústria de jogos eletrônicos (games) é uma
das maiores do ramo de entretenimento, com lucros anuais
entre 18 e 25 bilhões de dólares, e também é uma das que
mais crescem, com uma taxa de crescimento de 15 a 25%
por ano [7, 16]. A indústria de games também possui uma
presença crescente no Brasil, com uma arrecadação de 80
milhões de reais em 2008 no país [1].
A maior parte dos jogos para computador é controlada por
dispositivos de entrada convencionais como joystick,
teclado e mouse. Tais jogos não permitem que o jogador
faça uso de seus movimentos naturais para interagir com os
mesmos, o que implica que ele deve aprender a controlá-
los, ou seja, associar sequências de apertos de botões e
movimentos de eixos a ações dentro do jogo [15].
Existem vários motivos para um jogador desejar mudar a
forma de interação com um jogo. Usar um dispositivo de
entrada diferente ou uma nova forma de interação (por
exemplo, através de sons captados por um microfone ou por
reconhecimento de gestos) pode tornar a experiência de
jogar mais realista e divertida. Além disto, o
reconhecimento de gestos é uma forma de interação mais
intuitiva, podendo tornar o jogo acessível a usuários com
necessidades físicas especiais [14].
Um exemplo de método de interação a partir do
reconhecimento de gestos é o Kinect, produzido pela
Microsoft. O Kinect consiste em uma nova tecnologia para
o console Xbox 360, sem fios ou controles físicos,
reconhecendo o movimento do usuário através de uma
câmera especial, a ZCam. Através do processamento de
vídeo é realizado o mapeamento completo do corpo, além
do reconhecimento comandos de voz [12]. Sua utilização é
mostrada na Figura 1.
Figura 1. Kinect sendo utilizado em conjunto com um jogo de
corrida.
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA.
Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 19](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-25-320.jpg)
![Figura 2. Playstation Move da Sony em funcionamento.
A Sony realiza o desenvolvimento um controle sensível a
movimento, o Playstation Move, que conta com o auxílio
de esferas coloridas para que seu movimento possa ser
rastreado pelo Playstation Eye, a câmera do console
Playstation 3 [13], como mostrado na Figura 2.
No trabalho de Paula et al. (2006) [11] é proposto o
Camera Kombat, jogo de luta que, através do emprego de
Visão Computacional, possibilita aos usuários jogarem
utilizando o próprio corpo nos combates. Através de
técnicas de subtração de fundo, os jogadores são
identificados, possibilitando o reconhecimento das ações
realizadas por eles, como soco, chute ou esquiva, como
mostrado na Figura 3.
Figura 3. Camera Kombat em funcionamento,
detectando os jogadores e os movimentos realizados por
estes.
Figura 4. Demonstração do GeFighters, com a utilização de
marcadores para indicar a localização das mãos direita e
esquerda.
Teixeira et al. (2006) [15] propõem o GeFighters, outro
jogo de luta em que o usuário utiliza seus próprios
movimentos, mas diferente do Camera Kombat, o sistema é
baseado em marcadores para a identificação das mãos
esquerda e direita, como mostrado na Figura 4.
Estes trabalhos descritos na literatura são capazes de
reconhecer os movimentos do jogador e permitem a
interação com os jogos de maneira bastante efetiva. Porém,
eles sofrem de algumas limitações. O Kinect e o Playstation
Move são dependentes da utilização de câmeras especials, a
ZCam e o PlaystationEye respectivamente, restringindo seu
uso aos usuários que possuam tal dispositivo de hardware,
além de só poderem ser utilizados nos consoles para os
quais foram desenvolvidos, o XBox 360 e o Playstation 3,
respectivamente. O Camera Konbat e o GeFigthers podem
ser utilizados com câmeras de vídeos comuns, no entanto o
primeiro exige que o fundo permaneça estático e qualquer
variação de luminosidade causará falhas na detecção dos
movimentos. Já o segundo requer a existência de objetos
padronizados, no caso os marcadores que indicam a mão
esquerda e direita, para o reconhecimento dos movimentos.
Este trabalho tem como objetivo apresentar um sistema de
Visão Computacional (VC) que captura imagens através de
uma webcam comum e permite ao usuário controlar um
jogo de corrida qualquer através de gestos manuais. O
sistema dá a impressão ao usuário de estar segurando um
volante de automóvel, podendo girá-lo para a esquerda ou
para a direita, similarmente ao movimento feito ao dirigir
um veículo. Além disto, o sistema proposto permite o
acionamento de comandos especiais através do
reconhecimento dos dedos polegares, possibilitando o envio
de informações, similar ao realizado pelos botões de um
controle de video game.
O trabalho está organizado em 5 seções. A próxima seção
descreve os métodos que compõem o sistema de VC, em
seguida, a metodologia proposta é descrita. Na seção 4 são
descritos os resultados obtidos a partir da metodologia
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 20](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-26-320.jpg)
![Figura 5. Diagrama de blocos das etapas de um Sistema de
Visão Artificial.
proposta e, por fim, a seção 5 descreve as conclusões e as
perspectivas de trabalhos futuros.
FUNDAMENTAÇÃO TEÓRICA
Um sistema de Visão Artificial é composto das etapas
mostradas na Figura 5, as quais são detalhadas a seguir.
Aquisição da Imagem
A etapa de aquisição consiste da captura das imagens por
um elemento sensor, gerando uma matriz com valores
discretos à qual podem ser aplicadas diversas operações. A
imagem adquirida pode ser representada em diversos
espaços de cores, tais como YCbCr, RGB e HSV [4].
Pré-Processamento
A etapa de pré-processamento consiste no processo de
manipular uma imagem de modo que a imagem resultante
seja mais apropriada do que a imagem original para uma
aplicação específica. Ou seja, a principal meta é melhorar
uma imagem em algum sentido pré-definido, de modo a
recuperar uma imagem dos danos sofridos na etapa de
aquisição [4].
Há uma infinidade de técnicas de pré-processamento na
literatura. Uma técnica muito utilizada é a aplicação do
filtro da média, o qual consiste em uma janela deslizante de
tamanho 2N+1 x 2N+1, em que o pixel (x,y) da imagem (I)
em que a janela está centrada é substituído na imagem
filtrada (J) através de:
, = ∑ ∑ + , +
(1)
Segmentação de Imagens Digitais
O processo de segmentação de uma imagem digital consiste
em subdividir uma dada imagem em regiões ou objetos com
base em características destas regiões, as quais são
compostas por um conjunto de pixels satisfazendo um dado
critério [4].
Existem diversas técnicas capazes de segmentar um objeto
em uma imagem digital. Uma das técnicas muito utilizadas
é a segmentação por limiarização. Este tipo de segmentação
é baseado na distribuição dos níveis de cinza da imagem e
possui um baixo custo computacional [8].
A limiarização funciona através do estabelecimento de um
limiar T que separa a imagem em duas regiões. Os pixels da
imagem f(x,y) cujos valores são maiores que T são
classificados como pontos do objeto e os pontos da imagem
f(x,y) cujos valores são menores que T são classificados
como fundo. Dessa forma, pode-se criar uma imagem
segmentada g(x,y) em que, por exemplo, os pixels
referentes ao objeto recebam um valor 1 (branco) e os
pixels referentes ao fundo recebam um valor 0 (preto) [3].
O processo de limiarização pode ser então representado
pela seguinte expressão:
, =
1, , ≥
0, ,
(2)
Representação e Descrição
Após a segmentação de uma imagem, o conjunto resultante
de pixels deve ser representado e descrito de forma
adequada para o processamento computacional
subseqüente. A representação pode se dar na forma de
contornos ou de regiões completas [4].
Feita a representação, vem o processo de descrição ou
seleção de atributos, de forma a extrair atributos dos dados
representados que resultem em alguma informação
quantitativa de interesse ou que sejam básicos para
diferenciar uma classe de objetos de outra [5].
Um dos algoritmos existentes para a representação é o
algoritmo de elementos ou componentes conectados.
Elementos conectados são um conjunto de pixels agrupados
cujos valores de intensidade satisfazem um certo critério de
similaridade (no caso de imagens binárias, se seus valores
de intensidade são iguais). Esse algoritmo tem o objetivo de
identificar e rotular todos os agrupamentos de pixels
conectados presentes na imagem [4]. A Figura 6 mostra
uma região com três elementos conectados.
A partir da representação por elementos conectados, um
atributo importante de descrição que se pode extrair é o
centro de massa de um objeto. Uma das técnicas existentes
para o cálculo do centro de massa de um objeto é baseada
na Transformada da Distância, descrito no trabalho de
Morris e Elshehry (2002) [10]. Neste trabalho, a
Transformada da Distância é utilizada para calcular a
posição do centro de massa da região da mão por apresentar
maior robustez à presença do antebraço na imagem do que
as outras técnicas de cálculo do centro de massa.
Figura 6. Região com três elementos conectados.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 21](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-27-320.jpg)
![No trabalho de Leal et al. (2009)
algoritmo de representação e descrição para a detecção de
pontos críticos da mão humana. O algoritmo consiste, na
fase de representação, da aplicação de um algoritmo de
código em cadeia, o qual armazena em uma lista uma
sequência de segmentos conectados de modo a representar
o contorno da mão. Na fase de descrição, utiliza
informação do valor da curvatura dos pontos do contorno
para a identificação dos pontos críticos da mão, os quais
correspondem às pontas dos dedos e aos vales entre os
dedos.
Os pontos correspondentes aos vales entre os dedos são
descartados, restando somente os pontos correspondentes às
pontas dos dedos.
Reconhecimento e Decisão
Reconhecimento é o processo de atribuir um rótulo a um
determinado objeto baseado nos seus descritores, indicando
o seu significado. Já decisão é o processo de verificar qual
ação o sistema deve efetuar com base nos objetos que foram
reconhecidos [4].
METODOLOGIA
Esta seção apresenta o sistema de Visão
proposto, bem como detalha a metodologia utilizada para
desenvolvê-lo. O algoritmo proposto segue o mesmo
processo de um sistema de Visão Artificial mostrado na
Figura 5, na seção de Fundamentação Teórica
Aquisição
A etapa de aquisição da imagem é feita utilizando uma
webcam, fornecendo uma imagem representada no espaço
cores YCbCr. Para a captura da imagem da
utilizada a biblioteca OpenCV [6], que contém uma série d
funções na área de processamento de imagem. Com a
imagem adquirida, realiza-se todo o processo de
segmentação, extração do contorno e localização dos
centros de massa.
Pré-Processamento
Para a realização da etapa de pré-
escolhida aplicação do Filtro da Média sobre a imagem
adquirida pela câmera. Vários testes foram realizados e foi
observado que a utilização de uma janela 5x5 para o Filtro
da Média apresenta o melhor equilíbrio entre custo
computacional e desempenho de filtragem.
Segmentação
Neste trabalho, é segmentada a região da pele formada
pelos braços do usuário. Para isso, utiliza
limiarização descrita na seção anterior
YCbCr. Uma vantagem de realizar a segmentação neste
formato de cores consiste em evitar o esforço
computacional de converter a imagem para outro espaço de
cores, como RGB ou HSV.
Os limiares utilizados foram propostos por
(1999) [2]. Os pixels que estiverem nas faixas de valores do
canais Cb = [77,127] e Cr = [133,173] s
como pele.
(2009) [8] é descrito um
algoritmo de representação e descrição para a detecção de
pontos críticos da mão humana. O algoritmo consiste, na
, da aplicação de um algoritmo de
código em cadeia, o qual armazena em uma lista uma
sequência de segmentos conectados de modo a representar
o contorno da mão. Na fase de descrição, utiliza-se a
informação do valor da curvatura dos pontos do contorno
a identificação dos pontos críticos da mão, os quais
correspondem às pontas dos dedos e aos vales entre os
correspondentes aos vales entre os dedos são
descartados, restando somente os pontos correspondentes às
Reconhecimento é o processo de atribuir um rótulo a um
determinado objeto baseado nos seus descritores, indicando
o seu significado. Já decisão é o processo de verificar qual
ação o sistema deve efetuar com base nos objetos que foram
isão Computacional
proposto, bem como detalha a metodologia utilizada para
lo. O algoritmo proposto segue o mesmo
processo de um sistema de Visão Artificial mostrado na
seção de Fundamentação Teórica.
A etapa de aquisição da imagem é feita utilizando uma
, fornecendo uma imagem representada no espaço
cores YCbCr. Para a captura da imagem da webcam é
, que contém uma série de
funções na área de processamento de imagem. Com a
se todo o processo de
segmentação, extração do contorno e localização dos
-processamento foi
ção do Filtro da Média sobre a imagem
adquirida pela câmera. Vários testes foram realizados e foi
observado que a utilização de uma janela 5x5 para o Filtro
da Média apresenta o melhor equilíbrio entre custo
computacional e desempenho de filtragem.
a região da pele formada
pelos braços do usuário. Para isso, utiliza-se a técnica de
no espaço de cores
YCbCr. Uma vantagem de realizar a segmentação neste
em evitar o esforço
computacional de converter a imagem para outro espaço de
Os limiares utilizados foram propostos por Chai e Ngan
. Os pixels que estiverem nas faixas de valores do
canais Cb = [77,127] e Cr = [133,173] são considerados
Uma das vantagens da utilização dos limiares propostos por
Chai e Ngan (1999) é a sua capacidade de segmentar
corretamente os mais variados tons de pele
ser visto na Figura 7.
Representação e Descrição
Neste trabalho é desenvolvido um método capaz de
reconhecer os gestos mostrados na Figura
Figura 7. Os limiares propostos por Chai e Ngan (1999)
conseguem segmentar corretamente os mais variados tons de
pele
Figura 8. (a) Gesto com as mãos
câmera. (b) Gesto com as mãos fechadas apontadas para a
câmera rotacionadas para a esquerda. (c) Gesto com as mãos
fechadas apontadas para a câmera rotacionadas para a
direita. (d) Gesto com as mãos fechadas e com o polegar
esquerdo erguido. (e) Gesto com as mãos fechadas e com o
polegar direito erguido.
Uma das vantagens da utilização dos limiares propostos por
Chai e Ngan (1999) é a sua capacidade de segmentar
corretamente os mais variados tons de pele, conforme pode
Representação e Descrição
Neste trabalho é desenvolvido um método capaz de
reconhecer os gestos mostrados na Figura 8.
Os limiares propostos por Chai e Ngan (1999)
conseguem segmentar corretamente os mais variados tons de
pele.
. (a) Gesto com as mãos fechadas apontadas para a
câmera. (b) Gesto com as mãos fechadas apontadas para a
câmera rotacionadas para a esquerda. (c) Gesto com as mãos
fechadas apontadas para a câmera rotacionadas para a
direita. (d) Gesto com as mãos fechadas e com o polegar
do erguido. (e) Gesto com as mãos fechadas e com o
polegar direito erguido.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 22](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-28-320.jpg)
![Na Figura 8(a) é mostrado o gesto com as mãos do usuário
fechadas e apontadas para a câmera. Na Figura 8(b) é
mostrado o gesto com as mãos fechadas apontadas para a
câmera rotacionadas para a esquerda. Na Figura 8(c) é
mostrado o gesto com as mãos fechadas apontadas para a
câmera rotacionadas para a direita. Na Figura 8(d) é
mostrado o gesto com as mãos apontadas para a câmera e o
dedo polegar esquerdo erguido. Na Figura 8(e) é mostrado
o gesto com as mãos fechadas apontadas para a câmera e o
dedo polegar direito erguido.
Para o reconhecimento destes gestos, aplica-se sobre a
imagem segmentada através do método de limiarização o
algoritmo de elementos conectados descrito na seção
anterior a fim de localizar os dois objetos com tom de pele
de maior área na imagem, correspondendo às regiões dos
braços do usuário. O objeto segmentado localizado mais à
direita é considerado o braço direito, e o objeto localizado
mais à esquerda é considerado o braço esquerdo.
Em cada uma dessas regiões são calculadas as coordenadas
do centro de massa (xd e yd para o braço direito e xe e ye
para o braço esquerdo), bem como as coordenadas das
pontas dos dedos polegares, caso eles estejam erguidos,
através do método descrito em [8].
Na próxima seção é descrito o método para o
reconhecimento dos gestos apresentados na Figura 8.
Reconhecimento dos Gestos
Para a utilização do sistema proposto, o usuário deve
simular estar segurando um volante e apontar as mãos para
a câmera, como representado na Figura 8(a). Com base nas
coordenadas dos centros de massa das duas mãos,
calculadas a partir do método descrito na sub-seção anterior
e os quais são mostrados como círculos verdes na Figura
9(a), é possível definir um eixo de rotação do volante
virtual, formado pela reta que une os centros de massa das
duas mãos, conforme mostrado na Figura 9(a). Com base
nesse eixo, define-se o ângulo de rotação do volante que o
usuário simula estar segurando, como mostrado na Figura
9(b).
Para reconhecer os gestos de rotação à direita e à esquerda
utiliza-se o ângulo θ do eixo com a horizontal, o qual é
dado por:
= tan!
#$#%
$%
' (3)
Figura 9. (a) Identificação dos centros de massa de cada uma
das mãos e construção do eixo de rotação. (b) Giro do volante
definido a partir do ângulo do eixo de rotação.
A partir do valor deste ângulo, o movimento do volante
virtual para a esquerda ou para a direita é realizado
utilizando a seguinte expressão:
()* +,-.) = /
0,-.1), −20° 20°
5678,19:, ≥ 20°
; 1, .:, ≤ −20°
(4)
Acionamento de Comandos Especiais
Além dos movimentos para esquerda e direita, o sistema
desenvolvido é capaz também de identificar dois comandos
especiais (A e B) que simulam dois botões de um controle
de um video game.
Para acionar o comando especial botão A e o comando
especial botão B, o usuário deve erguer o polegar esquerdo
e direito, respectivamente, conforme mostrado nas Figuras
8(d) e 8(e).
Envio de Comandos doTeclado
Neste trabalho, utiliza-se o movimento do Volante Virtual
reconhecido para fazer a interação com um jogo de corrida.
Para isto, os movimentos reconhecidos acionam teclas
específicas e que são importantes para o jogo.
Isto é feito através da função nativa do Windows
keybd_event, a qual sintetiza o pressionar de um botão do
teclado. A função recebe como parâmetros o código ASCII
da tecla desejada e o estado dela (pressionada ou liberada)
[9]. Há cinco comandos que podem ser enviados pelo
sistema desenvolvido:
• Aceleração: comando enviado ininterruptamente
ao computador, exceto quando acionado o
comando Desacelera visto a seguir, codificado pela
tecla 'X';
• Esquerda: comando enviado quando o usuário
gira o volante para a esquerda, codificado pela
tecla 'L';
• Direita: comando enviado quando o usuário gira o
volante para a direita, codificado pela tecla 'R';
• Desaceleração: comando enviado quando o
usuário ergue o polegar esquerdo, acionando o
comando Botão A, fazendo com que o veículo
do jogo pare de acelerar.
• Item: comando enviado quando o usuário ergue o
polegar direito, acionando o comando Botão B,
indicando o uso de um item especial, codificado
pela tecla 'Z'.
RESULTADOS
Esta seção apresenta os resultados alcançados na
implementação do sistema proposto. Primeiramente são
descritos os resultados do reconhecimento dos gestos
propostos. Em seguida, são descritos os resultados da
utilização do sistema proposto em conjunto com um game
comercial. Por fim são descritas algumas limitações
presentes no método proposto.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 23](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-29-320.jpg)



![Design de interação aplicado a modelos colaborativos na
cobertura jornalística em eventos de calamidade pública
RESUMO
O artigo apresenta uma análise dos modelos de colaboração
utilizados pelos principais sites noticiosos do Brasil em
eventos de calamidade pública, em especial na cobertura
das fortes chuvas que provocaram enchentes e uma série de
transtornos no estado do Rio de Janeiro em abril de 2010. A
partir do estudo de caso dos modelos colaborativos de dois
dos principais portais jornalísticos do país, este artigo
pretende apontar as principais características e deficiências
das ferramentas atuais, propondo um novo modelo baseado
em mapas geográficos, que avance a questão do design de
interação no que diz respeito a relação do jornal com o
leitor-usuário, bem como no aproveitamento desse
conteúdo gerado pela colaboração na geração de uma base
de dados para políticas públicas que possam resultar em
uma série de medidas para o controle de situações de
calamidade futuras.
Author Keywords
Design, Colaboração, Mapas, Jornalismo, Interface,
Interação, Colaboração, Usuário
ACM Classification Keywords
DESIGN
INTRODUÇÃO
Nos últimos anos, a popularização das tecnologias digitais e
a ampliação das formas de acesso à Internet, além da queda
progressiva do custo de computadores e de conexão, vêm
criando um cenário propício à ampliação das práticas
comunicativas na Rede. Essa tendência vem modificando o
fluxo de informações na rede e inspira e justifica o
surgimento de experiências de jornalismo participativo,
processo em que os próprios internautas passam a atuar na
produção da notícia. Segundo BRAGA (2007, p.4), “os
fenômenos comunicacionais, na sociedade contemporânea,
apresentam uma diacronia muito dinâmica – não apenas
conseqüência do avanço tecnológico, mas também dos
processos sociais interativos que se diversificam
correlatamente”.
Permitir ao leitor a interação e o registro de sua 'voz'
qualifica enormemente a notícia. Como coloca
DALMONTE (2009, p.193), a efetiva participação do
leitor, ou a possibilidade de participação, desempenham
importante papel para o desenvolvimento do efeito de real,
pois as notícias não estão distantes, dispersas no mundo
virtual. Ao interagir com um produto jornalístico, o leitor
agrega àquela peça informativa não apenas suas impressões,
mas seus dados pessoais. O recurso jornalístico de uso de
personagens [personagem, no jornalismo, refere-se a
alguém que tenha vivenciado, ou vivencia, o fato narrado.
Este personagem, por meio da particularização, permite
ilustrar e dar densidade àquilo que é reportado, coloca o
autor] é ampliado, pois além das fontes selecionadas para a
composição do texto, outras vozes são agregadas, fazendo
com que a matéria se torne mais polifônica. Sob a
perspectiva de diversos olhares, vai além da instância de
produção.
Em função disso, muitos sites noticiosos estão se adaptando
a essa nova realidade. Há um interesse dos grandes jornais
online em expandir a participação e a interação com o
leitor, porém a grande maioria ainda mantém o controle das
fases da produção informativa nas mãos de jornalistas e
editores. Aliado ao fato de ser uma funcionalidade
relativamente nova, o conteúdo enviado pelo leitor ainda é
aproveitado de maneira incipiente pelos jornais. Na grande
maioria dos casos observados e exemplificados ao longo
deste artigo, a participação do leitor é feita através de um
formulário preenchido textualmente e publicada ou como
comentário a alguma notícia previamente publicada, ou
como matéria jornalística completa, com o leitor ocupando,
individualmente, o papel de um jornalista. Não existe, até o
momento, a idéia de formar um conteúdo verdadeiramente
coletivo a partir da colaboração de leitores, em um formato
que possa complementar o conteúdo oferecido pelos sites
jornalísticos, mas que fuja do formato tradicional de texto
noticioso, seja no processo de envio da colaboração, seja no
momento da publicação do conteúdo enviado.
Um exemplo de inovação nesse sentido se dá, por exemplo,
na possibilidade de utilização de mapas e ferramentas de
natureza georreferenciada como complemento ao processo
noticioso. Num momento em que o uso de ferramentas
desse tipo, como, por exemplo, o Google Maps, torna-se
cada vez mais usual entre os usuários domésticos, a idéia de
agregar conceitos de jornalismo participativo ao caráter
intuitivo e até mesmo lúdico dos mapas apresenta-se como
uma alternativa bastante interessante e desafiadora.
Para tanto, faz-se necessário o aperfeiçoamento da
integração dos dados e metadados gerados a partir da
colaboração de leitores com mapas temáticos, com o intuito
de melhorar o entendimento e a leitura das informações na
interface do modelo de colaboração, passando desde o
momento do envio da colaboração por parte do internauta
até as inúmeras possibilidades de aproveitamento dos dados
em ações de estratégia, de negócios ou mesmo de utilidade
pública.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 27](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-33-320.jpg)







![situação surgiram alguns modelos de jornalismo
colaborativo no Brasil, como o desenvolvido pelo Jornal O
Globo no Rio de Janeiro, com a criação do site Bairros.com
[http://www.oglobo.globo.com/rio/bairros/]; o papel do
cidadão [é] fundamental na difusão de conteúdos
hiperlocais, porque, por questões estruturais e econômicas,
a cobertura jornalística não pode alcançar tal amplitude.
Temos, assim, uma mudança de escala no trato do espaço
público, passando a trabalhá-lo não mais na visão
cartográfica lato sensu, mas alcançando a escala humana e
seu referenciais próximos, como a divisão por bairros, ruas,
quarteirões, prédios e espaços. Para o cidadão comum, essa
mudança permite uma melhor compreensão dos aspectos
abordados, uma vez que a visualização se aproxima
bastante da visão de mundo que ele possui, facilitando a
manipulação das informações e a contribuição com dados
próprios.
Georreferenciar uma entrada significa contextualizá-la e,
dessa forma, torná-la mais precisa. Ainda mais quando
agrupada a outros depoimentos de mesma natureza,
passamos a vislumbrar a realidade de determinada região
(2). Dessa forma, é possível mapear os tipos de problemas
característicos de cada região e qual as deficiências
presentes de modo geral. A ação de avaliação não necessita
de uma abstração e memória do local citado, já carregando
junto de si a informação da área tratada e suas questões
contíguas. Sendo assim, tanto numa percepção quantitativa
(certamente afetada pelos hábitos de determinada
população, pelas possibilidades e interesse de interação com
o modelo jornalístico) das ocorrências, quanto na
qualitativa, existe uma melhoria considerável na apreensão
destas informações.
Por último, a organização das informações a partir de uma
mapa facilita não apenas a busca mas também recuperar
determinada informação (4). Segundo PREECE, ROGERS
e SHARP (2005), nossa interação com qualquer interface se
estabelece também dentro de nossos padrões e capacidade
cognitivas, sendo um desses processos o de memória, sobre
o qual as autoras citam a pesquisa de Mark Lansdale,
psicólogo britânico, estudioso do problema de recuperação
de informação. Em relação a esta questão afirmam:
Ele [Lansdale] sugere ser interessante olhar para esse
processo como composto de dois processos da memória:
recuperação direta, seguida de verificação baseada em
reconhecimento. A primeira refere-se a utilizar informações
memorizadas sobre o arquivo que se deseja, para chegar o
mais próximo possível dele. (...) A segunda ocorre quando a
recuperação não conseguiu produzir o resultado que o
usuário esperava, exigindo, pois, que se consultem todos os
diretórios ou arquivos. (...) Lansdale propõe que os sistemas
de gerenciamento de arquivos devem ser projetados visando
a otimizar os dois tipos de processo da memória. Em
particular, os sistemas devem ser projetados de forma a
deixar que os usuários utilizem a memória que têm para
limitar a área que está sendo pesquisada e então representar
a informação nessa área da interface de forma a ajudá-los
ao máximo a encontrar o que precisam. (PREECE,
ROGERS e SHARP, 2005, p. 103)
Se expandirmos um pouco o conceito acima e substituirmos
a idéia de arquivo pela de notícia ou informação,
perceberemos como a organização e filtragem das
informações colabora para a navegação do usuário.
Tendo em vista todas essas questões, fica evidente a
utilidade de tal modelo no fomento de um arcabouço para a
discussão por parte da população das questões deficitárias
no que tange o espaço público e sua [in]capacidade de
abrigar aqueles que nele habitam; identificando quais os
problemas estruturais e quais os ocasionais, permitindo uma
conscientização e um aprendizado, além de ferramentas de
fiscalização da gestão pública. Todas essas questões podem,
ainda, ser aproveitadas pelo próprio veículo de
comunicação, seja gerando reportagens em resposta à
questionamentos dos leitores, seja em função da detecção
de padrões e outros interesses que possam gerar notícia
jornalística. Dessa forma, a colaboração do leitor na
construção da narrativa do jornalística se torna plena, pois
não apenas sua participação é publicada como serve de base
para direcionar as próprias editorias do jornal na busca de
conteúdo noticioso propício aos interesses e necessidades
de seus leitores
Sob o ponto de vista das ferramentas de webjornalismo que
se apresentam frente não só às novas tecnologias, mas
também por conta da familiarização da comunidade para
com elas, o modelo aqui proposto apresenta características
que o incluem no bojo dos aprimoramentos da chamada 4ª
geração do webjornalismo (BARBOSA, 2007 apud
DALMONTE, 2009, p. 123). Isso porque sua estrutura de
georeferenciamento armazena as informações em bases de
dados que reconfiguram a visualização da informação em
função da busca do usuário -- aqui, como o fez
DALMONTE (2009, p.227), é importante diferenciar banco
de dados e base de dados: [Para] Ribas (2005, p.7), tomado
por referência Colle (2002), (...) 1) banco de dados é o
conjunto de informações, o conteúdo armazenado em uma
base de dados; 2) e base de dados é a estutura lógico-
matemática que permite o armazenamento e a estruturação
dos conjuntos, de modo que os dados são independentes e
podem ser modificados, representados ou consultados de
diversas maneiras. Percebe-se, assim, a atualidade das
questões aqui levantadas, em um sistema que abarca quase
todas as características apontadas por Palacios (2002) como
sendo as representativas do webjornalismo, a saber: 1)
multimidialidade, 2) interatividade, 3) hipertextualidade, 4)
personalização, 5) atualização e 6) memória.
CONCLUSÃO
Como apresentado ao longo do artigo, o enfoque no design
de interação das ferramentas colaborativas permite o
desenvolvimento de modelos que aproveitem melhor a
potencialidade existente na relação do leitor com o site
noticioso.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 35](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-41-320.jpg)

![O design de material jornalístico: do impresso ao
virtual - os desafios da interatividade
RESUMO
O jornalismo sempre foi um dos campos mais tradicionais
do design. Com a popularização da internet e dos sites de
notícias, este campo se tornou mais abrangente e
heterogêneo. Este artigo apresenta o processo de transposi-
ção do meio impresso para o meio hipermidiático que o jor-
nalismo vem sofrendo desde os anos 1990. É feita uma
apresentação do workflow de produção de notícias, que
passa pela apuração, criação e publicação de notícias na mí-
dia tradicional impressa e sua transposição e adequação pa-
ra a internet, algumas soluções existentes hoje para o acesso
a matérias jornalísticas em webistes e leitores digitais. No
fim é feita uma proposta de um programa utilizando cons-
truído sob o padrão de programação MVC, visando facilitar
o trabalho do designer na criação de layout para conteúdo
jornalístico para diferentes mídias.
Palavras-chave
Design de notícias, interação, hipermídia, mvc
ACM Classification Keywords
H5.4. Information interfaces and presentation: Hypertext /
Hypermedia.
INTRODUÇÃO
A internet e as mídias eletrônicas apresentam hoje uma
realidade que há alguns anos era impensável: um enorme
volume de informação acessível a todos. A rede mundial de
computadores se tornou um dos principais veículos de in-
formação e notícias, divulgadas de maneira quase instantâ-
nea. Mídias eletrônicas permitem conteúdo rico, adicionan-
do sons, vídeos e conteúdo interativo ao texto jornalístico.
Atualmente, todos os principais jornais e revistas têm suas
versões online, que muitas vezes não exploram todas as
possibilidades destes novos meios de comunicação. Este
artigo pretende analisar algumas soluções de adaptação e
transposição do conteúdo jornalístico para as novas mídias,
além de apresentar uma alternativa de solução para uma
reportagem originalmente publicada na edição impressa da
revista Veja.
O SURGIMENTO DA INTERNET
Em 1969 foram ligados dois centros de pesquisa através de
uma rede de computadores a uma grande distância na Cali-
fórnia, EUA, dando início a Arpanet. De uso estritamente
militar, com o objetivo de cobrir todo o território norte-
americano para troca de informações sobre a segurança na-
cional do país e resistir a possíveis ataques inimigos, a rede
começou a incorporar outros centros de pesquisa e univer-
sidades dos EUA a partir de 1970.
Em 1973 foi criada a primeira conexão internacional,
ligando a Arpanet à Universidade de Londres. Em 1978
foram incorporadas redes de outros países e, em 1981, a
rede internacional cobria os EUA, Canadá, Reino Unido,
Europa e Austrália. Em 1988 começa a exploração comer-
cial da rede: serviços de email foram conectados e provedo-
res comerciais de serviços, os chamados ISP (Internet
Service Providers) foram criados. Outras redes separadas -
como Usenet e BITNET - foram conectadas ao que já se
chamava de internet.
No entanto, o acesso ainda era limitado. Em 1991 o
laboratório europeu CERN introduziu a World Wide Web,
criação de Tim Berners Lee, que permitia a utilização de
sistemas e ferramentas para criação e visualização de infor-
mação em sistemas hipermídia. A criação da linguagem
HTML (Hypertext Markup Language) permitiu a exibição
da informação através de uma estrutura de hipertexto e o
navegador Mosaic trouxe uma interface gráfica que
facilitava a navegação. Posteriormente, os navegadores
Netscape e Internet Explorer tiveram um importante papel
na popularização da rede [12].
Em 2004 surgiu o conceito de Web 2.0, que ao contrário do
que o nome sugere não usa uma nova versão de protocolos
ou novas tecnologias, mas procura criar aplicativos basea-
dos na web focados em na troca de informação, interope-
rabilidade, design centrado no usuário e colaboração, usan-
do tecnologias conhecidas como linguagens de script rodan-
do no servidor (PHP, ASP.NET, Java) com Javascript, uma
linguagem de programação que roda no computador do
usuário [27]. A Web 2.0 permite uma maior participação do
usuário, permitindo que ele desempenhe um papel ativo na
construção do conteúdo.
Hoje no Brasil o acesso à Internet chega a 63,2 milhões de
pessoas [2] o que demonstra sua importância como meio de
comunicação.
Jornalismo na internet
Com a abertura comercial da internet e o acesso da po-
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 37](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-43-320.jpg)
![pulação em geral à rede, começaram a surgir os websites
comerciais, preocupados em manter uma presença online,
mas ainda receosos em relação ao potencial comunicacional
e às possibilidades de retorno financeiro. O Chicago
Tribune em 1992 foi o primeiro jornal a publicar uma
edição online, uma cópia da sua edição impressa. O New
York Times lançou sua versão em 1994, e no fim do século
todos os principais jornais estavam online [19]. No Brasil, o
primeiro jornal a criar uma versão online foi o Jornal do
Brasil. Outros jornais criaram suas edições online em
seguida, como a Folha de São Paulo, o Estado de São Paulo
e O Globo.
A transposição do material jornalístico da mídia impressa
para a internet passa por três fases distintas [23]: Na
primeira fase, chamada transpositiva, os sites jornalísticos
apresentavam transposições de partes de suas matrizes,
apresentando uma ou duas matérias de suas principais edi-
torias, atualizadas uma vez por dia, acompanhando a produ-
ção e a publicação das edições impressas. Nesta fase, o
trabalho do designer não tinha uma fronteira definida e
frequentemente era feito por profissionais de informática
que criavam as páginas como um todo, do layout à
programação.
Em um segundo momento, conhecido como metáfora, os
produtos jornalísticos começam a explorar as possibilidades
oferecidas pela internet de maneira experimental, sem se
distanciar de sua versão impressa. Nesta fase diminui o
intervalo de atualizações das notícias, começam a surgir de
formas de interação com o autor ou com outros usuários
através de ferramentas como email ou fóruns de debate. A
criação do conteúdo jornalístico passa a levar em considera-
ção os recursos de hipermídia na internet. O designer passa
a ter uma atuação mais específica, na criação de templates,
material gráfico e adequação do conteúdo ao layout.
No terceiro momento o webjornalismo se distancia de vez
do modelo de mídia tradicional, deixando de ser apenas
uma versão da mídia tradicional e passando a explorar as
verdadeiras possibilidades oferecidas pela rede, facilitado
pela melhora da tecnologia de transmissão de dados
possibilitando a transmissão mais rápida de sons, imagens e
vídeos. Muitos websites jornalísticos no Brasil estão hoje
na segunda fase: seu conteúdo principal é uma versão da
edição impressa, com o acréscimo de alguns elementos
extra em multimídia. As equipes se tornam maiores, com
funções mais específicas; surgem novas áreas para o design
como, por exemplo, design de interação. Alguns exemplos
de jornais que possuem características da terceira fase no
mundo são o Telegraph, da Inglaterra [4], o El País da
Espanha [5] e a MSNBC, dos EUA [17].
Segundo GUERRERO e HUERTA [24] as fases do de-
senvolvimento da imprensa online não são três, mas quatro.
Na primeira, há uma reprodução do conteúdo textual im-
presso, sem imagens. Nesta fase não havia quase nenhum
recurso destinado à internet nas editorias dos jornais. Na
segunda fase, começam a ser incorporados recursos de
hipertexto e multimídia, como links, imagens, vídeo e
áudio. Neste momento começa a separação entre o
webjornalismo e o jornalismo impresso. Na terceira fase há
um incremento de recursos multimídia, acréscimo de
serviços de entretenimento, comunidades e serviços sociais.
Há o início de oferta de comércio eletrônico. Na quarta fase
é que se encontra o conteúdo produzido exclusivamente
para a internet. Elementos interativos como chats e
enquetes são incorporados às reportagens. Há uma reserva
de recursos e profissionais exclusivos para a produção de
conteúdo online. Ainda segundo os autores, é possível que
uma mesma publicação possua características que a inclua
em mais de uma fase. O designer desempenha nestas fases
papéis similares aos apresentados nas fases anteriores.
PERSPECTIVAS DO JORNALISMO
A abertura comercial da internet aconteceu de forma muito
abrupta, fazendo com que todas as empresas buscassem um
lugar no ciberespaço sem planejamento prévio. Estar na
internet era importante, afinal os concorrentes também cor-
riam para ter um site. No caso dos jornais principalmente as
estratégias de negócios se provaram inadequadas. No come-
ço, a nova mídia foi vista ceticismo em relação as suas
possibilidades de geração de renda. As direções de alguns
jornais não perceberam na rede uma oportunidade de novos
negócios, mas sim uma oportunidade de atrair novos
leitores para os jornais impressos, principalmente leitores
mais jovens, que vêm deixando de ler jornais [8]. Em outros
casos pensou-se que a disponibilidade do conteúdo integral
gratuitamente para os leitores na internet possibilitaria um
retorno com publicidade. O retorno nunca veio e os leitores
se acostumaram a ter de graça o mesmo conteúdo pelo qual
teriam que pagar para ler no jornal impresso [3]. Acabou se
criando um círculo vicioso, porque se o jornal passa a
cobrar pelo conteúdo perde leitores para os concorrentes,
onde o conteúdo é gratuito, e se continua disponibilizando
material gratuito continua atuando no vermelho.
Ainda assim muitos jornais cogitaram ou fizeram
experiências com a cobrança de acesso às notícias online,
de certa maneira paradoxal em relação à vontade de se re-
crutar jovens leitores. O New York Times chegou a cobrar
o acesso a seu conteúdo até 2007, quando aboliu a cobrança
procurando gerar mais renda com um aumento no número
de anunciantes. O editor-executivo do jornal, Bill Keller,
anunciou que o jornal estudava voltar a cobrar o acesso de
seus leitores em 2010 para diminuir os prejuízos. Rupert
Murdoch, o diretor da News Corp., empresa que reúne
jornais como o The Times e o The Sun, ingleses, e o norte-
americano New York Post, afirmou que todos os jornais da
empresa terão um modelo de cobrança onde parte do
conteúdo é gratuito e parte é paga. Este modelo é baseado
no utilizado pelo site do jornal sobre economia Wall Street
Journal, que também faz parte da News Corp. e é hoje um
dos poucos grandes webjornais que apresenta lucro. Alguns
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 38](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-44-320.jpg)
![críticos a cobrança afirmam que o único motivo de sucesso
do Wall Street Journal é que os leitores tendem a estar de
acordo com a cobrança quando buscam notícias especia-
lizadas, como é o caso deste jornal.
O The Times começou com o sistema de cobranças em
meados de 2010, e após três semanas a estimativa de queda
no número de leitores era próxima de 90% [7]. O jornal se
dividiu em dois na internet, em referência ao Times, que
circula de segunda a sábado, e o Sunday Times, que circula
somente aos domingos. A assinatura do primeiro custa uma
libra esterlina por dia, enquanto do segundo custa duas
libras esterlinas por semana, com assinaturas gratuitas para
bibliotecas cadastradas. No primeiro mês de cobrança o
jornal teve um declínio de 48% nos pageviews além de cair
609 posições no ranking Alexa, que mede a popularidade de
websites no mundo todo. Essa queda levou muitos leitores
aos jornais concorrentes como o Guardian e o Telegraph ou
mesmo a outros jornais que não são concorrentes diretos do
Times, como o tablóide Daily Mail.
Apesar de tudo, segundo Borges [3], a internet não é a prin-
cipal culpada nessa queda no número de leitores do jornal
impresso, que vem acontecendo desde o final dos anos 80,
antes da popularização da grande rede. O autor cita como
uma das causas o fato de que muitos jornais, que
tradicionalmente tinham uma administração familiar, passa-
ram a ser dirigidos por grupos de investimento como a já
citada News Corp. Nestes grupos a pressão por lucro é
maior, podendo levar em alguns casos a redução de recur-
sos, de custos e de pessoal, refletindo em uma queda na
qualidade do produto jornalístico.
No Brasil, O Globo Online disponibiliza as notícias de
última hora e outras notícias exclusivas da versão online
gratuitamente. O conteúdo do jornal impresso, incluindo as
colunas de opinião, só podem ser acessados por assinantes
da versão impressa. Não há assinatura exclusiva para a
versão eletrônica. Segundo Borges [3], O Globo Online não
se sustenta com propaganda e é um dos poucos jornais
online lucrativos graças à publicação dos chamados produ-
tos editoriais, ou seja, matérias pagas por empresas que bus-
cam a divulgação de seu ramo de atividade e atingir o pú-
blico consumidor do jornal.
O Jornal do Brasil recentemente publicou um comunicado
que devido suas dívidas o jornal deixará de circular como
impresso, sendo publicado exclusivamente na internet a
partir do dia 1º de setembro de 2010.
Porém nem tudo está perdido para o jornalismo. Os
smartphones, celulares modernos, com recursos como
agenda, acesso à internet e possibilidade de instalação de
aplicativos que aumentam suas funcionalidades, se tor-
naram um dos principais tipos de dispositivo de consumo
de mídia no mundo inteiro. Mais recentemente surgiram
também os leitores eletrônicos, e-readers em inglês, apare-
lhos voltados especificamente para a leitura de livros, jor-
nais ou revistas. Os jornais passaram a publicar conteúdo
também para estes dispositivos, através de assinatura ou
venda de exemplares avulsos, como faz o jornal O Globo
para a plataforma Kindle, da Amazon. A Esquire lança suas
edições simultaneamente nas bancas e como aplicativo para
o celular iPhone, da Apple. Muitos jornais e revistas já lan-
çaram aplicativos e edições para o leitor de ebooks iPad,
também da Apple. As perspectivas de lucros com venda de
conteúdo para estes dispositivos são promissoras, as
empresas estão empolgadas com o segmento e vêm
planejando modelos de cobrança pelo conteúdo desde o
início, diferente do que foi feito na web.
ESCRITA IMPRESSA VS. ESCRITA ELETRÔNICA
A escrita passou por milhares de anos de evolução com
quase nenhuma mudança. O papel, que só como suporte da
escrita impressa é utilizado a cerca de 500 anos, hoje cede
terreno para suportes eletrônicos de escrita, que possuem
características distintas que refletem na forma como o texto
é lido. Hoje se cria conteúdo para a escrita eletrônica sem
considerar estas características, como se estes suportes se
comportassem da mesma maneira que o papel.
Na leitura tradicional a imagem é formada pela reflexão da
luz no papel. A resolução os textos e imagens, medida em
DPI (pontos por polegada, em inglês), é de 300 no caso das
revistas e de 150 a 200DPI no caso dos jornais. Essas duas
características são as principais responsáveis pelo conforto
da leitura do papel, que pode ainda ser dobrado e facilmente
carregado no bolso ou em uma bolsa, ter suas margens
usadas para anotações a lápis ou caneta e seus cantos
dobrados para a marcação de páginas. Alguns usuários afir-
mam sentir a falta de uma relação física com o texto ele-
trônico [16]. Os impressos não precisam de eletricidade
para ser lidos, bastando um pouco de luz ambiente.
Leitores eletrônicos
Os leitores eletrônicos ou digitais podem ser de dois
principais tipos: monitores CRT ou LCD e telas de E-Ink.
Monitores de CRT ou LCD
Monitores de CRT e LCD possuem características bastante
parecidas. Os primeiros eram mais comuns há algum
tempo, mas são maiores, pesados e consomem mais ener-
gia. Os monitores de LCD, mais portáteis, ficaram popu-
lares e estão presentes em computadores, laptops, televiso-
res, telefones celulares e outros dispositivos. Ambos pos-
suem baixa resolução de tela (72 a 100 DPI), com a imagem
formada através de emissão de luz, por isso têm não pos-
suem a riqueza de detalhe da impressão em papel e causam
maior incômodo na leitura. A iluminação ambiente também
influencia na leitura em dispositivos deste tipo: são quase
impossíveis de serem lidos sob incidência de luz direta
como a da luz do sol. Sua autonomia de bateria também é
considerada baixa em relação aos dispositivos de E-Ink.
Sua principal vantagem é a possibilidade de uso de imagens
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 39](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-45-320.jpg)
![coloridas e vídeos em conjunto com o texto escrito.
Monitores de E-Ink
A tecnologia de E-Ink (tinta eletrônica em inglês) surgiu
para fazer com que a leitura eletrônica ficasse mais próxima
da leitura no papel. Sua imagem é formada por micro
esferas que possuem um lado claro e outro escuro. Através
de uma descarga elétrica essas micro esferas se orientam
para formar a imagem, como no papel, através da reflexão
de luz. Sua resolução é maior que a dos monitores de LCD
e CRT – o leitor eletrônico Kindle possui uma resolução
próxima a de um jornal – e sofrem menos influência da
iluminação direta. Os leitores de tinta eletrônica em comer-
cialização hoje não são coloridos nem têm a possibilidade
de uso de vídeo.
Leitores digitais no mercado
Os dois leitores eletrônicos portáteis mais conhecidos à
venda hoje são o Kindle, da Amazon, e o iPad, da Apple. A
Amazon contou com sua relação com as editoras para a
disposição de um grande número de títulos em um leitor de
e-ink, o mais similar possível à leitura tradicional. Já a
Apple apostou em um leitor baseado na tecnologia LCD,
podendo assim vender tanto livros como jogos e filmes já
disponíveis em sua loja online. Sendo assim, o Kindle é ex-
clusivamente um leitor eletrônico, enquanto o iPad é um
dispositivo para consumo de mídia em geral, inclusive li-
vros, jornais e revistas eletrônicos. Existem alguns outros
leitores eletrônicos de menor expressão produzidos pela
Sony e pela Barnes Noble também com tela em e-ink. No
Brasil a Positivo lançou um leitor eletrônico em meados de
2010 e a livraria online Gato Sabido vende seus leitores
eletrônicos chamados Cool-er, ambos com tela de E-Ink.
Os leitores eletrônicos em geral possuem algumas funções
que buscam mimetizar os impressos, como a possibilidade
de se marcar ou sublinhar trechos do texto, marcar páginas
para posterior consulta e anotações laterais. Estas funções
em geral precisam de um mínimo de aprendizado sobre o
funcionamento do dispositivo em questão.
Leitura eletrônica
Com as diferentes características dos suportes eletrônicos, a
leitura ocorre de maneira diferente na tela e no monitor.
Alguns estudos indicam que ela ocorre de maneira até 30%
mais lenta nos monitores LCD e CRT [16]. Em outro
estudo conduzido [18] os leitores atribuíram notas altas em
relação à satisfação de leitura tanto no iPad quanto no
Kindle, apesar de levarem de 7 a 10% a mais de tempo para
lerem um texto eletrônico nos aparelhos em relação à uma
versão impressa. À leitura na tela do computador foram
atribuídas notas muito baixas.
O usuário de textos eletrônicos corre o olho pela tela, prin-
cipalmente pela parte superior, buscando imagens e texto
em destaque para decidir o que gostaria ou não de ler. A
arrumação do conteúdo em seções, com cabeçalhos e textos
em destaque também facilita esta seleção, assim como fra-
ses curtas e diretas. Como no papel, blocos de texto muito
largos fazem com que o leitor se perca ao passar para a
linha seguinte. Porém, este é um fator mais crítico no
monitor, pois as linhas podem extrapolar o limite da tela,
fazendo com que o uso da barra de rolagens horizontal seja
necessário e se torne ainda mais difícil achar a próxima
linha.
Algumas regras de escrita são similares às de estilo jornalís-
tico, outras são novas ou adaptações para melhor adequar a
leitura ao monitor. Deve-se procurar manter os parágrafos
pequenos, com no máximo 100 palavras cada um. As linhas
de texto também não podem ser muito compridas, para que
o leitor não se perca, e jamais deve ficar maior que a largu-
ra da tela, para que não haja necessidade do uso da barra de
rolagem. Algumas outras observações devem ser tomadas,
como manter a ordem direta nas sentenças e evitar palavras
ou linguagem rebuscada, mantendo a leitura o mais simples
possível [13, 28].
O corpo da fonte de texto também é um fator importante a
ser levado em consideração. Os usuários em geral costu-
mam estar a uma distância maior da tela de computador do
que a distância em que seguram um livro ou outro impres-
so, portanto o texto no computador não pode ter uma fonte
com o mesmo tamanho de corpo que num impresso. Um es-
paço entrelinhas maior, que deixa o texto “respirar” tam-
bém facilita a leitura em suportes eletrônicos.
Smartphones e leitores eletrônicos costumam ser segurados
a uma distância similar da dos livros, porém nos primeiros,
devido ao tamanho reduzido da tela, as linhas de textos ten-
dem a ficar muito curtas, fazendo com que a leitura seja
mais lenta.
JORNALISMO E TECNOLOGIA
O webjornalismo possui algumas características que o
diferenciam do jornalismo impresso tradicional, sendo uma
das principais a interatividade. O leitor se relaciona dire-
tamente com o autor e com outros leitores, através de chat,
email, sistema de comentário (e opinião) dos leitores e fó-
runs de discussão. O leitor pode passar a se sentir como par-
te integrante do processo e pode construir a publicação. Ele
tem uma atitude ativa, é um coautor ou editor da matéria.
Sem ele, não há narrativa.
Este processo de construção leva a uma customização ou
personalização do conteúdo jornalístico. O usuário constrói
sua narrativa, se aprofundando ou não em determinados
temas. As publicações têm a possibilidade de fornecer
conteúdos individualizados de acordo com o interesse do
usuário, através da pré-seleção dos assuntos por parte do
leitor ou de maneira automática, através da análise de seus
padrões de navegação [19].
Outro fator que diferencia o webjornal do jornalismo tradi-
cional é a facilidade de atualização. A periodização é uma
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 40](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-46-320.jpg)

![Figura 1: O jornal O Globo em sua versão para o Kindle –
foto de Michel Filho para O Globo
possui algumas características que diferenciam seus méto-
dos de publicação. A principal diferença é que o jornal onli-
ne diminui o tempo entre o ocorrido e sua publicação. As
notícias em tempo real trazem uma agilidade que só é
possível nessa mídia. O repórter envia para a redação ou
publica remotamente notas curtas durante o dia, conforme
as ocorrências, que posteriormente podem ser reutilizadas e
desenvolvidas para se tornar pequenas notícias, dependendo
da relevância ou repercussão. Frequentemente a repercus-
são determina que notícias serão mais trabalhadas para a
versão impressa do jornal.
Os jornais online normalmente têm um corpo menor de
repórteres e é comum que repórteres da versão impressa
sejam utilizados na versão online. Os repórteres do jornal
online têm maior autonomia e devem decidir que notícia
devem aprofundar. No caso de um notícia inicialmente apu-
rada por um repórter da versão impressa, é de responsabili-
dade do repórter do webjornal de averiguar os fatos e fazer
o aprofundamento. O editor do jornal online deve estar
sempre atento para atualizar notas, matérias e chamadas, as-
sim como decidir a o que dar destaque, pois um webjornal
está em constante fechamento.
No jornal online o espaço para publicação é virtualmente
infinito. O editor do jornal impresso tem uma preocupação
com o tamanho das páginas, a publicação de anúncios e sua
influência no layout, que não são as preocupações do editor
online. No webjornal notícias podem ser mais aprofunda-
das, outros temas que sofreram desgaste podem ser tra-
balhados e outras informações que no impresso seriam des-
cartadas podem ser publicadas com fotos, vídeos e até links
para notícias antigas, ajudando a dar o aprofundamento e
entendimento que o leitor desejar.
Segundo alguns analistas, a velocidade de publicação dos
webjornais deve empurrar os jornais impressos para uma
posição mais analítica, sem se ater aos acontecimentos em
si e mais ao seu contexto [3].
O Globo e o Kindle
O jornal O Globo lançou uma versão de seu jornal para o
leitor eletrônico Kindle, da Amazon. Esta edição eletrônica
só pode ser adquirida, em formato avulso ou por assinatura,
através da livraria online, em dólares e com cartão de crédi-
to internacional. O conteúdo é quase o mesmo da edição
impressa. Por uma restrição da Amazon deve ser enviada a
edição internacional do jornal a ser publicado. No caso do
Globo isso significa retirar informações localizadas como
as editorias de bairro e informações sobre eventos culturais.
Também por restrição da livraria eletrônica são retirados
todos os anúncios.
O jornal O Globo utiliza um software de gerenciamento e
arquivamento de reportagens, padrão no mercado editorial,
em que foi feita uma adaptação para gerar, junto com o
último clichê uma versão em XML que será enviada para a
Amazon para ser convertida em seu formato proprietário.
As fotos utilizadas são versões em baixa resolução em
formato JPG, as mesmas usadas no site do jornal.
O aparelho está agora em sua segunda versão e foi pensado
inicialmente para livros, não conteúdo jornalístico. Talvez
por isso a Amazon tenha fixado regras rígidas na publi-
cação e vinculado essa edição eletrônica a uma edição im-
pressa. Pode ser que no futuro o aparelho possa ter algumas
funções que permitam uma frequência maior de atualização
e talvez uma conexão com o site do jornal, permitindo a in-
clusão de hiperlinks e outros recursos hipermídia no apa-
relho.
A Esquire e o iPhone
Em Janeiro de 2010 a revista Esquire lançou sua edição
impressa com uma versão em formato de aplicativo para
iPhone, usando uma plataforma para a publicação de
revistas para o smartphone da Apple chamada Everest, cria-
da pela empresa ScrollMotion e vendida na época por
U$1,99, contra U$4,99 da versão impressa.
A versão para iPhone foi lançada não como uma edição
especial, mas como sendo a própria revista, com o conteúdo
integral à disposição do leitor para a leitura no smartphone.
Com exceção de uma pesquisa do tipo Quizz, a seção de
cartas e pequenos boxes de texto suplementar em alguns
artigos, tudo está presente nesta versão digital. Após este
número da revista a editora Hearst lançou uma versão do
leitor digital que oferece edições avulsas e assinaturas
trimestrais, semestrais e anuais. O aplicativo pode ser lido
no iPad, mas não foi desenvolvida explorando o maior es-
paço em tela do aparelho.
A edição eletrônica analisada, de janeiro de 2010, tem
como único anunciante a marca de desodorantes Axe em
pequenos banners após os artigos ou apresentada como uma
matéria, no fim do sumário. Como material bônus, um ví-
deo da “mais sexy mulher do mundo”, como eleita pela re-
vista em uma edição anterior.
O aplicativo é aberto com uma imagem da capa, exatamente
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 42](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-48-320.jpg)


















![Reconhecimento de Fonemas usando Predição Linear
para movimento labial de modelos faciais humanóides
virtuais
Raphael T. S. Carvalho, Rodrigo C. S. Costa, Paulo C. Cortez
Universidade Federal do Ceará, Brazil
Dept. de Engenharia de Teleinformática
Grupo de Interação Homem Máquina
raphael, rodcosta, cortez@gihm.info
ABSTRACT
Linear predictive analysis is a technique widely used in the
recognition of phonemes. In this article, we discuss the
different aspects of their applications in vowel recognition
of the Portuguese language and lip movements of a virtual
humanoid facial model. LP analysis is used to extract
features of the shape of the vocal tract, which is correlated
with the phoneme being spoken. The vectors of extracted
features are classified into a set of seven vowels using
artificial neural networks. The computational effort and
performance classification of this technique are analyzed.
The information extracted from the vowel can be applied to
the lip movement in entertainment applications and avatar
animation in virtual environments.
Author Keywords
Linear Predictive Analysis, vowel recognition, avatar
animation, lip movements.
1. INTRODUÇÃO
Personagens animados por computador podem ser
representados em duas ou três dimensões. Conhecidos
como humanóides virtuais ou avatares, podem ser
controlados por diferentes técnicas. Nas indústrias de jogos
são tradicionalmente manipulados através de joysticks.
Também é possı́vel animá-los através da utilização de
comandos presentes em interfaces gráficas, nas quais o
usuário deve escolher os comandos dentre um conjunto
finito de botões ou através de um mouse ou teclado [12].
Existem várias metodologias para animar um modelo facial
humanóide virtual, podendo ser baseadas em parâmetros
matemáticos, nas caracterı́sticas fı́sicas da face, em visão
artificial e no processamento da voz [1].
Geralmente, os métodos baseados em visão artificial se
Submetido para Interaction South America 2010.
concentram em apenas detectar a boca, por exemplo, aberta
ou fechada. Por outro lado, uma forma para realizar a
animação dos movimentos labiais de forma mais realista é
utilizar o reconhecimento de fonemas e palavras, a partir
do processamento da voz [8]. Em virtude disso, o objetivo
deste trabalho é realizar o estudo da técnica baseada em
Predição Linear usada no reconhecimento da fala para
aplicar na animação do movimento labial de um modelo
facial humanóide virtual.
O reconhecimento da fala consiste em identificar fonemas,
sı́labas, palavras para formar a mensagem original, ou
uma informação na qual existe uma seleção mais direta
da resposta, sem interpretação dela. Assim, uma ação
pode ser executada diretamente quando um padrão falado é
reconhecido [9].
O reconhecimento automático da voz consiste no processo
de extrair automaticamente a informação lingüı́stica do sinal
da fala, a qual está codificada. Este processo normalmente
acontece em três etapas conforme mostrado na Figura 1 [9].
A primeira etapa consiste em obter digitalmente o sinal de
áudio e convertê-lo para um padrão a ser utilizado pelas
etapas seguintes.
Figure 1. Etapas do processo de reconhecimento de voz.
A segunda etapa realiza a extração das caracterı́sticas que
descrevem adequadamente o sinal de voz ou o representam
de forma mais compacta. Esta etapa é necessária devido ao
fato do sinal de voz não ser usado diretamente para alimentar
a etapa de reconhecimento, exceto quando sub-amostrado.
Geralmente, o sinal de voz é ruidoso e pode possuir
milhares de amostras, tornando difı́cil seu armazenamento
e aumentando a complexidade do classificador.
A etapa de reconhecimento da fala consiste em classificar
essas caracterı́sticas e, em geral, é dividida em treinamento
e classificação. No treinamento, as caracterı́sticas dos
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 61](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-67-320.jpg)
![fonemas são utilizadas para determinar um modelo que
represente cada classe. A etapa de classificação usa o
modelo gerado no treinamento para determinar qual fonema
é pronunciado.
Baseado no processo de reconhecimento da voz, este artigo
está dividido em 9 seções. A Seção 2 apresenta os
fundamentos da produção da fala. A Seção 3 descreve a
ferramenta matemática utilizada para realização do trabalho.
A Seção 4 apresenta a técnica de extração de caracterı́sticas
para reconhecimento de fonemas. As Seções 5 e 6
descrevem o conjunto de dados e a metodologia de
simulação utilizados no trabalho, respectivamente. A Seção
7 descreve os resultados dos testes e por fim, a Seção
8 apresenta as considerações finais e as perspectivas de
trabalhos futuros.
2. MODELAGEM DA PRODUÇÃO DA FALA
A fala é uma das capacidades ou aptidões que os
seres humanos possuem de comunicação, manifestando
seus pensamentos, opiniões e sentimentos através dos
vocábulos. Consiste no principal sinal entre os distintos
sinais abordados pela linguagem natural, como por exemplo,
ideogramas, gestos, gritos, trejeitos e outros tipos de
linguagem corporal [9].
Existem duas principais fontes de caracterı́sticas da fala
especı́ficas aos locutores, as fı́sicas e as adquiridas (ou
aprendidas). As caracterı́sticas fı́sicas relacionam-se
principalmente ao trato vocal, estrutura formada pelas
cavidades que vão das pregas vocais até os lábios e o nariz
[11]. A Figura 2 ilustra o conjunto de órgãos que formam o
trato vocal e compõem o sistema de produção da fala.
Figure 2. Sistema de produção da fala [11].
Na produção da fala, as cordas vocais situadas na laringe são
excitadas pelo ar vindo dos pulmões. A vibração das pregas
vocais geradas devido à passagem do fluxo de ar produz
um som fraco e constituı́do de poucos harmônicos, que é
amplificado quando passa pelas cavidades de ressonância
(laringe, faringe, boca e nariz) e ganha “forma” final
quando é articulado através de movimentos de lı́ngua, lábios,
mandı́bula, dentes e palato [11].
Essa passagem pelas cavidades do trato vocal altera o
espectro do som devido às ressonâncias, que formam picos
de energia no espectro de frequência conhecidos como
formantes. Através da análise espectral da fala produzida
é possı́vel estimar a forma do trato vocal.
Uma classificação comum dos eventos sonoros é feita quanto
ao estado de vibração das cordas vocais. Adota-se uma
convenção de três estados: silêncio, vozeados (sonoros) e
não-vozeados (surdos). O silêncio representa a etapa em
que nenhum som é produzido. Os sons ou fonemas sonoros
são aqueles em que as cordas vocais são tensionadas e
vibram de maneira aproximadamente periódica. Os sons
surdos são produzidos quando não há vibração das cordas
vocais, de modo que o som é formado basicamente nas
cavidades do trato vocal, resultando em um sinal com
natureza não-periódica ou aleatória [11].
São ilustrados na Figura 3 exemplos de sons vozeados e
não-vozeados, em que se pode observar na Figura 3(a) a
natureza aleatória dos sons não-vozeados e, na Figura 3(b),
a forma quasi-periódica de um fonema vozeado.
(a) Elocução do fonema
/s/: Som não-vozeado.
(b) Fonema /z/: Som
vozeado
Figure 3. Exemplo de eventos sonoros vozeados e não-vozeados [11].
Os sons vozeados não devem ser confundidos com os
fonemas da lı́ngua portuguesa, uma vez que, o som é
entendido como uma complexa realidade fı́sico acústica
de cada unidade sonora da fala, enquanto que os fonemas
correspondem a percepção eclética e interpretativa realizada
pelo falante e ouvinte, respectivamente [9].
O fonema é a menor unidade sonora (fonética) de
uma lı́ngua que estabelece contraste de significado para
diferenciar palavras. Os fonemas, na lı́ngua portuguesa, são
classificados em vogais, semi-vogais e consoantes.
As vogais são sons produzidos sem obstáculos para a
passagem de ar, que passa livremente pela boca, oriundo
do pulmão. Sua emissão é independente de outro fonema,
por isso constitui a base da sı́laba. Os sons das vogais
produzem-se a partir de diferentes posicionamentos dos
músculos da boca, constituı́dos pela lı́ngua, pelos lábios e
pelo palato.
Na produção das vogais, a forma do trato vocal é constante
com o tempo e uniforme, com as vibrações sustentadas das
cordas vocais. Assim, para as vogais, o trato vocal pode ser,
aproximadamente, modelado como uma concatenação de
uma série de tubos cilı́ndricos de área transversal uniforme
[5].
Uma aproximação simples do modelo que consiste em 𝑚
tubos acústicos é ilustrado na Figura 4. Os tubos têm as áreas
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 62](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-68-320.jpg)
![Figure 4. Representação esquemática do sistema vocal e aproximação
por tubos concatenados [5].
transversais 𝐴1 a 𝐴𝑚. Embora estes valores têm grande
variação de pessoa para pessoa, a distribuição é semelhante
em relação a uma dada vogal.
As semi-vogais sempre acompanham uma vogal, formando
sı́laba com ela. Na lı́ngua escrita, as semi-vogais são
representadas pelo i e u, podendo em alguns casos serem
representadas pelo e e o.
As consoantes são fonemas produzidos através da obstrução
do ar proveniente do pulmão, precisando de uma vogal para
ser emitidos. Esses obstáculos podem ser totais ou parciais,
a partir da posição da lı́ngua e dos lábios.
Com base no conhecimento sobre as caracterı́sticas
da formação da fala humana, é possı́vel entender os
fundamentos da técnica de extração de caracterı́sticas
descrita na próxima seção.
3. PREDIÇÃO LINEAR
Predição Linear (LP) é uma operação matemática em que os
valores futuros de um sinal de tempo-discreto são estimados
como uma função linear de amostras passadas.
Em Processamento Digital de Sinais (PDS), LP é
freqüentemente chamada Codificação Linear Preditiva
(LPC) e pode então ser vista como um sub-conjunto de teoria
de filtros.
Para um sinal discreto 𝑠𝑛, LP consiste em modelar o sinal
como a saı́da de um sistema com entrada desconhecida 𝑢𝑛,
representado matematicamente por [7]
𝑠𝑛 = −
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ˆ
𝑠𝑛−𝑘 + 𝐺 ⋅
𝑞
∑
𝑙=0
𝑏𝑙 ⋅ 𝑢𝑛−1, 𝑏0 = 1 (1)
em que 𝑎𝑘, 1 ⩽ 𝑘 ⩽ 𝑝, 𝑏𝑙, 1 ⩽ 𝑙 ⩽ 𝑞, e o ganho 𝐺 são os
parâmetros do sistema hipotético. Esta equação mostra que
a saı́da 𝑠𝑛 é uma função linear de saı́das passadas e entradas
presentes e passadas.
A equação 1 pode também ser especificada no domı́nio
da freqüência aplicando-se a Transformada Z em ambos
os lados dessa equação, obtendo com isso a função de
transferência 𝐻(𝑧) do sistema [7]
𝐻(𝑧) =
𝑆(𝑧)
𝑈(𝑧)
= 𝐺
1 +
𝑞
∑
𝑙=1
𝑏𝑙 ⋅ 𝑧−𝑙
1 +
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ 𝑧−𝑘
, (2)
em que 𝑈(𝑧) é a Transformada Z da entrada desconhecida
𝑢𝑛 e 𝑆(𝑧) é a Transformada Z de 𝑠𝑛 dada por
𝑆(𝑧) =
∞
∑
𝑛=−∞
𝑠𝑛 ⋅ 𝑧−𝑛
. (3)
Quando 𝑏𝑙 = 0 para 1 ⩽ 𝑙 ⩽ 𝑞, tem-se um modelo chamado
de todo-pólo, também conhecido como Auto-Regressivo
(AR) [7].
3.1 Estimação dos parâmetros
O modelo todo-pólo é utilizado nos sinais da fala, em
que o sinal de entrada 𝑢𝑛 pode ser considerado como
desconhecido. Desta forma, o sinal 𝑠𝑛 pode ser predito
somente através do somatório ponderado linearmente das
amostras passadas. A aproximação de 𝑠𝑛 por ˜
𝑠𝑛 é dada por
˜
𝑠𝑛 = −
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ˆ
𝑠𝑛−𝑘. (4)
A estimação dos parâmetros desse modelo pode ser feita
através do Método dos Mı́nimos Quadráticos (MMQ), em
que assumi-se que o erro 𝑒𝑛, entre o valor atual 𝑠𝑛 e o valor
predito ˜
𝑠𝑛, é dado por
𝑒𝑛 = 𝑠𝑛 − ˜
𝑠𝑛 = 𝑠𝑛 +
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ˆ
𝑠𝑛−𝑘. (5)
No MMQ, os parâmetros 𝑎𝑘 são obtidos com o resultado
da minimização do Erro Quadrático Médio (MSE-Mean
Squared Error) ou do erro total em função de cada um
dos parâmetros. A análise pode ser realizada através de
duas abordagens. A primeira assume 𝑠𝑛 como um sinal
determinı́stico e a segunda como um processo aleatório.
Na primeira abordagem, o erro quadrático 𝐸 é dado por [7]
𝐸 =
∑
𝑛
𝑒𝑛
2
=
∑
𝑛
(
𝑠𝑛 +
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ˆ
𝑠𝑛−𝑘
)2
, (6)
podendo ser minimizado utilizando a expressão
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 63](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-69-320.jpg)
![∂𝐸
∂𝑎𝑖
= 0, 1 ⩽ 𝑖 ⩽ 𝑝 (7)
A partir das equações 6 e 7, obtém-se o seguinte conjunto de
equações
𝑝
∑
𝑘=1
𝑎𝑘
∑
𝑛
𝑠𝑛−𝑘 ⋅ 𝑠𝑛−𝑖 = −
∑
𝑛
𝑠𝑛𝑠𝑛−𝑖. (8)
O MSE total, denotado por 𝐸𝑝, é obtido expandindo a
equação 6 e substituindo na equação 8, resultando em
𝐸𝑝 =
∑
𝑛
𝑠𝑛
2
+
𝑝
∑
𝑘=1
𝑎𝑘
∑
𝑛
𝑠𝑛 ⋅ 𝑠𝑛−𝑘 (9)
Existem dois métodos para estimar os parâmetros
dependendo do intervalo de duração do erro: o método de
autocorrelação e método da covariância.
No Método de Autocorrelação, o erro é minimizado para um
intervalo infinito −∞ 𝑛 ∞. Assim, as equações 8 e 9
são reduzidas a [7]
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ 𝑅(𝑖 − 𝑘) = −𝑅(𝑖), 1 ⩽ 𝑖 ⩽ 𝑝 (10)
𝐸𝑝 = 𝑅(0) +
𝑝
∑
𝑘=1
𝑎𝑘𝑅(𝑘), (11)
em que
𝑅(𝑖) =
∞
∑
𝑛=−∞
𝑠𝑛𝑠𝑛+1, (12)
é a função de autocorrelação do sinal 𝑠𝑛. Note que 𝑅(𝑖) é
uma função par, ou seja, 𝑅(−𝑖) = 𝑅(𝑖). Os parâmetros
𝑅(𝑖 − 𝑘) formam o que é conhecido como matriz de
autocorrelação. Na prática, o sinal 𝑠𝑛 é conhecido ou
utilizado apenas em um intervalo finito 0 ⩽ 𝑛 ⩽ 𝑁 − 1.
Desta forma, a função de autocorrelação é dada por
𝑅(𝑖) =
𝑁−1−𝑖
∑
𝑛=0
𝑠′
𝑛𝑠′
𝑛+1, 𝑖 ⩾ 0. (13)
No Método da Covariância, o erro é minimizado para um
intervalo finito 0 ⩽ 𝑛 ⩽ 𝑁 − 1. Assim, as equações 8 e 9
são reduzidas a
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ 𝜑𝑘𝑖 = −𝜑0𝑖, 1 ⩽ 𝑖 ⩽ 𝑝 (14)
𝐸𝑝 = 𝜑00 +
𝑝
∑
𝑘=1
𝑎𝑘𝜑0𝑘, (15)
em que a covariância do sinal 𝑠𝑛 no dado intervalo é dada
por
𝜑𝑖𝑘 =
𝑁−1
∑
𝑛=0
𝑠𝑛−𝑖𝑠𝑛−𝑘. (16)
Os coeficientes 𝜑𝑘𝑖 na equação 14 formam a matriz de
covariância. A partir da equação 16, pode-se mostrar que
a matriz de covariância 𝜑𝑖𝑘 é simétrica, ou seja, 𝜑𝑘𝑖 = 𝜑𝑖𝑘.
Com base na equação 16, observa-se que os termos ao longo
da diagonal principal estão relacionados com o coeficiente
anterior através da relação
𝜑𝑖+1,𝑘+1 = 𝜑𝑖𝑘 + 𝑠−𝑖−1𝑠−𝑘−1 − 𝑠𝑁−1−𝑖𝑠𝑁−1−𝑘. (17)
A partir da equação 17, verifica-se que para determinar os
valores do sinal 𝑠𝑛, para −𝑝 ⩽ 𝑛 ⩽ 𝑁 − 1, deve ser
conhecido um total de 𝑝 + 𝑁 amostras. O método de
covariância reduz-se ao método de autocorrelação quando
𝑁 tende ao infinito.
A segunda abordagem considera o sinal aleatório e o erro 𝑒𝑛
na equação 5 também é um processo aleatório. Pelo MMQ,
minimiza-se o valor esperado ℰ do quadrado da erro, ou seja
𝐸 = ℰ(𝑒𝑛
2
) = ℰ
(
𝑠𝑛 +
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ˆ
𝑠𝑛−𝑘
)2
. (18)
Aplicar a equação 7 na equação 18 resulta em
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ℰ(𝑠𝑛−𝑘𝑠𝑛−𝑖) = ℰ(𝑠𝑛𝑠𝑛−𝑖), 1 ⩽ 𝑖 ⩽ 𝑝. (19)
O erro médio mı́nimo é então dado por
𝐸𝑝 = ℰ(𝑠𝑛
2
) +
𝑝
∑
𝑘=1
𝑎𝑘ℰ𝑠𝑛𝑠𝑛−𝑘. (20)
A forma de resolução das equações 19 e 20 depende se o
processo 𝑠𝑛 é estacionário ou não estacionário. No caso em
que 𝑠𝑛 é um processo estacionário, tem-se que
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 64](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-70-320.jpg)
![ℰ(𝑠𝑛−𝑘𝑠𝑛−𝑖) = 𝑅(𝑖 − 𝑘), (21)
em que 𝑅(𝑖) é a autocorrelação do processo. Com isso, as
equações 19 e 9 reduzem-se a equações idênticas a 10 e
11, respectivamente. A única diferença é que, neste caso,
a autocorrelação é de um processo estacionário em vez de
um sinal determinı́stico. O caso estacionário fornece a
mesma solução para os coeficientes 𝑎𝑘 que o método de
autocorrelação no caso determinı́stico [7]. Além disso, se
o processo é estacionário e ergódico, a autocorrelação pode
ser calculada para um tempo médio.
Se 𝑠𝑛 é um processo não-estacionário, tem-se que
ℰ(𝑠𝑛−𝑘𝑠𝑛−𝑖) = 𝑅(𝑛 − 𝑘, 𝑛 − 𝑖), (22)
em que 𝑅(𝑛 − 𝑘, 𝑛 − 𝑖) é a autocorrelação não-estacionária
entre os tempos 𝑛−𝑘 e 𝑛−𝑖. Assumindo-se que a estimação
de parâmetros de interesse ocorre no tempo n=0, as equações
19 e 9 podem ser reescritas como
𝑝
∑
𝑘=1
𝑎𝑘𝑅(−𝑘, −𝑖) = 𝑅(0, −𝑖), (23)
𝐸′
𝑝 = 𝑅(0, 0) +
𝑝
∑
𝑘=1
𝑎𝑘𝑅(0, 𝑘). (24)
respectivamente, em que 𝐸′
𝑝 é o erro médio mı́nimo do
processo não-estacionário.
Na estimativa dos coeficientes de autocorrelação
não-estacionário do sinal 𝑠𝑛, nota-se que os processos
não-estacionários são não ergódicos e, portanto, não se pode
substituir a média do conjunto por um tempo médio.
No entanto, para uma determinada classe de processos
não-estacionários, conhecidos como processos localmente
estacionários, é razoável estimar a função de autocorrelação
com relação a um ponto no tempo como um tempo médio
de curto prazo. Exemplos de processos não estacionários,
que podem ser considerados localmente estacionários, são
de sinais da fala e de Eletroencefalograma(EEG) [7].
De maneira análoga ao caso estacionário, estima-se
𝑅(−𝑘, −𝑖) através de 𝜑𝑖𝑘 utilizando a equação 16. Usar
esta aproximação para a autocorrelação de um processo
não-estacionário conduz a uma solução para os parâmetros
𝑎𝑘 na equação 23 que é idêntico ao que é dado pela
equação 14 no método de covariância para o caso
determinı́stico. Observa-se que, para um sinal estacionário,
𝑅(𝑡, 𝑡′
) = 𝑅(𝑡 − 𝑡′
) e, portanto, as equações 23 e 24 são
reduzidas e resultam nas equações 10 e 11.
3.2 Cálculo dos Parâmetros Preditivos
Para cada uma das duas abordagens de predição linear
apresentada anteriormente, os coeficientes preditivos 𝑎𝑘,
1 ⩽ 𝑘 ⩽ 𝑝, podem ser calculados resolvendo um conjunto
de 𝑝 equações em que 𝑝 é desconhecido. Essas equações são
mostradas na equação 10 para o método de autocorrelação
(estacionário) e na equação 14 para o método da covariância
(não-estacionário).
Existem diversos métodos para otimizar os cálculos
necessários para solução dessas equações, por exemplo, o
método de redução ou eliminação de Gauss e o método
de redução de Crout [7]. Estes métodos gerais requerem
𝑝3
/3 + 𝑂(𝑝2
) operações (multiplicações ou divisões) e 𝑝2
locais de armazenamento.
Entretanto, evidencia-se através de 10 e 14 que a matriz
de coeficientes em cada caso é uma matriz de covariância.
Matrizes de covariância são simétricas e, em geral,
semi-definidas positiva, embora na prática são, geralmente,
definidas positiva.
Portanto, as equações 10 e 14 podem ser solucionadas
mais eficientemente através do método de decomposição de
Cholesky. Este método requer 𝑝3
/6 + 𝑂(𝑝2
) cálculos e
𝑝2
/2 armazenamento, ou seja, representa metade do esforço
computacional dos métodos gerais [7].
É possı́vel reduzir mais o armazenamento e o tempo de
cálculo, analisando a forma especial da equação 10. Esta
equação pode ser expandida na forma matricial
⎡
⎢
⎢
⎣
𝑅0 𝑅1 . . . 𝑅𝑝−1
𝑅1 𝑅0 . . . 𝑅𝑝−2
.
.
.
.
.
.
...
.
.
.
𝑅𝑝−1 𝑅𝑝−2 . . . 𝑅0
⎤
⎥
⎥
⎦ =
⎡
⎢
⎢
⎣
𝑎1
𝑎2
.
.
.
𝑎𝑝
⎤
⎥
⎥
⎦ = −
⎡
⎢
⎢
⎣
𝑅1
𝑅2
.
.
.
𝑅𝑝
⎤
⎥
⎥
⎦ .
(25)
Através desta equação é possı́vel observar que a matriz de
autocorrelação 𝑝 × 𝑝 é simétrica e os elementos ao longo de
qualquer diagonal são idênticos.
[6] propôs um procedimento recursivo para solucionar esse
tipo de equação. O procedimento foi mais tarde reformulado
por [10]. Este método supõe que o vetor coluna no
lado direito da equação 25 é um vetor coluna genértico.
Um outro método, proposto por [3], considera que este
vetor coluna compreende os mesmos elementos encontrados
na matriz de autocorrelação, possuindo um desempenho
computacional duas vezes maior que o método de [6]. O
método requer apenas 2𝑝 locais de armazenamento e 𝑝2
+
𝑂(𝑝) operações: uma grande redução de complexidade em
relação aos métodos gerais.
O procedimento recursivo de Durbin pode ser especificado
através das seguintes equações [7]:
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 65](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-71-320.jpg)
![𝐸0 = 𝑅(0), (26)
𝑘𝑖 = −
𝑅(𝑖) +
𝑖−1
∑
𝑗=1
𝑎
(𝑖−1)
𝑗 𝑅(𝑖 − 𝑗)
𝐸𝑖−1
, (27)
𝑎
(𝑖)
𝑖 = 𝑘𝑖, (28)
𝑎
(𝑖)
𝑗 = 𝑎
(𝑖−1)
𝑗 + 𝑘𝑖 ⋅ 𝑎
(𝑖−1)
𝑖−𝑗 , 1 ⩽ 𝑗 ⩽ 𝑖 − 1, (29)
𝐸𝑖 = (1 − 𝑘2
𝑖 )𝐸𝑖−1. (30)
Estas equações 27 a 30 são solucionadas recursivamente
para 𝑖 = 1, 2, . . . , 𝑝, cuja solução final é dada por
𝑎𝑗 = 𝑎
(𝑝)
𝑗 . (31)
O cálculo dos coeficientes de autocorrelação ou de
covariância requer 𝑝 ⋅ 𝑁 operações, que podem influenciar o
tempo da computação se 𝑁 𝑝, como é freqüentemente
o caso.
A solução da equação 25 não é afetada se todos os
coeficientes de autocorrelação são multiplicados por uma
constante. Em particular, se todos 𝑅(𝑖) são normalizados,
isto é divididos por 𝑅(0), são formados os coeficientes de
autocorrelação normalizados 𝑟(𝑖)
𝑟(𝑖) =
𝑅(𝑖)
𝑅(0)
. (32)
em que ∣𝑟(𝑖)∣ ⩽ 1.
Um sub-produto do algoritmo recursivo de [3] é o cálculo
do erro mı́nimo total 𝐸𝑖 em cada etapa. Pode-se facilmente
mostrar que o erro mı́nimo 𝐸𝑖 diminui à medida que a ordem
da predição aumenta. Neste caso 𝐸𝑖 não é negativo, logo, é
um erro quadrático. Portanto, tem-se que [7]
1 ⩽ 𝐸𝑖 ⩽ 𝐸𝑖−1, 𝐸0 = 𝑅(0). (33)
Se os coeficientes de autocorrelação são normalizados
utilizando a equação 32, então o erro mı́nimo 𝐸𝑖 é também
dividido por 𝑅(0), sendo conhecido como erro normalizado
𝑉𝑖, dado por
𝑉𝑖 =
𝐸𝑖
𝑅(0)
= 1 +
𝑖
∑
𝑘=1
𝑎𝑘𝑟(𝑘). (34)
Considerando-se a relação descrita na equação 33 é possı́vel
observar que
1 ⩽ 𝑉𝑖 ⩽ 𝑝, 𝑖 ⩾ 0. (35)
Também, utilizando as equações 30 e 34, o erro normalizado
final 𝑉𝑝 é dado por
𝑉𝑝 =
𝑝
∏
𝑖=1
1 − 𝑘𝑖
2
. (36)
As quantidades intermediárias 𝑘𝑖, 1 ⩽ 𝑖 ⩽ 𝑝, são conhecidas
como coeficientes de reflexão, também denominados de
coeficientes de correlação parcial. O coeficiente 𝑘𝑖 pode
ser interpretado como a correlação parcial (negativa) entre
𝑠𝑛 e 𝑠𝑛+1, mantendo 𝑠𝑛+1, ⋅ ⋅ ⋅ , 𝑠𝑛+𝑖−1 fixos. O uso
do termo “coeficiente de reflexão” vem da teoria de linha
de transmissão, em que 𝑘𝑖 pode ser considerado como
coeficientes de reflexão no limite entre duas seções com
impedâncias 𝑍𝑖 + 𝑍𝑖+1, sendo dado por [7]
𝑘𝑖 =
𝑍𝑖+1 − 𝑍𝑖
𝑍𝑖+1 + 𝑍𝑖
. (37)
Assim, a função de transferência 𝐻(𝑧) pode então ser
considerada como uma seqüência de seções com taxas de
impedância, usando a equação 37, sendo dada por
𝑍𝑖+1
𝑍𝑖
=
1 + 𝑘𝑖
1 − 𝑘𝑖
, 1 ⩽ 𝑘 ⩽ 𝑝. (38)
A mesma explicação pode ser dada para qualquer tipo
de situação em que existe transmissão de onda plana
com incidência normal, em um meio consistindo de uma
seqüência de seções com diferentes impedâncias. No caso
de um tubo acústico com 𝑝 seções de igual espessura, a
taxa de impedância reduz ao inverso da taxa de áreas de
seção-transversal consecutivas. Este fato pode ser usado na
análise da fala.
4. EXTRAÇÃO DE CARACTERı́STICAS
Para identificar o fonema, alguma de suas caracterı́sticas
no tempo/frequência ou em algum outro domı́nio devem
ser conhecidos. Assim, uma caracterı́stica pode ser
definida como uma unidade mı́nima, que distingue fonemas
maximamente próximos [4].
Através da extração de caracterı́sticas, o espaço de dados
é transformado num espaço de caracterı́sticas que possui
a mesma dimensão do espaço de dados original, porém
é representado por um número reduzido de caracterı́sticas
efetivas [2].
O método baseado em Predição Linear realiza a extração
da informação da forma do trato vocal, utilizando a análise
proposta por [13]. O método compara um modelo do filtro
acústico, representado na Figura 4 pelos tubos conectados,
com o modelo de produção da fala.
A comparação entre o modelo de tubo acústico e o modelo
derivado da LP conduz a seguinte conclusão. Os coeficientes
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 66](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-72-320.jpg)
![de reflexão 𝑘𝑖, calculados como um subproduto do algoritmo
recursivo de LP, estão diretamente relacionados com a
variação da área do trato vocal, conforme o modelo do tubo
concatenadas, através da equação [5]
𝑘𝑖 =
𝐴𝑖−1 − 𝐴𝑖
𝐴𝑖−1 + 𝐴𝑖
. (39)
Estes coeficientes de reflexão são usados como
caracterı́sticas para classificação. As caracterı́sticas
extraı́das fornecem a informação da forma do trato vocal
para vogais sustentadas, através da equação 39.
5. CONJUNTO DE DADOS
Para analisar a LP na extração de caracterı́sticas, utiliza-se
um conjunto de dados formado pelas amostras de áudio
dos fonemas do tipo vogal. Essas amostras são capturadas
de 13 pessoas, sendo uma do sexo feminino, pronunciando
cada vogal durante aproximadamente 3 segundos de forma
constante e sem pausas, variando-se apenas a distância para
o microfone. Para aquisição das amostras é utilizado um
microfone para computadores pessoais da marca Leadership.
As vogais pronunciadas consistem nas vogais da lı́ngua
portuguesa a, ê, é, i, ô, ó, u. No total, o conjunto de dados
possui 7 classes de vogais.
As amostras de áudio são extraı́das a uma taxa de
amostragem de 8kHz e 8 bits na quantização, ou seja, a
configuração mı́nima de digitalização de um sinal de voz.
Utiliza-se a configuração mı́nima para permitir uma melhor
análise da técnica de extração de caracterı́sticas, explorando
ao máximo o potencial desta técnica. Todas as amostras
foram gravadas em uma sala fechada com ruı́do proveniente
de condicionadores de ar e de forma espontânea.
6. METODOLOGIA DE SIMULAÇÃO
Para avaliar o desempenho dessa técnica são realizadas
simulações em um computador pessoal da marca Dell
com processador Intel Pentium D de 2,80 GHz e 2
GB de memória RAM com sistema operacional Windows
XP. Todas as simulações foram realizadas utilizando-se a
plataforma de simulação Simulink do Maltab versão 2006b.
A Figura 5 ilustra o fluxograma da metodologia do
reconhecimento de vogais usando Predição linear.
O sinal de voz é não-estacionário e ruidoso, de modo que
a analogia com filtros digitais somente é válida para um
perı́odo de tempo aproximadamente estacionário da fala, que
geralmente é em torno de 10 a 30 ms.
Para esse fim, implementa-se o janelamento do sinal
utilizando uma janela retangular que é movida ao longo do
sinal de voz sem sobreposição entre frames adjacentes. O
tamanho dessa janela nos testes é de 32ms, ou seja, 256
amostras de áudio por frame para um taxa de amostragem
de 8kHz.
Quanto à etapa de extração de caracterı́sticas, varia-se
Figure 5. Fluxograma do reconhecimento de vogais usando LP.
a quantidade de caracterı́sticas extraı́das por frame de
áudio. No método baseado em LP varia-se a quantidade de
coeficientes de reflexão de 8 a 28.
O classificador utilizado para avaliar as técnicas de extração
é a rede neural Perceptron Multicamadas (MLP) com 2
camadas, 1 camada de entrada com quantidade de neurônios
igual ao número de caracterı́sticas extraı́das e 1 camada de
saı́da com 7 neurônios referentes às classes das vogais. Os
parâmetros de treinamento da rede neural são escolhidos
para se obter um estudo mais preciso e são: 100 épocas de
treinamento, MSE desejado de 10−5
e passo de apredizagem
de 0, 01.
Para avaliar o desempenho de classificação, o conjunto de
dados é dividido em dois conjunto: um de treinamento e
outro de teste. As amostras são embaralhadas aleatoriamente
e 80% delas são atribuı́as ao conjunto de treinamento,
enquanto os 20% restantes são utilizados no teste.
A avaliação da técnica é feita com base nas taxas de acerto
média, máxima, mı́nima e desvio-padrão, e na matriz de
confusão. Além disso, o tempo total médio de treinamento
e de reconhecimento são determinados. Os resultados são
extraı́dos de 10 simulações independentes.
O resultado da classificação da rede neural é mostrado
no modelo facial humanóide virtual. Cada vogal tem
uma representação visual no modelo facial chamada de
visema, referente a um movimento labial especı́fico para a
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 67](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-73-320.jpg)


![Uma Visão da Interação além da Tecnologia
Milena Ribeiro Lopes
Instituto Nokia de Tecnologia
calma.milena@gmail.com
+55 61 81524819
Christina Maria Pedrazza Sega
Universidade de Brasília
segach@hotmail.com
+ 55 61 81318456
RESUMO
A área de design de interação surgiu em um contexto
essencialmente tecnológico que busca melhorar o uso dos
produtos portáteis com a reformulação da lógica de
comunicação entre homem e dispositivo. Por isso, muitos
autores que tentam definir os conceitos desta nova área
atrelam a disciplina à tecnologia. Temos visto, porém, que,
apesar de ter surgido neste âmbito, o Design de Interação
pode ser aplicado a muitos outros contextos e produtos, que
não necessariamente dependem de tecnologia. A interação é
tema de estudo em diversas áreas de conhecimento que
buscam entender o comportamento humano, mas é o
Design que propõe novas soluções de interação que poderão
beneficiar a todas elas. O Design de Interação é essencial à
computação, aos dispositivos móveis e a evolução dos
mesmos no mercado, mas pode também ser muito útil
quando aplicado a outras áreas, como Arquitetura, Cinema,
Marketing, entre outras.
Palavras-chave
Interação; design; contexto.
ACM Classification Keywords
H5.m. Information interfaces and presentation (e.g., HCI):
Miscellaneous.
INTRODUÇÃO
O cenário tecnológico no qual nos encontramos atualmente
tem sido berço para nascimento de muitas áreas de pesquisa
que visam acompanhar as inovações e as necessidades
humanas atreladas a elas.
A otimização da computação a tornou compacta, ubíqua,
portátil e possibilitou sua agregação a outros produtos de
uso pessoal, como PDAs e celulares. Esses produtos que
nos auxiliam diariamente em nossas tarefas são um grande
alvo de pesquisas para acompanhar as inovações
incessantes.
Os estudos a respeito dos novos adventos tecnológicos têm
sido tecidos por diversas áreas, como engenharia,
computação, psicologia e design, que colaboram
harmonicamente para as melhorias desses produtos e dão
origem a novas áreas de pesquisa que permeiam todas elas:
fatores humanos, usabilidade, interação homem-
computador, experiência do usuário, interface do usuário,
entre outras. O design de interação apareceu nesse mesmo
contexto, visando encontrar formas de melhorar a interação
e projetar interfaces inteligentes de forma nova e coerente.
As limitações a este cenário mercadológico momentâneo do
design de interação é o interesse particular desse estudo,
que visa analisar os conceitos e fundamentos atribuídos ao
mesmo e propor uma ampliação do contexto-foco da área,
para além da tecnologia.
CONCEITOS DE DESIGN DE INTERAÇÃO
O termo design de interação ainda é muito discutido por
especialistas que deram origem a vários conceitos nos
últimos anos, com diferentes reflexões a respeito dessa
nova área do design. A tentativa de encontrar os
fundamentos adequados para o design de interação visa
delimitar o campo de atuação dos pesquisadores e
profissionais deste ramo do design.
Bill Moggridge [15], que foi um dos primeiros a falar sobre
o assunto, e provavelmente o criador do termo, defende a
ideia de que o design de interação é o “design dos aspectos
subjetivo e qualitativo de todas as coisas; é ao mesmo
tempo digital e interativo, criando soluções que são
funcionais, desejáveis e acessíveis”. Sob essa perspectiva, o
design de interação se alinha aos propósitos do design na
função, estética e valor, e enfatiza o contexto tecnológico
no qual se insere. Dan Saffer [19] enquadra a disciplina nas
“artes aplicadas” e a define como “a arte que facilita as
interações entres os humanos por meio de produtos e
serviços que tenham algum tipo de consciência”. Deste
ponto de vista, a interação se destina a conectar humanos
com o auxílio de tecnologias inteligentes. Saffer [19]
explica muito bem o porquê de esta área seguir a
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 70](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-76-320.jpg)
![metodologia do design, reforçando que a forma de trabalhar
do design atende aos propósitos do design de interação,
como por exemplo, foco no usuário, prototipagem e
incorporação de emoção.
David Malouf [12], por sua vez, concordou com a linha de
raciocínio de Robert Reimann [18] e disse que os produtos,
serviços e sistemas devem responder aos estímulos criados
pelos seres humanos, e que essas respostas precisam ser
significativas, persuasivas e semi-previsíveis. Não muito
diferente disso, Nico McDonald [13] falou sobre a área que
definiria o relacionamento entre as ações do usuário e as
respostas para as mesmas.
Com base nessas definições e no contexto tecnológico no
qual o Design de Interação surgiu, é possível compreender
por que a disciplina está atrelada aos produtos e às
tecnologias mais recentes, e se destaca mais entre os
dispositivos móveis. Essa ênfase pode ser explicada pela
tendência de otimizar funções nos aparelhos e pela
necessidade crescente de tornar nossas atividades portáteis
e móveis. De acordo com Nico McDonald [13], o maior
desafio da área é projetar interações que são sensíveis à sua
localização e à sua atividade.
Uma das maiores preocupações discutidas pelos
especialistas, com o aparecimento desta nova disciplina, é
conseguir conceituá-la e delimitá-la para distingui-la das
outras disciplinas que compartilham temas, práticas e
teorias comuns.
Muitos dos elementos usados para descrever o design de
interação já são estudados por outras áreas e, às vezes, pode
parecer que este apenas reúne propriedades de outras
disciplinas em uma só. Saffer [19], por exemplo, apontou
componentes como o tempo, espaço, movimento, aparência,
textura e som como sendo os mais importantes em um
projeto. Esses componentes não são exclusivos do design
de interação, pois tempo, espaço, movimento e som já são
dimensões exploradas em todos os projetos com interfaces
digitais. Aparência e textura são elementos da arte e do
design como um todo e por isso não caracterizam uma nova
forma de arte por si só. Robert Reimann [18] afirma que
essa nova disciplina apropria-se das teorias do design
tradicional, da psicologia e engenharias e utiliza as técnicas
do design, apesar de ter seus próprios métodos de análise.
Analisando essas ideias e concatenando os elementos, é
possível entender que o Design de Interação é chamado de
Design devido à metodologia que utiliza (envolve técnicas
de pesquisa, geração de alternativas, análise e validação por
meio de protótipos), mas se diferencia por seu objetivo.
Diferentemente das outras subáreas do Design, ele se
preocupa em estudar e projetar respostas para as ações do
homem nos produtos cotidianos através de elementos
visuais, táteis e sonoros. Por essa diferenciação, o Design
de Interação é respeitado por muitos como uma nova
disciplina, apesar de utilizar parâmetros de usabilidade,
experiência do usuário, fatores humanos, design emocional
e psicologia cognitiva para a criação das soluções
interativas.
ESTUDOS DA INTERAÇÃO NA COMUNICAÇÃO
As interações sociais são estudadas há décadas por
comunicadores e sociólogos, que nos apresentaram os
estudos do comportamento do indivíduo e das massas na
sociedade, que possibilitaram um maior entendimento a
respeito das ações dos homens e das necessidades dos
mesmos. Esses estudos originaram pesquisas direcionadas
ao comportamento do consumidor, compartilhadas pelas
áreas da publicidade, marketing e psicologia, que teceram
estudos a respeito do processamento cognitivo e dos
estímulos sensoriais sinestésicos que podem ocasionar no
comportamento de um indivíduo.
De acordo com Sêga [20], para compreender o mundo e
ser por ele compreendido, o homem precisa integrar-se
nesse mundo. A autora defende a ideia de que através da
troca de experiências individuais e coletivas, os
significados dessas representações passam a ser
compreendidos mutuamente por todos, estabelecendo-se
as relações sociais e suas convenções. Esses conceitos nos
levam a refletir sobre as convenções impostas na interação
do homem com o mundo, do homem com o homem, de
acordo com Mead [14], do homem com o objeto, proposto
por Baudrillard [1], e do homem com ambientes.
O INTERACIONISMO SIMBÓLICO
As ideias interacionistas surgiram com a psicologia de
William James [8] e seus principais seguidores foram:
Charles Cooley [3], John Dewey [6] e George Herbert
Mead [14].
Os estudiosos do Interacionismo Simbólico compreendem
a linguagem como representação simbólica da realidade. O
mundo das linguagens é vasto, visto que há duas categorias
maiores de linguagens: a linguagem verbal e a linguagem
não-verbal. Dentro desta última categoria há uma gama de
outras formas de comunicação, como: a) pictorial
(desenhos, gravuras); b) auditiva (códigos de uma língua, a
sonora e a musical); c) gestual e expressiva (expressões
faciais).
O pai do interacionismo simbólico foi George Herbert
Mead [14] e seu maior discípulo foi Herbert Blumer [2],
criador do termo “interacionismo simbólico”, em 1937.
Embora Blumer concordasse com Mead, procurou ampliar
o campo do interacionismo, resolveu dar maior relevância
ao conceito de “significado” que, até então, havia sido
relegado ao segundo plano pelas ciências sociais da época.
Para ele, o universo dos indivíduos é constituído de objetos
e, para tanto, ele dividiu os objetos em: 1) físicos (coisas);
b) sociais; c) abstratos (ideias). Para ele, os objetos só
adquirem significado através da interação simbólica,
embora seus significados se diferenciem de pessoa para
pessoa, dependendo do contexto sócio-cultural dessas
pessoas.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 71](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-77-320.jpg)
![A realidade simbólica diz respeito sobre a maneira como
os indivíduos produzem símbolos e como esses indivíduos,
na categoria de receptores, assimilam outros símbolos
vindos de diferentes culturas. O símbolo busca uma relação
de identificação e de aproximação entre os membros de
uma dada sociedade, estabelecendo relações de interação
através da troca e compreensão da linguagem verbal ou
não-verbal, como a dos objetos. Como exemplo disso,
temos a guitarra elétrica simbolizando o “rock n’ roll”,
passando a ser um ícone desse gênero musical e assim
compreendido pelos seus adeptos.
Os meios de comunicação de massa, em especial a
televisão, vêm desempenhando a função de interagir os
indivíduos na sociedade de massa com determinados tipos
de programa, como por exemplo, os reality shows, com o
feedback do público telespectador.
No campo da mídia, a publicidade também vem cumprindo
com esse papel social de interação. Mesmo que ela atenda
aos interesses da economia, ela integra o indivíduo no
grupo em que pertence. Ultimamente, a publicidade vem
recebendo mais atenção e controle ético dos órgãos
responsáveis pela veiculação publicitária em vários países,
incluindo o Brasil. Separando os efeitos nocivos que ela
possa proporcionar aos indivíduos menos atentos a sua
manipulação, os produtos anunciados e destinados à venda
assumem o lugar da companhia ideal para o ser humano.
Tais objetos são capazes até de amenizar, mesmo que
temporariamente, a solidão de alguém. Se não fosse dessa
forma, as pesquisas de opinião pública não estariam
investigando o gosto do consumidor e até a compulsão
pelo consumo que algumas pessoas têm. Estudos pelos
quais os analistas do comportamento humano vêm se
interessando cada vez mais.
Ao anunciar um determinado produto e,
preferencialmente, a marca deste, o público-alvo, quer da
televisão, rádio ou mídia impressa, o elege como sendo
seu parceiro, sua cara-metade. Podemos ver isso nas
marcas de tênis e jeans usados pelos jovens, como forma
de auto-afirmação e de aceitação pelo grupo. Análises de
anúncios mostram que um homem, ao adquirir um carro,
está buscando, inconscientemente, a parceria ideal para
ele, ou seja, o relacionamento perfeito que ele gostaria de
ter ou a substituição de uma relação que já não o satisfaz
mais. Um carro não tem as reações humanas indesejáveis,
plenas de surpresas desagradáveis e que possam estar fora
de seu controle. À medida que a mídia dita os padrões
estéticos vigentes, a indústria automobilística procura
ajustar-se ao novo padrão estético e às necessidades
psicológicas e racionais do indivíduo. Consequentemente,
as indústrias automobilísticas, evidentemente com o apoio
de psicólogos e designers, projetaram os carros com
formas arredondadas lembrando as curvas do corpo
feminino, pois o formato redondo está mais relacionado à
emoção do que as linhas retas, sendo estas mais voltadas
para o raciocínio e a lógica, conforme Sêga (2005).
INTERAÇÃO MECÂNICA
No dia-a-dia, interagimos com objetos, com pessoas e com
o entorno em tempo integral, mas poucas vezes essa
interação é consciente. Quase toda a comunicação não-
verbal que realizamos é mecânica, fazemos por instinto ou
por aprendizado. Gazzaniza [7] afirma que em nosso
cotidiano temos 2% de consciência sobre as decisões que
tomamos e 98% de inconsciência, o que nos sugere que a
maior parte das nossas ações fazemos “adormecidos”.
De acordo com a teoria do cérebro tríplice de MacLean
[11], nosso cérebro humano é divido em três partes
relacionadas com fases da evolução da nossa espécie:
cérebro primitivo (instintivo, reptiliano), sistema límbico
(emocional, mamífero) e neocórtex (intelectual, primata),
mais evoluído e moderno, que compartilhamos com os
elefantes e cetáceos.
O cérebro primitivo está relacionado com a maneira como
gerenciamos a informação do presente e das sensações do
entorno. Para detectar as mudanças de informação
precisamos tê-las ordenadas, e em situações que existe
muita mudança de informação não detectamos bem o que
acontece ao nosso redor. Precisamos da ordem para
gerenciar a informação. Porém, quando recebemos sempre
os mesmos padrões, nos aborrecemos e nos desconectamos
do mundo exterior. Portanto, é importante que em nosso
cotidiano vivenciemos experiências que rompam com o
padrão, que tragam certo grau de complexidade para nossas
tarefas diárias.
O sistema límbico está relacionado com o passado, com a
memória e com a emoção. Ele se desenvolve em nossa
evolução quando começamos a viver em grupos e constituir
família, pois sem emoção e sem memória, uma mãe não
cuidaria de seus filhos (como os répteis que abandonam
suas crias). Os seres humanos são especialistas em
comunicação emocional, é como nos comunicamos não-
verbalmente a todo instante, detectando as emoções dos
outros. A interação que exercemos com o mundo ao nosso
redor faz parte dessa comunicação e está impregnada de
emoção. Infelizmente, interagimos mecanicamente em
nosso dia-a-dia, assistimos à televisão sentados no sofá,
fazemos compras com o carrinho percorrendo prateleiras,
abrimos portas para entrar nos lugares, tomamos banho em
pé, comemos sentados ao redor de uma mesa, pedimos
comida por meio de um cardápio, vemos o mundo através
de janelas, tudo de forma inconsciente, pois essas tarefas e
ações já não nos nutrem com novas experiências.
A parte moderna do cérebro, o neocórtex, está relacionada
com o futuro e com as habilidades artísticas, com a criação,
imaginação, compartilhamento de emoções, cooperação
social e experiências religiosas. Essa parte moderna do
cérebro sugere a constante necessidade que os humanos têm
de vivenciar novas experiências, reiterando a necessidade
do cérebro primitivo em oferecer certo grau de
complexidade de informação e do cérebro mamífero em
comunicar emocionalmente com o meio. Esses três cérebros
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 72](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-78-320.jpg)
![e suas características oferecem um questionamento sobre
como estamos interagindo com o meio, sobre a
mecanicidade de nossa comunicação, possibilidades a
serem exploradas nos três planos cerebrais através de novas
experiências interativas.
PRAZER, NOVAS EXPERIÊNCIAS
A construção de novas interações tem como objetivo
proporcionar prazer e satisfazer, principalmente, as
necessidades emocionais e intelectuais por meio da
ampliação da consciência da comunicação com o entorno.
Para entender melhor como funciona a nossa comunicação
com o meio, a nível biológico-psicológico, é necessário
analisar que tipos de pensamentos podemos ter quando
interagimos com o espaço ao nosso redor que estão
relacionados com as sensações processadas por nosso
cérebro e também compreender os tipos e os níveis de
prazer que esse tipo de interação poderia nos prover a nível
consciente e inconsciente. O pensamento produtivo é
definido por Joan Corbella [4] como o tipo de pensamento
que depende ao máximo de estímulos externos, percepções
do mundo exterior, e se ocupa das realidades do mundo e da
solução de problemas. O autor nos fala também do
pensamento criativo, relacionado com a imaginação e o
pensamento quimérico, relacionado com a fantasia e
obedecem apenas às leis da afetividade, deixando de lado a
realidade e a lógica.
O sistema afetivo faz julgamentos e nos permite saber
rapidamente o que é bom ou ruim em nosso entorno, pode
ser a nível inconsciente ou consciente. Já o sistema
cognitivo-emocional é consciente, nos permite interpretar e
dar sentido às coisas, ao mundo. De acordo com Damasio
[5], o afeto e a emoção são essenciais para o processo de
tomada de decisão, onde o afeto nos permite uma decisão
rápida e a emoção nos faz racionalizar conscientemente e
compreender as causas do afeto.
Donald Norman [17] defende a ideia de que as decisões
inconscientes não são capazes de uma manipulação
simbólica, de um raciocínio cuidadoso, pois o processo é
rápido, simples e automático. Já o processo consciente é
lento e trabalhoso, ponderamos as decisões e refletimos e
racionalizamos bastante para encontrar explicações.
Norman [16] propõe três níveis de processamento
relacionados com emoção e afeto que são aplicáveis ao
Design e aos objetos do nosso cotidiano, que são:
a) Nível visceral: Diz respeito à atração instintiva e ao
impacto emocional imediato. Não é racional e nos faz
gostar ou não de algo à primeira vista;
b) Nível comportamental: Relacionado com a
funcionalidade, efetividade, compreensão e sensação física
durante o uso dos objetos.
c) Nível Reflexivo: Relacionado com significado,
memórias, idéias, mensagens e valores que aportam os
objetos.
Com esses conceitos, podemos interligar o prazer que
sentimos quando vemos, utilizamos ou refletimos sobre um
determinado objeto com as necessidades instintivas,
emocionais ou cognitivas atreladas à natureza humana.
Experimentar e interagir com o entorno, realizando tarefas
cotidianas, de uma forma nova, significa instigar a pensar e
a racionalizar, de uma forma mais consciente (mesmo que
grande parte dessa comunicação ainda seja inconsciente) a
fim de obter prazer suprindo as necessidades emocionais e
intelectuais de nossa mente.
Para isso, é importante ressaltar que a ideia de re-projetar as
interações consiste em questionar a comunicação que existe
agora para melhorá-la e não apenas para promover
experiências novas. Ou seja, analisar como interagimos
com os objetos em determinadas situações e aperfeiçoar a
interação proporcionando uma comunicação mais intuitiva,
mais satisfatória e mais lógica, para que tenhamos mais
prazer, sensação que é reforçada pela complexidade do
novo (novos padrões/necessidades cerebrais) e pela
orientação do Design para emoção e afeto.
INTERAÇÃO PARA MÚLTIPLOS CONTEXTOS
O conceito de design de interação, apesar de ter sido
pensado para produtos tecnológicos, tem muitas aplicações
em produtos e ambientes não-tecnológicos, nos quais a
interação já vem sendo projetada de forma intuitiva.
De acordo com Jon Kolko [10] o design de interação é
reconhecido como um novo campo, porém as pessoas vêm
projetado interações há séculos. Ele afirma que a área tem
profundas raízes em muitas outras disciplinas existentes e
que por isso o assunto fica confuso nas outras áreas que
muitas vezes compartilham os mesmos nomes e as mesmas
técnicas.
Alguns estudos visam ampliar a visão inicial do design de
interação, incluindo estudos do corpo como produto, assim
como o ambiente e outros elementos que fazem parte de um
contexto. Karen Kortbek [9] afirma que o interesse na
inclusão do corpo no design de interação é crescente pela
comunidade de pesquisadores da interação homem-
computador. Em seu estudo de interação em espaços
públicos, a autora inclui técnicas de dramaturgia à
metodologia e explica que direção de atores e design de
interação podem se reabastecer mutuamente se o contexto
interativo, que inclui corpo, ambiente e a interação
propriamente dita, for “assistido” e “dirigido”.
Desta forma, percebemos que “projetar novas interações”
vai mais além da tecnologia e interfaces gráficas. O estudo
da interação pode ser tão importante para a produção de
aparelhos portáteis quanto para a arquitetura, artes plásticas,
design de produtos, entre outros. A área trata de re-projetar
a lógica de comunicação, antes de tudo, e pode ser
estendida a diversas outras áreas, onde a prática já existe
inconscientemente, sem o apoio de pesquisas, da
metodologia e espírito criativo.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 73](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-79-320.jpg)










![C.D.E. Uma Ferramenta para Análise de Jogos
Bruno William Carvalho Bulhões
Departamento de Design da Universidade Federal
do Paraná
460, General Carneiro, ed. Dom Pedro I,
Curitiba-PR
brunobulhoes@adugestudio.com
+55 41 96533274
Thiago de Souza Rodrigues Alves
Departamento de Design da Universidade Federal
do Paraná
460, General Carneiro, ed. Dom Pedro I, Curitiba-
PR
beto@adugestudio.com
+55 41 96265302
Rafael Pereira Dubiela
Departamento de Design da Universidade Federal do Paraná
460, General Carneiro, ed. Dom Pedro I, Curitiba-PR
rafaeldubiela@yahoo.com.br
+55 41 88423123
RESUMO
Neste artigo apresentamos uma abordagem formal e
aprofundada com o intuito de complementar o
conhecimento analítico do Design de Jogos. Baseado no
Framework MDA e em conceitos similares que se
aproximam das necessidades estruturais do nosso estudo,
criamos o Framework CDE (que significa Componentes,
Dinâmicas e Experiência). O Framework serve como uma
ferramenta capaz de fornecer uma visão estruturada
aprimorando tanto o estudo (do artefato – jogo digital)
quanto a prática (auxiliando no design). Componentes
representa o nível mais próximo do designer, onde este é
capaz de ter influência direta, ao passo que é o nível mais
abstrato para o usuário. Dinâmicas representa o nível cujas
interações acontecem, do sistema consigo, do sistema com
o usuário e dos usuários consigo. Experiência é o nível
menos tangível para o designer, porém, entendendo as
influências do sistema nesse aspecto é possível desenvolvê-
lo a fim de atender as necessidades do usuário, através do
entendimento das recompensas oferecidas, canais de
conforto e perfis de jogador. Acreditamos que essa
metodologia servirá para expandir o entendimento de jogos,
de acadêmicos a desenvolvedores.
Palavras Chave
Design de Jogos, Framework CDE, Componentes,
Dinâmicas, Experiência.
Classificação ACM
A.m. General Literature: Miscellaneous.
ABSTRACT
In this paper we present an indepth formal approach that
attempts to expand the analytical knowledge about Game
Design. Based on the MDA Framework and similar
concepts that approach its structural needs, we managed to
build the CDE Framework (standing for Components,
Dynamics and Experience). The framework serves as a tool
to provide a structured view that improves both the study
(of the artifact – digital game) and practical (helping with
the design). Components is the closest level to the
designer, where he directly take action, whereas it is the
most abstract level to the user. Dynamics is the level where
the interactions take place, from system-system to system-
user and user-user interactions. Experience is the least
tangible level to the designer, knowing its influences on the
system he may design it to fit to the user needs, through the
understanding of offered rewards, flow channels and player
profiles. We believe that this methodology will enhance the
understanding of games, from scholars to developers.
Author Keywords
Game Design, Framework CDE, Components, Dynamics,
Experience.
INTRODUÇÃO
Para estudar e desenvolver jogos existem diversas
abordagens e caracterizações que auxiliam os processos.
Um deles é a caracterização de Salen e Zimmerman [21]
que estrutura os jogos emtrês níveis, do formal ao abstrato:
rules, play e culture. Ele tem validade como ferramenta de
investigação, porem não tem a precisão necessária para
aplicação prática de design de jogos. De forma similar,
existe o framework Mechanics, Dynamics e Aestethics
(MDA) de Hunicke et al [13] que defende uma abordagem
do estudo e pratica do design de jogos nesses três níveis, do
formal ao abstrato. O framework MDA tem grande
funcionalidade pratica, e por sua vez não tem a
profundidade e abrangência necessária para estruturas
Permissiontomake digital or hard copies of all or part of this work for
personal or classroom use is grantedwithout fee provided that copies are
not made or distributedforprofit orcommercial advantage andthat copies
bear this notice andthe full citationonthe first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA.
Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 84](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-90-320.jpg)
![teóricas mais complexas. No entanto, este framework foi o
ponto de partida para o desenvolvimento do nosso próprio,
chamado Componentes, Dinâmicas e Experiência (CDE)
[2].
No framework CDE, componentes lidam com as unidades
que compõem o sistema. As regras, mecânicas, elementos
sensoriais, a narrativa e a interface do jogo são exemplos de
componentes. Componentes formam o nível formal do
framework.
Dinâmicas emergem das interações entre os componentes
do jogo entre si e com os jogadores que utilizam o sistema
de jogo. Portanto, emergem quando um ou mais jogadores
participam do sistema. Dinâmicas formam o nível
intermediário do framework.
Experiência é o ultimo nível, o qual diz respeito às
respostas sensoriais dos jogadores ao participarem de um
jogo. Experiência forma o nível abstrato do framework.
De modo similar ao MDA, o CDE estrutura-se de forma
que os componentes, durante o funcionamento do jogo,
contribuem para a emergência de dinâmicas de jogo, as
quais geram respostas sensoriais (experiência) no jogador.
Este fluxo é relacionado à perspectiva do designer.
O objetivo do framework é auxiliar o estudo e a pratica do
design de jogos ao encorajar os designers a visualizar a
relação de causa-efeito que existe entre cada componente de
um jogo e a experiência que os jogadores têmao jogar.
COMPONENTES
Os componentes dentro do framework CDE lidam com as
peças que compõem o artefato jogo. São o conjunto de
componentes que formam o jogo enquanto umobjeto e que
portanto existem independente do jogo estar sendo jogado
por jogadores ou não. Os componentes são os elementos
que o designer de jogos pode criar, moldar e alterar para
desenvolver o design do jogo.
Nós chegamos à definição dos componentes baseado na
definição de elementos de jogo de Jesse Schell [24] que
divide jogos como contendo quatro componentes:
tecnologia, regras, estética e história. A partir desta
definição, do modelo tipológico de Aarseth e Elverdam [1],
a própria definição de Mechanics de Hunicke et al [13] e da
definição do nível regras de Salen e Zimmerman [22]
chegamos à conclusão que os componentes dos jogos
podem ser caracterizados em três tipos: Regras, Narrativa e
Representação.
Antes de explicar com mais detalhes o que são cada umdos
três componentes é necessário explicar o conceito de half-
real:
“Jogos digitais são duas coisas completamente
diferentes ao mesmo tempo: jogos digitais são
reais no sentido de que eles são compostos por
regras reais que jogadores realmente interagem;
onde ganhar e perder um jogo é um evento do
mundo real. No entanto, quando se ganha umjogo
ao derrotar um dragão, o dragão não é um dragão
real, mas um dragão ficcional. Jogar um jogo
digital é portanto interagir com regras reais
enquanto imagina-se um mundo ficcional e um
jogo digital é um sistema de regras assim como é
um universo ficcional.” [18]
Expandindo este conceito, é possível afirmar que jogos são
ao mesmo tempo, um sistema de regras cuja interação e
desenvolvimento ocorre no mundo real, ao mesmo tempo
em que são uma peça de ficção quando a interpretação
destas regras reais moldam uma representação virtual.
Há claras implicações e discussões metafísicas a partir deste
conceito os quais não entraremos em detalhes neste
trabalho. O importante aqui é apenas salientar que este
conceito permeia nosso framework em todos os três níveis,
em especial neste nível o de componentes. Portanto,
citaremos o conceito de half-real diversas vezes durante a
apresentação de elementos do framework.
Dito isto, podemos prosseguir comas definições específicas
de cada componente.
Regras
Regras são um conjunto de premissas sistêmicas que ditam
o que existe e o que é possívelou não dentro do universo do
jogo. As regras são o principal componente de um jogo no
sentido em que sem elas o jogo não existe . Com base no
framework de Järvinen [17] que apresenta os conceitos de
Components, Procedures, Environments, Themes e
Interface, e a definição de sistemas de Salen e Zimmerman
[19] que apresenta Objects, Attributes, Internal
Relationships e Environments, como elementos de um
sistema em que jogos podem ser enquadrados. Portanto
concluímos que regras além de delimitar o contexto do
jogo, determinam a existência e função de todos os outros
componentes.
Regras são subdividas em quatro categorias, Procedurais,
Contextuais, Composicionais e Operacionais.
Procedurais são as regras que pautamos objetivos, estados
de jogo e como este é controlado, bem como seu começo e
fim. Tais procedimentos ditam o ritmo e a estrutura do jogo.
Contextuais são as regras que definem o espaço de jogo,
física, limites, etc. Essa categoria diz respeito ao espaço de
possibilidades do jogo. As regras determinam este espaço
criando um contexto e um fluxo de jogo.
Composicionais são as regras que delimitam e quantificam
os objetos de jogo, determinando seus atributos, bemcomo
suas relações como sistema.
Operacionais são as regras que definem as ações que cada
agente de jogo pode realizar para alterar o estado do jogo.
Tais regras alteram diretamente o estado do jogo; são as
mecânicas de jogo.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 85](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-91-320.jpg)
![Procedurais (Conditions)
Baseado nos conceitos de Rules, Control e Player Structure
de Aarseth [1], Procedures de Järvinen [17], chegamos à
classificação que compreende Estrutura de jogo, Controle
do Estado de Jogo e Objetivo. Essas são as regras que
determinam as condições fundamentais para existência,
manutenção e conclusão do jogo.
a. Estrutura de jogo: delimita quantos e quais agentes
existem no jogo, quais são as condições que devem ser
atendidas para o início da sessão de jogo e quais condições
necessárias para atingir o estado de fim de jogo. O estado
de fim de jogo pode ser desejável, quando o jogador
cumpre seus objetivos, obtendo vitória, ou indsesejável,
quando o jogador falha durante o percurso do jogo, obtendo
derrota.
b. Controle do estado de jogo: diz respeito a como o
sistema do jogo permite o controle das variáveis de jogo, o
controle do espaço e do tempo. Por exemplo, em um jogo
de estratégia em tempo real, o jogador tem controle dos
recursos, da produção de unidades (objetos controláveis),
dá área visível e do tempo (alguns jogos permitem que o
jogador interrompa o andamento da partida para analisar o
estado atual da mesma).
c. Objetivo: diz respeito aos metas apresentadas e que
devem ser perseguidas durante o jogo. Tais regras podem
descrever um único objetivo que seja o ponto central do
jogo para atingir o estado desejável de fim de jogo, uma
série de objetivos que devem ser cumpridos a fimde atingir
o estado de fim de jogo ou objetivos secundários que não
levam o usuário a um estado desejável fim de jogo, mas o
levam a atingir uma recompensa desejada.
Contextuais (Space of Possibility)
Salen e Zimmerman [20] definem espaço de possibilidades
como todas as ações e estados possíveis que podem ser
conseguidos dentro de um determinado jogo.
Analogamente, Aarseth [1] apresenta os conceitos de Space
e Time. As regras contextuais descrevem o espaço, tempo e
limites do jogo.
a. Espaço: diz respeito ao universo constituinte do jogo, em
quantas e quais dimensões ele existe. Regras espaciais
também dizem respeito a constituição do level design
(configuração espacial do jogo). Por exemplo, no xadrez o
espaço do jogo é uma matriz 8x8.
b. Tempo: diz respeito a a todas as relações de tempo no
universo real. Por exemplo, em um jogo de turnos, quanto
tempo os jogadores têm para desempenhar suas ações,
quanto tempo dura cada turno, a relação do tempo real com
o tempo ficcional (a relação de tempo de jogo, como tempo
do universo do jogo). O tempo é uma dime
c. Física: diz respeito aos princípios físicos que regem o
universo real do jogo. Por exemplo, em um jogo de
plataforma (cujas mecânicas centrais são de movimento) a
física determina a aceleração do personagem, a gravidade
que incide sobre ele e até mesmo a possibilidade de
desempenhar ações que poderiam ser consideradas
“antifísicas” como pulo duplo.
Composicionais (Game Tokens)
Jogos são compostos diversos objetos, portanto vimos a
necessidade de uma categoria específica para tratar essa
diversidade de elementos. Por objetos compreende-se
quaisquer entidades que componham o jogo. Regras
composicionais são responsáveis pela determinação dos
atributos e as relações entre os objetos do jogo dentro do
espaço de possibilidades.
Quanto a classificação, regras composicionais estão
divididas de acordo com a relevância para conquista do
estado de fim de jogo e tipo de acordo coma influência dos
objetos em relação ao sistema.
Além disso, cada objeto tem regras que lhes definem
atributos que são interpretados pelas regras condicionais,
contextuais e operacionais que regem estes atributos. Por
exemplo um objeto de jogo pode ter como atributo sua
posição no espaço, seus pontos de saúde, sua existência ou
não dentro do jogo, a possibilidade de execução de uma
regra operacional ou não, etc.
a. Relevância
• Objetos primários: são objetos fundamentais para
condições de início e fim de jogo. Exemplo a peça do rei no
Xadrez, avatar do Mario em Super Mario Bros. (Nintendo,
1985).
• Objetos secundários: são objetos que existem dentro do
espaço de possibilidades, mas não têm influência direta, ou
não têm influência alguma para que se atinja o estado
desejável fim de jogo. Exemplo as demais peças no Xadrez,
barris explosíveis em Mass Effect 2 (BioWare, 2010).
b. Tipo
• Objetos controláveis: são objetos capazes de
desemepenhar ações controladas pelo jogador.
Em Baldur’s Gate 2: Shadows of Amn o personagem
principal e os demais personagens que podemfazer parte do
grupo, são exemplos de objetos controláveis.
• Objetos não-controláveis: são objetos capazes de
desempenhar ações, no entanto não são controladas pelo
jogador. Objetos não-controláveis são operados pelo
sistema do jogo.
É possível considerar, em geral, inimigos como exemplos
de objetos não-controláveis.
• Objetos inanimados: são objetos que não desempenham
ações, mas podem manipulados por objetos controláveis ou
não controláveis.
Em Super Mario Bros. os blocos quebráveis e os que
contém itens são exemplos de objetos inanimados.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 86](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-92-320.jpg)
![Operacionais (Mechanics)
Regras operacionais correspondem às mecânicas de jogo.
Sicart [25] classifica mecânicas como métodos invocado
por agentes, ou seja, ações executadas por agentes que
exercem alguma influência no jogo. Sem mecânicas um
jogo não existiria, pois sem elas os jogadores seriam
impossibilitados de exercerem influencia sobre o seu
resultado. O conjunto completo de todas as mecânicas em
um determinado jogo pode ser chamado de interface de
jogabilidade.
Mecânicas são categorizadas levando emconsideração dois
atributos: relevância, com base na classificação de Core,
Primary e Secondary Mechanics de Sicart [25], e tipo.
a. Relevância
• Mecânicas centrais: são usadas por umagente de jogo de
maneira relevante, obrigatória e recorrente para atingir o
estado desejado de fim de jogo. Por exemplo, no Super
Mario Bros. as mecânicas centrais são andar e pular. Estas
mecânicas são suficientes e obrigatórias para concluir o
jogo.
• Mecânicas primárias: são mecânicas de auxilio às
centrais podendo ser usadas recorrentemente a fim de
atingir o estado desejado de fim de jogo. No exemplo de
Super Mario Bros. (Nintendo, 1985) a mecânica de corrida
é uma mecânica primária que pode utilizada
recorrentemente para auxiliar a conclusão do jogo mas não
é obrigatória.
• Mecânicas secundárias: são mecânicas que não auxiliam
diretamente o a atingir o resultado desejado de final de
jogo, ou só se apresentam ocasionalmente, ou precisam ser
combinadas com mecânicas primarias. Continuando o
exemplo anterior, atirar bolas de fogo é uma mecânica
secundaria em Super Mario Bros. pois seu uso é ocasional e
contextual.
• Mecânicas acessórias: são mecânicas que não afetam o
resultado do jogo de forma relevante. No Super Mario Bros.
não existe exemplo de mecânicas acessórias, mas se o
personagem tivesse uma mecânica onde ele mostrasse uma
careta para a tela, isto seria um exemplo de mecânica
acessória.
Tipo:
• Mecânicas ativas: mecânicas nas quais o agente deve
oferecer input para que estas sejam realizadas. No jogo
Final Fantasy XII (Square Enix, 2006) a mecânica Attack
pode ser acionada pelo jogador a partir de um menu
contextual, caracterizando-a como uma mecânica ativa.
• Mecânicas passivas: mecânicas que independem de input
do agente para serem realizadas. Estas mecânicas são
acionadas pelas regras em situações projetadas. No mesmo
Final Fantasy XII um gambit programa o personagem a
utilizar a mecânica Attack automaticamente dentro de um
contexto caracteriza esta mecânica como uma mecânica
passiva. Vale portanto ressaltar que o tipo da mecânica não
esta atrelada a ela em si e sim ao contexto do seu uso.
Narrativa
A narrativa contribui com o universo ficcional que Jesper
Juul [18] diz estar presente em todos os jogos, e que faz a
contra-partida com as regras reais (correspondentes ao
universo real) destes. No âmbito da estrutura dos
componentes neste framework, a narrativa em conjunto
com os elementos sensoriais formariam este universo
ficcional.
No que diz que diz respeito ao universo real, esses
elementos e estrutura funcionam de uma maneira diferente.
O início da narrativa é ditado pelas condições de início de
jogo, o desenvolvimento da história é ditado pelo
andamento do jogo conforme suas interações nas diversas
instâncias de jogo e a conclusão da narrativa é quando o
estado de fim de jogo é atingido, seja através da vitória ou
da derrota.
No que diz respeito ao universo ficcioanl, sintetizamos as
classificações propostas por Dubiela [10], que destrincha os
elementos da narrativa emdiversas subcategorias a partir de
“história” e “discurso” e considerando como estrutura suas
definições de “formas de narrativas em jogos eletrônicos
informatizados”, chegamos às seguintes classificações:
Elementos
a. Personagens: são agentes que buscam transpor
obstáculos a fim de atingir o objetivo perseguido.
Personagens são o elemento principal das narrativas.
b. Universo: é o ambiente onde os personagens estão
inseridos e os eventos ocorrem.
c. Eventos: são as ações desempenhadas para que o objetivo
seja atingido. Eventos tambémpressupõemos conflitos que
se apresentamao longo da narrativa.
d. Discurso: é a relação entre drama e temporização, ou seja
a maneira como a narrativa estrutura as ações dramáticas a
fim de gerar expectativa , ao longo do tempo de jogo e
tempo narrativo.
Estrutura
a. Forçada: é um recurso de narração para apresentar
histórias concetadas à narrativa principal ou fragmentos
desta, bem como micro-histórias que se desenvolvem
paralelamente. A principal característica da narrativa
forçada é a de interromper as demais narrativas, bem como
a interação do usuário com o sistema do jogo.
Em Metal Gear Solid 4: Guns of the Patriots é comum o uso
de seqüências animadas como recurso para o
desenvolvimento da história.
b. Evocada: é a situaçõe onde a história a ser narrada já
existia, ou apresenta um episódio específico de uma
narrativa anterior ou está inserida emum universo já criado.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 87](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-93-320.jpg)
![Em American McGee’s Alice a narrativa é construída a
partir de um universo conhecido, criado por Lewis Carrol
em Alice in Wonderland.
c. Embutida: é a narrativa gerada com conteúdo embutido
em si, cujas informações podem ser inseridas em objetos,
artefatos ou até mesmo em espaços configurados para fins
de acessar tais informações. Narrativas embutidas podem
também ser apresentadas através de elementos
representacionais, como a caracterização de personagens,
por exemplo.
Em Singularity são encontradas diversas anotações que
contam histórias de pessoas que viveram no passado, em
relação à narrativa principal, tais anotações enriquecem a
narrativa e, em alguns casos, antecipam eventos que
ocorrerão no jogo.
d. Emergente: é o produto da interação do usuário com o
sistemas de regras do jogo somada a narrativa da história do
jogo. Este tipo de narrativa não possuem uma estrutura
linear ou pré-organizada e são em sua essência randômicas.
Em Gravitation, é possível fazer inferências sobre narrativa
a partir da observação das interações entre o jogador e o
sistema (dinâmicas procedurais).
No universo real, a narrativa, através dos procedimentos, se
dá de maneira semelhante à narrativa emergente, pois as
interações que ocorrem no sistema representam uma
seqüência de fatos. Entretanto o universo real, no que diz
respeito à narrativa, se diferencia da narrativa embutida
uma vez que um jogo pode não apresentar uma narrativa
explícita, mas seus procedimentos ainda configuram uma
história baseada em ma seqüência de acontecimentos que
podem ser interpretados como narrativa.
Em uma partida de Tetris, as peças utilizadas, a maneira
como foram dispostas, as peças eliminadas e a pontuação
obtida contam uma história única e correspondente àquela
partida.
Representação
São os elementos que comunicam aos sentidos (imagens,
som e roteiro) para tornar tangível e compreensível aos
jogadores as regras e apresentar, de fato, a narrativa e seus
elementos. As regras tendem a ser premissas e
procedimentos abstratos e, portanto, necessitam de
elementos sensoriais associados para se tornarem mais
compreensíveis por jogadores humanos. Os elementos
sensoriais são análogos ao alfabeto e a linguagemenquanto
os outros componentes são análogos à mensagem em si.
Assets visuais (elementos gráficos e animações) e sonoros
(música e efeitos sonoros) em jogos digitais bem como o
formato e cores das peças de xadrez são exemplos de
elementos sensoriais.
Baseado no Framework IEZA (Interface, Effect, Zone and
Affect) de representação sonora de Hulberts e van Toi, que
separa as categorias emquatro quadrantes dividos pelo eixo
de diegético e não diegético e pelo eixo de atividade e
ambientação, o segundo eixo é referente ao que motiva a
existência da representação. Considerando essa estrutura,
sintetizamos, a fim de torná-la mais abrangente e
compatível com outras representações além da sonora, em
duas categorias - tipo e função da representação. Tipo
corresponde à natureza da representação; se ela é diegética
ou não diegética. Função diz respeito ao papel dessa
representação, levando em consideração o tipo, e é dividida
entre contextual e informacional. No entanto essas
definições não são rígidas, uma vez que existem elementos
que podemnão se enquadrar em apenas uma função.
Tipo
Diegético: São todas as representações que existem dentro
do universo do jogo.
Não Diegético: São todas as representações que não
existem dentro do universo do jogo.
Função
Contextual: São representações que delimitamcontextos de
jogo. Representações contextuais ambientam o jogo e
caracterizam seus elementos.
A fala dos personagens em Mass Effect é uma
representação contextual sonora e de roteiro, além de fazer
parte do universo do jogo, portanto diegética. Entretanto, as
legendas dessas falas são representações contextuais não
diegética, uma vez que a representação do texto em si não
existe dentro do universo do jogo.
Informacional: São representações que tem como função
facilitar a comunicação do sistema de regras ao jogador.
HUDs (Heads Up Displays) são exemplos de
representações informacionais. Em Shadow of the
Colossus, apesar do HUD representar gráficamente regras
composicionais referentes ao avatar e os inimigos, as
representações em si não fazem parte do universo de jogo,
portanto são não diegéticas. Já em Dead Space a
representação do HUD, além de informar regras
operacionais do avatar, faz parte do universo do jogo por
ser elemento integrado com o traje espacial do personagem,
portanto diegética.
DINÂMICAS
O nível de dinâmicas dentro do framework CDE diz
respeito às interações sistêmicas entre os componentes do
jogo e o jogador durante a instância de jogo. Por instância
de jogo nos referimos a uma partida de um determinado
jogo do começo ao fim.
No framework MDA, Hunicke et al. [13] definem o nível
Dynamics como a fluência do comportamento das
Mecânicas agindo sobre os inputs do jogador e os demais
outputs no decorrer do jogo.
A palavra chave para o conceito de Dinâmicas é
comportamento. Pode-se chamar de dinâmicas de jogo o
comportamento que emerge do sistema a partir da interação
dentre todas as partes do sistema de jogo e os jogadores
participantes. Isso inclui interações entre os componentes,
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 88](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-94-320.jpg)
![do jogador com os componentes e do jogador com outros
jogadores.
Antes de entrar na descrição das categorias de dinâmicas é
oportuno definir o conceito de interação.
Na língua inglesa o conceito que mais se aproxima do que
queremos dizer a respeito de interação é o interplay:
O efeito que duas ou mais coisas têm umas com as outras
[5].
Relação, ação ou influência recíproca. Exercer influência
em algo [8].
No entanto não há umequivalente direto para esse termo na
língua portuguesa, mas analisando as definições de
interplay podemos concluir que é um conceito análogo à
interação que significa:
Influência recíproca [9].
Portanto, o conceito de interação que utilizaremos é: ação,
relação e/ou influência recíproca entre dois agentes ou
objetos.
Nós categorizamos as dinâmicas em três tipos, de acordo
com quais interações são realizadas. Baseado emumestudo
anterior [2], chegamos a Dinâmicas Agenciais, que são as
dinâmicas que emergem da interação ativa do jogador com
o sistema de jogo (regras) e da própria interação entre os
jogadores; Dinâmicas Procedurais, que são as dinâmicas
geradas pelas interações entre as regras do jogo entre si e
com o resto dos componentes, narrativa e a representação;
Dinâmicas Estéticas, que emergem da interação entre
narrativa e representação, e da interação passiva do jogador
com estes componentes.
Dinâmicas Agenciais (Interação Ativa)
São as dinâmicas que surgem da interação do jogador com
as regras e dos jogadores entre si. São dinâmicas que
surgem da ação do jogador sobre outros jogadores, e sobre
o sistema, por isso, as chamamos de dinâmicas agenciais.
As regras operacionais são o principal mecânismo de
interação do jogador com o sistema, é por elas que o
sistema interpreta o input do jogador sobre o sistema, e, a
partir das dinâmicas processuais, geram um output
perceptível em resposta à ação do jogador. Vendo de uma
perspectiva mais profunda pode ser considerada a utilização
emergente dessas mecânicas, isto é, após a interpretação e
domínio da mecânica pelo jogador, este a utiliza com um
objetivo além do que foi proposto para o jogo pelo
designer.
Exemplos: Mockball, x-ray climb, infinite bomb jump são
exemplos de interações inventivas do jogador com as
mecânicas de Super Metroid (Nintendo, 1994); Utilizar o
casco verde como escudo no Super Mario Kart (Nintendo,
1992) também é um exemplo de uma interação inventiva
por parte do jogador.
A interpretação que o jogador infere sobre as outras regras e
o sistema em geral, a criação de regras pelo jogador que não
façam parte do sistema do jogo mas influenciam o
andamento deste, bem como a customização e a
flexibilidade que as regras permitem ao jogador manipular
são interações que desenvolvem outros variados níveis de
dinâmicas agenciais.
Exemplos: Gambitos de Xadrez são interpretação de regras
que, aparentemente, vão contra os objetivos do jogo, mas
com o conhecimento superior de um jogador podem se
tornar estratégias eficientes; O fair play em uma partida de
Futebol é uma regra criada por jogadores com intuito
político que gera uma situação amistosa na disputa;
Planejamento do level up dos personagens no Final Fantasy
X (Squaresoft, 2001) é uma manipulação direta do jogador
sobre as regras do jogo, neste caso os atributos dos
personagens.
As interações entre jogadores surgem a partir do contato
entre os agentes, que podem ou não ser humanos, ao jogar
uma partida de um jogo que possibilite múltiplos jogadores.
Podem haver interações a nível social, interações
psicológicas e interações de jogadores humanos com
jogadores artificiais.
Exemplos: Partidas amistosas de Super Smash Bros. (HAL
Labs., 1999) onde os jogadores estão mais interessados na
atividade social do que na competição; Jogos mentais em
partidas competitivas de jogos de luta; Luck manipulation
de geradores de números aleatórios, presentes na maioria
dos jogos digitais.
Dinâmicas Procedurais (Interação Processual)
São as interações que ocorrem com as regras entre si e as
interações das regras como universo ficcional representado
pelo jogo, narrativa e representação. Basicamente, todo o
sistema de regras e os sub-sistemas que os compõem, se
comportam proceduralmente durante uma instância de jogo
ao modo que esta avança de acordo com a agência dos
participantes. Este comportamento procedural afeta tanto as
regras e o estado de jogo, quanto os sistemas narrativos e
representacionais. Este comportamento procedural é de
extrema importância para a compreensão do conceito de
expressão procedural.
Podemos compreender dinâmicas procedurais como o
comportamento de um determinado jogo, a forma como o
jogo enquanto um sistema comporta-se. Como
explicaremos na seção de expressão procedural, este
comportamento de jogo não é apenas lógico, operacional, e
pode ser utilizado para a expressão através da metáfora ou
da retórica.
Primeiramente a interação entre regras se dá quando duas
regras geram uma terceira regra, quando regras procedurais
afetam a influência de outras regras, ou quando existem um
conjunto de sub-regras de variados tipos que juntas formam
a premissa de uma regra maior, inferida por este conjunto
de regras. Estas regras obscuras, nâo escritas, se traduzem
no conceito de metajogo.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 89](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-95-320.jpg)
![Exemplos: Resposta dinâmica de velocidade máxima em
jogos de corrida, em que os retardatários têm a velocidade
máxima aumentada e os líderes têm sua velocidade máxima
reduzida, a fim de aumentar a dramaticidade; Contraste de
regras entre as magias elementais de Final Fantasy X
(Square 2001), em que fogo e gelo se opõem mutuamente,
assim como água e eletricidade; Gravidade, atrito e
velocidade são regras composicionais por si só e se
complementam, através de suas interações, formando um
sistema de física.
Toda regra operacional é uma interação com uma regra
composicional ou contextual no momento em que é
exercida, uma vez que as mecânicas são fundamentadas
pelas regras procedurais. Alem disso existem mecânicas
cujo uso afeta diretamente as regras. Quando uma regra
procedural ou composicional determina a eficácia de uma
mecânica sobre outra, também se caracteriza interação entre
regras.
Exemplos: A habilidade Armor Break em Final Fantasy X
(Square, 2001) é um exemplo de mecânica que influencia o
estado de uma regra; Triangularidade mecânica presente
principalmente em jogos de luta em que defender supera
atacar, que supera agarrar, que, por sua vez, supera
defender é um exemplo de como outras regras interagem
com regras operacionais.
A profundidade mecânica, quando existemmuitos usos para
uma determinada regra operacional, de um jogo também é
resultante das dinâmicas procedurais. O conceito de
jogabilidade emergente, onde o jogo resulta em muito mais
do que a soma de suas partes (como, por exemplo, Go) é
uma clara manifestação do potencial das dinâmicas
procedurais.
Exemplos: A mecânica de charge shot em Super Metroid
(Nintendo, 1994), combinada com pulo, que a princípio não
inflige dano, modifica a mecânica de pulo gerando o pulo
chamado de pseudo-screwattack, capaz de infligir dano nos
inimigos; A impossibilidade de alterar a direção do pulo do
personagem Mario em Super Mario Bros. surge da
interação da mecânica correr/mover-se com a mecânica de
pulo.
As regras enquanto um sistema também definem toda a
representação e a narrativa no sentido de sua existência,
quando estas surgem e como estas evoluem e são
apresentadas. A relação entre as regras e o o universo
ficcional é direta, as regras determinam o que é possível
dentro daquele universo ficcional e o que este universo
representa, cosntruindo um significado através da
associação de símbolos.
Dinâmicas Estéticas (Interação Sensível)
São as interações que envolvemos componentes ligados ao
universo ficcional do jogo, ou os componentes sensíveis
(narrativa e representação). Ocorrem com as relações
internas entre cada componente, dentre narrativa e
representação, em si, entre ambos e com a interação do
conjunto destes componentes como jogador.
Estas dinâmicas são responsáveis por trazer uma
experiência estética mais impactante, próxima, perceptível,
ao jogador e são fundamentais para auxiliar a expressão
procedural, se forem capaz de reforçar a idéia representada
pelas dinâmicas procedurais.
EXPERIÊNCIA
O nível de experiência diz respeito ao a como o artefato
jogo oferece a satisfação aos jogadores. Como o jogador
busca a satisfação e como o jogo promove sensações que
levam a satisfação através de suas regras e dinâmicas.
É importante salientar satisfação como o objetivo de um
jogador com a atividade de jogar ao contrário da palavra
diversão, pois muitos jogos oferecem a satisfação aos
jogadores não pelo mero entretenimento, ou pelo caráter
lúdico, mas através de recompensas mais profundas, como
aprendizado e superação intelectual. Estes tipos de
recompensas e fontes de satisfação são desassociados da
idéia que se tem por diversão e por isso buscamos manter
distância desta palavra dentro do framework CDE.
Buccini [4] considera experiência como sendo
acontecimentos individuais que ocorrem como
resposta a algum estímulo. Estes acontecimentos
ocorrem, em geral, como conseqüência da
observação ou participação em acontecimentos
reais, imaginários ou virtuais. As experiências
não são fenômenos espontâneos, mas induzidos,
que possuem referencial (partem de algum lugar)
e intencionalidade (objetivam algo).
Portanto, nosso objetivo ao incluir o conceito de
experiência no Framework CDE é entender onde o artefato
contribui para o fenômeno da experiência e qual é a
influência de tal fenômeno nos jogadores.
Recompensas
Para que a satisfação ser atingida, é necessário que o
jogador se mantenha interessado na atividade de jogar e o
motor que mantém o jogador interessado a participar de um
jogo é a motivação. Enquanto um jogo motivar o jogador,
ele continuará jogando.
Segundo Buccini [4], quando um desejo, ou necessidade
humana é satisfeito, o ser humano passa a sentir outras
necessidades e desejos, daí a importância dos produtos
sempre estarem evoluindo visando agradar os usuários.
Buccini elucida o fato de que não basta apenas uma
manifestação que motive o jogador; a motivação precisa ser
realimentada. Um dos fatores importantes para a
manutenção da motivação é a recompensa. Baseado nas 8
formas de diversão apresentadas no capítulo Aesthetics do
Framework MDA (sensation, fellowship, fantasy,
discovery, narrative, expression, challenge e submission)
[13] e na lista de 14 formas de diversão (beauty, immersion,
intellectual problem solving, competition, social
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 90](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-96-320.jpg)
![interaction,comedy, thrill of danger, physical activity, love,
creation, power, discovery, advancement and completition,
application of an ability) de Garneau [11], foi possível
desenvolver um modelo que abrange 9 tipos de
recompensa: conquista, fantasia, drama, expressão,
descoberta, aprendizado, avanço, contemplação e interação
social.
Recompensas como dito, são o que motivam o jogador a
participar da atividade do jogar. Recompensas emjogos são
conquistadas através da superação dos obstáculos que o
jogo oferece ao jogador (seja obstáculos das próprias
regras, ou outros jogadores). A dificuldade em se adquirir
uma recompensa e a intensidade da recompensa afetam a
motivação. Uma recompensa pequena para um grande
esforço é desmotivadora, assim como uma grande
recompensa para um pequeno esforço.
Aprendizado
A construção do aprendizado requer um conjunto de
elementos, uma vez que o aprendizado não é um fenômeno
único. Dentro das correntes da filosofia do aprendizado, se
destaca o construtivismo. Analogamente, a filosofia
construtivista presume que as pessoas aprendam fazendo,
isto é, elas constroem seus conhecimentos em situações de
experiências cognitivas em atividades práticas [23].
Dessa forma, a interação com um jogo pode pressupor a
recompensa atingida com o aprendizado do jogador, isto é,
está ligada ao fato do jogo proporcionar um aprendizado
sobre algo relacionado ao próprio jogo ou ao ato de jogar.
Exemplos: Xadrez, Victoria 2 (Paradox Interactive, 2010),
McDonalds’s Videogame (Molleindustria, 2006).
Avanço
Com o momento da interação entre o usuário e a interface
do jogo digital, se constrói a percepção de recompensa a
partir do crescimento metafórico do personagem. Seria a
recompensa atingida com o acúmulo de riquezas e poder
dentro do universo do jogo ou fora dele. Muitos jogos dão
esta recompensa diretamente, dando objetos, mecânicas
novas ou aumento dos atributos do avatar do jogador.
Exemplos: Final Fantasy XII (Square Enix, 2006), Mass
Effect (BioWare, 2007), Prototype (Radical Entertainment,
2009).
Conquista
É a recompensa sentida pela superação de obstáculos que
apresentem umgrande desafio, que não se pode ser vencido
sem que o jogador domine os meios que se tempara superar
tal obstáculo. Este obstáculo pode, evidentemente, ser um
outro jogador concorrente.
Conquista como recompensa pode se manifestar de diversas
maneiras. Exemplos disso podem ser percebidos em jogos
como nas séries Ninja Gaiden e Contra, cujo ponto central
dos jogos é fazer a superação de cada fase ser uma grande
conquista. Super Metroid, além de outras recompensas,
oferece a possibilidade de jogar buscando a taxa mínima de
itens, ou jogado em ordem inversa, ambos são modos de
jogar que aumentam o desafio do jogo e consequentemente
a sensação de conquista.
Exemplos: Ninja Gaiden Trilogy (Tecmo, 1995), Contra III
(Konami, 1992), Street Fighter 3: Third Strike (Capcom,
1999).
Contemplação
É a recompensa a partir da experiência estética
experienciada pelos sentidos. Em geral, aspectos visuais e
sonoros são recompensas valorizadas por certos perfis de
jogador. A recompensa através dos sentidos se dá a partir
de como os elementos sensoriais do jogo são apresentados e
o quão o jogador se identifica com estes de forma similar as
outras mídias de entretenimento.
Um exemplo de jogo que recompensa jogadores através de
elementos sensoriais é Machinarium (Amanita Design,
2009) [26], onde conforme o jogo progride, novos
personagens e cenários detalhadamente desenhados são
apresentados ao jogador. Estas recompensas sensoriais são
motivadoras o suficiente para manter o jogador interessado
a progredir com o jogo.
Exemplos: Machinarium (Amanita Design, 2009),
Everyday Shooter (Quesay Games, 2007), Shadow of the
Colossus (Team Ico, 2005).
Descoberta
À medida que existe mais de uma forma da recompensa a
ser identificada, é nesse quesito que a recompensa seria
resultante do prazer da descoberta e exploração do
desconhecido. Aqui o usuário pode ter acesso a construção
de novas realidades a partir do princípio da conclusão.
A recompensa da descoberta está ligada ao novo, ao
desconhecido. A partir do desconhecido, cria-se o interesse
por este, em conhecê-lo, torná-lo familiar. Tornar o
desconhecido familiar é o processo que define a
recompensa da descoberta.
Pode-se considerar como uma recompensa pela descoberta,
também, as surpresas, os encontros súbitos com situações
ainda não exploradas, ou esperadas, misturando-se um
pouco à recompensa do drama neste sentido.
Exemplos: The Legend of Zelda: Majora’s Mask (Nintendo,
2000), The Path (Tales of Tales, 2009), Super Metroid
(Nintendo, 1994).
Drama
Aristóteles [3] definiu, em sua época, o drama como a
imitação de uma ação eminente onde os personagens atuam.
Encadeados segundo uma ordem previamente criada,
representam um evento que é uma relação de ações e
acontecimentos demonstrando situações de causa e efeito.
Todavia, no presente artigo, o drama é a recompensa gerada
através da experiência e da estética da narrativa. Logo,
qualquer tipo de jogador pode se sentir recompensado pelo
drama, por acontecimentos, pela exposição de uma história,
etc.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 91](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-97-320.jpg)
![Dessa forma, é possível identificar uma forma dos jogos
recompensarem o jogador sistematicamente com o drama,
separando trechos de jogo com breves sequências
cinemáticas (animações) ou de textos que expõem um
pouco mais o enredo que acompanha o jogo.
Para que a recompensa narrativa possa ser quantificada em
resultados, o jogador ao interagir com a narrativa, deve se
interessar por esta. Porém, para o presente estudo, não será
focado em qual tipo de narrativa ou técnicas são mais ou
menos eficazes como recompensas.
Exemplos: Metal Gear Solid 4: Guns of the Patriots
(Kojima Productions, 2008), Silent Hill 2 (Konami, 2001),
Final Fantasy Tactics (Square, 1997).
Expressão
É a recompensa atingida ao utilizar o jogo como forma de
expressão pessoal. Alguns jogos possibilitamque o jogador
faça as escolhas dentro do universo do jogo de acordo com
suas preferências. Em outras circunstâncias, possibilitam
que o usuário crie conteúdo para o jogo.
Em uma partida do jogo The Sims, o jogador pode
personalizar o lar dos sims ao seu gosto. O jogo Guitar
Hero permite que os jogadores interajam com suas músicas
preferidas, seja as que vêm inclusas no jogo original ou as
que podem ser adquiridas posteriormente. Em ambos os
casos, é possível adquirir conteúdo gerado por outros
usuários.
Exemplos: The Sims (Maxis, 2000), Guitar Hero
(Harmonix Music Systems, 2005), Audiosurf (Dylan
Fitterer, 2008).
Fantasia
É uma recompensa que premia quem busca a fuga da
realidade. Jogos produzem esta recompensa através da
imersão no universo ficcional. Essa imersão pode ser tanto
sensorial quanto interativa, fortalecendo a sensação de que
o jogador está dentro do jogo ou que o jogador é o próprio
avatar controlado. Qualquer perfil de jogador pode se sentir
recompensado pelo simulacro gerado por um jogo imersivo,
mas exploradores e sobreviventes buscam com maior
frequência este tipo de recompensa.
Exemplos: The Elder Scrolls IV: Oblivion (Bethesda Game
Studios, 2006), Zeno Clash (ACE Team, 2009), Crysis
(Crytek Frankfurt, 2008).
Interação Social
Alguns jogos digitais disponibilizam um vasto universo de
interação entre os jogadores. Nesses casos, é possível
estabelecer uma complexa rede de contatos. Essas relações
possuem seus códigos de conduta frequentemente tão ou
mais complexos que as relações interpessoais feitas no
mundo real. Essa forma de explorar novos contatos sociais
seria a recompensa através da interação social trazida por
uma atividade.
Exemplos: World of Warcraft (Blizzard Entertainment,
2004), Farmville (Zynga, 2009), Mario Party 8 (Nintendo,
2007).
Dessa maneira, observa-se que as experiências de
conquista, fantasia, drama, expressão, descoberta,
aprendizado, avanço, contemplação e interação social,
formam as estruturas de recompensas que contribuem para
a motivação dos jogadores com a atividade, bem como com
a obtenção da satisfação.
Canais de Conforto
O que esta sendo apresentado nós apresentamos aqui nesse
artigo como canais de conforto é uma adaptação da
Teoria do Fluxo de Mihaly Csikszentmihalyi [6], teoria esta
que defende que o estado emocional de uma pessoa ao
executar uma atividade depende da habilidade que a pessoa
tem sobre a execução desta atividade e a dificuldade que a
atividade exige para ser completada.
Dependendo destes dois fatores, diversos estados mentais
podem ser atingidos, durnte uma atividade, sendo o mais
importante deles, o de Fluxo, atingido ao se executar uma
atividade onde o participante tem uma grande habilidade e
para completá-la e há uma grande dificuldade imposta [7].
A teoria inicial, que apenas procurava entender o fluxo, foi
expandida, encontrando outros estados emocionais
conforme os níveis de habilidade e dificuldade são
exigidos. No nosso framework, a teoria do fluxo
compreende como o jogo cria um ambiente de conforto ao
dar ao jogador habilidades através da jogabilidade ou treino
e ao mesmo tempo lança desafios de diferentes níveis a este
jogador.
O balanço da habilidade, que no caso de jogos pode ser
reduzida ou ampliada através de regras (facilidades ou
dificuldades de jogabilidade) e da dificuldade apresentada
(os obstáculos do jogo que impedem o jogador de atingir
seu objetivo) ajudam a criar um estado mental para o
jogador durante a atividade. Este estado mental deve ser
confortável ao jogador. Confortável no sentido de ser um
estado mental que o jogador busca coma atividade, não que
este deva ser positivo.
Este estado mental confortável depende do perfil de jogador
e de como o jogo apresenta seu universo ficcional, porém,
um jogador que não se sente confortável dentro do estado
mental promovido pelo jogo, perderá o interesse pela
atividade e abandonará o jogo.
Dentro da teoria do fluxo, existem oito estados mentais,
todos estes estados mentais podem ser produzidos por um
jogo ao balancear habilidade do jogador e desafios
impostos. São eles: Apatia, Tédio, Apreensão,
Relaxamento, Ansiedade, Controle, Exaltação, Fluxo [6].
Obviamente cabe ao designer buscar os canais mais
positivos ou canais onde os jogadores daquele determinado
jogo se sentirão confortáveis.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 92](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-98-320.jpg)
![Em jogos a baixa habilidade pode ser traduzida em
mecânicas muito simples, ou muito difíceis de lidar, ou um
jogo com uma curva de aprendizado que impeça ao jogador
melhorar sua habilidade nele. Se o jogo depender demais de
fatores aleatórios, ou não for claro o suficiente em como o
esforço do jogador determina as alterações do estado do
jogo (falta de feedback) isso também incorre em “baixa
habilidade”. Mecânicas superficiais, que não permitem
avanço ou desenvolvimento de um repertório que torne o
jogador mais eficiente no uso delas, também podem
incorrer em um grau de habilidade baixo para o jogo. O
contrário de tudo isso, mecânicas com profundidade, com
pleno e claro resultado e que permitem que o jogador
desenvolva-as em usos mais eficientes incorre no jogo por
característica permitir um alto valor de habilidade ao
jogador.
O desafio pode ser traduzido em jogos nos obstáculos que o
jogo apresenta ao jogador para impedir que este consiga as
recompensas desejadas com a atividade (referentes ao
capítulo anterior). Há diversas formas de se criar desafios e
não entraremos nelas dentro do escopo deste artigo. Para
este artigo, cosideraremos o grau de dificuldade como emo
quão recorrente é o fracasso (perder o jogo)
contrabalanceado em o quão punitivo é este fracasso, entre
começar o jogo a partir do zero ou continuá-lo a partir de
algum ponto anterior.
Evidentemente canais de conforto variam mesmo dentro de
um determinado jogo, já que os obstáculos e a dificuldade
bem como as habilidades do jogador inerentes ou
permitidas pelo jogo podem variar de acordo comas regras.
Estas variações resultam em flutuações dos canais de
conforto promovidos.
Abaixo segue a descrição dos oito canais de conforto e
quais as condições para que estes emerjam.
Apatia
Apatia é o canal atingido quando a habilidade e os desafios
impostos são ambos baixos. Um jogo que promove a apatia
pode ser considerado como um passatempo quase passivo,
onde o jogador exerce muito pouco esforço para vencer e
não é contestado ou desafiado para tal.
Tédio
Tédio é o canal promovido quando a habilidade permitida é
razoável, mas os desafios impostos são baixos. Um jogo
entediante, portanto, é um jogo que não apresenta desafios
para o jogador e ao mesmo tempo lhe dá recursos razoáveis
para exercer esforço sobre este jogo.
Apreensão
Canal onde a habilidade permitida ou atingida pelo jogador
é baixa e os desafios são razoáveis. Um jogo pode
promover a apreensão como uma retórica estética, porém
não deve-se sustentar uma situação de apreensão por muito
tempo por não ser um estado mental positivo.
Relaxamento
Quando a habilidade do jogador é muito grande e os
desafios impostos são baixos o jogo promove a sensação de
relaxamento. A grande habilidade em contraponto aos
obstáculos leves permitem testes, despreocupação e
desapego, porém sem levar ao tédio, sendo assim, portanto,
um estado mental positivo.
Ansiedade
Jogos muito difíceis e nos quais o jogador não tem muita
habilidade ou não permitem ao jogador muita habilidade,
promovem a sensação de ansiedade. A ansiedade é uma
sensação negativa se persistir por muito tempo, porémpode
ser de grande auxílio retórico se promovida em pequenas
doses.
Controle
Controle é o canal atingido quando um jogo permite uma
grande habilidade para o jogador exercer em face a um
desafio moderado. O canal de controle é positivo a partir do
momento que ao se sentir no controle a maioria das pessoas
se sentem confortáveis com a situação, porémpode não ser
o que o jogador efetivamente esteja buscando.
Exaltação
Uma grande dificuldade como obstáculo a uma habilidade
moderada gera o canal de exaltação. É um estado mental
onde o jogador se sente estimulado, revigorado por estar
enfrentando algo maior do que ele, porém com recursos o
suficiente para superar o obstáculo. Consideramos umcanal
positivo para um jogo promover.
Fluxo
Quando a habilidade e a dificuldade são altas, promove-se o
estado de flow ou fluxo. É um estado mental positivo de
alta concentração, controle e estimulação, algo como a
mistura dos canais de Controle e Exaltação. O jogador se
intensifica e se sente mentalmente engolido pela atividade,
perdendo a sensação de tempo-espaço externos ao jogo.
Portanto, os canais de conforto dizem respeito a como o
jogo, através do balanço de habilidade e dificuldade
definidos pelo designer, constrói um ambiente emocional
para o jogador. Este ambiente deve ser confortável para o
jogador, ou este abandonará a atividade mesmo se as
recompensas forem interessantes.
Perfil do Jogador
O perfil de jogador mede como este tende a participar de
um jogo. O que o motiva a jogar, que expectativas ele tema
respeito do jogo e que tipos de dinâmicas e resultados o
divertem. O perfil é dependente e inerente do próprio
jogador. Para traçar o perfil dos jogadores dentro do nosso
framework, nós utilizamos o estudo Brain Hex [16].
International Hobo é uma empresa que estuda o perfil
demográfico dos jogadores de jogos digitais. O estudo
iniciou-se com o DGD-1 (demography game design 1) [14],
que foi atualizado para DGD-2 (demography game design
2) [15], que, por sua vez, foi utilizado como base para o
BrainHex.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 93](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-99-320.jpg)
![Os perfis que esse estudo contemplou foram: o audaz, o
conquistador, o colecionador, o social, o estrategista, o
sobrevivente e o explorador.
Os perfis são a parte mais importante na compreensão da
satisfação pois são os perfis de jogador que ditam quais
recompensas e quais canais de conforto determinado
jogador busca. Cada perfil tem diferentes ambições, busca
diferentes estímulos e requer diferentes combinações de
recompensas e canais de conforto para se satisfazer comum
jogo.
Audaz
O audaz procura ação eletrizante, radical e em alta
velocidade. O perfil tem como comportamento o foco na
busca pela ação, uso de reflexos e tomada de riscos [16].
O audaz, em geral, busca ser principalmente recompensado
com a conquista, a expressão e a fantasia. Mais do que
qualquer outro perfil, o audaz sente-se confortável no canal
de fluxo. Além do fluxo, o audaz prefere os canais de
exaltação e ansiedade, sentindo-se pouco estimulado nos
canais de controle e relaxamento.
Colecionador
O colecionador gosta de coletar tudo e fazer tudo que é
possível no jogo. O perfil tem como comportamento o
esforço para atingir a satisfação de completar tarefas e
coletas, além da intensa satisfação em cumprir objetivos
que se mostram muito distantes - o que pode se tornar
obsessivo [16].
O colecionador busca como recompensas principalmente o
avanço, o aprendizado, a expressão e a descoberta. O
colecionador sente-se confortável no canal de controle e
relaxamento, podendo também manter-se no canal de fluxo
e tédio, e até mesmo, apatia, se as recompensas forem
frequentes ou grandes o suficiente. Isso acontece pelo fato
do colecionador ser um jogador obstinado, indo além do
que lhe é confortável em prol das recompensas.
Conquistador
O conquistador se esforça ao máximo para atingir a vitória
e gosta de derrotar inimigos incrivelmente difíceis e vencer
outros jogadores. O perfil tem como comportamento a
voracidade que foca e motiva o jogador a conquistar a
vitória e permite intensas emoções ao atingí-la [16].
O conquistador sente-se plenamente recompensado pela
conquista, evidentemente, e também pelo aprendizado e o
avanço. O canal de conforto que o conquistador busca é o
de controle, acima de todos, porém se sentindo confortável
no canal de fluxo e exaltação. Ansiedade e apreensão
podem ser positivos para o conquistador, mas apenas
durante o início do jogo, nas etapas de aprendizado.
Estrategista
O estrategista gosta de resolver quebra-cabeças e
desenvolver estratégias. O perfil tem como comportamento
o foco na atividade mental caracterizada pela busca das
decisões mais eficientes [16].
O estrategista busca a recompensa da conquista, do
aprendizado e da descoberta. O estrategista tambémprocura
jogos que permitam a expressão através de diversas
maneiras de se resolver um problema ou superar um
obstáculo. Seu canal de conforto preferido é o de controle,
podendo também sentir-se confortável com o fluxo e com o
relaxamento.
Explorador
De acordo como estudo, o explorador é o jogador que gosta
de encontrar coisas estranhas e mesmerizantes ou re-
encontrar objetos familiares. O comportamento do
explorador se centra na curiosidade, interesse e no prazer de
estimular os sentidos [16].
O explorador busca o drama, a fantasia e especialmente a
descoberta e a contemplação como recompensas. O
explorador sente-se mais confortável nos canais de controle
e relaxamento, porém aceita doses pontuais de fluxo e
exaltação.
Sobrevivente
O sobrevivente gosta de escapar de ameaças aterrorizantes,
suspense e de riscos desconhecidos. O comportamento
deste perfil está relacionado com a sensação de medo: o
sobrevivente gosta de ser aterrorizado e se sentir seguro
novamente após responder a ameaças [16].
O sobrevivente busca como recompensa o drama, fantasia e
descoberta. O sobrevivente busca os canais de apreensão e
ansiedade, sentindo-se também confortável no canal de
exaltação. O sobrevivente abomina os canais de controle e
relaxamento.
Social
O social gosta de jogar com pessoas emque confia e ajudar
os outros. O perfil tende a ser aberto, mas não se dá bem
com quem abusa de sua confiança [16].
O jogador social busca como principal recompensa a
interação social, e também, fantasia, drama e expressão. O
canal mais procurado é o de relaxamento, porém, os canais
de controle e fluxo são também confortáveis se não
atrapalharem a interação entre os jogadores.
Além disso jogadores geralmente apresentam mais de um
destes perfis, em variados níveis de interesse. Há também
jogadores que apresentamaversão aos gostos de umdestes
perfis [16].
O que quisemos demonstrar é que a aplicação da parte de
experiência do nosso framework pode ser utilizada em
conjunto com outros estudos demográficos para se
descobrir aspectos da experiência de jogo desejados. Assim,
o designer pode compreender aspectos do jogo emrelação à
experiência e desenvolvê-los de acordo com os requisitos
do projeto.
CONCLUSÃO
Neste artigo formalizamos o Framework CDE em sua
totalidade, expandindo o framework MDA ao torná-lo
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 94](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-100-320.jpg)


![O USO DA METODOLOGIA DE PERSONAS NA
PRODUÇÃO DE PERFIS PARA HIPERMÍDIA ADAPTATIVA
Thiago Pinheiro
ESDI/UERJ
Rua Evaristo da Veiga, 95
Rio de Janeiro/RJ
t_pinheiro@yahoo.com
Barbara Szaniecki
ESDI/UERJ
Rua Evaristo da Veiga, 95
Rio de Janeiro/RJ
dolar.rj@terra.com.br
André Monat
ESDI/UERJ
Rua Evaristo da Veiga, 95
Rio de Janeiro/RJ
andresmonat@yahoo.com.br
RESUMO
Este artigo é parte integrante de um projeto em
desenvolvimento que visa construir uma hipermídia
adaptativa para auxiliar visitas guiadas em museus. Nele
analisaremos a importância da metodologia de personas
para o design centrado no usuário e descreveremos em
detalhes a utilização desta ferramenta na criação dos perfis
a serem atendidos pelo sistema proposto em sua fase de
implementação.
ABSTRACT
This paper is part of a project in progress for the production
of an adaptive hypermedia for guided visitation at
museums. Here we analyze the importance of the
methodology of personas in user-centered design and
describe in details the use of this tool for the creation of the
profiles to be assisted by the proposed system at the
implementation stage.
Palavras-chave
Personas, hipermídia adaptativa, visitas guiadas, museus.
ACM Classification Keywords
H5.4. Information interfaces and presentation:
Hypertext/Hypermedia.
INTRODUÇÃO
No início da era industrial, os processos de engenharia e
venda, por si sós, eram suficientes para gerar produtos que
fossem desejáveis aos olhos dos consumidores. Para que as
pessoas adquirissem alguma coisa, bastava que o bem
atendesse a seus critérios de utilidade, qualidade e que
oferecesse um preço razoável pelo qual estivessem
dispostas a pagar. Com o passar do tempo, a indústria
percebeu a necessidade de diferenciar seus produtos de
outros com igual funcionalidade e o design passou a figurar
como elemento de destaque nessa estratégia. Designers
gráficos passaram a ser contratados para desenvolver
embalagens e propagandas mais eficazes e designers
industriais se dedicaram progressivamente a projetar
produtos mais ergonômicos, eficientes e atraentes.
Nesse contexto de valorização do produto por adequação às
necessidades dos utentes, surgem a filosofia e as
metodologias do design centrado no usuário, do inglês
user-centered design (UCD).
O termo user-centered design foi cunhado por Donald
Norman [8], que o definiu como sendo uma filosofia
baseada nos interesses e necessidades do usuário para a
geração de produtos mais facilmente inteligíveis e usáveis.
A Usability Professionals’ Association (UPA) [11] define
UCD como uma abordagem em design que foca todos os
processos – planejamento, projeto e desenvolvimento – no
usuário.
Embora devesse ser o senso comum, centrar o design no
usuário não é um procedimento natural. Tendemos a ser
egocêntricos e acabamos por desenvolver produtos
baseados em nossas próprias vontades e necessidades,
mesmo que na maioria das vezes não sejamos o utilizador
final desses produtos. Às vezes, até mesmo procuramos
pessoas com perfis semelhantes ao nosso para pedirmos
opinião sobre nossos projetos – a conclusão é o nascimento
de um produto inadequado ao público a que vai servir.
Metodologias do UCD
À medida que a filosofia do design centrado no usuário
ganhou força, algumas metodologias surgiram para
concretizar os princípios por ela preconizados.
Mas foi apenas em 1999 que se deu o surgimento da
primeira e única normatização do UCD, instituída pela ISO
13407 (“Human-centred design processes for interactive
systems”) [6].
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 97](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-103-320.jpg)
![De acordo com essa norma, uma vez identificada a
necessidade de centrar os processos no usuário, quatro
atividades vão formar o ciclo principal de trabalho (Figura
1):
a) especificação do contexto: identifica-se quem utilizará o
produto, com que finalidade e sob que condições;
b) especificação dos requisitos: identificam-se as
necessidades comerciais e que necessidades do usuário
devem ser satisfeitas para que o produto seja bem-sucedido;
c) design das soluções: atividade onde o conhecimento
angariado é concretizado em diferentes protótipos que
serão testados junto aos usuários;
d) avaliação do processo: esta etapa leva em consideração o
feedback dos utentes e verifica-se o preenchimento dos
critérios percebidos na segunda fase. Aqui se avalia a
necessidade de modificações no produto, gerando mais uma
iteração do ciclo ou liberando o produto para o lançamento.
Apesar de não especificar métodos exatos, a norma serve
de base para várias metodologias do design centrado no
usuário, dentre as quais podemos citar também, outro
modelo de processos igualmente bastante conhecido – o do
ciclo de engenharia da usabilidade, proposto por Jakob
Nielsen [7]. Este sistema consiste em onze etapas, a saber:
1) conhecimento do usuário;
2) análise competitiva;
3) definição de metas de usabilidade;
4) design paralelo;
5) design participativo;
6) design coordenado;
7) análise heurística;
8) prototipagem;
9) teste empírico;
10) design iterativo;
11) coleta de feedback.
Como se percebe aqui, mesmo que descritas em alto nível,
as atividades são identificadas mais detalhadamente do que
no modelo proposto pela ISO. O fluxo básico é bastante
semelhante nos dois esquemas – ambos partem da pesquisa
sobre o usuário para identificação de requisitos/objetivos e
chegam à prototipagem e teste do design, explorando a
natureza iterativa do processo. Ambos os modelos também
reforçam que o feedback dos usuários deve ser considerado
desde cedo, já que alterações no design são notavelmente
menos custosas quando feitas nas etapas iniciais do
desenvolvimento.
Ainda embasada na normatização da ISO, se destaca a
metodologia de Personas, ferramenta estudada e utilizada
no desenvolvimento deste artigo, que descreveremos mais
minuciosamente adiante.
HIPERMÍDIA ADAPTATIVA
Este artigo é parte integrante de um projeto mais amplo
cujo objetivo é verificar a possibilidade da elaboração de
uma hipermídia adaptativa para auxílio a visitas guiadas a
museus.
Figura 1. Ciclo básico de atividades no design centrado no usuário segundo a ISO 13407.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 98](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-104-320.jpg)
![Cabe neste momento esclarecer o conceito de hipermídia,
que Freire [4] aponta como sendo semelhante ao hipertexto,
mas difere deste uma vez que as ligações (links) são
representadas também por elementos de diferentes
formatos, tais como imagens, gráficos, vídeos, áudios,
animações, etc. Sendo assim, a hipermídia constitui uma
base de dados na qual o usuário navega entre as
informações de forma interativa e não-seqüencial,
determinando seu próprio percurso de acesso e uso da
informação – características herdadas do próprio
hipertexto.
Peter Brusilovsky [1] aponta a hipermídia adaptativa como
uma direção relativamente nova na pesquisa sobre as
relações entre hipermídia e modelos de usuário. Essa
tecnologia promete sanar a limitação de aplicativos de
hipermídia tradicional, onde é apresentado a todos os
usuários um mesmo conteúdo de página e um mesmo
conjunto de links a uma população relativamente diversa.
Os sistemas de hipermídia adaptativa constroem um
modelo de objetivos, preferências e conhecimento prévio
de cada usuário individual e usam esse modelo ao longo da
interação com o usuário, a fim de se adaptar às
necessidades deste.
Sendo assim, o sistema auxiliar para visitas guiadas se
colocaria como um recurso para apresentar roteiros
personalizados que sugerissem as obras mais relevantes a
serem vistas pelos usuários do museu, levando em
consideração as preferências e a bagagem cultural de cada
um.
Para a geração dos perfis a serem atendidos pela hipermídia
proposta, optamos por utilizar a metodologia de personas,
exposta a seguir.
PERSONAS
A idéia de personas foi introduzida por Alan Cooper em
seu livro The Inmates are Running the Asylum [2].
Contrastando com a abordagem da norma ISO 13407, o uso
de personas compreende a aplicação de uma metodologia
completa, uma ferramenta com métodos bem definidos que
se propõe a tratar mais eficientemente a questão do design
centrado no usuário.
O termo persona é compartilhado com os profissionais de
marketing, onde serve a propósito diferente. A distinção
básica entre a persona do marketing e a persona do design é
que a primeira é baseada em dados demográficos,
influenciando nos processos de venda e distribuição; a
última se baseia puramente nos usuários e vai guiar o
processo de design [2]. Em outras palavras, a construção de
personas para o marketing obedece a um processo de
pesquisa quantitativa e estatística, enquanto no design
temos como direção a pesquisa etnográfica/qualitativa.
De acordo com Alan Cooper, personas são arquétipos
hipotéticos de usuários reais, definidos com rigor e precisão
significativos. Em outras palavras, trata-se de personagens
fictícios, construídos a partir da coleta de dados dos
usuários em potencial e que servirão para orientar o
desenvolvimento do produto.
John Pruitt [9] advoga que a metodologia de personas é de
grande potencial para concretizar o design centrado no
usuário. Para Pruitt, A utilização dessa metodologia serviria
não apenas de ligação entre a parte burocrática e a
execução do design, mas iria além, gerando empatia entre a
equipe de desenvolvimento e fazendo com que as
perspectivas do usuário fossem efetivamente levadas a
sério.
Cooper assume o uso de personas também como alternativa
para sanar o fenômeno que denominou “usuário elástico”.
O autor chama à atenção a imprecisão do termo usuário,
uma vez que numa equipe de desenvolvimento, cada
participante tem uma concepção diversa quanto às
características e necessidades do público-alvo. Em
momentos críticos do desenvolvimento dos projetos, esses
“usuários” assumem uma elasticidade para que se encaixem
convenientemente nos argumentos de quem quer esteja
decidindo. Isto confere a uma equipe de desenvolvimento, a
liberdade de projetar conforme queiram, enquanto
aparentemente servem ao “usuário” [3].
Vasara [12] reforça que as personas trazem à vida os tipos-
chave de usuários, especialmente para aqueles que não
participaram do levantamento de dados.
Nota-se que o investimento de tempo na realização da
pesquisa inicial é compensador uma vez que guia as etapas
conseguintes, atendo a equipe aos reais objetivos,
necessidades e limitações do usuário e evitando falhas cuja
correção posterior seria ainda mais dispendiosa em tempo e
em custos.
Com base nos fatores expostos, é comum o surgimento da
pergunta: por que não basear os perfis em pessoas de
verdade?
Pessoas reais tendem a ter peculiaridades que não se
aplicam ao público-alvo geral, o que poderia interferir no
design de forma negativa. Exemplificando, Alan Cooper
cita o presidente de uma companhia que, baseado em sua
preferência particular, determina que todos os softwares
produzidos pela empresa fossem operados apenas pelo
mouse. Projetar com esse usuário em mente excluiria todos
os demais que gostam de utilizar o teclado para a
manipulação de software.
Outro motivo para não serem usadas pessoas reais, jaz no
conceito “usuários não são designers”. Para Jakob Nielsen
[7], se pessoas reais fossem usadas no lugar de personas,
invariavelmente seriam solicitadas a opinar sobre questões
no design e, embora os usuários sejam hábeis em identificar
problemas, não são capazes de elaborar a soluções por não
serem designers.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 99](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-105-320.jpg)
![A metodologia de personas
Desde sua introdução por Alan Cooper em 1999, a
metodologia de personas vem ganhando destaque através
do estudo de outros autores e de sua crescente utilização no
desenvolvimento de produtos e serviços. Percebemos que
as técnicas usadas para produção das personas variam entre
os autores e de acordo com o contexto do planejamento,
constituindo um método bem definido, porém flexível.
Apesar de ser de comum acordo entre os autores que as
informações devem ser coletadas diretamente dos usuários
em potencial, a maioria não especifica as ferramentas
usadas – mesmo porque o contexto é único para cada
projeto. Em linhas gerais, concordam em dedicar sua
atenção à pesquisa qualitativa. Goodwin [5] explica que as
personas são baseadas primariamente em dados
etnográficos, sugerindo que a pesquisa deve ser
essencialmente baseada em dados qualitativos, coletados
através de entrevistas e observação.
Goodwin vai além e abranda o valor da pesquisa
quantitativa, propondo que esta seja usada apenas para
validar as descobertas da pesquisa qualitativa caso haja
tempo hábil e verba disponível para realizar a investigação
extra.
No desenvolvimento deste projeto, utilizamos os seis
passos propostos por Pruitt e Adlin conforme resumo a
seguir:
1º passo: identificar categorias de usuários que são
importantes para seu projeto, de forma a facilitar o
processamento dos dados e estabelecer uma ponte entre os
tipos de usuários e as personas a serem criadas.
2º passo: processar os dados para extrair informações
relevantes ao desenvolvimento do produto.
3º passo: identificar e criar esqueletos, diferenciando-os
através dos detalhes que caracterizam cada categoria.
4º passo: priorizar os esqueletos que serão efetivamente
desenvolvidos ao nível de persona.
5º passo: enriquecer os esqueletos selecionados com
detalhes, histórias, personalidades, contextos, etc.,
elevando-os efetivamente ao nível de persona.
6º passo: validar a as personas, checando se estas refletem
os dados coletados e se abrangem todas as possíveis
hipóteses.
APLICAÇÃO
Reconhecemos que nos diversos estudos de casos,
freqüentemente relatados nas obras para exemplificar a
aplicação da metodologia de personas, o objetivo era
definir prioridades e reduzir ao máximo o número de perfis,
delineando mais precisamente o público-alvo para o qual se
estava projetando.
Em oposição, este trabalho tem como prioridade abranger,
dentro do espectro de freqüentadores de museus, o mais
variado público possível. Para isto, utilizamos a exposição
“Virada Russa”, em cartaz na cidade do Rio de Janeiro
entre junho e agosto de 2009 no Centro Cultural do Banco
do Brasil (CCBB), como cenário para realização de
entrevistas a serem usadas como base para a identificação
do público freqüentador de museus.
Elaboramos um conjunto de perguntas (Anexo A) que
serviu de roteiro para as entrevistas. Consideramos as
seguintes variáveis:
Freqüência de visitação a exposições;
Motivo da visitação;
Nível de conhecimento prévio sobre o tema;
Nível de interesse por material multimídia;
Interesse pelo serviço de visita guiada.;
Necessidade de informações adicionais;
Tempo estimado de permanência no local;
Tempo efetivo de permanência no local.
Valorizando o aspecto qualitativo da metodologia
empregada, permitiu-se que os entrevistados falassem
livremente e as informações relevantes eram registradas
reservadamente em seguida. Naturalmente, o nível de
colaboração variou bastante entre os 33 visitantes
abordados e, dentre os que mais contribuíram, nove
apresentaram características peculiares que influenciavam
de forma significativa seu comportamento durante a
visitação.
Além do “usuário básico”, identificamos duas categorias
importantes de usuários: a que requeria informação
diferenciada e a que requeria apresentação diferenciada.
Tendo por base estes nove visitantes que se destacaram nas
entrevistas, elaboramos e categorizamos dez esqueletos
listados e descritos a seguir.
Entende-se por esqueleto os perfis que poderiam
potencialmente dar origem a uma persona devido a suas
singularidades (o mesmo que arquétipo, para Alan Cooper).
Categoria 1: usuários básicos
A leiga: Teve seu interesse por arte iniciado
recentemente e, por isso, tem pouco conhecimento e
opinião crítica sobre o assunto. Tenta assimilar, num
nível geral, toda informação a seu alcance. Peculiaridade:
tenta captar o máximo de informações gerais por ser
ignorante no assunto.
O visitante casual: Não tem qualquer interesse em se
aprofundar no assunto. Está presente na exposição por
acaso e seu tempo de permanência variará de acordo com
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 100](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-106-320.jpg)


![exposição. A hipermídia ofereceria inicialmente uma lista
padrão contendo as obras mais relevantes e, à medida que o
usuário percorresse a exposição com o dispositivo móvel, o
sistema armazenaria um histórico das obras visualizadas
que serviria de base estatística para distinguir a preferência
por certo estilo ou movimento artístico, atualizando a
listagem em concordância com as predileções do usuário e
de seu tempo disponível.
Ainda conforme os conceitos da adaptatividade, a
hipermídia empregaria os princípios propostos por
Brusilovsky adequando seu conteúdo através da adaptação
da linguagem e da modificação de fragmentos textuais [1].
CONCLUSÃO
Vimos o uso da metodologia de personas orientando a
pesquisa e a criação de perfis a serem atendidos por uma
hipermídia adaptativa para auxílio a visitas guiadas a
museus. Apesar da bibliografia ainda um pouco restrita,
muitos casos bem-sucedidos têm sido relatados,
demonstrando grande eficácia, especialmente no
desenvolvimento de software.
Mesmo tendo sido formalizada há relativamente pouco
tempo, a metodologia compreende conceitos já bastante
discutidos por pensadores do design, da ergonomia e, mais
recentemente, da usabilidade, demonstrando ser uma
ferramenta poderosa do design centrado no usuário.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 103](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-109-320.jpg)

![Estudo comparativo de extensões UML
nos artefatos do projeto de sistemas interativos
First Author Name (Blank if Blind Review)
Affiliation (Blank if Blind Review)
Address (Blank if Blind Review)
e-mail address (Blank if Blind Review)
Optional phone number (Blank if Blind Review)
Second Author Name (Blank if Blind Review)
Affiliation (Blank if Blind Review)
Address (Blank if Blind Review)
e-mail address (Blank if Blind Review)
Optional phone number (Blank if Blind Review)
RESUMO
Este trabalho analisa o problema de projetar e desenvolver
interfaces para sistemas interativos, sob o ponto de vista da
documentação gerada por esse processo. As representações
dos diversos aspectos do projeto geraram extensões UML.
No entanto nem todas as necessidades do projeto de
sistemas interativos são atendidas por essas extensões,
sobretudo, porque uma única representação não é suficiente
para contemplar os diversos níveis de abstração que
precisam ser abordados no projeto de sistemas interativos.
Dessa forma, este trabalho realiza uma análise comparativa
dessas soluções, no contexto de um projeto real. O
resultado desta análise é empregado na proposta de um
conjunto de artefatos para o projeto de sistemas interativos.
PALAVRAS CHAVE
Modelagem da interação; extensões UML; Interação
Homem-Computador; artefatos do processo de software.
ABSTRACT
This paper examines the problem of designing and
developing interactive interfaces to systems from the point
of view of documentation generated by this process. The
representations of the various aspects of the project
generated extensions UML. However, not all the needs of
the project, interactive systems are addressed by these
extensions, mainly because a single representation is not
sufficient to cover the various levels of abstraction that
must be addressed in the design of interactive systems.
Thus, this work performed a comparative analysis of these
solutions in the context of a real project. The result of this
analysis is employed in the proposal of a set of artifacts to
the project of interactive systems.
Keywords
Modeling the interaction, Extensions UML, IHC, Artifacts
of the process of software.
INTRODUÇÃO
Para permanecerem competitivas, as equipes de projetos de
software buscam na modelagem do sistema os diversos
níveis de abstração do processo de desenvolvimento de
software. O uso de modelos auxilia no entendimento e na
comunicação da equipe. A elaboração de modelos elimina
detalhes irrelevantes para o processo e serve como
catalisador, possibilitando a criação de visões simplificadas
de realidades complexas [24].
Como conseqüência do progresso na área de hardware e de
software, aumentaram as opções de estilo de interação e a
complexidade dos softwares projetados e diversificou-se o
perfil dos usuários, tendo ocorrido também o aumento da
busca por usabilidade.
Para facilitar a representação da interação e da interface de
sistemas interativos, autores, vêm estendendo a UML. No
entanto o projeto de sistemas interativos, como qualquer
projeto de software, é uma construção intelectual que passa
por diferentes níveis de abstração. A UML, útil para
capturar diversas abstrações do projeto de software, pode
ser adequada à representação das abstrações específicas da
interação homem-computador.
Na experiência profissional da autora como analista e
desenvolvedora de sistemas interativos, observou-se que a
representação da interação assume diferentes aspectos, a
saber:
representação do perfil dos diversos usuários que
interagem com o sistema;
representação do diálogo entre sistema e usuário;
representação da seqüência das telas e de sua navegação;
representação dos símbolos; e
representação das funções do sistema.
A consistência dessa representação e sua comunicabilidade
no ambiente de projeto são aspectos importantes, não
apenas para o sucesso do projeto de um sistema interativo,
mas também, para a eficácia e a produtividade de uma
equipe de projeto.
Contudo há a preocupação da comunidade de
desenvolvimento de software em garantir que a UML seja
completa para o desenvolvimento de software e que se
preencham todas as lacunas. Para tanto, autores, como
Page-Jones[20], Conallen [5], Silva e Paton [25] e Nunes
[16], dentre outros, utilizaram mecanismos de extensão, os
quais são elementos de modelagem que permitem
tratamento visual e especializado e definem como criar
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 105](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-111-320.jpg)
![novas semânticas na construção da interação do usuário
com o sistema.
ARTEFATOS DO PROCESSO DE DESENVOLVIMENTO
DE SISTEMAS INTERATIVOS
As atividades da Engenharia de Software, em geral,
envolvem uma grande quantidade e variedade de tipos de
artefatos, os quais são gerados durante o processo de
desenvolvimento de software. Um artefato pode ser visto
como qualquer informação gerada, alterada ou usada no
decorrer do processo de desenvolvimento [9]. Sendo assim,
um artefato pode estar na forma de um modelo, um
elemento do modelo (um gráfico, uma classe, um
subsistema etc), um caso de teste, uma ata de reunião, um
manual etc.
Quando os artefatos produzidos são claros, a tendência é a
de que os atores do desenvolvimento de sistema se
entendam. Por sua vez, um documento, ainda que esteja
bem escrito, pode causar dificuldades de entendimento a
quem o lê, por causa de determinada escolha ou decisão
para se constituir daquela maneira. Por esse motivo, são
produzidos diversos artefatos ao longo do processo de
desenvolvimento de sistemas interativos, algumas vezes,
com aspectos repetidos em diferentes níveis de
detalhamento e com relação entre si [1].
Esta pesquisa considerou os artefatos sugeridos por sete
diferentes trabalhos, os quais foram selecionados por vários
motivos: em primeiro lugar, porque todos tratam de
processos de desenvolvimento de sistemas interativos.
Nesse sentido, a coleção de trabalhos captura as diversas
gerações de processos de desenvolvimento de sistemas
interativos, surgidas ao longo dos últimos vinte anos –
desde o trabalho sobre a Engenharia Cognitiva, de Norman
e Draper [15], até a abordagem orientada a objetos de
Mayhew [13], passando por trabalhos clássico da
Engenharia de Usabilidade de Nielsen [14] e do ciclo
estrela, proposto por Hix e Hartson [7]. Este trabalho
considera também a posição da ISO sobre o referido
processo, em sua norma 13.407 [8].
Outro fator relevante para a seleção desses trabalhos foi o
fato de discutirem especificamente os artefatos gerados
pelos mesmos processos. Nesse sentido, contribuem
também: o trabalho de Mayhew [13], o qual revela uma
preocupação importante com os artefatos; o trabalho de
Paula e Silva [21, 25] que define um artefato da Engenharia
Semiótica e o trabalho de Brown [3], que detalha os
artefatos produzidos modernamente na documentação do
projeto de websites.
Nos trabalhos centrados no processo, considera-se que eles
sugerem atividades, das quais é possível extrair artefatos no
processo de desenvolvimento de software, os quais
expressam a necessidade dos projetistas na representação de
suas idéias. Os processos descritos pelos autores, e suas
respectivas atividades, não serão descritas neste artigo por
limitações de espaço.
SELEÇÃO DOS ARTEFATOS
A partir de uma leitura dos autores foi possível extrair os
artefatos para o desenvolvimento de sistemas interativos:
a) perfil dos usuários – é o documento que descreve o tipo
de usuários, perfil e atividades por eles desempenhadas;
b) cenários – são composições realistas da tarefa do usuário,
relacionadas com o objetivo da avaliação, as quais simulam
uma tarefa real, em que o usuário interage com o sistema e
onde é registrado cada procedimento tomado;
c) personas – são perfis de usuários fictícios, mas
representativos;
d) especificação de casos de uso – são narrativas de texto
do caso de uso. Caso de uso são descrições de interações
típicas entre os usuários e o sistema. Eles representam a
interface externa do sistema e especificam um conjunto de
exigências do que o sistema deve fazer;
e) protótipo – tem a função de demonstrar os requisitos de
um sistema;
f) plano de testes – consiste na definição das metas e dos
objetivos dos testes no escopo da iteração (ou projeto), os
itens-alvo, a abordagem adotada, os recursos necessários e
os produtos que serão liberados;
g) diagrama de tarefas – descreve detalhes de como o
processo é implementado, bem como, as instruções e ordens
para a sua execução;
h) questionário com o usuário;
i) manual de instalação – contém instruções para instalação
do sistema;
j) manual do usuário – contém instruções de como o
sistema pode ser operado pelo usuário;
k) tabela de signos – descreve os signos integrantes da
conversa usuário-preposto do designer;
l) diagrama de metas – especifica as metas que os usuários
terão ao utilizarem o sistema e a relação entre essas;
m) diagrama de interação – representa uma visão global das
possíveis conversas que podem ocorrer entre o usuário e o
preposto do designer para alcançarem as metas
representadas no diagrama de metas;
n) mapa do sistema (site maps) – organiza e estrutura o
conteúdo do sistema e seus acessos por meio de um mapa,
ampliando sua visualização e proporcionando modificações
em sua navegação;
o) fluxo de interação (flow charts) – trata tanto do fluxo da
interação das telas do sistema, quanto da interação entre o
sistema e o usuário; e
p) wireframes – desenvolve esboços das telas do sistema,
com pré-disposições e posicionamento de conteúdos e
funcionalidades.
ARTEFATOS UML NO PROCESSO DE MODELAGEM DE
SISTEMAS INTERATIVOS
Segundo Booch, Rumbaugh e Jacobson [2], no processo de
desenvolvimento de um software, é benéfica a produção
dos seguintes artefatos: requisitos, arquitetura, projeto,
código-fonte, planos de projetos, planos de testes,
protótipos e versões. Dependendo da cultura de
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 106](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-112-320.jpg)
![desenvolvimento, alguns desses artefatos são tratados de
maneira mais ou menos formal do que outros.
A partir do estudo dos modelos de processos realizados,
foram selecionadas três fases que contribuem para a
construção da camada interativa no processo de modelagem
e desenvolvimento de interface: análise de requisitos,
design e testes.
Análise de requisitos – São representados pelas descrições
de Caso de Uso , diagramas de Caso de Uso , diagramas de
classe e diagramas de seqüência.
Design – diagramas de atividades, diagramas de estado de
transição e diagramas de pacotes, contendo componentes de
design.
Testes – diagramas de classe e de compontes. Casos de uso
para orientar os testes de usabilidade.
Embora a UML não se refira primordialmente a elaboração
de teste, é possível fazer testes unitários por meio dos
diagramas de classe (Unit test), além de teste integrado com
os diagramas de componentes (component test).
EXTENSÕES DA UML PARA SISTEMAS INTERATIVOS
Alguns autores, preocupados em garantir que a UML seja
completa para o desenvolvimento de software e preencha
todas as lacunas de representação necessárias nesse
processo, utilizaram mecanismos de extensão para criar
novas semânticas necessárias para representar a interação
do usuário com o sistema, a análise de requisitos, a
construção de interfaces e a interação entre objetos que
compõem o sistema. Para representar essa preocupação, foi
feito um levantamento de extensões da UML, cujo
resultado é apresentado a seguir, na Tabela 1.
EXTENSÕES UML SELECIONADAS PARA UM ESTUDO
COMPARATIVO
Foi realizado um estudo comparativo das extensões UML
para representação da interação homem-computador, por
meio de uma análise comparativa aplicada a um projeto real
de software interativo, o qual não está descrito neste artigo
por limitações de espaço. O foco da comparação é a
representatividade da extensão em cada artefato, que deve
oferecer ao projetista um meio de expressar precisamente
suas intenções em todo o processo de desenvolvimento. As
extensões selecionadas foram: Page-Jones, UMLi, WAE e
Wisdom, [20,4, 25 e 16].
Page-Jones [20] desenvolveu dois diagramas adicionais
para representar a IU na UML, o diagrama para layout de
janelas, estendido do diagrama de caso de uso, e diagrama
para navegação de janelas, estendido do Diagrama de
pacote.
UMLi é um projeto de pesquisa desenvolvido pelo grupo de
gerência da informação da Universidade de Manchester, em
1998. Segundo Paton e Silva [4], a UMLi foi desenvolvida
para proporcionar interação amigável entre usuário e
sistema. Ela propõe dois novos diagramas UML para o
projeto de IU, descritos como Diagrama IU e Diagrama de
Atividade Estado de Seleção.
Extensão Ano Foco Autores Ref.
Diagramas
de Layout e
de
Navegação
de Janelas.
1996 Prototipação e
navegação de tela.
Page-Jones [20]
UMLi 1998 Modelagem de
interface e modelagem
do comportamento UI.
Paton e Silva [25]
WAE 1998 Internet Jim Conallen [5]
WISDOM 2000 Modelagem de
Sistemas Interativos –
prototipação evolutiva.
Nuno Jardim
Nunes
[15]
AUML 2000 Modelagem de
sistemas envolvendo
objetos e Modelagem
de comunicação entre
agentes (objetos).
Odell,
Parunak e
Bauer
[17]
Libra 2004 Comportamento de
elementos: objetos e
aspectos.
Chaves [4]
IMML 2003 Modelagem visual de
interfaces de usuário.
Descrição abstrata de
IU.
Jair
Cavalcante
Leite
[11]
TUML 1997 Modelos temporais. Svinterikou [26]
UMP²D 2000 Desenvolvimento de
aplicações paralelas.
André Luís
Olivete, Dr.
Onofre
Trindade
Júnior
[18]
Xchart 1997 Modelo de
Especificação e
implementação de
gerenciadores de
diálogo.
Fábio
Nogueira de
Lucena
[12]
UWE 2000 Extensão para modelar
Sistema Hipermídia
Adaptativa (SHAs).
Nora Parcus
de Koch
[10]
UML-MC 2002 Extensão da UML para
representar Mapas
Conceituais
Robinson e
Crespo
[23]
Tabela 1 – Extensões UML levantadas
Criada por Conallen [25], a WAE (Web Application
Extension for UML) estende a notação UML e traz novos
estereótipos com semântica e restrições adicionais,
permitindo a modelagem de elementos específicos da
arquitetura envolvida numa aplicação Web, incluindo-os
nos modelos dos sistemas. Conallen propõe Experiência do
Usuário (UX), a qual é apresentada por meio de um
conjunto de diagramas utilizados pra descrever a IU.
De acordo com Nunes [16], a arquitetura de IU WISDOM é
uma extensão do padrão de análise
interface/entidade/controle (model-view-controller, MVC)
da UML. Nunes propõe nove artefatos, são eles: Modelo
perfil do usuário estendido do diagrama de caso de uso,
Modelo de domínio/negócio estendido dos diagramas de
classe e diagramas de atividade, Modelo de casos de uso
essencial estendido do diagrama de caso de uso, Modelo de
Análise e Modelo de Interação ambos estendidos dos
diagramas de classe, Modelo de desenho estendido dos
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 107](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-113-320.jpg)
![diagramas de classe e diagramas de estado, Modelo de
diálogo estendido do diagrama de classe, Modelo de
Requisitos estendido do diagrama de classe e diagrama de
estado e Modelo de Implementação.
As extensões foram aplicadas em um projeto do Centro
XXXXXX do xxxxxxxx na Seção de XXXXXXX O
projeto visa ao desenvolvimento de um sistema interativo
denominado Sistema de Gestão de Árvores Urbanas
(SISGAU). O estudo comparativo analisa as extensões
UML nas fases de análise de requisitos, design e teste.
Nas extensões estudadas, foram encontrados para a fase de
análise de requisitos, o modelo de perfil do usuário e o
modelo de diálogo, ambos da WISDOM.
Modelo de Perfil do Usuário – é representado por um
diagrama de casos de uso, com os estereótipos de
classificação, ação e composição. Esse modelo segue a
perspectiva definida pelo mapa de papéis do usuário, ilustra
e organiza características dos usuários e seus papéis, tipo de
usuário, conjunto de interesses, comportamento,
responsabilidades e expectativas em relação ao sistema.
Essa extensão mostra – por meio do diagrama de casos de
uso – os usuários do sistema e seus papéis, acrescentando
descrições textuais para explicar responsabilidades,
expectativas e comportamentos.
Modelo de Diálogo – esse modelo especifica a estrutura de
diálogo da aplicação interativa, focando as tarefas e seus
usuários.
A Figura 2, a seguir, descreve esta situação: um grupo de
usuário (administrador e inspetor) pode consultar, cadastrar
e alterar as telas avaliação, diagnóstico e prospecção do
tronco, seguindo essa seqüência. No caso, a interface de
Avaliação do Tronco tem as seguintes funções:
InserirAvaliacaotronco(),alteraAvaliacao
tronco(),consultaAvaliacaotronco().
Nota-se que o usuário Consulta apenas consulta as telas
avaliação tronco, diagnóstico tronco e propecção tronco.
É interessante ressaltar neste modelo que, além de ele
demonstrar os tipos de usuários, suas tarefas (consultar,
alterar e cadastrar) e as telas que percorre, ele descreve
também as funções contidas em cada tela.
Os artefatos identificados como necessários para o Design
são: protótipos, mapa do sistema, fluxo de interação,
diagrama de interação e Wireframe. As extensões que se
aplicam a essa fase são:
a) Page-Jones – Diagrama de navegação de Janelas e
Diagrama de Janela;
b) UMLi – Interação do Fluxo de Telas e Diagrama IU;
c) WAE – Mapa de caminho de navegação, Descrição de
telas e conteúdo, Fluxo de navegação; e
d) WISDOM – Fluxo de telas – modelo de interação,
modelo de desenho ou apresentação.
Figura 2 - Modelo de diálogo – WISDOM.
Page-Jones [20] propõe o diagrama de navegação de
janelas, que é uma extensão do diagrama de estado da
UML, cujo objetivo é mostrar como os usuários podem
passar de uma janela para outra ao longo de rotas
expressivas e importantes na aplicação.
Seguindo o fluxo exposto na Figura 3 a seguir, verifica-se
que a interface (denominada pelo autor de janela)
Avaliação do Tronco foi acionada a partir da interface
Avaliação do Colo. Nessa interface, é executada a função
InserirAvaliacaoTronco e, a partir dos botões
diagnóstico e prospecção, é possível navegar para outras
duas telas: Diagnóstico ou Prospecção.
A interface Diagnóstico recebe os dados do tronco
(demonstrado pelo colchete diagnostico.tronco, da classe
diagnóstico) e a interface prospecção recebe os dados da
FendaRachadura (classe).
Caso o usuário escolha a interface Prospecção, ele terá de
passar necessariamente pela interface Diagnóstico e, se ele
escolher a interface Diagnóstico, a próxima interface que
ele percorrerá é a de Avaliação Copa.
Todos os estereótipos demonstrados na Figura 3 (cb, nav e
jn), inserida a seguir, fazem parte da extensão, segundo
proposta de seu autor.
Figura 3 – Diagrama de navegação de janelas –
Fonte: Page-Jones [20]
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 108](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-114-320.jpg)
![O que torna esta extensão atraente é o fato de ela ser
simples em demonstrar a navegação de telas (prisma), as
funções que a interface necessita para sua execução e os
eventos (botões). Outra vantagem é o fato de não haver
necessidade de uma ferramenta específica para desenhar
esse diagrama.
Outro diagrama proposto por Page-Jones [20] é o de
janelas, que tanto pode ser uma extensão do diagrama de
caso de uso como pode ser uma extensão do diagrama de
pacote, quando representa agrupamentos exclusivamente de
elementos.
Para desenhar o diagrama de janelas, foi utilizada a
ferramenta Microsoft Visio. Foi desenhado o diagrama de
caso de uso e, nesse, foi indicada uma interface denominada
Diagrama de Layout, exposto na Figura 4, a seguir.
No Diagrama de Layout – Figura 5, a seguir – foram
colocados os elementos da interface sem nenhum
refinamento.
Figura 4 – Caso de Uso Avaliação Tronco – Fonte:
Page Jones [20].
A proposta de Page-Jones é bem simples: ele estende o
diagrama de caso de uso da UML para demonstrar o
protótipo.
Na UMLi, Paton e Silva [25] propõem o diagrama de
Interação do Fluxo de Telas, o qual é uma alternativa para
representar o processo descrito por um caso de uso. Para
tanto, esse diagrama dispõe dos mesmos elementos dos
diagramas de estado, ou seja, eventos e estados, mas esses
não se restringem a um único objeto. O diagrama de
Interação do Fluxo de Telas é muito parecido com o
diagrama de navegação de janelas do Page-Jones [20].
Na Figura 6 a seguir, está demonstrada a seguinte situação:
os dados da interface Avaliação Colo (descrito pelo
estereótipo AvaliacaoColo.dados, classe
AvalicaoColo) são enviados, após confirmação, para a
interface Avaliação Tronco que é composta pela função
InserirAvaliacaoTronco e pelos dados do
diagnóstico, presentes na classe diagnóstico
(diagnostico.tronco) e da fendaRachadura,
presente na classe prospecçao
(prospeccao.fendaRachadura ).
Figura 5 – Diagrama de Janela – Avaliação Tronco.
De acordo com os dados recebidos, o sistema ativa a
interface Prospecção Tronco ou Diagnóstico Tronco e, se
ativar a interface Prospecção, a seqüência posterior será a
interface Diagnóstico Tronco e Avaliação Copa.
Assim, a extensão apresenta o nome das telas: Avaliação
Tronco, Prospecção Tronco e Diagnóstico Tronco; o fluxo
das telas; os eventos activates e confirms; as
funções InserirAvaliacaoTronco,
InserirDadosProspecçao e
InserirDadosDiagnostico; e os dados
dados.AvaliacaoColo, dignostico.tronco e
Prospeccao.fendaRachadura .
Figura 6 – Interação do Fluxo de Telas – UMLi.
Outro diagrama proposto por Paton e Silva é o UI, utilizado
para modelar interface. Esse diagrama é estendido a partir
do diagrama de classe da UML e as instâncias dessas
classes são os próprios objetos interagindo.
Para modelar o Diagrama IU, é necessário ter o diagrama
de classes da UML. O Diagrama IU, representado na Figura
7 a seguir, apresenta a interface Avaliação Tronco, na qual,
estão os objetos extraídos do diagrama de classe da UML,
e, nesse, constam os ícone editores, que é um ícone de
entrada de dados. Dentro da interface, há também dois
recipientes e, dentro desses recipientes, há informações
emitidas pelos usuários – do diagnóstico e da prospecção.
Essas serão utilizadas em outras interfaces. Há o símbolo
responsável por receber informações emitidas por usuários
tanto fora como dentro dos recipientes.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 109](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-115-320.jpg)
![Figura 7 – Diagrama IU.
Na WAE Conallen [5] propõe um novo conceito na
modelagem de sistemas e apresenta o modelo de
experiência do usuário (UX), o qual é usado para descrever
a equipe e as atividades dos responsáveis em manter a
interface com o usuário. Para a fase de Design, Conallen
propõe na UX quatro artefatos: Fluxo de tela, Mapa de
Caminho de Navegação, Descrição de Telas e Conteúdo e
Cenários do Roteiro.
a) Fluxo de Tela
Um artefato da UX é o Fluxo da tela, na Figura 8 a seguir, o
usuário inspetor acessa a interface Avaliação Tronco, por
meio de uma página client, que acessa uma página server a
qual contêm as funções do sistema: interferência,
fenda_rachadura e diagnostico_tronco.
Figura 8 – Fluxo da tela – WAE.
O fluxo de tela demonstra o tipo de usuário, a interface, as
funções executadas e o tipo de armazenamento – cliente ou
servidor.
b) Mapa de Caminho de Navegação
O artefato mapa de caminho de navegação é bem simples e
expressa o nome das interfaces e o caminho que o usuário
deve percorrer para navegar no sistema.
No SISGAU, não há um menu onde o usuário seleciona a
tela que ele quer cadastrar. Desse modo, ele tem de seguir
uma seqüência de telas (Wizard) e, quando modelada no
Mapa de Caminho de Navegação, essa seqüência de telas
tornou-se confusa.
c) Diagrama de Descrições de Telas e Conteúdo
Esse artefato do modelo UX é uma extensão do diagrama
de classe da UML. A interface é representada com uma
classe estereotipada, com ícones e atributos estereotipados,
como se vêem a seguir na Figura 10. O nome da interface é
usado como nome da classe – tem um símbolo indicando
que é uma interface – e a descrição da interface capturada é
usada como a descrição da classe. As classes podem ser
organizadas em pacotes. Neste estudo, são analisadas duas
interfaces: Avaliação Tronco e Diagnóstico Tronco, os
dados de entrada da interface são indicados pelo estereotipo
dexibido e os dados são gerenciados pelo estereotipo
dbanco.
Exemplificando, o diagrama de Descrições de telas e
conteúdo é um diagrama de classe da UML com
estereótipos indicando quais dados são de entrada – aqueles
produzidos pelo usuário – e quais dados são gerenciais –
aqueles produzido pelo sistema, além de um ícone,
indicando quais classes são interfaces.
Figura 9 – Descrição de Telas e Conteúdo – WAE.
d) Cenários do Roteiro
Conalen, no Artefato Cenários do Roteiro, descreve um
fluxo de telas com entrada de dados do usuário, visto a
seguir, na Figura 18. Nesse, o usuário fornece informações
sobre a interface (Avaliação do Tronco) e a navegação é
orientada para a próxima interface, desde que se tenha
obtido sucesso na inserção de dados. Ou, explicando
melhor, a Figura 10 demonstra esta situação: o usuário
inspetor acessa a interface Avaliação do Tronco, que
dispara a função InsereAvaliacao(). Se os dados forem
consistentes, aparece a interface Diagnóstico Tronco; caso
os dados estejam incompletos, aparece a interface Dados
Perdidos (interface de erro); e, se houver erro de
processamento (problemas externo ao sistema, por exemplo
conexão da rede), aparece a interface Erro de
Processamento.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 110](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-116-320.jpg)
![Figura 10 – Cenários do Roteiro – Fluxo de navegação
determinado pela entrada de dados do usuário.
Essa extensão apresenta um cenário de roteiro de forma
bem macro, sem muito detalhamento de interface e não há
descrições das funções do sistema nem dos eventos.
Na WISDOM, Nunes [16] propõe dois artefatos para essa
fase: modelo de interação e modelo de apresentação. O
modelo de interação é um fluxo de casos de uso. Na Figura
11, está demonstrada a seguinte situação: se o usuário
acessar o caso de uso localização, terá duas opções, incluir
ou alterar/consultar. Caso ele opte por incluir, ele segue
uma seqüência de telas até finalizar (wisard), caso
contrário, ele pode acessar a interface que quer alterar ou
consultar.
Figura 11 – Fluxo de Casos de Uso – Modelo de Interação –
WISDOM.
A proposta desse artefato não é descrever o fluxo de
interfaces, mas demonstrar a seqüência dos casos de uso.
Na modelagem desse fluxo, constatou-se que, quando os
casos de uso seguem obrigatoriamente uma seqüência que
independe da ação do usuário, fica inviável a sua
visualização.
Outra proposta de Nunes é o modelo de apresentação, uma
extensão do diagrama de classe. Esse modelo apresenta o
nome da Interface, seus eventos e objetos. Após modelar o
modelo de apresentação, é possível desenhar o protótipo da
interface.
A Figura 12, a seguir, expõe o modelo de apresentação, o
qual traz um diagrama de classe estereotipado, em que está
descrita a interface Avaliação Tronco. Essa possui dois
eventos: voltar ou prospecção. Dentro da interface
Avaliação Tronco, há três divisões: Interferência,
Diagnóstico e Fenda/Rachadura e os objetos que compõem
cada divisão. O protótipo é construído a partir do diagrama
de classe estereotipado.
Figura 12 – Modelo de desenho ou apresentação –
WISDOM.
Os artefatos identificados como necessários para o Teste
são: questionário com o usuário, documentação de testes,
manual de instalação e manual do usuário. Não há artefatos
para representação dessa fase nas extensões estudadas.
VANTAGENS E DESVANTAGENS DAS EXTENSÕES
Page-Jones
Os dois artefatos propostos por Page-Jones [20], o
Diagrama de Layout de Janela e o Diagrama de Navegação
de Janela, são artefatos simples de modelar e que não
precisam de ferramenta específica para desenhá-los.
O objetivo principal do Diagrama de Layout de Janela é
adicionar o protótipo aos diagramas UML. Esse protótipo
apresenta detalhes da interface que, muitas vezes, não são
descritos nos casos de uso nem nos diagramas de classe.
A vantagem principal que esse diagrama oferece é a de
detalhar o caso de uso por meio de um protótipo. Outra
vantagem é promover uma estrutura para uma posterior
especificação da interface, a qual inclui validações cruzadas
de campos requeridos, sincronizações entre campos,
verificações de banco de dados e assim por diante. Um
ponto negativo é que alguns requisitos não aparecem na
especificação, por exemplo, os requisitos não funcionais.
O objetivo do Diagrama de Navegação de Janela é mostrar
como os usuários podem passar de uma janela para outra ao
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 111](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-117-320.jpg)
![longo de rotas expressivas e importantes da aplicação. O
Diagrama de Navegação de Janela mostra as rotas de
interação para um caso de uso. A vantagem desse diagrama
está na representação da navegação e na opção de rotas
alternativas. Uma desvantagem é que não há descrição do
tipo de usuário.
UMLi
Os dois artefatos propostos por Paton e Silva [25] –
Diagrama UI e Diagrama de Atividade – são artefatos não
tão simples de modelar, pois requerem ferramenta
específica. Os autores desenvolveram a ARGOi, mas não
foi possível a sua utilização neste trabalho.
O objetivo do artefato Diagrama UI é modelar a interface
com o usuário e, para tanto, ele apresenta entradas e saídas
de dados, além dos objetos da tela.
Uma desvantagem é que somente quem conhece a
simbologia entende o que o diagrama quer demonstrar, pois
não se trata de algo ontológico.
O objetivo do Diagrama de Atividade é apresentar a
seqüência de estados e eventos da tela, deixando sua
aparência muito semelhante à de um fluxograma.
Uma vantagem desse artefato é que ele está diretamente
ligado ao Diagrama UI. Seguindo o Diagrama de Atividade
e interpretando o Diagrama UI, é possível compreender a
interação e projetar a interface. Outra vantagem desse
diagrama é o fato de ele apresentar um processo descrito
por um caso de uso.
WAE
Os artefatos propostos por Conallen [5] serão eficazes para
modelar a interface, se utilizados conjuntamente, pois um
completa o outro.
O objetivo do artefato Fluxo de Tela é descrever os
caminhos ao longo de todas as telas que participam dos
cenários e os caminhos de navegação esperados são
modelados com associações entre as telas.
Uma vantagem desse artefato é o fato de ser de fácil
modelagem e entendimento. Sua desvantagem é não dispor
de simbologia para demonstrar um fluxo alternativo.
O objetivo do Mapa de Caminho de navegação é apresentar
uma visão da aplicação cujo objetivo é mostrar como
usuários do sistema navegarão nele. Esse mapa é
representado em diagrama hierárquico em árvore.
Uma vantagem do Mapa de Caminho de Navegação é a
apresentação de rotas de navegação, juntamente com as
funcionalidades do sistema e os usuários.
O objetivo do artefato Descrição de Telas e Conteúdo é
apresentar os objetos de cada interface e as classes que
interagem com a mesma. E uma desvantagem desse artefato
é a não-apresentação de eventos (“voltar”, “próxima
página” etc.).
O objetivo do Cenário do Roteiro é compreender e
estruturar os cenários, mostrando o ponto de vista do
usuário.
A vantagem desse artefato é que ele conta a história da
aplicação por meio das telas. Outra vantagem é a oferta de
um esquema de roteiro mapeado para o modelo de caso de
uso. Sua desvantagem é fornecer visão pouco detalhada das
interfaces e da interação.
WISDOM
O objetivo do artefato Modelo do Perfil do Usuário é
apresentar os usuários do sistema, mediante descrição de:
tipo de usuário, comportamento, responsabilidades e
expectativas em relação ao sistema. A vantagem desse
diagrama é apresentar o usuário e suas tarefas aos
stakeholders.
O objetivo do Modelo de diálogo é especificar a estrutura
de diálogo da interface, ou seja, explicitar as seqüência das
tarefas e fornecer relações que assegurem consistência dos
diferentes elementos de apresentação.
A vantagem desse artefato é o fato de descreve as funções
contidas em cada tela, além de demonstrar os tipos de
usuários, suas tarefas (consultar, alterar e cadastrar) e as
telas por ele percorridas.
O objetivo do Modelo de Interação é organizar os
elementos da arquitetura do sistema, diretamente
relacionados com sua estrutura de utilização.
A vantagem desse artefato é que ele demonstra a seqüência
dos casos de uso. E uma desvantagem é que ele inviabiliza
a modelagem e sua visualização, quando os casos de uso
seguem obrigatoriamente uma seqüência.
O objetivo do Modelo de Apresentação é definir a parte
perceptível do sistema, ou seja, a interface, focando como
as diferentes entidades de apresentação estão estruturadas
de forma a realizar a interação com o usuário.
PROPOSTA DE ARTEFATOS
Analisando os artefatos levantados, os quais foram descritos
anteriormente, e a modelagem das interfaces em um projeto
real, verifica-se que não há necessidade de produzir todos
os artefatos na modelagem de sistemas interativos. A
pressão dos clientes por prazos menores obriga os
desenvolvedores a buscarem soluções de modelagem mais
rápidas, eficazes e que atendam às expectativas dos clientes
e da equipe de desenvolvimento.
Tendo em vista essas premissas, foram extraídos um
conjunto de artefatos classificados por esta pesquisadora, no
contexto da qualidade em uso, como eficazes, produtivos e
satisfatórios. Esses artefatos foram extraídos dos modelos
propostos pelos autores estudados e na aplicação das
extensões, esses artefatos estão descritos na Tabela 3.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 112](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-118-320.jpg)
![Verifica-se que uma parte expressiva dos artefatos
propostos foi extraída das extensões UML.
Fases e
visões
Artefatos Propostos Autores/
extensões
Análise de
Requisitos –
visão de caso
de uso.
Questionário com o usuário. [9]
Modelo de Perfil do usuário. [12]
Cenários. [7], [11], [10],
[ 9] e [15]
Tabela de signos. [15]
Modelo de tarefas. [11], [10], [6] e
[9]
Análise de
Design –
Visão lógica
e de
concorrência.
Definição da Arquitetura –
Deployment.
[2]
Validação e detalhamento do
cronograma de
desenvolvimento.
Experiência da
autora.
Diagrama de estado estendido
por meio do modelo de diálogo.
WISDOM [12]
Diagrama de Janela. Page-Jones [14]
Mapa de caminho de navegação. WAE [4].
Fluxo de telas. WAE [4].
Testes –
Visão de
componentes
e de
implantação
Programas bem documentados. Experiência da
autora.
Bibliotecas. Experiência da
autora.
Banco de dados – MER e
dicionário de dados.
Experiência da
autora.
Cenários do roteiro. WAE [4].
Manual de instalação e manual
do usuário.
[9]
Tabela 3 – Artefatos sugeridos para a modelagem de
projeto de sistemas interativos
CONCLUSÃO
Este trabalho levantou os artefatos dos modelos de
processo, tal como sugere a literatura – artefatos gerados
pela UML e artefatos das extensões UML – os quais são
propostas para modelagem de interação das interfaces, para
o desenvolvimento do sistema interativo.
Fez-se um estudo comparativo das extensões, por meio de
sua aplicação a um sistema real, no qual, o foco da
comparação foi a representatividade dos artefatos gerados,
de modo a oferecer ao projetista um meio de expressar
precisamente suas intenções em todo o processo de
desenvolvimento, medindo, em um contexto de uso, a
eficácia, a produtividade e a satisfação.
Uma das conclusões obtidas a partir deste trabalho é o fato
de os artefatos gerados pelos processos de desenvolvimento
de sistemas interativos não serem explícitos. Foi necessário
que a autora inferisse nos artefatos das atividades sugeridas
por vários dos autores pesquisados, porque não há
padronização de artefatos propostos pelos autores.
Outra conclusão apresentada neste artigo é a de que a
modelagem de sistemas interativos não pode se basear
somente em elementos definidos pelo metamodelo da
UML. A UML, por ser uma linguagem de modelagem, não
atende às necessidades de representação de um sistema
interativo, já que é originalmente destinada a oferecer uma
forma visual gráfica de comunicação para representação
dos principais conceitos e elementos de um sistema.
Entretanto uma das fortes características da linguagem de
modelagem unificada, presente em seu metamodelo é o
mecanismo de extensão que essa linguagem implementa.
Entende-se ser impossível modelar artefatos dos modelos
de processos de desenvolvimento de sistemas interativos
somente a partir de elementos da UML e seus diagramas.
Uma das alternativas, então, é utilizar extensões da UML
em conjunto com os diagramas da UML, tendo em vista
suas visões.
Os autores das extensões estudadas, [14, 18, 4 e 12],
recomendam a modelagem de sistemas interativos por meio
dos diagramas UML, aos quais eles acrescentam extensões
e adicionam artefatos para facilitar o entendimento dos
stakeholders.
De modo geral, a análise e a implementação dos artefatos
das extensões mostraram que:
o primeiro passo para promover o desenvolvimento de
softwares interativos com qualidade e fácil de utilizar
deve ser a garantia de que os envolvidos nos projetos
(stakeholders) gerem artefatos de qualidade e
compreendam essa atividade de forma contextualizada;
para modelar a interação, em geral, os autores adaptaram
o diagrama de estado da UML e incluíram estereótipos
(elementos de modelos), para facilitar a visualização e a
contextualização;
não há produtividade no desenvolvimento dos artefatos
propostos pelas extensões por faltarem ferramentas que
apóiem a modelagem com os elementos específicos das
extensões;
falta manual de instrução ou uma documentação
sintetizada que indique como aplicar as extensões em um
projeto de sistemas interativos;
as extensões têm, em geral, simplicidade na semântica;
as extensões possibilitam a construção de mecanismos
adaptados a necessidades específicas.
somente os artefatos das extensões não conseguem
satisfazer todas as fases do projeto de sistemas
interativos. A fase mais representada é a de Design.
Enfim, este estudo demonstrou que não há na literatura uma
regra. Ademais os autores estudados não fazem indicações
de quais artefatos são necessários para modelagem do
processo de sistemas interativos. Esse trabalho procurou
nos autores dos processos de desenvolvimento de software,
na UML e em suas extensões, o melhor dos artefatos
propostos e, assim, sugeriu uma lista desses que sejam
capazes de demonstrar especificação, visualização,
modelagem e documentação.
REFERÊNCIAS
1. Bombani, L.; Ciancarini, P.; Vitali, F. “Sophisticated
hypertext funcionalities for software engineering”. In:
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 113](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-119-320.jpg)


![Design’. Porém, nem tudo é Design e nem todos são
designers. O termo Design se refere a um potencial ao qual
cada um tem acesso e que se manifesta na invenção de
novas práticas da vida cotidiana. [.] Design é uma atividade
fundamental, com ramificações capilares em todas as
atividades humanas; por isso, nenhuma profissão pode
pretender o monopólio do Design.” (Bonsiepe, 1997, p.15).
Partindo de uma visão aberta à inclusão que caracteriza a
área do Design, no presente estudo defendo a idéia de que
existe no campo do Design um grande potencial para
trabalhos conjuntos com diversas áreas, com vistas a
atender a novas exigências da sociedade contemporânea.
Foi precisamente este entendimento que conduziu as
reflexões aqui realizadas sobre as possibilidades de um
diálogo interdisciplinar entre Design e Design de interação
como base para a discussão do papel do Design na
construção de interfaces digitais que disponibilizem
informações significativas e promovam experiências
agradáveis.
O Design é um processo ativo que influencia a sociedade
criando sua cultura material. Segundo essa ótica, Meurer,
citado por Frascara (1997) diz que o mundo em que
vivemos é mais que a matéria que se há solidificado como
forma, e que se deteve no tempo. Sua forma está definida
mediante a atividade e a ação é seu centro. Se o Design é
concebido orientado em direção a ação, entendida como
interação ativa e mudança criadora, ele não focará somente
o objeto como forma. Ao contrário, os designers se
preocuparão pelo desenvolvimento de modelo de processos
interativos, nos quais os objetos desempenham um papel
central indiscutível como meio para a ação. Segundo esta
visão, o Design se relaciona com a totalidade do espectro
concreto e intelectual da interação humana, da interação
entre as pessoas, dos produtos, e com o mundo em que
vivemos. (Meurer, apud Frascara, 1997, p. 220).
Tomando esta definição do Design como campo, que nas
palavras de Meurer, “se relaciona com a totalidade do
espectro concreto e intelectual da interação humana”, trago
aqui uma reflexão de questões que envolvem o Design no
contexto da interação.
DESIGN DE INTERAÇÃO: CRIAR EXPERIÊNCIAS
As tecnologias intelectuais vêm reformulando a visão do
homem sobre o mundo, vários aspectos da sociabilidade
humana estão emergindo por meio dos recursos das
tecnologias de informação e de comunicação, criando assim
uma nova paisagem de experiências e interações.
O AIGA (American Institute of Graphic Arts) coloca que
Design de Experiência possui a visão de um produto ou
serviço a partir do seu ciclo de vida completo com o
consumidor, de antes dele perceber a necessidade até o
momento de descarte; prioriza a criação de relações com
indivíduos, não mercados de massa. A preocupação com a
evocação e a criação de ambientes que se conectem em
níveis de valor ou emoção com o consumidor; construído
tanto sobre as disciplinas tradicionais de Design, quanto a
partir de um ambiente variado de outras disciplinas.
Para Winograd (1997), em uma visão tradicional da
interface, a interação acontece entre a pessoa e a máquina e
sobre o espaço que é sustentado entre elas. Entretanto, este
espaço é aberto e habitado por outras pessoas e outros
dispositivos, formando uma rede complexa de interações
que não se sustenta simplesmente na criação da melhor
ferramenta de trabalho dentro de um mundo pré-existente,
mas na criação de novos mundos onde os indivíduos sejam
capazes de perceber, agir e responder às experiências.
Para melhor explorar o tema sobre Design no contexto da
interação lanço mão de Shedroff (2010), que utiliza o termo
Information interaction Design, que é a intersecção das
disciplinas Design da Informação, Design de Interação e
Design Sensorial.
Segundo o autor, Design da Informação aborda a
organização e apresentação de dados: a sua transformação
em informações válidas e significativas. Embora a criação
desta informação é algo que todos nós fazemos, em certa
medida, ela só recentemente foi identificada como uma
disciplina com comprovados processos que podem ser
empregados ou ensinados. Enquanto o Design da
Informação centra-se principalmente na representação de
dados e sua apresentação, a ênfase em Design de Interação
é a de criar experiências agradáveis. E o Design Sensorial
refere-se ao emprego de todas as técnicas com as quais nós
nos comunicamos com os outros através dos nossos
sentidos.
Ou seja, uma categoria abrangente sobre as disciplinas
envolvidas com a criação e apresentação dos meios de
comunicação para as aplicações hipermídia, como; design
gráfico, animação, vídeo, tipografia, som, etc, Estes níveis
de compreensão são importantes porque definem os limites
com os quais podemos criar e comunicar. Para o
desenvolvimento de um projeto hipermídia, o design deve
estar atento para o visual, o verbal, o sonoro, o tátil e o
sinestésico que devem estar presentes de acordo com os
objetivos e as características dos usuários a que se destina o
projeto.
Citando Bonsiepe (1997), a interface deve ser entendida em
um caráter mais amplo desde sua ação instrumental,
relacionada a desenvolvimento de produtos até sua ação
comunicativa, uso de signos e informações. O autor ressalta
que uma das características da hipermídia que a torna
interessante é a interação dialógica do meio visual com o
discursivo, nela a informação pode vir sob a forma texto,
áudio, imagens, seqüências de vídeos, animações, música e
sons (Bonsiepe, 1997, p. 144). Entretanto estas formas
precisam ser elaboradas dentro do processo de
desenvolvimento de uma interface, pois se as possibilidades
abertas pela tecnologia de informação e comunicação
estarão ou não disponíveis dependerá da qualidade de
interface. Esta poderá inibir ou facilitar o acesso às
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 116](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-122-320.jpg)







![Influência do perfil do usuário na inteligibilidade de
interfaces de data warehouse
Mônica Gouvêa
IPT - Instituto de Pesquisas Tecnológicas do
Estado de São Paulo
Av. Prof. Almeida Prado, 532
05508-901 São Paulo SP
gouvea.monica@gmail.com
Lucia Vilela Leite Filgueiras
IPT - Instituto de Pesquisas Tecnológicas do
Estado de São Paulo
Av. Prof. Almeida Prado, 532
05508-901 São Paulo SP
lfilguei@gmail.com
RESUMO
A forma pela qual a informação extraída de um data
warehouse é visualizada pelo usuário final é de
fundamental importância, já que decisões são tomadas
com base na informação apresentada. Percebeu-se ser
necessário explorar as relações de dependência entre a
a compreensão de soluções de interface e o perfil de
seu usuário. Para realizar este estudo, fizemos uma
abordagem que se baseia em duas técnicas pouco
usadas, a de Human Dynamics para explorar o perfil
de usuário e a de Sense-Making para compreender a
dinâmica de uso das interfaces DW. Apresentamos
neste artigo os resultados deste estudo.
PALAVRAS-CHAVE
Interface de Data Warehouse, Sense-Making, Human
Dynamics.
1. INTRODUÇÃO
Data warehouses(DW) são arquiteturas de Banco de
Dados, estruturadas de forma a armazenar
informações históricas extraídas das atividades das
empresas, principalmente de seus dados transacionais.
As informações do DW destinam-se à geração de
relatórios e produção de tendências, de alta relevância
nos processos decisórios das empresas. A forma pela
qual a informação é extraída do DW e visualizada
pelo usuário final é de fundamental importância. A
interface de usuário de um DW está diretamente
relacionada com a ferramenta de front end, por meio
da qual se configura um conjunto de dados e a forma
de representação para demonstração. A ferramenta é
chamada de front end porque é através dela que os
usuários finais do DW interagem com as informações.
A ferramenta influencia na inteligibilidade da
informação e por isso, esta escolha deve levar em
conta o perfil do usuário que irá manipulá-la.
A experiência profissional da primeira autora na
implantação de DW em diversas empresas de
diferentes ramos de negócios - financeiro, logístico e
de telecomunicações - indica que, quando a decisão
da construção de um DW é tomada, vários fatores são
avaliados pelos altos gestores da companhia. Entre
esses fatores, considera-se o orçamento
disponibilizado para tal implementação, a empresa
responsável pela implementação da solução; o
Sistema Gerenciador de Banco de Dados (SGBD) que
será utilizado para o armazenamento das informações,
as ferramentas a serem disponibilizadas e a equipe
que irá responder pelo processo de desenvolvimento e
implantação do sistema.
O que se tem verificado é que, em geral, as soluções
de interface com o DW são propostas de acordo com a
empresa responsável por implementar a solução DW,
ou seja, geralmente, são soluções de interface que
utilizam produtos de propriedade da empresa. Para o
usuário final que utiliza a solução, cabe apenas aceitar
e adequar-se à interface selecionada.
No entanto, os desenvolvedores poderiam optar por
diferentes soluções, mais adequadas a suprir as
necessidades do usuário. Porém, as ferramentas de
front end são escolhidas e disponibilizadas,
normalmente sem levar em consideração o perfil do
usuário final que as irá utilizar.
Para Heckel, apud Araujo [1], “Quando os
computadores pessoais foram inventados...alguns de
nós éramos programadores; nossa especialidade era a
comunicação com computadores, uma atividade
substancialmente diferente da comunicação com seres
humanos”. O profissional de TI, afirma Araújo, acaba
por não mensurar os fatores humanos quando
desenvolve uma interface, esquecendo-se de pensar
nas expectativas do usuário final e na sua interação
com o sistema. Souza et al. [13] descrevem a
interação como um processo que engloba as ações do
usuário, sobre a interface de um sistema, e suas
interpretações e reações, sobre as respostas reveladas
por essa interface.
Para caracterizar a interface de DW, é necessário
conceituar o termo interface que será utilizado neste
trabalho. A interface é a camada por meio da qual o
usuário final obtém as informações necessárias do
DW, construída por meio de uma ferramenta de front
end, que permite a análise dos dados coletados.
Ainda com base na experiência profissional da
primeira autora, observa-se que a maioria dos esforços
para resolver o problema crescente da subutilização
ou de rejeição ao sistema DW, devido a sua interface,
tem sido concentrada no desenvolvimento de novas
ferramentas de front-end, o que enfrenta apenas parte
do problema da rejeição.
Quando do desenvolvimento de solução de uma
interface, é importante que o desenvolvedor de TI
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 124](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-130-320.jpg)
![concentre-se na forma pela qual vai disponibilizar a
solução para o usuário final. Para se produzir a
informação consolidada e adequada à decisão, a partir
do DW, existem camadas de dados e diversos
programas que processam a informação antes de gerar
a visão da informação que o usuário deseja. Essas
camadas são transparentes ao usuário, não ocorrendo
a necessidade de interação, sendo que a camada mais
importante para o usuário é a interface no front end.
Assim, o sucesso de um DW pode depender da
disponibilidade da ferramenta certa de front end para
as necessidades de seus usuários.
O que se observa, também, é que o usuário, muitas
vezes, rejeita a solução de interface DW pela perda da
liberdade em função das regras que, muitas vezes, ele
mesmo definiu e acaba por descartar essa solução,
mesmo que ela esteja implementada em uma
ferramenta ideal. As informações geradas pelo usuário
dependem da realidade dele, de sua necessidade
específica, conforme a demanda exigida em seu
negócio, de seu perfil, das tarefas que realiza de posse
da informação, de conhecimentos prévios, entre
outras necessidades. Estes fatores fazem com que a
opção pelas ferramentas mais simples apresente mais
flexibilidade, ao contrário das consultas
disponibilizadas pelo DW que, usualmente, não levam
em consideração o usuário como indivíduo e com
necessidades individuais.
Assim, o foco proposto neste estudo é o de considerar
o usuário final de DW como o mais importante e
influente fator para determinar necessidades de
informação, conforme análise de Ferreira [5],
baseando-se na análise do perfil do usuário final para
a geração de consultas para DW.
Para tanto, o presente artigo está organizado da
seguinte forma: na primeira seção apresentam-se
modelos de usuários de DW englobando os papéis dos
usuários, bem como os perfis de usuários vistos pelo
Human Dynamics. Na segunda seção descreve-se a
abordagem de Sense-Making usada para a
compreensão das necessidades dos usuários. Na
terceira seção descreve-se o experimento realizado e
em seguida, os resultados obtidos com aplicação dos
métodos propostos.
2. MODELO DE USUÁRIOS DW
O objetivo da modelagem de usuários é caracterizá-
los, para que o projeto possa ser adequado a eles. O
modelo dos usuários de DW deve levar em conta os
seguintes aspectos: o papel que ele exerce no
ambiente DW e de suas tarefas neste ambiente; suas
características individuais, pessoais, de formação,
de capacidade de abstração, de concentração e sua
atitude, a que denominamos aqui aquilo que define o
o tipo de comportamento humano em relação à
informação e à busca por ela.
O conhecimento sobre o usuário precisa ser traduzido
na forma de um modelo, compreensível e usável pelos
projetistas. Conforme Filgueiras e Aquino Jr.[6],
dentro do processo de modelagem de usuários,
podem-se distinguir duas facetas:
O papel realizado pelo usuário num sistema
computacional corresponde à função específica de
cada usuário, que é definida pelas tarefas que ele
realiza. Em uma organização, os indivíduos trabalham
juntos, porém de forma estruturada. Essa estrutura
define o relacionamento entre as pessoas, sendo que
os diferentes papéis de cada usuário são as diferentes
tarefas que eles realizam. Da mesma forma, no
relacionamento com um sistema computacional,
algumas tarefas podem ser exclusivas de usuários
específicos e outras tarefas podem ser comuns a
diferentes papéis de usuários.
O perfil é a visão estatística das características
individuais do usuário, em relação a aspectos
socioeconômicos e bagagem de conhecimento. Em
especial, uma característica relevante do perfil que
merece destaque neste trabalho é o comportamento do
indivíduo na busca por informação.
Desenvolver o modelo de usuário é desenvolver
arquétipos de usuários para representação de uma
população que realiza um determinado papel. O DW é
um gerador de informações para tomada de decisão e
acompanhamento de indicadores que visam auxiliar
na administração de um negócio, sob a perspectiva do
usuário final que vai fazer uso das informações
disponibilizadas. Identifica-se, pois, a importância de
se obter o modelo de usuários que buscam as
informações dentro dessa base de dados.
2.1. Papéis no ambiente DW
Soares [12] cita que o ambiente DW envolve, desde
profissionais de processamento de dados, até analistas
de negócios que podem ser considerados como
usuários do ambiente. Existe uma comunidade de
usuários do sistema DW, com diversos papéis.
Segundo Inmon [7], a geração atual de ferramentas de
front end tem transformado, muitas vezes, os usuários
finais em administradores de dados, o que esse autor,
descreve como não sendo o desejo do usuário.
Este trabalho preocupa-se com os usuários a quem se
denominou gestores da informação que se
relacionam com a interface de um DW, quando da
busca e extração de informações de acordo com suas
necessidades gerenciais. O que diferencia os gestores
da informação em relação a sua interação com a
interface DW é a forma de acesso à informação.
Adotando-se a nomenclatura usada na comunidade de
prática, há dois principais papéis, user e power user.
Enquanto user é o usuário que apenas consulta e
navega nos relatórios, o power user é o usuário que
pode criar e desenvolver novas consultas (queries)
2.2 Perfil segundo a experiência com uso da
ferramenta de interface
Cooper e Reimann [2] destacam três tipos de usuário
a que denominam Iniciantes, Experientes e
Intermediários. Os iniciantes tornam-se intermediários
muito rapidamente. Os indivíduos que ocupam o nível
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 125](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-131-320.jpg)
![de iniciantes tendem a migrar para o nível de
intermediário e se, por acaso, não o conseguem, a
tendência é a de buscarem outro produto ou atividade
que os eleve a um nível intermediário e não mais o
deixe na posição de iniciantes.
Observa-se existir aquele sentimento de frustração
descrito por Cooper e Reimann, de usuários mais
experientes em relação ao DW, pelo motivo de os
produtos disponibilizados serem criados baseados em
perfis de usuários iniciantes. Se, por um lado, a
tecnologia evoluiu rapidamente, levando o usuário
final à mudança no seu comportamento, por outro
lado, esse fator, ainda que considerado positivo, pode
ocasionar subutilização ou rejeição da interface DW.
Tendo como base o que foi descrito por Cooper e
Reimann, o usuário passa a ser exigido muito mais em
seu nível de conhecimento e, caso ocorra alguma
barreira que ele não consegue transpor e que possa
interromper sua comunicação com o sistema de
interface DW em sua busca por informação, ele,
muito provavelmente, tende a subutilizar, rejeitar e,
até mesmo, a buscar outro produto.
Esse fato nos levou a analisar as dinâmicas envolvidas
no relacionamento com a informação.
2.3. Perfil humano segundo Human Dynamics
A experiência prática da primeira autora mostrou que,
muito freqüentemente, uma mesma interface
desenvolvida para indivíduos com o mesmo perfil e o
mesmo papel não tinha o mesmo efeito de satisfação.
Observou-se que uma característica comportamental,
a atitude perante a busca da informação, tinha um
papel relevante.
Na interação com os DW, os comportamentos
humanos que interessam são a capacidade de
abstração, a capacidade de síntese e a tomada de
decisão.
Human Dynamics (HD) é uma teoria que identifica
grupos de comportamento comuns relacionados à
aprendizagem e à resolução de problemas e, dessa
forma, espera-se que essa técnica possa contribuir
para a identificação dos perfis de usuários. A teoria
nasceu na Suécia com Sandra Seagal e David Horne e
foi usada para tratar as crianças e suas características
individuais de aprendizagem, bem como em diversas
empresas para analisar as relações corporativas e
desenvolver as equipes. HD evidencia e documenta
diferenças inerentes no funcionamento de pessoas,
vendo-as como sistemas inteiros, com diferentes
“dinâmicas de personalidade”. Essas diferenças são,
segundo seus autores, mais fundamentais do que
idade, raça, cultura ou sexo; podem ser identificadas
desde a infância [11].
Nove sistemas humanos distintos foram identificados;
cinco deles, altamente predominantes. Cada sistema é
composto de três princípios organizadores básicos: o
mental, o emocional e o físico.
Estes princípios possuem uma dimensão quantitativa
(pessoal) e outra qualitativa (transpessoal), o que
forma nove sistemas possíveis. De acordo com Seagal
e Horne [10], verificou-se que cinco desses são mais
numerosos distanciando-se dos demais:
Mental-físico;
Emocional-mental ou emocional-objetivo);
Emocional-físico ou emocional-subjetivo);
Físico-mental e
Físico-emocional.
Em virtude de HD oferecer um novo paradigma de
compreensão do comportamento humano, tanto
coletivo quanto individual, acredita-se ser ela uma
forma adequada para segmentar em grupos os
indivíduos estudados. Diante da proposta deste
trabalho que é a de caracterizar os perfis de usuários
existentes, quando de sua interação com um DW,
verifica-se a necessidade de segmentar os usuários
identificados em grupos para facilitar o processo de
análise. Assim, neste estudo, os perfis de usuário
foram determinados com o uso de HD.
3. SENSE-MAKING NA COMPREENSÃO DAS
NECESSIDADES DOS USUÁRIOS
Esta seção é dedicada ao estudo de necessidades do
usuário gestor da informação de DW. O objetivo é
mostrar um método sistemático para realizar um
diagnóstico preciso das causas dos problemas
manifestados por tais usuários. Este método é usado
na pesquisa de campo com os usuários, visando
verificar as necessidades reais deles e a distância entre
essas necessidades e as ferramentas disponibilizadas
para acesso à informação.
O método escolhido para esta investigação é o Sense-
Making, de Dervin [4]. O conceito básico do Sense-
Making é que, durante a trajetória de um indivíduo,
barreiras podem surgir em seu caminho e as reações
de cada indivíduo a essas situações são de acordo com
as suas características individuais. Para a análise
dessa relação, no Sense-Making, desenvolveu-se o
trinômio situação-lacuna-uso, tradução para o original
situations-gaps-uses::
Situação: o evento e o tempo no contexto do
evento;
Lacuna: vazios que necessitam de pontes, cuja
transposição permite obter as informações
necessárias ou as respostas às questões que
indivíduos se propõem na situação estudada; as
lacunas se movimentam no tempo e no espaço;
Uso: é aquilo para o qual o indivíduo busca sentido,
criando novo senso.
No Sense-Making, o foco é dado no movimento
cognitivo do indivíduo através do tempo e do espaço,
na busca por vencer as descontinuidades (as lacunas)
usando qualquer sentido que tenha ele tenha
construído. A metodologia de Sense-Making
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 126](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-132-320.jpg)
![reconhece esses movimentos por informação de forma
holística, preocupando-se não apenas com os
conceitos, mas também com as atitudes, emoções,
visões. Um aspecto essencial do Sense-Making são os
movimentos, portanto. Percebemos que ao entender
os movimentos, e ao equacionar as forças que os
promovem ou impedem, somos capazes de entender a
forma como os indivíduos operam seus trinômios
situação-lacuna-uso.
Algumas situações e respectivos movimentos,
identificados por Dervin são:
Indeciso: estar em um ponto em que você precisa
escolher entre dois ou mais caminhos à frente.
Arrastado: ser arrastado por um caminho que não
foi da sua escolha.
Andando em círculos: não ter caminhos a seguir.
Perdendo o rumo: estar em um caminho e, de
repente, ele desaparecer.
Barreira: saber onde você quer ir, mas algo ou
alguém está bloqueando o seu caminho.
Sendo levado: seguir algo ou alguém porque ele/ela
sabe mais que você e pode mostrar-lhe o caminho.
Esperando algo: gastar tempo esperando alguma
coisa em particular.
Matando o tempo: gastar tempo sem esperar nada
em particular.
Desligando: perder a sintonia.
Observando: assistir ao que acontece sem se
preocupar com o movimento.
Em movimento: Ver-se progredindo sem bloqueio e
sem necessidade de observação.
Para obter dos usuários a sua visão do problema, a
metodologia de Sense-Making descreve diferentes
formas de entrevistas, que procuram capturar a
dinâmica dos trinômios situação-lacuna-uso, entre as
quais destacam-se as seguintes.
A Micro-Moment Time-Line Interview baseia-se em
uma linha do tempo que vai sendo construída na
entrevista, pedindo-se que o entrevistado explore o
que aconteceu em uma determinada situação
relevante, passo a passo, especificando o que
aconteceu primeiramente e assim por diante. Para
cada trinômio detectado, a entrevista procura
compreender as informações necessárias para criar o
entendimento e o movimento no tempo. A Micro-
Element Interview é baseada na identificação de fatos
relevantes e da exploração dos trinômios associados a
estes fatos. Na Life-Line Interview solicita-se ao
entrevistado que recorde uma série de situações que
ocorreram em sua vida, ou em uma extensão
significativa do tempo.
O procedimento para se iniciar uma entrevista,
segundo Márdero [8], tanto individual como em
grupo, é o de solicitar a narração da última vez que o
vivenciou determinada situação. O entrevistador deve,
naquele momento, tentar identificar três partes do
triângulo: a situação, a lacuna e o uso, ou ajuda.
4. METODOLOGIA PROPOSTA
Definiu-se o Sense-Making como linha mestra para
este trabalho, com vistas a aplicação de questionários
e entrevistas, por apresentar uma abordagem centrada
no usuário, o que permite reconhecer aspectos
individuais de cada usuário em seu processo de
extração de informações de um DW. Deseja-se
estudar como pessoas com diferentes dinâmicas de
personalidade exploram interfaces DW, evidenciando
as diferenças em seus movimentos de Sense-Making.
4.1. Atribuição do perfil HD
A atribuição dos perfis de usuário foi feita por meio
de auto-avaliação de cada sujeito envolvido na
pesquisa. Como HD não tem um questionário para a
atribuição dos perfis, mas depende do auto-
conhecimento, fornecemos aos participantes uma
descrição de cada perfil, bem como uma lista de
atributos que descrevem a dinâmica de personalidade.
Cada participante identificou-se com uma das
descrições, sendo este o perfil atribuído à pessoa.
Os sujeitos foram caracterizados pelos atributos:
Nome do indivíduo. Para garantia de privacidade,
eles são denominados por letras: A, B, C e D.
HD: informa o perfil Human Dynamics;
Papelque o indivíduo realiza, no uso de DW.
Perfil de conhecimento da tarefa: por meio de um
questionário, avaliou-se o grau de conhecimento do
indivíduo sobre a ferramenta de front end em uso.
No experimento, foi solicitado aos participantes que
realizassem três diferentes conjuntos de tarefas:
navegar por um relatório existente, modificar um
relatório existente, criar um novo relatório. A
interface apresentada aos usuários foi desenvolvida
sobre a ferramenta SAP BW– Business Warehouse.
A ferramenta de front end usada foi o BEx Analyzer.
Aplicou-se um protocolo de observação do
comportamento do usuário diante de situações
relativas à interação com o DW, após o que se passou
para uma entrevista micro-moment [3].
No instrumento de pesquisa desenvolvido, as
seguintes informações foram preenchidas.
Tarefa: Identifica o momento e descreve a tarefa
que estava fazendo.
Movimento: estado, segundo a relação apresentada.
5. RESULTADOS
O experimento envolveu quatro usuários. Como o
número é muito pequeno, os resultados são de
natureza qualitativa. Os resultados aqui apresentados
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 127](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-133-320.jpg)
![são os de dois dos indivíduos estudados, pertencentes
às dinâmicas de personalidade do HD emocional-
subjetivo e mental-físico. Dentre os papéis de usuário,
um é power user e o outro é classificado como user.
Para facilidade na demonstração dos resultados do
experimento, desenvolveu-se uma adaptação do
gráfico descrito por Sanchez et al. [9] para mostrar os
movimentos do indivíduo ao executar as tarefas
determinadas. Os eixos escolhidos por Sanchez foram
Arousal-Sleepiness e Pleasure/Displeasure. A
adaptação, mostrada na Figura 1, buscou mapear o
comportamento do indivíduo durante o experimento.
O eixo de iniciativa representa comportamentos em
que o usuário está no controle (pró-ativo) e
comportamentos em que o sistema está no controle. O
eixo de apreciação representa comportamento de
aceitação e de rejeição da situação. Sobre este gráfico,
representam-se os estados de movimento do indivíduo
na medida em que ele evolui nas tarefas.
Figura 1- Representação gráfica da observação de
situação de uso
A seguir, selecionaram-se alguns caminhos
percorridos pelo usuário para a representação gráfica
da observação da situação de uso. Nestes gráficos, a
usuária A (em vermelho) tem 32 anos, perfil HD
emocional-subjetivo e papel de power user; ela
trabalha como analista de DW. O usuário B (em azul)
tem 45 anos, perfil HD mental-físico e papel de user,
sendo um executivo usuário da informação gerencial.
Ambos usaram todas as três interfaces, porém aqui
apresentamos o resultado para a ferramenta Analyser.
A análise mostrada na Figura 2 é a dos participantes
realizando a tarefa 1, de navegar em um relatório já
existente. O usuário A, quando se depara com a
situação-gap-uso demonstra facilidade e age com
entusiasmo, o que é característica de seu perfil HD.
Contudo, ao se deparar com um ambiente impessoal,
com falta de oportunidade para se expressar
individualmente, ou seja, buscar a informação da
forma que imagina, gera o sentimento de ser arrastado
por caminhos que não foram de sua escolha.
Ao contrário do emocional-subjetivo, ao analisarmos
o comportamento do mental-físico, verificamos que o
usuário B demonstra ser “arrastado”, pois como tem
facilidade na visão do todo em um processo e não
consegue buscar a informação da forma que imagina,
a sensação de estar em caminhos que não foram sua
escolha o faz se sentir aborrecido. Em conseqüência
disso, ele se desliga, desconecta-se da atividade, sem
dar muita importância, por achá-la fácil em demasia.
Figura 2 - Observação de situação de uso para tarefa 1
(emocional- subjetivo X mental-fisico)
A figura 3 mostra o gráfico para a segunda tarefa, na
qual se solicita que os participantes modifiquem um
relatório existente. Note-se que o usuário A, indivíduo
emocional-subjetivo, continua se sentindo arrastado
pela especificação das tarefas, que não dá espaço ao
sua vontade de criar novas formas. A segunda tarefa é
dada ao indivíduo mental-físico que, ao se deparar
com barreiras durante a execução da tarefa, sofre
stress pela falta de tempo para completar a tarefa, e
busca comunicação objetiva com outra pessoa.
Figura 3- Observação de situação de uso para tarefa 2
(emocional-subjetivo X mental-físico)
A figura 4 mostra a terceira tarefa, de criar um novo
relatório. O indivíduo A tem facilidade e sente-se
confortável em criar soluções próprias, portanto,
mantendo-se em movimento e observando seus
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 128](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-134-320.jpg)

![Tecnologias para Assistir Pessoas com Deficiência
Auditiva: Levantamento e Discussão sobre seu Uso
Soraia Silva Prietch
UFMT/ Rondonópolis
Rodovia Rondonópolis-Guiratinga KM 06 (MT
270) Bairro Sagrada Família – CEP 78.735-901
soraia@ufmt.br
Lucia Vilela Leite Filgueiras
Escola Politécnica da Universidade de São Paulo
Av. Prof. Luciano Gualberto, nº 158, São Paulo –
SP – CEP 05508-900
lfilguei@usp.br
ABSTRACT
This work takes as a basis the definition of Assistive
Technology by performing a survey on this topic,
particularly on the implementation of the technologies
currently available to assist the deaf community, followed
by results and discussions formulated from reflection of the
materials found in the literature.
Keywords
Assistive Technology, Acessibility, Deaf Person.
1 INTRODUÇÃO
A maior barreira enfrentada por pessoas com deficiência
auditiva (seja esta parcial ou total) é a comunicação com
outras pessoas de seu convívio. Essa barreira, muitas
vezes, reprime uma grande quantia de pessoas, que
possuem déficit auditivo, sendo que uma parcela dessa
quantia não tem conhecimento de que, atualmente, existem
diversos recursos acessíveis para auxiliar a compreensão
do que está sendo realizado ou o atendimento de suas
necessidades. Neste contexto, as tecnologias assistivas
podem trazer grande auxílio para minimizar as
dificuldades que a barreira de comunicação proporciona,
pois tais tecnologias, geralmente, agregam conhecimentos
de diversos campos dos saberes, podendo ser representadas
em formatos de recursos variados com a finalidade de
promover a acessibilidade às pessoas com algum tipo de
deficiência em qualquer ambiente social, seja de educação,
de saúde, de moradia, de lazer, dentre outros.
Levando em conta o exposto, tem-se como objetivo, com
esta pesquisa, realizar um estudo bibliográfico, em
profundidade, sobre as tecnologias assistivas disponíveis
para apoio às pessoas com deficiência auditiva.
Além de levantar quais tecnologias assistivas estão
disponíveis, faz-se necessário identificar quais se
encontram em desenvolvimento, quais são os próximos
desafios, bem como discutir os pontos positivos e negativos
das pesquisas já realizadas e das perspectivas do que ainda
está por vir. Este é um trabalho em andamento, cujo
objetivo final é o de projetar recursos digitais com
propósito de auxílio ao processo de ensino-aprendizagem
de pessoas surdas. Desta forma, este levantamento
proporcionará subsídio para as decisões de projeto
necessárias, posteriormente.
As seções deste artigo se encontram organizadas da
seguinte maneira: a Seção 2 enfoca o levantamento
bibliográfico a respeito das tecnologias assistivas, sejam
propostas, pesquisas já concluídas, e desafios apontados; a
Seção 3 aborda os resultados e discussões referentes ao
conteúdo levantado na seção anterior; e, na Seção 4
constam as considerações finais deste trabalho.
2 TECNOLOGIAS PARA ASSISTIR PESSOAS SURDAS
Nesta seção é apresentado o resultado de um levantamento
bibliográfico e comercial, das tecnologias, atualmente
disponíveis, para assistir pessoas surdas no uso do
computador, desenvolvidas por grupos de pesquisadores
provenientes de diversos países.
2.1 Acesso remoto
A seguir, alguns trabalhos constam dispostos na Tabela 1,
os quais agrupam aplicações de tecnologias assistivas para
acesso remoto que possibilitam a ampliação da
comunicação de pessoas com necessidades auditivas
especiais, principalmente, via telefonia celular.
Tabela 1. Relação de trabalhos que tratam das tecnologias
assistivas, de acesso remoto, para pessoas surdas.
Tecnologias Artigos
Telefone de surdos [21]
Luva conversora para celular [46]
MobileASL [14], [15]
SignWriting em telefonia móvel [2]
Alertas visuais e táteis para telefones celulares [28]
O trabalho de Hersh et al [21] tem como objetivo discutir a
relação entre a legislação e o uso de espaços públicos por
pessoas com deficiência, evidenciando as adaptações feitas
a dispositivos projetados para o uso diário. Em especial, os
autores mencionam o design de telefones e alarmes,
processadores de fala portáveis, além de informar diversas
categorias de dispositivos eletrônicos.
Já no artigo de Sarji [46] é descrito um protótipo de luva
portável que traduz gestos (American Sign Language,
ASL) em fala (língua inglesa), de baixo custo, que utiliza
sistema embarcado, transferindo as informações de sinais
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 130](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-136-320.jpg)
![comunicadas através da luva com sensores, por meio de
Bluetooth, para telefone celular ou PDA, além disso,
utiliza aplicações COTS. Assim é enfatizado o uso de
interface natural e de mobilidade, cujas características são
exploradas para possibilitar o aumento da comunicação
entre pessoas surdas e ouvintes.
Em 2006, Cavender, Ladner e Roth [14] publicaram um
trabalho a respeito do MobileASL, que na época
mencionaram que o acesso a celulares nos Estados Unidos,
por pessoas surdas, era limitado a mensagens de texto, o
que ocasionava em uma pressão pela comunicação em
língua inglesa ao invés da Língua Americana de Sinais
(ASL), sua língua materna. Neste sentido, os autores
realizaram sua pesquisa, com o auxílio de pessoas surdas,
a fim de determinar as técnicas de compressão de vídeo
mais viáveis para explorar a natureza visual da língua de
sinais, já vislumbrando a possibilidade futura de acesso em
tempo real através do telefone celular. Com o passar de
alguns anos, no artigo de Cherniavsky et al [15], em
continuidade ao trabalho anterior, é descrito o sistema
MobileASL para comunicação de vídeo em tempo real
através da rede atual de telefonia celular dos EUA.
Segundo os autores, o objetivo do MobileASL é possibilitar
que as pessoas surdas se comuniquem em língua de sinais,
via celular, através de compressão e transmissão de vídeos,
em tempo real, da língua de sinais. O sistema foi avaliado
em um estudo de usuário com participantes fluentes em
ASL, os quais foram envolvidos em conversas irrestritas de
telefones celulares em um laboratório, tendo como
resultado que o dispositivo pode possibilitar o aumento da
comunicação visual entre pessoas surdas e ouvintes.
Contudo, de todos os artigos mencionados na Tabela 1 o
trabalho de Ketabdar e Polzehl [28], apesar de relatar uma
versão demo, se destaca por sua utilidade no dia-a-dia, pois
através do microfone do celular é captado o áudio do
ambiente, sobre o qual é realizada análise de contexto para
emissão de avisos de mudanças que ocorreram naquele
local.
2.2 Acesso direto/ local
Nesta subseção são abordados trabalhos que relatam o
projeto, o desenvolvimento e/ou a avaliação de tecnologias
assistivas de acesso direto ou local, as quais podem
proporcionar maior interação entre ouvintes e pessoas com
deficiência auditiva. Tais trabalhos podem ser
visualizados, de forma resumida, na Tabela 2.
Tabela 2. Relação de trabalhos que tratam das tecnologias
assistivas, de acesso direto/ local, para pessoas surdas.
Tecnologias Artigos
Processadores de fala portáteis [21]
Luva tradutora [7]
BSL para correios [16], [27]
Semi-transparência de vídeo em reuniões [35]
O trabalho de Bedregal, Dimuro e Costa [7] introduz o
reconhecimento de gestos de mão, durante a comunicação
na Língua Brasileira de Sinais, adquiridos por uma luva de
dados. O método usa um conjunto de ângulos das juntas
dos dedos e da separação entre os dedos para a
classificação das configurações de mão, e classificações de
segmentos de gestos de mão para a realização do
reconhecimento. Assim, considera-se que esta seja uma
aplicação interessante para locais onde ouvintes não
compreendem a língua de sinais, e a luva serviria como
um sistema tradutor. Contudo, algumas questões ainda
devem ser consideradas como, por exemplo, as expressões
faciais, o movimento do corpo e do braço, dentre outros
pontos de extrema importância para efetuar o
reconhecimento de uma comunicação em língua de sinais.
No artigo de Cox et al [16] é apresentado o TESSA, um
sistema experimental que objetiva auxiliar transações entre
uma pessoa surda e um funcionário dos Correios através da
tradução da fala do funcionário para a língua de sinais.
Um sistema reconhecedor de fala reconhece a fala do
funcionário e, então, o sistema sintetiza a sequência
apropriada de sinais na Língua Britânica de Sinais (BSL)
usando um avatar desenvolvido especialmente para esta
finalidade. Os resultados desta avaliação foram positivos,
apesar de alguns pontos que foram apontados, não haviam
sido ainda melhorados no sistema. Contudo, os autores
colocam, ainda, que a maioria dos aspectos identificados
para melhorias estava sendo planejada para serem
desenvolvidas mais adiante no projeto ViSiCAST.
Neste contexto, no artigo de Kennaway [27] é discutida a
experiência que os autores tiveram com o projeto
ViSiCAST, no qual foi utilizada uma descrição de gestos
de linguagem independente de avatar. Assim, foi
desenvolvido um software chamado Animgen, para
sintetizar animação de dados a partir de tais descrições,
juntamente com uma descrição de geometria do avatar
particular, primariamente se preocupado com o aspecto
não-linguístico. Nota-se que na ausência de um dos
sentidos do corpo humano, no caso a audição, outros
sentidos devem ser estimulados, neste caso, o visual por
meio de animação.
Para Miller et al [35], realizar reuniões é parte vital da
participação em atividades sociais, sendo que para uma
pessoa surda, que não entende a língua falada,
acompanhar um discurso em reuniões pode se tornar
confuso se existirem muitas fontes de informações
simultaneamente. Quando a pessoa se concentra em uma
das fontes de informação, esta perde as informações
provenientes de outras fontes; por exemplo, enquanto a
pessoa olha os slides de um apresentador, esta perde
informações advindas do intérprete de sinais. Assim, o
trabalho dos referidos autores relata o uso da tecnologia de
semi-transparência de vídeo, a partir da qual foram
desenvolvidas duas aplicações para assistir o surdo em
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 131](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-137-320.jpg)
![reuniões de grupos locais e reuniões de pessoas com acesso
remoto. Durante a realização desta pesquisa, as
características das aplicações foram projetadas
iterativamente, à medida que os feedbacks eram
incorporados a partir de indicações de pessoas surdas. Esta
pesquisa é uma extensão do projeto Facetop, descrito no
artigo de Miller, Culp e Stotts [34].
Percebe-se, com os trabalhos apresentados aqui, que a
questão da exploração visual se faz bastante presente.
Tanto no caso da luva [7], quanto no uso de avatar [27] e
da semi-transparência de vídeo [35] este sentido é
privilegiado, visto que é uma das formas de comunicação
mais eficientes para interagir com pessoas surdas.
2.3 Tradutores
Esta sub-seção aborda pesquisas sobre a conversão de uma
língua de sinais para uma língua oral-auditiva. Na Tabela
3, apresentam-se os trabalhos que tratam de tradutores.
Foram encontrados tradutores referentes às línguas dos
seguintes países: Espanha, Estados Unidos da América,
Brasil, África do Sul e Itália.
Tabela 3. Relação de trabalhos que tratam sobre tradutores, de
línguas, para pessoas surdas.
Tecnologias Autores
Língua Espanhola de Sinais (SSL) [45]
Reconhecedores automáticos de ASL [31]
Português para LIBRAS (Falibras-MT) [50]
SOTAC [9]
SWService [48]
BuscaSigno [19]
Língua Sul Africana de Sinais [52]
3DictSL: dicionário online de língua de sinais
internacional
[10]
No trabalho de San-Segundo et al [45] foi desenvolvida
uma proposta de arquitetura para tradução do espanhol
falado para a comunicação na Língua Espanhola de Sinais
(Spanish Sign Language, SSL) para pessoas surdas, a qual
compreende em quatro módulos: reconhecimento de fala,
análise semântica, geração de sequência de gestos e
animação dos gestos.
De acordo com Lu e Huenerfauth [31], gravações de
captura de movimentos de língua de sinais são usadas em
pesquisas de reconhecimento automático dessas línguas ou
animações de línguas de sinais genéricas, as quais
possuem aplicativos de acessibilidade para usuários surdos
com baixos níveis de alfabetização em linguagem escrita.
Luvas de captura de movimento são usadas para registrar a
configuração de mão do usuário. Infelizmente, estas luvas
requerem um consumo de tempo e um processo de
calibração manual inexato cada vez que o usuário a utiliza.
Este artigo descreve o projeto e a avaliação de um novo
protocolo de calibração para luvas de captura de
movimento, o qual é projetado para tornar o processo mais
eficiente e ser acessível para participantes que são surdos e
utilizam a Língua Americana de Sinais (ASL). O
protocolo foi avaliado experimentalmente; pessoas surdas
que se comunicam em ASL usaram as luvas, foram
calibradas (usando o novo protocolo e usando uma rotina
de calibração fornecida pelo fabricante da luva), e foram
questionados a respeito do desempenho da sequência de
configuração de mão. O novo protocolo recebeu pontuação
significativamente mais alta do que a calibração padrão. O
protocolo tem sido disponibilizado livremente online, e
inclui direcionamentos para pesquisadores, imagens e
vídeos de como participantes movimentam suas mãos
durante o processo e direcionamentos para participantes
(como vídeos de ASL e textos em inglês).
O artigo de Tavares, Coradine e Breda [50] apresenta um
ambiente, chamado Falibras-MT, para a autoria de
tradutores automáticos de textos do Português para
LIBRAS, na forma gestual animada. Esse ambiente usa
memória de tradução para permitir que o tradutor a ser
especificado possa considerar o domínio de conhecimento
do texto inicial, além de outras características importantes,
tais como discurso e pragmática das línguas envolvidas. É
apresentada uma visão geral sobre o projeto do ambiente,
com suas principais funções e a arquitetura.
Em Breda et al [9] é apresentada uma análise do SOTAC
(Software of Automatized Translation based on
Knowledge), o qual tem como objetivo traduzir textos, de
forma automática, de português para LIBRAS e de
LIBRAS para português, baseado em conhecimento. É
apresentado o projeto e um protótipo de um sistema para
autoria e uso de tradução automática para suporte à
tradução. A saída traduzida é fornecida em uma linguagem
alvo e pode ser apresentada nas formas de texto, de vídeo,
ou de áudio. O artigo também apresenta uma análise de
usabilidade, navegabilidade, funcionalidade e
complexidade do sistema, assim como sua capacidade de
integração com outras tecnologias existentes.
O trabalho de Souza e Pinto [48] tem como objetivo
apresentar a SWService (SignWritting Service), uma
biblioteca que fornece os recursos necessários para que
softwares baseados na web possam utilizar a Língua
Brasileira de Sinais na forma escrita. A solução apresenta
como principal vantagem a utilização da tecnologia Web-
Services, o que permite seu uso sem necessidade de
desenvolvimento ou instalação local. Além disso, são
apresentados estudo de caso e pesquisa de opinião sobre o
Sign WebForum, um fórum de discussão que utiliza a
SWService para efetuar a escrita e a leitura de mensagens
em Português e LIBRAS. Já no artigo de Duduchi e
Capovilla [19] é descrita a construção de uma interface
computacional, denominada BuscaSigno, para o acesso ao
léxico da língua brasileira de sinais sem depender de
conhecimento da língua portuguesa. E neste mesmo ano,
van Zijl [52] relatou sua pesquisa sobre o projeto da
máquina de tradução da língua sul africana de sinais.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 132](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-138-320.jpg)
![Conforme Buttussi, Chittaro e Coppo [10], descrevem que
vários pesquisadores propuseram dicionários multimídia
para línguas de sinais de países específicos, mas existem
poucas propostas de dicionários multi-linguagem. Além
disso, os dicionários multimídias existentes sofrem várias
limitações, onde a maioria deles permite somente a
pesquisa de palavra para sinal, enquanto somente algumas
delas exploram parâmetros de sinais (isto é, configuração
de mão, orientação, localização e movimento) para
permitir uma busca de sinal para palavra. As soluções
atuais também usam imagens ou vídeos para representar
sinais e seus parâmetros, mas imagens 2D são
freqüentemente enganosas para uma identificação correta.
Desta forma, o trabalho de Buttussi, Chittaro e Coppo [10]
teve como objetivo enfrentar os problemas acima descritos,
explorando tecnologias Web3D, tais como X3D e H-Anim
humanoids, para melhor entender os sinais e simplificar a
busca de sinais para palavra, e de sinais para sinais,
propondo um dicionário online de língua de sinais
internacional, chamado 3DictSL. Assim, os autores
apresentam uma proposta de arquitetura cliente/servidor
do 3DictSL e ferramenta de autoria, a qual permite que
pessoas surdas ampliem o dicionário com sua própria
linguagem, além disso, a pesquisa também apresenta
detalhes da interface com o usuário do site e como as
tecnologias AJAX, ASP.NET, Javascript e X3D são
combinadas para desenvolver a proposta. Como o trabalho
se configura em um estudo de caso prático, o artigo
mencionado discute somente a implementação da Língua
Italiana de Sinais (LIS).
Destaca-se, dentre estes trabalhos, o artigo de Buttussi,
Chittaro e Coppo [10], pois apresenta vários aspectos
relevantes, a saber: a disponibilização de conteúdo online,
a proposição de um dicionário multi-linguagem
envolvendo diversas línguas de sinais e orais-auditivas de
uma gama de países, e a possibilidade de contar com
tecnologia de representação 3D para facilitar a animação
de gestos.
Nesta linha, existem vários desafios, a citar: questões
relacionadas aos regionalismos da língua de sinais dentro
de um próprio país; considerações de que uma língua de
sinais de um país possui estrutura gramatical diferente da
língua materna aos ouvintes, dentre outros.
2.4 Recursos de ensino-aprendizagem
Existem, hoje em dia, diversas iniciativas que incentivam a
presença de aprendizes surdos em ambientes educacionais,
e fornecem recursos facilitadores para o acesso e a
permanência destes estudantes nas diferentes etapas e
modalidades de cursos. Alguns destes exemplos são
mencionados na Tabela 4 e descritos na sequência.
Tabela 4. Relação de trabalhos que tratam das tecnologias
assistivas, como recursos de ensino-apredizagem, para pessoas
surdas.
Tecnologias Autores
Jogos educativos [1], [8], [20], [44]
Ambientes de aprendizagem [11], [18], [36],
[40], [49]
Apoio para a pessoa surda no ensino
superior
[13], [14], [29],
[43]
No artigo de Brashear [8], a autora descreve sobre o
CopyCat, um jogo sobre a Língua Americana de Sinais
(ASL) que a tecnologia de reconhecimento de gestos para
auxiliar crianças surdas a praticar suas habilidades na
ASL. A base de dados das amostras de sinais, utilizada no
jogo, foi coletada a partir de estudos com usuários
(crianças surdas), jogando uma versão do jogo Mágico de
Oz da Escola da Área de Atlanta para Surdos (EUA). No
artigo de Adamo-Villani e Wright [1] são descritas a
implementação e a avaliação da segunda versão do SMILE
(Science and Math in an Immersive Learning
Environment), um jogo de aprendizagem imersivo que
emprega um ambiente virtual de fantasia 3D para engajar
crianças surdas e com deficiência auditiva em tarefas
educacionais baseadas em matemática em ciências. Nesta
versão, (a) foram combinadas estratégias usadas em jogos
de computador comerciais com lições de pesquisas
educacionais em aprendizagem e motivação, bem como (b)
foram avaliados a usabilidade e o recurso através de um
estudo de usuário. Já em Saliés e Starosky [44], discute a
questão do uso de jogos, por uma criança surda durante
terapia de fala, no processo de aquisição da língua
portuguesa como sua segunda língua, e o artigo de
Henderson et al [20] enfoca o desenvolvimento de um jogo
que utiliza a ASL para crianças surdas.
No artigo de Drigas e Kouremenos [18] é apresentado um
Sistema de Gerenciamento de Aprendizagem (LMS), o
qual oferece vídeos na Língua Grega de Sinais (GSL,
Greek Sign Language) em correspondência a cada texto
contido no ambiente de aprendizagem. O sistema foi
projetado para adultos surdos com o propósito de formação
ao longo da vida profissional e educacional. No sistema, as
necessidades especiais dos aprendizes surdos são atendidas
da seguinte forma: informação bilingue (texto e linguagem
de sinais), alto nível de visualização, aprendizagem
interativa e exploratória, e aprendizagem com seus pares
através de vídeo conferência. O trabalho de Panselina,
Sigalas e Tzougraki [40] também trata do enfoque
educacional a estudantes surdos, contudo o mesmo aborda
o design e o desenvolvimento de uma ferramenta
multimídia bilingue (usando a GSL) para o ensino de
conceito de química.
Ainda no contexto de ambientes de aprendizagem, os
trabalhos brasileiros [11], [36] e [49] merecem destaque,
pois são três abordagens diferentes umas das outras, mas
que trazem contribuições bastante interessantes para o foco
de interesse da presente pesquisa. O primeiro apresenta um
sistema de autoria online para simplificação de textos, e
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 133](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-139-320.jpg)
![também discute as potencialidades do uso de tal
ferramenta no contexto educacional. O segundo trabalho
dispõe “um modelo de uma plataforma, de educação
baseado nos critérios de acessibilidade digital
considerando, a prióri, as características dos surdos”. E, no
terceiro artigo, os autores promovem a comparação entre a
avaliação de usabilidade e a avaliação de acessibilidade da
ferramenta HagáQuê, cujo recurso refere-se a um software
de autoria, com finalidade pedagógica, para a produção de
histórias em quadrinho.
Segundo Saksiri, Ferrell e Ruenwongsa [43], na Tailândia
existe uma grande necessidade de melhorar as
oportunidades educacionais para estudantes com
deficiência auditiva em idade de ingressar em cursos
universitários. Assim, esta pesquisa descreve dois aspectos
desta questão: (a) projeto e teste de uma ferramenta
instrucional com animações de sinais virtual para a Língua
Tailandesa de Sinais, e (b) investigação de como
instrutores que ministram aulas em universidades podem,
de maneira eficaz, ensinar estudantes surdos e avaliar seu
desempenho, particularmente utilizando esta ferramenta.
Para isso, foi realizada revisão de literatura, construído um
modelo 3D que inclui expressões faciais rudimentares, e
foi concebida uma estrutura para investigar o processo
instrucional.
Em sua pesquisa, Cavender [13] expõe que estudantes com
deficiência auditiva enfrentam barreiras com relação ao
acesso a universidades, tornando isso um desafio, e
considera que as tecnologias educacionais têm o potencial
para melhor incluir esses estudantes no meio acadêmico.
Neste contexto, a autora descreve sua proposta de trabalho,
a qual trata do desenvolvimento e da avaliação de uma
plataforma, utilizando conceitos de computação ubíqua,
para sala de aula para que estudantes com deficiência
auditiva possam acessar intérpretes e captionists
remotamente, evitando dispersão visual, e facilitando o
acesso, a interação e a permanência de pessoas surdas no
ensino superior. Discutindo ainda o ensino superior,
Cavender, Ladner e Roth [14] relatam sobre um curso
acadêmico de verão em computação, com nove semanas de
duração, para pessoas surdas, apresentando os problemas
que esses estudantes passam, bem como as lições
aprendidas pelos professores ao tentar contornar esses
problemas.
No artigo de Kheir e Way [29], os autores informam que
computadores, cada vez mais, estão se tornando presentes
em sala de aula, com os laptops dos estudantes se tornando
norma, ainda assim, alguns usos benéficos desta tecnologia
tão difundida estão sendo ignorados. Softwares de
reconhecimento de fala estão amadurecendo, e possuem o
potencial de fornecer notas em tempo real tendo
assistência em sala de aula, particularmente para
estudantes surdos. Assim, o artigo mencionado relata o
design e a avaliação do sistema Villanova University
Speech Transcriber (VUST) que, segundo os autores,
diminui custos comparando-se ao método tradicional e
aumenta a acessibilidade durante palestras de ciência da
computação para estudantes surdos usando um software de
reconhecimento de fala em tempo real.
Faz-se necessário destacar que o acesso à educação é um
dos direitos que todas as pessoas, com algum tipo de
deficiência ou não, possui, devendo ser respeitado e
priorizado. Os trabalhos mencionados aqui contribuem de
forma abrangente, no sentido de existir diversificadas
iniciativas de pesquisas (jogos, EAD, computação ubíqua,
dentre outras), sendo estas profundamente fundamentadas
nas necessidades educacionais especiais das pessoas
surdas, visto que estas contam com desejos, anseios e
aspectos de aprendizagem diferenciados.
2.5 Outros dispositivos de uso na vida diária
Além dos recursos já apresentados anteriormente nesta
seção, ainda podem ser citadas outras soluções que além de
bastante interessantes, ainda promovem a articulação entre
pessoas surdas e equipamentos/ dispositivos, que antes
eram restritos a pessoas ouvintes, em um formato criativo e
interativo. Alguns exemplos seguem relacionados na
Tabela 5.
Tabela 5. Relação de trabalhos que tratam das tecnologias
assistivas, para uso no dia-a-dia, para pessoas surdas.
Tecnologias Autores
Alarmes [21]
Percepção da música [26], [37]
Percepção de sons no ambiente de trabalho [22], [33], [51]
Legendas emotivas para TV [39]
Assistência à saúde [42]
A pesquisa de Nanayakkara et al [37] relata sobre um
protótipo de sistema projetado para tentar enriquecer a
experiência de música para as pessoas surdas. Este sistema
foi desenvolvido com base em um conceito inicial guiado
por informações obtidas a partir de um levantamento
aprofundado conduzido com 43 participantes surdos, cujo
resultado sugeriu que o protótipo melhora a experiência
musical de uma pessoa surda, sendo que os usuários
preferiram ou a cadeira háptica sozinha (54%) ou a cadeira
háptica com o display visual (46%). É interessante
mencionar que o trabalho descreve o uso de interface
multimodal (tátil e visual), buscando maior inclusão dos
surdos em ambientes que envolvem música.
Em linha de pesquisa semelhante à descrita no parágrafo
anterior, Karam et al [26] desenvolveram o Modelo
Humano de Cóclea (Model Human Cochlea, MHC) é uma
técnica de substituição sensorial para apresentação de
música como múltiplos canais de estímulos vibro-táteis. O
protótipo MHC foi introduzido para um grupo de cidadãos
idosos surdos em um centro comunitário, onde eles
poderiam testar a cadeira, e fornecer um feedback sobre
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 134](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-140-320.jpg)
![sua experiência. Os resultados deste trabalho sugerem que
o MHC pode, potencialmente, oferecer maior significado
para expressar a informação emocional básica a partir de
música em um display vibro-tátil quando os sinais se
aproximam mais aos elementos de percepção da música
tais como melodia e peças instrumentais.
Na pesquisa de Ho-Ching, Mankoff e Landay [22], os
autores desenvolveram dois protótipos, os quais consistem
em displays visuais para fornecer sensibilização do áudio
do ambiente para indivíduos surdos. A pesquisa foi
realizada no campo de trabalho, com participantes surdos e
ouvintes, a atenção foi concentrada no suporte à
sensibilidade de sons não ligados à fala, tais como
telefones tocando e sons de batidas, no ambiente de
trabalho. Em termos de design, foram utilizados dois tipos
de equipamentos: o primeiro, um (a) spectrograph, que
realiza o registro fotográfico de um espectro luminoso,
mostrando passo e amplitude, enquanto o segundo, um (b)
positional ripples, mostra amplitude e localização dos
sons, sendo que ambos suportam monitoramento e
notificação de sons, a descoberta de novos sons, e não
requerem um conhecimento a priori dos sons detectados.
Um experimento controlado envolvendo participantes
surdos resultou que nenhum display distrai
significativamente. Contudo, usuários preferiram o display
positional ripples, pois o consideraram mais fácil de
monitorar (notificações de sons foram detectadas com 90%
de sucesso no laboratório instalado).
No trabalho de Matthews, Fong e Mankoff [33] é
ponderado que sons constantemente ocorrem ao nosso
redor, nos mantendo alerta no ambiente e que pessoas com
deficiência auditiva têm dificuldade em manter essa
sensibilização dos sons. Desta forma, é apresentada uma
investigação de displays periféricos e visuais para auxiliar
pessoas surdas a manter essa sensibilidade de som do
ambiente. Assim, os autores apresentam duas
contribuições: primeiro, (a) é apresentado um conjunto de
preferências de design visual e requisitos funcionais para a
visualização dos periféricos de áudio sem fala que irão
auxiliar em melhorias em futuras aplicações. Sendo assim,
preferências de design visual incluem fácil interpretação,
capacidade de enxergar, e distrações apropriadas, e
requisitos funcionais incluem a capacidade de identificar
que som ocorreu, exibe um histórico de sons apresentados,
customiza a informação que é mostrada, e determina a
precisão da informação apresentada; e, segundo, (b) foram
projetados, implementados e avaliados dois protótipos em
pelo funcionamento que incorporam essas preferências e
requisitos, servindo como exemplo para futuros designers
na tentativa de promover o progresso em direção à
compreensão de saber qual a melhor forma de
proporcionar a sensibilização periférica de áudio para os
surdos.
Segundo Tomitsch e Grechenig [51], em trabalhos
anteriores já foi investigado o valor da visualização de sons
de ambiente para pessoas com deficiência auditiva. Este
trabalho foi construído com base nestes resultados e
especificamente explora a aplicabilidade do teto para tais
visualizações. Assim, foram reunidos requisitos de design
baseados em um processo de design participativo incluindo
entrevistas com especialistas, um questionário online, bem
como um workshop de design em uma organização local
para pessoas surdas. Os resultados do workshop mostraram
que as pessoas aprovaram a ideia do uso do teto para
visualização de ambiente. Contudo, eles também
expressaram uma forte necessidade de um display
tradicional suplementar para obter maiores detalhes das
informações sobre como ocorrem os sons. Os autores
expressam a intenção da criação de um protótipo com
aplicações de computação ubíqua e reforçam a importância
do levantamento de requisitos junto ao público-alvo.
Conforme Ohene-Djan, Wright e Combie-Smith [39],
muitas pessoas surdas ou deficientes auditivas usam
legendas para obter acesso ao conteúdo de áudio de
apresentações na TV e em filmes. Contudo, legendas
informam ao visualizador o que está sendo dito, e falham
ao comunicar como está sendo dito. Esta falha emocional
vivenciada pelo visualizador destaca um significante
prejuízo à apresentação da legenda em curso,
especialmente quando usado para aprendizagem por uma
pessoa surda. Portanto, no artigo mencionado, foi descrito
um sistema que demonstra a apresentação de legendas que
descreve as emoções por trás das palavras usadas na tela.
O sistema também oferece aos espectadores a habilidade de
personalizar e adaptar suas interações com as legendas,
para auxiliá-los em seu processo de aprendizagem. No
entanto, é válido refletir se esse tipo de recurso, ao invés de
auxiliar, não iria atrapalhar o leitor/usuário por aumentar
a quantidade de texto a ser lido.
O artigo de Piper e Hollan [42] descreve o projeto e a
avaliação da Interface Compartilhada de Fala (Shared
Speech Interface, SSI), uma aplicação para um display de
mesa (tabletop) multitoque interativo projetado para
facilitar conversações médicas entre um paciente surdo e
um ouvinte, onde o médico não possui domínio da língua
de sinais. Assim, foi empregado um processo de projeto
participativo envolvendo pessoas surdas, bem como
médicos e especialista. Sendo relatados os resultados a
partir de uma avaliação que compara a conversação
quando facilitada por: (a) uma mesa digital, (b) um
intérprete de língua de sinais humano, e (c) ambos. Essa
pesquisa revela que os displays de mesa têm propriedades
valiosas para facilitar a discussão entre os indivíduos
mencionados, bem como melhora a privacidade e
independência.
É importante destacar os trabalhos de Karam et al [26] e
de Nanayakkara et al [37], pois nos mesmos são relatados
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 135](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-141-320.jpg)
![projetos e experimentos inovadores, os quais possibilitam
às pessoas com necessidades auditivas especiais a sensação
musical, o que se imagina ser uma experiência
emocionante, intensa e diferenciada.
Além dos trabalhos acima descritos, existem muitos outros
que tratam de diversos temas interessantes a respeito de
tecnologias assistivas para pessoas surdas, alguns
exemplos, a saber: (a) Design e/ou avaliação de sistemas:
[4], [23] e [47]; (b) Soluções para a Web: [17], [24], [54];
(c) Reconhecimento facial ou de movimento de lábios:
[25], [41], [53]; (d) Computação vestível: [3], [12], [32].
3 RESULTADOS E DISCUSSÕES
Ao efetuar a busca pelas palavras-chaves deaf e hearing
impaired no The Guide to Computing Literature do ACM
Portal, foram apresentados 1.175 e 1.131 trabalhos
relacionados, respectivamente, sendo que destes foram
obtidos artigos que datam de 1970 até 2010, ou seja, o
interesse por pesquisas em tecnologias para assistir pessoas
surdas não é tema tão recente quanto se imagina, pois
constam registrados 40 anos de trabalhos realizados nesta
temática. É válido lembrar que dos mil cento e trinta e um
trabalhos localizados no guia, muitos destes foram listados
pelo fato de terem citado referências nos artigos com a
palavra-chave em questão, e não por tratar realmente do
assunto, sendo assim esta quantidade de trabalhos que
relacionam a computação e a surdez não é precisamente
concreta. Além destes termos de pesquisa e de base de
dados, também, foram localizadas outras fontes utilizando
diferentes termos de busca, os quais constam relacionados
no Apêndice, ao final deste artigo. E o que se percebe, no
que tange à quantidade de trabalhos publicados nesta
temática, é que nas bases literárias internacionais se
encontra um número muito maior e mais rico do que nas
bases nacionais observadas.
Retomando aos mencionados trabalhos da década de 70, se
percebe que naquele período as aplicações da computação
para o auxílio às pessoas surdas eram diferentes das atuais,
devido a uma série de fatores os quais não serão tratados
neste artigo, se preocupando com as primeiras
experiências, descritas por Newton e Vonhof [38], da
introdução do computador na educação de pessoas surdas,
com o relato de uso de softwares do tipo CAI, no artigo de
Barnes [5], com a atuação de pessoas surdas enquanto
profissionais da área de computação, no trabalho de Bates
[6], dentre outras. Contudo, hoje em dia, mesmo com
recursos mais avançados e conhecimentos acumulados
desde então, ainda existe uma constante busca em termos
de melhorias na assistência às pessoas com deficiência
auditiva que naquela época já havia sido iniciada.
Sendo assim, no contexto deste trabalho, tendo-se como
tema principal as tecnologias assistivas, verificou-se a
amplitude das pesquisas que vêm sendo desenvolvidas, no
mundo todo, para que pessoas surdas possam ter condições
iguais, ou o mais similares possível, de pessoas ouvintes
para o alcance de uma qualidade de vida, no mínimo,
adequada. Neste sentido, ao longo do texto exposto, na
Seção 2, se encontra a descrição de esforços no processo de
idealização, desenvolvimento e avaliação de sistemas com
aplicações de diversas naturezas, sejam sistemas de
tradução de uma língua oral para uma língua de sinais (ou
vice-versa), sejam sistemas de reconhecimento de fala,
jogos eletrônicos, animação de avatares para execução de
sinais, sistemas para telefonia celular, projetos que
envolvem computação ubíqua, dispositivos com interfaces
diferenciadas como as luvas para captura de gestos e as
cadeiras vibro-táteis, dentre outros.
Outrossim, conforme dito no parágrafo acima, ao
mencionar o mundo todo, é importante destacar que
existem pessoas surdas em qualquer país e, com isso, deve-
se lembrar que sua língua materna deve ser respeitada, a
qual não é a mesma língua oral que as pessoas ouvintes se
comunicam, sendo assim alguns destes exemplos também
constam no levantamento bibliográfico que são os casos da
Língua Brasileira de Sinais (LIBRAS) que não é a língua
portuguesa, a Língua Americana de Sinais (ASL) que não
é a língua britânica, dentre outras. Levando ainda essa
discussão em consideração, faz-se necessário acrescentar
que os estudos que envolvem aplicações em alta tecnologia
assistiva devem englobar conhecimentos de algumas áreas
como, por exemplo, linguística, computação, psicologia,
fonoaudiologia e pedagogia, sendo, portanto, uma rica
experiência para as pessoas que embarcam nesse processo.
Desta forma, é possível perceber através dos grupos de
pesquisadores, autores dos trabalhos estudados, que existe
uma formação multidisciplinar adequadamente
representada.
Além disso, foi possível observar algumas tendências nos
trabalhos mais recentes como os dispositivos móveis, as
interfaces naturais, as tecnologias de objetos interativos, as
redes sem fio, as interfaces multimodais, a computação
vestível, enfim, um universo de novas descobertas e outras
ainda por surgir, sendo que a tecnologia permeia toda essa
evolução e em alta velocidade, buscando ampliar a
mobilidade, a praticidade, a comunicação, a autonomia,
dentre outros. Com isso, inicia-se uma reflexão sobre os
desafios agregados a essas tendências, em especial, por se
tratarem de pesquisas que envolvem o ser humano como
público-alvo/usuário direto destas tecnologias, questões
como ética, segurança e privacidade entram em jogo, as
quais ainda devem ser largamente refletidas e debatidas.
Por fim, vale ainda ressaltar que se considera importante
que as pesquisas realizadas no meio acadêmico tivessem
algum incentivo no sentido de que os produtos e resultados
gerados se tornassem, amplamente, divulgados e aplicados
no uso prático diário, não sendo apenas engavetados. Uma
sugestão seria a formação de parcerias com grandes
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 136](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-142-320.jpg)
![empresas de tecnologia pudessem garantir a produção em
série de determinadas aplicações, após tempo determinado
de teste e avaliação baseada em critérios de qualidade
internacionais. Neste contexto, cabe mencionar a
existência da Lei da Inovação Tecnológica [30], a qual
“dispõe sobre incentivos à inovação e à pesquisa científica
e tecnológica no ambiente produtivo”, na tentativa de
promover a integração entre, por exemplo, Universidades e
empresas na produção de produtos inovadores.
4 CONSIDERAÇÕES FINAIS
As respostas obtidas, durante a realização deste trabalho,
significam que existe uma gama de possibilidades de
pesquisa a serem conduzidas sobre o assunto, visto que o
tema é bastante abrangente no que tange a áreas de
conhecimento envolvidas. Além disso, a temática de
tecnologias para assistência a pessoas com deficiência é
tópico de interesse em diversas subáreas da computação,
em especial, de interface homem-máquina, pois trata da
relação direta entre o usuário e os mais variados tipos de
tecnologia. Tais respostas ajudam a resolver o problema
em mãos, já mencionado anteriormente, que se refere à
limitação principal de pessoas surdas, a comunicação desta
com as pessoas ouvintes e, em alguns casos, com pessoas
com o mesmo tipo de deficiência que ainda não se
expressam através da língua de sinais de seu país.
Com relação às perspectivas de continuidade deste
trabalho, podem ser citados os seguintes: (a) a ampliação e
o aprofundamento das leituras sobre o tema em questão;
(b) o contato com pessoas surdas de local previamente
determinado, a fim de absorver detalhes da cultura e das
necessidades dessas pessoas tão especiais; (c) a proposição,
o desenvolvimento e a avaliação de um protótipo de
tecnologias assistivas voltadas para o auxílio de pessoas
com deficiência auditiva.
REFERÊNCIAS
1.Adamo-Villani, N.; Wright, K. SMILE: an immersive
learning game for deaf and hearing children. Intern.
Conference on Computer Graphics and Interactive
Techniques archive, ACM SIGGRAPH 2007, No. 17.
2.Ahmed, A.S.; Seong, D.S.K. SignWriting on mobile
phones for the deaf. Mobility '06.
3.Amemiya, T.; et al. Virtual Leading Blocks for the Deaf-
Blind: A Real-Time Way-Finder by Verbal-Nonverbal
Hybrid Interface and High-Density RFID Tag Space.
IEEE Virtual Reality 2004, p.165.
4.Barbacena, I.L.; et al. Comparative analysis of tactile
sensitivity between blind, deaf and unimpaired people.
International Journal of Advanced Media and
Communication, Volume 3, Issue 1/2, June 2009.
5.Barnes, O. D. CAI at the National Technical Institute for
the Deaf. ACM, SIGCUE, Vol.5, Issue 1, 1971.
6.Bates, R.L. The deaf in computer professions. ACM,
SIGCAPH Computers and the Physically Handicapped,
Issue 6, April 1972.
7.Bedregal, B.R.C.; Dimuro, G.P.; Costa, A.C. Interval
Fuzzy Rule-Based Hand Gesture Recognition. Scientific
Computing, Computer Arithmetic and Validated
Numerics. 12th GAMM, IEEE, 2006.
8.Brashear, H. Improving the Efficacy of Automated Sign
Language Practice Tools. ACM, SIGACCESS
Accessibility and Computing, Issue 89, Sept/2007.
9.Breda, W.; et al. SOTAC: A Software for Knowledge-
Based Automatic Translation. WCCE 2009.
10.Buttussi, F.; Chittaro, L.; Coppo, M. Using Web3D
Technologies for Visualization and Search of Signs in an
International Sign Language Dictionary. ACM, Web3D
2007, Italy, April 15–18, 2007.
11.Candido Jr, Arnaldo; et al. Supporting the adaptation
of texts for poor literacy readers: a text simplification
editor for Brazilian Portuguese. Proceedings of the
Fourth Workshop on Innovative Use of NLP for Building
Educational Applications, 2009.
12.Caporusso, N. A wearable Malossi alphabet interface
for deafblind people. ACM, AVI '08: The Working
Conference on Advanced Visual Interfaces, May 2008.
13.Cavender, A.C. Using Networked Multimedia to
Improve Educational Access for Deaf and Hard of
Hearing Students. ACM, SIGACCESS, Issue 89, 2007.
14.Cavender, A.C.; Ladner, R.E.; Roth, R.I. The summer
academy for advancing deaf and hard of hearing in
computing. SIGCSE '09.
15.Cherniavsky, N.; et al. Activity Analysis Enabling
Real-Time Video Communication on Mobile Phones for
Deaf Users. UIST’09, ACM, October 4–7, 2009.
16.Cox, S.; et al. TESSA, a system to aid communication
with deaf people. ASSETS 2002, July 8-10, 2002.
17.Debevc, M.; et al. Accessible Multimodal Web Pages
with Sign Language Translations for Deaf and Hard of
Hearing Users. DEXA '09.
18.Drigas, A.S., Kouremenos, D. An e-Learning
Management System for the Deaf people. WSEAS
Transactions on Advances in Engineering Education,
Issue 1, Volume 2, pp. 20-24, 2005.
19.Duduchi, M.; Capovilla, F.C. BuscaSigno: a construção
de uma interface computacional para o acesso ao léxico
da língua de sinais Brasileira. IHC, 2006.
20.Henderson, V.; et al. Development of an American
Sign Language game for deaf children Proposing a
speech to gesture translation architecture for Spanish
deaf people. IDC '05.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 137](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-143-320.jpg)












![disso, busca ressaltar as potencialidades do design da
informação e sua contribuição para a aprendizagem.
O POTENCIAL DO PROCESSO DE COLABORAÇÃO
A discussão sobre colaboração não é recente. Ela surge do
paralelo entre dois pontos importantes para a engenharia de
software, a colaboração e cooperação. É sutil a diferença
entre colaboração e cooperação. Esses termos expressam
formas levemente diferentes de trabalho. De acordo com
Kutova (2006) uma das definições mais antigas dentro da
área de informática, é a de James Bair (1989) que explica
colaboração como sendo a comunicação entre pessoas que
trabalham juntas e com um mesmo objetivo, porém essas
pessoas são avaliadas individualmente, e cooperação como
a comunicação em que não existe mais o conceito de
indivíduo, apenas o de grupo.
Kutova (2006) cita que num projeto colaborativo há mais
espaço para autonomia e para relacionamentos informais. A
permanência dentro do escopo pré-estabelecido é de difícil
controle e nem sempre desejada. Deve haver um estímulo à
interação entre os participantes. Já num projeto cooperativo,
existe uma interdependência positiva. As interações entre os
participantes são essenciais. É provável que surja
espontaneamente, ou de forma planejada, uma estrutura
social, com hierarquias e distribuição de responsabilidades.
As habilidades dos participantes devem ser complementares
para alcance do objetivo único do grupo. Assim, o processo
de colaboração abarca outra discussão: a interação e a
interatividade.
Segundo Silva (2008), o conceito de interação vem de
longe, entretanto o conceito de interatividade é recente.
Pode ter surgido no final dos anos 70 e início da década de
80 no contexto das novas tecnologias de informação. Um
dado que permite esta afirmação é a ausência do termo nos
dicionários de informática até meados dos anos 80.
Para Lemos (1997), a palavra interação está relacionada ao
contato interpessoal e direto chamado por ele “interação
social”; enquanto interatividade é “uma nova qualidade de
interação”, influenciada diretamente pelo meio. “Podemos
compreender a interatividade digital como um diálogo entre
homens e máquinas”.
Para Primo e Cassol (1999), a partir da definição de Steuer,
“[...] interatividade é uma extensão em que usuários podem
participar modificando a forma e o conteúdo do ambiente
mediado em tempo real”. Pode-se dizer então que
interatividade é uma forma de comunicação versátil que
permite que os usuários alterem o fluxo da informação
conforme desejarem. Primo e Cassol (1999) explicam que
para tanto, existem três fatores básicos a serem medidos. O
primeiro é a velocidade que o sistema responde ao usuário,
sendo que a resposta mais rápida permite uma maior
interatividade. O segundo fator é amplitude da interação, ou
seja, o número de elementos possíveis de serem alterados
pelo usuário. E por fim o mapeamento, que é o meio pelo
qual o usuário se conecta e se comunica com o sistema, por
exemplo, mouse, teclado ou gamepad.
Filatro (2008) propõe uma clara diferenciação entre
interação e interatividade. A interação diz respeito ao
comportamento das pessoas em relação a outras pessoas e
aos sistemas. Ela está ligada à ação recíproca pela qual
indivíduos e objetos se influenciam mutuamente. A
interatividade, por sua vez, ao descrever a capacidade ou o
potencial de um sistema propiciar interação, é um pré-
requisito para a interação (FILATRO, 2008).
PROCESSO COLABORATIVO NA EAD
As comunidades de discussão online são comumente usadas
nos sistemas de educação a distância e em cursos de
capacitação de classes presenciais (face-to-face classes).
Para encontrar o constante fluxo de mensagens pelos
instrutores é um desafio gratificante, e os estudantes estão
geralmente satisfeitos com a experiência. A essência da
aula virtual é um meio de facilitar a aprendizagem
colaborativa, muitas vezes com projetos.
A educação a distância para os alunos, permite o aumento
da sua capacidade de estar em constante comunicação uns
com os outros, e é uma forma de evidente benefício. Mas,
mesmo no campus de base dos cursos, a tecnologia
proporciona um meio muito rico para que o ambiente de
aprendizagem colaborativa ultrapasse a aula tradicional,
pela capacidade de conectar os alunos e tornar claro
materiais disponíveis em uma base de dados (HILTZ, 1992;
HAZEMI and HAILES, 2001).
A colaboração em cursos de EAD é caracterizada e
difundida pelos ambientes virtuais de aprendizagem (AVA)
ou ambientes hipermidiáticos de aprendizagem (AHA). Um
AVA consiste em uma opção de mídia que está sendo
utilizada para mediar processo ensino-aprendizagem à
distância. Nos últimos anos, os ambientes virtuais de
aprendizagem estão cada vez mais utilizados no âmbito
acadêmico e corporativo como uma opção tecnológica para
atender esta demanda educacional. Diante do exposto,
destaca-se a importância de um entendimento mais crítico
sobre o conceito que orienta o desenvolvimento ou uso
desses ambientes, assim como, o tipo de estrutura humana e
tecnológica que oferece suporte ao processo ensino-
aprendizagem (CYBIS, 2007).
Os AVAs, sintonizados com os novos paradigmas
epistemológicos da educação, privilegiam a aprendizagem
colaborativa, a construção compartilhada do conhecimento,
a interação, a subjetividade, a autonomia e o
desenvolvimento de uma consciência crítica nos estudantes.
Atraídos pelo potencial sócio-técnico dos ambientes de
aprendizagem, que fazem do digital seu suporte e pela
possibilidade de constante atualização, muitos educadores
têm se utilizado do ciberespaço como um meio para a
renovação de suas práticas pedagógicas (CIBYS, 2006). A
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 150](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-156-320.jpg)
![Interação Homem Computador (IHC) é um campo de
estudo interdisciplinar que tem como objetivo entender
como e porque as pessoas utilizam (ou não) as tecnologias
da informação (PADOVANI, 2002).
Os AVAs são projetados de acordo com a necessidade de
seus usuários. A premissa básica do design centrado no
usuário é a de que suas necessidades sejam levadas em
consideração durante todo processo de design e
desenvolvimento, o que pode ser alcançado avaliando-se o
design em vários estágios de seu desenvolvimento e
corrigindo-o para que se adapte às necessidades dos
usuários (GOULD e LEWIS, 1985). O design, portanto,
progride em ciclos interativos de design – avaliação – novo
design (redesign) (PREECE, et. al. 2005).
Os usuários preferem sistemas que sejam fáceis de aprender
e utilizar assim como eficazes, eficientes, seguros e
satisfatórios. É também essencial que alguns pontos sejam
agradáveis, atraentes, desafiadores, etc. Saber o que avaliar
a importância de avaliar e quando avaliar são, portanto,
tarefas fundamentais. Desse modo, a avaliação é necessária
para a certificação de que os usuários podem vir a utilizar o
produto e apreciá-lo (PREECE, 2002). Além disso, hoje os
usuários procuram muito mais do que um sistema usável,
como aponta a Nielsen Norman Group, uma empresa de
consultoria de usabilidade:
“A experiência do usuário” abrange todos os aspectos da interação do
usuário final... o primeiro requisito para uma experiência exemplar do
usuário consiste em encontrar as necessidades exatas do cliente, sem
ansiedade ou incomodação. A seguir, vem a simplicidade e a elegância,
que produzem produtos bons de se ter e de utilizar.
ESTRATÉGIAS (OU MODALIDADES) QUE
POTENCIALIZAM A COLABORAÇÃO
Através da interface2
Para a educação a distância a colaboração apresenta certa
amplitude de troca de saberes e contribui para o
aprendizado autodirigido. Schneidermann e Plaisant (2005)
apresentam modalidades de colaboração classificados por
eles como fatores de compartilhamento online. Quando bem
gráfica, o design de informação é
apresentado ao usuário, e que através dos sistemas de
informação, pode-se obter a colaboração do mesmo. A
colaboração online é capaz de potencializar o design da
informação através da troca e articulação do conhecimento
de seus usuários. Por este motivo, o processo colaborativo
na internet pode ser classificado de várias maneiras. A
colaboração é a articulação do usuário com a interface
gráfica e sistemas de informação.
2
A interface atua como uma espécie de tradutor realiza a
mediação entre duas partes, tornando uma sensível para a outra.
Em outras palavras, a relação governada pela interface é uma
relação semântica, caracterizada por significado e expressão
[...]Em seu sentido mais simples, a palavra interface se refere a
softwares que dão forma à interação entre usuários e o
computador. (JOHNSON, 2001, p. 17-18).
implementados, esses pontos caracterizam a interação entre
o usuário/sistema de forma qualitativa. A seguir, essas
modalidades são destacadas e comentadas.
Focada em parcerias (focused partnerships): segundo os
autores, a colaboração focada em parcerias permite o
compartilhamento através da parceria online por correio
eletrônico, bate-papo, mensagem instantânea, telefone,
mensagem de voz, vídeo conferência e outras combinações
de tecnologia.
Palestra ou demo (lecture or demo): conforme os mesmos
autores, a palestra ou demo são formatos onde a pessoa
pode compartilhar informações com o maior número de
usuários em locais remotos. A hora de início e a duração é
mesma para todos, as questões podem ser levantadas pelos
participantes. Não é necessária a manutenção do histórico
do assunto, mas a capacidade de se ter um replay é útil para
a posterior análise daqueles que não puderam comparecer –
afirmam eles.
Conferências (conferences): as conferências permitem a
comunicação de grupos distantes ao mesmo tempo (o que a
torna síncrona) ou separados ao longo do tempo (de
maneira assíncrona). Os recursos de colaboração de
conferências são utilizadas para reuniões, planejamentos,
discussões de estudos, problemas com os deveres de casa,
monitoria, etc.
Processo de trabalho estruturado (stuctured work
process): o processo de trabalho estruturado permite que as
pessoas colaborem com os papéis distintos da Organização
onde atuam em tarefas diferentes. Por exemplo, no
desenvolvimento de uma revista científica on-line um editor
projeta a apresentação, outro faz as revisões, outro a
publicação; e assim por diante. Ben Schneidermann e
Catherine Plaisant (2005) ainda dão um exemplo desse tipo
de colaboração em uma agência de seguro-saúde que recebe
notificações, e reembolsa ou rejeita as contas médicas, e até
em uma universidade que efetua admissões por comissão de
registros, opiniões ou aplicações.
Reunião de apoio à decisão (meeting and decision
support): essa colaboração pode ser realizada numa reunião
“face-to-fece” (onde todos estão presencialmente online),
em que cada usuário, utilizando o computador pode fazer
contribuições simultâneas, compartilhar idéias e arquivos e
discutir em janelas diferentes da principal de reunião.
Segundo eles, essa colaboração é ideal para votações.
Comércio eletrônico (electronic commerce): a colaboração
do comércio eletrônico é uma das mais caracterizadas e
utilizadas na web. Ela permite que as pessoas façam
pesquisas de preço, compartilhem suas opiniões sobre
produtos, sobre atendimento, sobre a, venda, serviços de
pós-venda, etc.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 151](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-157-320.jpg)




![5. JOHNSON, S. Cultura da interface: como o
computador transforma nossa maneira de criar
e comunicar. Rio de Janeiro: Zahar. 2001
6. KUTOVA, Marcos A. S. Colaboração x
Cooperação. Das minhas leituras, 9 de outubro de
2006. Disponível em:
http://blog.kutova.com/2006/10/09/colaboracao-
x-cooperacao/ Acesso em: 10 abr. 2009.
7. LEMOS, A. L. M. Anjos Interativos e
Retribalização do Mundo. Tendência Xxi,
Lisboa, v. 2, p. 19-29, 1997.
8. PADOVANI, S. Avaliação ergonômica de
sistemas de navegação em hipertextos fechados.
In: Design e avaliação de interface. Rio de
Janeiro – RJ: IUsER, 2002.
9. PEREIRA, Alice T. AVA em Diferentes
Contextos. Rio de Janeiro – RJ: Ciência Moderna,
2007.
10. PREECE Jeniffer. ROGERS, Ivonne. SHARP.
Helen. Design de Interação. São Paulo – SP:
Bookman, 2005.
11. PRIMO, A. F. T. AND CASSOL, M. B. F., 1999.
Explorando o conceito de interatividade:
definições e taxonomias. [online]. Disponível em:
http://usr.psico.ufrgs.br/~aprimo/pb/pgie.htm
12. SHNEIDERMAN, Ben; PLAISANT, Catherine.
Designing the user interface. Strategies for
effective Human-Computer Interaction.
Pearson, 2005.
13. SILVA, M. Que é interatividade? Boletim
Técnico do SENAC, Rio de Janeiro, v. 24, n. 2, p.
27-35, 1998.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 156](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-162-320.jpg)
















![Implementando Acessibilidade em um Sistema de Gestão
de Aprendizagem através do Design Centrado no Usuário
Virgínia Chalegre, Fabrício Teles, Audrey Vasconcelos
Centro de Informática, Universidade Federal de Pernambuco
Caixa Postal 7851 CDU Recife PE 50732-970, Brasil
{vcc, fst, abv}@cin.ufpe.br
ABSTRACT
The era of digital inclusion has made accessibility a
requirement increasingly essential to Web pages, since this
environment plays a key role in the daily life of people with
special needs. This paper presents the first results towards
the accessibility of a learning management system, through
the user centered design, taking into account expectations
of visually impaired users, and accessibility guidelines
proposed by the WAI/W3C.
RESUMO
A era da inclusão digital tem tornado a acessibilidade um
requisito, cada vez mais, essencial para as páginas Web,
uma vez que este ambiente desempenha papel fundamental
no cotidiano das pessoas com deficiência. Este artigo
apresenta os primeiros resultados rumo à acessibilização de
um sistema de gestão da aprendizagem, através do design
centrado no usuário, levando em consideração as
expectativas de usuários com deficiência visual, bem como
as diretrizes de acessibilidade propostas pela WAI/W3C.
Palavras-chave
Acessibilidade, Learning Management System, Design
Centrado no Usuário.
ACM Classification Keywords
H.5.3 [HCI]: Web-based interaction.
INTRODUÇÃO
Estabelecer normas gerais e critérios básicos para a
promoção da acessibilidade a pessoas com deficiência é o
objetivo da Lei Federal Brasileira de Acessibilidade (Lei Nº
10.098, de 19 de dezembro de 2000). Apesar de seu
razoável tempo de vida, ainda são poucas as ações práticas
para sua operacionalização na sociedade. Especificamente
no ramo da educação, a acessibilidade muitas vezes é
negligenciada, sendo considerada como desejável, quando
deveria ser tratada como essencial.
De acordo com o Censo do IBGE de 2000 [6], estima-se
que 24,5 milhões de pessoas, em torno de 14,5% da
população brasileira, possuem algum tipo de deficiência.
Desse montante, o principal grupo é dos deficientes visuais
que abrange 48,1% do total, sendo incluídas as pessoas
cegas ou com baixa visão.
Levando-se em consideração esse significativo número de
pessoas com deficiência, entende-se a importância de
propor soluções de inclusão em todos os níveis do processo
de educação. Acredita-se que os sistemas de gestão da
aprendizagem (Learning Management System – LMS)
virtuais possam atuar como um facilitador nesse processo,
desde que sejam concebidos com base em requisitos bem
fundamentados de acessibilidade para Web. Nesta
perspectiva, a WAI1
tem desenvolvido especificações,
guias, software e ferramentas em busca da padronização de
tais definições [10].
Entretanto, tornar esses sistemas virtuais acessíveis não é
uma tarefa fácil, visto que geralmente os envolvidos com o
desenvolvimento de ambientes Web conhecem pouco das
necessidades das pessoas com deficiência, como também
muitas vezes não possuem prática com a implementação
dos padrões propostos pela WAI. Alinhado a isso, há ainda
o fato de não se considerar diretrizes de acessibilidade
durante todo o ciclo de desenvolvimento do LMS. Esta
prática propaga inconsistências e causa retrabalho, uma vez
que a validação da acessibilidade geralmente é feita apenas
ao final do desenvolvimento.
O objetivo deste estudo foi desenvolver uma proposta para
um LMS acessível, seguindo a perspectiva do Design
Centrado no Usuário. O grupo de usuários abordado foi o
dos deficientes visuais, por se tratar do maior e mais
representativo subconjunto das pessoas com deficiência.
Avaliou-se como as necessidades de acessibilidade
poderiam ser atendidas em um LMS, tanto pela visão do
1
O World Wide Web Consortium (W3C) é um consórcio
internacional responsável por desenvolver padrões a serem
adotados na Web, sendo a Web Accessibility Initiative
(WAI) um grupo de trabalho da W3C responsável pelas
ações de acessibilidade.
Cópias digitais ou impressas deste artigo são permitidas desde que sejam
para uso pessoal ou em sala de aula e com as devidas referências, não se
prestando para fins comerciais. Por favor, mantenha este aviso na primeira
página.
Interaction South America 2010 - 2 a 4 de dezembro, Curitiba - Paraná -
Brasil
Copyright 2010 IxDA Curitiba.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 173](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-179-320.jpg)
![usuário quanto pela visão da WAI, considerando mais
especificamente as diretrizes Web Content Accessibility
Guidelines (WCAG 2.0).
AMADEUS
Baseada no conceito de blended learning, que reune ensino
à distância (e-learning) e ensino presencial, a plataforma
Amadeus apresenta-se como o primeiro LMS de segunda
geração [2]. A solução, disponível no Portal do Software
Público Brasileiro [7], permite estender as experiências dos
usuários de EaD para diversas plataformas (Internet,
desktop, celulares, PDAs e TV Digital) de forma integrada
e consistente.
O objetivo do Amadeus é ampliar as possibilidades de
trabalho dos professores e proporcionar formas criativas de
relacionamento, promovendo a comunicação e colaboração
entre os participantes. Essa ampliação das formas de
interação dos usuários com os conteúdos e entre os próprios
usuários permite a implementação de novas estratégias de
ensino e de aprendizagem orientadas por teorias
construtivistas ou sociointeracionistas do desenvolvimento
humano. A Figura 1 ilustra a tela principal desse LMS.
Figura 1. Tela Principal do Amadeus.
Apesar do promissor potencial da plataforma, diretrizes de
acessibilidade nunca foram consideradas em sua concepção,
por exemplo, conteúdos não textuais (vídeos, imagens, etc)
não possuem seu respectivo descritivo textual, dificultando
e muitas vezes invializando a utilização de tais conteúdos
por parte dos deficientes visuais, neste caso.
O cenário atual do Amadeus, onde estas dificuldades de
acessibilidade estão presentes, motivou a aplicabilidade da
pesquisa apresentada neste trabalho. Ao utilizar como
estudo de caso esta plataforma, a pesquisa em questão visa
ampliar o grupo de usuários da ferramenta, incluindo os
portadores de deficiência.
DESIGN CENTRADO NO USUÁRIO
Conforme mencionado, o presente estudo foi desenvolvido
com base na abordagem Design Centrado no Usuário, ou
seja, seguiu-se um processo baseado nas quatro fases do
design da interação: Pesquisa, Brainstorm, Avaliação e
Prototipação [8], no qual o ponto central foi a experiência
do usuário.
Nas próximas sub-seções será descrita, detalhadamente, a
execução de cada uma dessas fases no âmbito deste estudo.
Fase 1 - Pesquisa
A metodologia de pesquisa qualitativa utilizada foi a
Grounded Theory [9]. A ideia básica desta metodologia é
ler um banco de dados textual (por exemplo, notas de
campo e transcrições de entrevistas) para descobrir ou
nomear variáveis (denominadas de categorias, conceitos e
propriedades) e seus relacionamentos. A partir daí é
construída uma teoria sobre o fenômeno; neste caso, a
acessibilidade para deficientes visuais nos sistemas de
gestão de aprendizagem.
A formulação das questões de pesquisa, em termos
concretos, foi guiada pelo objetivo de esclarecer o que os
entrevistados revelaram. Os principais questionamentos
respondidos foram:
• Como se dá a interação dos usuários DVs (Deficientes
Visuais) e quais as suas maiores dificuldades no acesso
dos ambientes na Web em geral.
• Relatos de episódios onde o DV enfrentou dificuldades
no acesso às informações nos ambientes Web/EaD.
• Descrições de como funciona a interação do DV com o
professor nos ambientes de EaD.
Dentro da metodologia de pesquisa utilizada foram
definidas duas fontes de dados:
• Entrevistas com usuários com deficiência visual total.
• Documentação da WCAG 2.0.
Tais fontes de dados passaram pelo processo de coleta,
análise e interpretação de dados. A partir da análise e
interpretação da primeira fonte de dados (entrevistas com os
usuários), foram destacados alguns conceitos, a partir das
sugestões de acessibilidade que emanaram das entrevistas
realizadas. A seguir há alguns exemplos destes conceitos,
os quais estão devidamente justificados por trechos
transcritos das entrevistas:
a. Descrever o formato da página e estruturá-las por frames,
cabeçalhos e tabelas, facilitando a navegação, uma vez
que o leitor possui recurso para passar de um componente
para outro.
“... possa fazer a estruturação por frames, pode ser feito
por texto de cabeçalho (header) também - isso facilita (a
navegação) porque os leitores de tela fornecem recursos
para ’pular’ de um frame para outro, para ’pular’ de
uma tabela para a próxima tabela”.
b.Localizador rápido de conteúdo.
“Deve-se criar caminhos/alternativas/soluções diferentes
para pessoas diferentes chegando objetivamente e
diretamente no que interessa, no mesmo conteúdo. Só
isso já facilitaria muitíssimo a criação de sites com
acessibilidade”.
c. Não utilizar CAPTCHA (Completely Automated Public
Turing test to tell Computers and Humans Apart).
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 174](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-180-320.jpg)
![“CAPTCHA é um atentado à acessibilidade para um
deficiente visual”.
d. O conteúdo deve ser objetivo e os componentes não
textuais devem possuir um descritivo textual.
“Por exemplo, se for o caso de ler textos, que estes sejam
objetivos, sem muitas figuras, e caso existam, que sejam
descritas”.
e. Não inserir indicações de cor e desenhos.
“... a utilização de cores é outra coisa que nos atrapalha
muito, porque alguns sites utilizam cores para se
identificar determinados pontos dentro dele, mas pra nós
isso atrapalha. O que para as outras pessoas ajuda, para
nós dificulta a identificação dos elementos”.
f. Quando o material for gravado (leitura de texto, vídeo),
disponibilizar um gerenciador integrado à ferramenta,
que seja possível acessá-lo diretamente, além de permitir
parar, avançar e voltar.
“... quando tiver uma voz gravada nos materiais, tem que
dar a possibilidade de pará-las; ter controle sobre o
áudio”.
g. As avaliações devem ter opções de múltipla escolha
simples. Não deve haver associações entre duplas
colunas.
“... eu desisti de fazer um teste porque ele tinha umas
alternativas de escolha muito complicadas. Associar um
lado com outro, uma coluna com a outra. Associar a da
direita com a esquerda. Então eu o abandonei...”.
h. Informar quando a página é atualizada/modificada e pôr
o foco na funcionalidade selecionada. Por exemplo, se o
usuário selecionar Fórum, a página deve ser atualizada e
o foco deve estar no Fórum, para evitar passar por todos
os links novamente, antes de chegar à funcionalidade
selecionada.
“... em portais de notícias, que possuem várias
manchetes na mesma página, você começa a ler uma
notícia, quando vê já está no meio de outra notícia que
não tem nada a ver com a anterior. Você começa a ler:
‘Hoje o presidente esteve na cidade...’ e em seguida já
vem o texto: ‘... a previsão do tempo é de sol e calor’”.
i. Descrever o link que está sendo acessado.
“É importante para quem não vê (DV) que haja uma
descrição do link que está sendo acessado. O flash diz
que aquele link não tem nome e apenas atribui a esse link
um número, ficando o DV sem saber do que se trata”.
A partir da análise da segunda fonte de dados
(documentação WCAG), foi identificado que a sua
documentação oficial da WCAG 2.0 [10] já estrutura os
dados de forma categórica e conceitual. Desta forma, o
processo de interpretação focou em selecionar os princípios
e recomendações relacionadas às questões de pesquisa deste
trabalho, a saber:
a. Perceptível: A informação e os componentes da interface
do usuário têm de ser apresentados aos usuários de forma
que eles possam perceber.
a1. Alternativas em Texto: Fornecer alternativas em texto
para qualquer conteúdo não textual.
a2. Mídias com base no tempo: Fornecer alternativas para
multimídia baseada no tempo.
b.Operável: Os componentes de interface de usuário e a
navegação devem ser operáveis.
b1. Acessível por Teclado: Fazer com que toda a
funcionalidade fique disponível a partir do teclado.
b2. Tempo Suficiente: Fornecer tempo suficiente aos
utilizadores para lerem e utilizarem o conteúdo.
c. Compreensível: A informação e a operação da interface
de usuário devem ser compreensíveis.
c1. Legível: Tornar o conteúdo de texto legível e
compreensível.
c2. Previsível: Fazer com que as páginas Web surjam e
funcionem de forma previsível.
d.Robusto: O conteúdo tem de ser robusto o suficiente para
poder ser interpretado de forma concisa por diversos
agentes do usuário, incluindo tecnologias assistivas.
e. Compatível: Maximizar a compatibilidade com atuais e
futuros agentes de utilizador, incluindo tecnologias de
apoio.
A partir desta primeira interpretação, um segundo processo
interpretativo foi executado com o objetivo de selecionar as
recomendações de acessibilidade mais importantes, sob a
ótica dos usuários deficientes visuais. As recomendações
selecionadas foram: a1 (Alternativas em Texto), a2 (Mídias
com base no tempo), b1 (Acessível por Teclado), b4
(Navegável), c1 (Legível) e c2 (Previsível).
Tanto estas recomendações de acessibilidade da WAI,
como também as sugestões de acessibilidade identificadas
nas entrevistas com os usuários, foram utilizadas para a
formulação da teoria (diretrizes de acessibilidade aplicadas
neste trabalho) e consideradas nas fases seguintes do
processo de design da interação centrado no usuário.
Fase 2 - Brainstorm
A fase de brainstorm consistiu em uma sessão de 60
minutos, na qual foram exploradas soluções a serem
incorporadas à fase de prototipação. Utilizou-se a técnica de
brainstorm de modo simples e prático, tendo as seguintes
atividades:
a. Exposição das questões de pesquisa.
b.Exposição dos resultados da fase de pesquisa.
c. Apresentação de ideias para elaboração do protótipo.
Algumas da ideias suscitadas no brainstorm foram:
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 175](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-181-320.jpg)

![Figura 5. Tela de Login.
(1) Imagem do logotipo do Amadeus, com o seguinte
descritivo textual: “Imagem, no topo da tela, com o nome
projetoAmadeus, o logotipo do Amadeus e a versão em que
o sistema se encontra - Alpha”
(2) Barra de acessibilidade com cinco botões distintos e
com seus respectivos equivalentes textuais. Abaixo, seguem
as funcionalidades de cada um, da esquerda para a direita:
• Botão que descreve como o sistema está estruturado, por
exemplo: “A tela está dividida em dois frames: O
primeiro com a imagem do logotipo do Amadeus e com
os botões de acessibilidade e o segundo possui os campos
de login”.
• Botão que ativa o modo acessibilidade para deficientes
auditivos, o qual traduz o texto selecionado para a
Linguagem Brasileira de Sinais (LIBRAS).
• Botão para diminuir o tamanho da letra da tela atual.
• Botão que serve para deixar a letra da tela atual no
tamanho normal.
• Botão para aumentar o tamanho da letra da tela atual.
(3) Campos de entrada de dados, identificados pelo leitor de
tela, para fazer o login no sistema.
(4) Botão, devidamente identificado pelo leitor de tela, com
o descritivo: “Botão Entrar para fazer login no sistema”.
(5) Botão, devidamente identificado pelo leitor de tela, com
o descritivo: “Botão Google para fazer login no sistema,
utilizando a sua conta do Google[5]”.
(6) Link, devidamente identificado pelo leitor de tela, com o
descritivo: “Link Esqueceu a Senha que direciona para a
página de identificação do usuário, onde o sistema irá
enviar uma nova senha por email”.
(7) Link, devidamente identificado pelo leitor de tela, com o
descritivo: “Link Nova Conta que direciona para a página
de cadastro do usuário”.
Figura 6. Tela dos Cursos.
(1) Primeiro item a ser lido pela ferramenta assistiva, assim
que a tela for carregada. Esta área informa ao usuário que
ele está logado e os botões têm as respectivas descrições:
“Botão Perfil que, ao ser selecionado, direciona para uma
tela onde é possível modificar o seu perfil” e “Botão Sair
para fazer o logout no sistema”.
(2) Campo de busca no início da tela para que os usuários,
com e sem deficiência, possam pesquisar o conteúdo de seu
interesse e acessá-lo rapidamente.
(3) Área onde estão listados os cursos, separados por
categorias relacionadas ao aluno. Os links dos cursos têm
seus descritivos textuais, indicando para onde o usuário será
levado. Na categoria Cursos Disponíveis, o botão Inscrição
está ao lado do link para facilitar o acesso, evitando que o
usuário tenha que procurar esta opção para se inscrever no
curso desejado.
Figura 7. Perfil Aluno - Tela do Curso Selecionado.
(1) Menu lateral com todas as opções disponíveis pelo
curso. Cada link tem o descritivo textual que explica o
objetivo da funcionalidade e indica seu direcionamento. Na
Figura 7, a descrição da opção selecionada é “Menu Dados
do Curso, opção que indica o Nome do Curso, Professores,
Objetivos, Programa, Limite de Vagas e datas importantes”.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 177](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-183-320.jpg)

![Figura 10. Perfil Aluno - Tela Módulo do Curso - Avaliação.
(1) Avaliação relacionada ao módulo selecionado, com um
botão e seu equivalente textual para finalizá-la. Possui
perguntas acessíveis com respostas abertas ou de múltipla
escolha. Uma sugestão, relatada pelos deficientes visuais
nas entrevistas, é não inserir perguntas que tenham
relacionamentos de dois lados, pois dificulta a leitura da
ferramenta e consequentemente a localização dos
elementos.
As recomendações da WAI relacionadas ao protótipo do
presente trabalho são detalhadas a seguir:
• Alternativas em Texto: Para cada componente das telas
do protótipo (botão, imagem, link, frame, caixa de texto e
menu) é proposta uma descrição textual, a fim de que os
deficientes visuais possam acessá-los com a ferramenta
assistiva.
• Mídias com Base no Tempo: A ideia é que sejam
fornecidas legendas para a totalidade do áudio pré-
gravado existente em um conteúdo com mídia
sincronizada, com o objetivo de permitir que o usuário
possa gerenciar os áudios, evitando que, por exemplo, o
áudio de uma aula sobreponha o áudio da ferramenta
assistiva.
• Acessível por Teclado: Todo componente tem uma tecla
de atalho para que possa ser acessado via teclado, sendo
também ordenados adequadamente para que o deficiente
visual consiga “desenhar” as telas em sua mente da
mesma forma que as pessoas sem deficiência as
enxergam.
• Navegável: Foi feita uma separação de forma, função e
conteúdo, de maneira a estruturar as páginas e facilitar o
acesso de todos (pessoas com e sem deficiência).
• Legível: A informação é perceptível, ou seja, a proposta é
que o conteúdo seja objetivo o suficiente, que tenha
explicações para palavras incomuns e abreviaturas,
tornando-o de fácil compreensão.
• Previsível: Os mecanismos de navegação são repetidos
em várias páginas Web, tornando a navegação previsível
pela experiência do usuário. Os componentes de entrada
de dados estão disponíveis via teclado, com informações
do que é necessário preencher e os componentes que têm
a mesma funcionalidade são identificados de forma
consistente.
Fase 4 - Avaliação
A avaliação foi feita com alguns entrevistados logo após a
elaboração do protótipo. O processo foi descrever cada tela
do protótipo, com todos os detalhes das funcionalidades,
botões, links, menu, imagens, bem como a interação entre
os componentes e a sequência das telas, ouvindo os seus
comentários a todo momento.
Os usuários validadores do protótipo destacaram a
navegabilidade da interface, considerando-a simples,
objetiva e de fácil interação, com descritivos textuais para
todas as funcionalidades disponíveis. Apontaram como
ponto de melhoria a ênfase aos componentes acessíveis via
teclado, já que, em algumas ferramentas, links do menu, por
exemplo, só expandem com o click do mouse. Além desse,
outros aspectos analisados:
a. Incluir, na barra de acessibilidade, um botão de contraste
do background com a cor da fonte e outro botão para
ativar o modo monocromático, com o objetivo de tornar o
Amadeus acessível também para os usuários que
possuem deficiências visuais específicas (Protanopia:
deficiência com vermelho, Deuteranopia: deficiência com
a cor verde, Tritanopia: deficiência com a cor azul,
acromia: sem cores [3]). A partir de tal necessidade, as
telas do protótipo foram atualizadas para contemplar a
nova barra de acessibilidade (Figura 11).
Figura 11. Barra de acessibilidade com os novos botões.
b.Retirar a opção de “Buscar Curso” da Tela dos Cursos
(Figura 6), porque já existe uma busca no frame acima e,
deixando as duas, pode confundir o usuário DV, além de
tornar cansativo, pois o leitor de tela passará por este
componente cada vez que for selecionada a tela dos
cursos.
c. Colocar uma opção de aumentar e diminuir o volume
através do teclado, além dos botões disponíveis. Esta
melhoria é referente à Figura 9 e vai além do que pode
ser exibido na prototipação. Desta forma, fica como
sugestão para a futura implementação do protótipo.
CONCLUSÃO E PERSPECTIVAS FUTURAS
O objetivo principal deste estudo foi alinhar as necessidades
dos usuários deficientes visuais com as WCAG, propondo
interfaces acessíveis para o uso de um LMS. Usando como
estudo de caso a plataforma Amadeus, novas telas foram
prototipadas, considerando as recomendações de
acessibilidade identificadas. As telas apresentadas, e suas
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 179](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-185-320.jpg)

![Medindo Emoções em Reuniões no Second Life
Cleyton Slavieroi
Jivago
Medeirosi
Karen
Figueiredoi
Willian
Jefferson
Freitas da
Silvai
Cintia
Ramalho
Caetano da
Silva
Ana Cristina
Bicharra
Garcia
Instituto de Computação – Universidade Federal Fluminense – Niterói, RJ - Brasil
{cslaviero, jmedeiros, kfigueiredo, wsilva, ccaetano, bicharra}@ic.uff.br
RESUMO
Reuniões são capazes de alterar o estado emocional de
indivíduos, fato que pode influenciar no bom andamento
destas reuniões. A dificuldade de percepção e interpretação
das emoções dos participantes de uma reunião é um dos
fatores que podem prejudicar o trabalho colaborativo à
distância em ambientes virtuais como o Second Life.
Focando neste problema, este trabalho apresenta um
método para medir as emoções de um grupo de
participantes de uma reunião no ambiente virtual Second
Life. Além da descrição do processo de elaboração da
aplicação, este artigo também apresenta uma avaliação
preliminar da aplicação dois ambientes distintos de trabalho
colaborativo no Second Life.
Palavras-chave
Ambientes virtuais, Second Life, emoções, ambientes
colaborativos.
ACM Classification Keywords
H.5 [Information Interfaces and Presentation (e.g., HCI)]:
H5.3 Group and Organization Interfaces – collaborative
computing, computer-supported cooperative work,
synchronous interaction.
INTRODUÇÃO
Muitas empresas e grupos de pesquisa gerenciam projetos
que envolvem pessoas e equipes de trabalho distribuídas
geograficamente. Um mecanismo que dá suporte ao
trabalho colaborativo a distância é a realização de reuniões
virtuais. Nas últimas décadas, várias pesquisas vêm sendo
desenvolvidas com intuito de permitir a prática de reuniões
à distância, incluindo a execução de reuniões em ambientes
virtuais em 3D [4].
Ambientes virtuais são espaços criados por computador
para representar mundos virtuais nos quais os seus
integrantes podem interagir entre si e com objetos virtuais
em tempo real através de entidades controladas, i.e.
avatares[13]. O Second Life (SL) [11] é um ambiente
virtual que permite a criação de salas de reunião virtuais
onde os avatares podem se encontrar e discutir [4].
Apesar de no SL o senso de co-presença ser simulado
através da presença dos avatares no mesmo espaço virtual, a
manifestação da emoção dos usuários é limitada pela
execução de gestos programados para os avatares. A
dificuldade de percepção e interpretação das emoções dos
participantes de uma reunião é um dos fatores que podem
prejudicar a construção da propriedade coletiva (do inglês,
common ground), dificultando o trabalho colaborativo à
distância [6].
Além dos gestos predefinidos para os avatares limitarem a
manifestação emotiva do usuário, um gesto executado
durante uma reunião virtual pode não ser percebido pelos
outros participantes. E ainda que este gesto seja percebido
por todos os participantes, outra questão importante surge:
como registrar todos os gestos realizados em uma reunião e
transformá-los em uma informação que representa o estado
emocional do grupo reunido?
Segundo Olson e Olson [6], o estado emocional de um
grupo pode influenciar diretamente no seu desempenho ao
longo de uma reunião e na qualidade do trabalho produzido.
Avaliar este estado emocional pode auxiliar na condução da
reunião pelo mediador e, até mesmo, condicionar a
interrupção da mesma. Visando solucionar estes problemas,
o objetivo deste trabalho é elaborar um método para a
medição de emoções de um grupo de usuários no ambiente
virtual SL, analisando seu uso em reuniões realizadas neste
ambiente.
A partir desta seção, o restante deste artigo está organizado
da seguinte forma: incialmente, o ambiente virtual Second
Life é brevemente apresentado e alguns trabalhos
relacionados são discutidos; em seguida, algumas teorias
emocionais que serviram de inspiração para a criação do
nosso método de medição são abordadas; mais a frente, o
método de medição proposto, as técnicas utilizadas para sua
concepção, detalhes do modelo da aplicação e da
implementação são apresentados; uma avaliação preliminar
da utilização do método desenvolvido é apresentada logo
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA.
Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 181](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-187-320.jpg)
![depois e por fim, as conclusões e trabalhos futuros são
traçados.
AMBIENTES VIRTUAIS E SECOND LIFE
Como descrito na seção anterior, o Second Life é um
ambiente virtual. Ele foi criado pela Linden Labs,
localizada em São Francisco, Califórnia, em 2003 [13]. Este
ambiente permite a imersão dos usuários em um nível mais
elevado, comparado aos outros tipos de interação via
Internet, como conversas utilizando mensageiros
instantâneos, redes sociais e comunidades virtuais baseadas
somente em texto.
Diferente dos outros ambientes virtuais em 3D, que são, em
sua maioria, ambientes distintos do mundo real, o SL é
considerado um metaverso, pois visa reproduzir
virtualmente características do mundo real, ou da “primeira
vida” (do inglês, first life) [13]. Ainda assim, o SL
possui limitações se comparado a um ambiente real, como
restrições do próprio ambiente [3]. Uma limitação
importante é a dificuldade de trazer a sensação de realidade
ao ambiente [2], sendo esta pesquisada por nosso trabalho,
no âmbito da captura e medição de emoções.
Embora existam limitações, uma forma de contorná-las é
criando ferramentas [2] ou utilizando as ferramentas
disponíveis no próprio ambiente [13]. O SL possibilita a
criação de objetos virtuais das mais variadas formas, desde
as mais simples até as mais complexas, através das formas
primitivas que disponibiliza. Além disso, utilizando uma
linguagem de programação própria, a Linden Script
Language (LSL) [11], os usuários podem desenvolver
objetos interativos.
A possibilidade de elaborar interações entre objetos e
usuário em um mundo virtual permite superar algumas
limitações, proporcionando maior imersão dos usuários no
ambiente virtual. Na seção a seguir, abordamos alguns
trabalhos na área de ambientes virtuais colaborativos que
poderiam se beneficiar da proposta apresentada por este
trabalho.
Trabalhos Relacionados
Nesta seção abordamos algumas pesquisas que vêm sendo
desenvolvidas na última década com a finalidade de
melhorar a sensação de imersão em ambientes virtuais,
incluindo o SL.
Na área de trabalhos voltados à imersão do usuário em um
ambiente virtual, temos o trabalho de DiPaola e Collins [2],
por exemplo, tentam proporcionar maior imersão por meio
da criação de personagens que possuem expressões faciais e
que movimentam os lábios de acordo com o som emitido
pelo participante representado por esse personagem em um
ambiente virtual 3D chamado OnLive Traveler, que permite
o uso de voz para comunicação. Estas expressões faciais
são selecionadas pelo usuário, e sofrem decaimento, da
mesma forma que as emoções aplicadas neste trabalho.
Apesar os autores não especificam se as taxas são fixas ou
variáveis entre as emoções, como comentado por Picard [9],
fato este que prejudica uma representação mais fiel do
estado emocional dos usuários no ambiente proposto.
Além da procura por maior imersão dos usuários, pesquisas
vêm buscando utilizar o potencial de ambientes virtuais
para criar ambientes colaborativos virtuais, voltados
primariamente para troca de informações, em específico no
SL. Um exemplo de implementação desse tipo de ambiente
é o Time2Play [8], um jogo colaborativo educacional. O
objetivo deste é permitir que crianças criem e encenem
histórias no SL, expressando assim sua criatividade e
imaginação. Outro exemplo é o trabalho de Lucia et al. [4],
que investiga a utilização do SL no auxílio ao trabalho
colaborativo a distância, e propõe um método para
gerenciar reuniões, chamado de SLMeeting.
No que diz respeito a elementos ou objetos auxiliares
dentro de ambientes virtuais colaborativos, temos como
exemplo o Social Proxy [12], um objeto que é anexado a
tela do utilizados. O Social Proxy auxilia a visualização da
presença dos usuários em uma reunião, exibindo inclusive
quem está falando (ou digitando um texto) no momento.
Esta característica permite que a reunião possua uma
sequência bem definida, fato que é dificultado em uma
reunião virtual.
FUNDAMENTAÇÃO TEÓRICA
Conjecturando a importância das emoções, vários
pesquisadores do campo da psicologia desenvolveram
teorias que modelam a geração de emoções em humanos.
Um dos modelos mais importantes é a teoria das emoções
OCC [7]. Este modelo é especialmente difundido na área da
computação devido a sua facilidade de implementação [1].
O modelo mapeia uma lista de 22 emoções principais e
define as emoções como uma reação a um evento, que é
desencadeada por uma avaliação subjetiva do evento de
acordo com os objetivos do agente, normas e crenças.
Para descrever a composição de uma emoção, o modelo
OCC utiliza uma série de atributos, como: (i) tipo, nome da
emoção que está sendo experimentada; (ii) valência, denota
o tipo de reação (positiva ou negativa); (iii) intensidade, a
intensidade da emoção; (iv) time-stamp, o momento no qual
a emoção é criada ou atualizada. Baseado nesses atributos,
Picard [9] discute sobre a intensidade das emoções ao longo
do tempo. Para o autor, a partir do momento em que a
emoção é criada ela tende a diminuir ao longo do tempo e,
conseqüentemente, desaparecer. Emoções mais intensas
tendem a desaparecer mais rapidamente. Se nada acontece
ao agente durante certo tempo, ele se acalma retornando a
um estado neutro.
Os conceitos apresentados nesta seção serviram de base
para a elaboração do método de medição de emoções
apresentado na próxima seção deste trabalho.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 182](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-188-320.jpg)
![MEDINDO EMOÇÕES NO SECOND LIFE
Nesta seção todo processo para a elaboração da aplicação
do método de medição de emoções de um grupo de
participantes de uma reunião para o Second Life será
apresentado em detalhes, desde a sua concepção até a sua
implementação.
Reuniões
Todo o processo de modelagem e desenvolvimento do
componente foi feito através de reuniões no ambiente
Second Life. As reuniões foram realizadas, em sua
totalidade, em uma sala de reunião localizada na ilha
ADDLabs – UFF, com o objetivo de coordenar tarefas,
compartilhar informações, tomar decisões consistentes, e
estabelecer um consenso no grupo para a geração de um
produto final de qualidade. Permitindo assim, controle e
acompanhamento do processo de desenvolvimento através
do ambiente virtual.
A sala de reuniões era composta por um conjunto de
componentes para facilitar a colaboração do grupo, como
whiteboard, agenda de grupo, cronograma de tarefas,
modelo de argumentação, repositório de atas, social Proxy,
etc. Os componentes atuaram como forma de integrar a
equipe e facilitar a coordenação, comunicação e percepção.
A figura 1 mostra o grupo atuando em uma das reuniões.
Figura 1. Grupo atuando durante uma das reuniões
A proximidade com o objeto de estudo, realizando reuniões
dentro do ambiente, nos permitiu perceber as nuances da
utilização do mesmo, fato este que auxiliou na melhor
elaboração deste trabalho.
Foram realizadas seis reuniões com duração máxima de
uma hora. Antes de cada reunião era descrita uma agenda,
contendo tópicos que seriam abordados, a fim de facilitar o
gerenciamento da reunião e o grupo não se envolver em
atividades repetitivas. As agendas eram distribuídas antes
das reuniões a fim de garantir que todos os participantes
fossem informados sobre os tópicos a serem cobertos. Ao
final, era gerada uma ata de reunião, contendo decisões
tomadas, tarefas a serem realizadas por cada participante
além de um cronograma para continuação e andamento do
projeto. Toda a documentação do projeto foi armazenada no
GoogleDocs, de forma a facilitar o compartilhamento caso
o participante necessitasse de alguma informação e não
estivesse com o Second Life aberto.
O grupo atuou de forma distribuída e optou pela utilização
de comunicação via texto, que facilita o registro das
conversas para análises futuras. Uma limitação da utilização
da comunicação via texto é o intervalo de tempo entre o
envio e recebimento de uma mensagem, devido a repetições
de mensagens postadas.
Nas reuniões, foram discutidos aspectos do projeto, como a
elaboração de questionários para a criação do modelo de
usuário, forma de interação dos usuários com a proposta,
modelagens dos objetos EmotionSender e EmotionMeter,
implementação e métodos de avaliação dos resultados. As
próximas seções detalham cada um destes pontos.
O Modelo do Usuário
De forma a caracterizar e identificar os usuários que
utilizarão a aplicação proposta, um questionário1
foi
elaborado. O questionário, composto por doze perguntas,
foi criado para identificar características pessoais e detalhes
de uso do ambiente SL, além de informações que nos
auxiliaram posteriormente na definição de características da
aplicação. Treze usuários foram entrevistados no total.
Analisando as respostas obtidas, foi possível descobrir os
seguintes pontos:
(i) Os usuários que responderam o questionário são
adultos de 21 a 35 anos, e conhecem o SL, em sua
maioria, há pouco tempo (entre um e seis meses);
(ii) 46% dos usuários utilizam pelo menos uma vez por
semana esse ambiente virtual, principalmente para
reuniões;
(iii) Os usuários concordam que a utilização de objetos
criados para auxiliar reuniões, como o Social Proxy
[12], facilitam a realização das mesmas; e
(iv) 77% dos usuários entrevistados concordam que o SL
não tem meios eficazes de transmitir emoções sentidas
por participantes em uma reunião.
Aos entrevistados também foi perguntado que emoções
sentiam quando participavam de uma reunião. As emoções
utilizadas como opções no questionário foram selecionadas
a partir da lista de emoções descrita por Ortony et al. [7].
Seis emoções foram reveladas como as mais sentidas pelos
entrevistados durante uma reunião: admiração, reprovação,
contentamento, descontentamento, satisfação e insatisfação.
Essas são as emoções utilizadas em nossa aplicação.
Por fim, questões de interface e usabilidade foram
investigadas, sendo obtido que os usuários sentem-se mais
1
Questionário e modelo de usuário disponíveis em:
http://www.ic.uff.br/~kfigueiredo/emotionsSL/modeloUsua
rio.pdf.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 183](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-189-320.jpg)
![confortáveis quando eles próprios informam a emoção, ao
invés de serem alertados para informar à emoção que estão
sentindo. Além disso, uma informação importante foi sobre
a leitura do resultado da emoção do grupo pelo usuário. A
grande maioria dos entrevistados (98%) concorda com uma
transição de cores, em ordem decrescente de emoção, de
verde para amarelo e amarelo para vermelho, para informar
o que chamamos de “temperatura” da reunião. Esta e outras
questões sobre o funcionamento da aplicação desenvolvida
são melhor abordadas nas próximas seções.
Técnicas de construção e avaliação
Além do resultado final desse trabalho resultar em uma
nova aplicação para o ambiente SL, o SL também foi
escolhido como ambiente para o desenvolvimento do
trabalho. Assim, foram realizadas seis reuniões dentro do
SL em uma sala de reuniões virtual criada especificamente
para este propósito. Objetos virtuais de apoio a reuniões no
SL também foram utilizados, como um repositório de atas,
uma agenda, um acompanhamento de tarefas, um quadro
branco e o Social Proxy [12].
Para a construção da aplicação do trabalho algumas técnicas
foram adotadas. A primeira delas foi o modelo de tarefas
GOMS (Goals, Operators, Methods, and Selection Rules),
um método que representa a estrutura cognitiva do usuário
em termos de objetivos, operadores, métodos e regras de
seleção [5]. O GOMS foi utilizado como ferramenta para
documentar as interações entre os avatares e os objetos que
compõem a aplicação sob a perspectiva do usuário.
Outras técnicas de construção adotadas foram o desenho do
Modelo de Navegação e Storyboard dos objetos, que
descrevem respectivamente transições entre estados da
interface de acordo com a interação do usuário, e detalhes
de como a interface será organizada.
Para a avaliação das interfaces, foi utilizada uma técnica
denominada Avaliação Heurística. Nesta técnica, um
avaliador externo realiza uma análise sobre diferentes
interações, buscando por problemas de interface [12]. Um
grupo composto por três usuários de ambientes de reuniões
no SL serviu como avaliador externo desse trabalho, sendo
esta avaliação executada após a terceira reunião de
construção do trabalho, ponto no qual já havíamos
desenvolvido um protótipo da aplicação. Os resultados da
Avaliação Heurística foram considerados para a finalização
da aplicação.
O Modelo da Aplicação
Idealizando o desenvolvimento do método de medição de
emoções dos participantes de uma reunião no SL, o modelo
da aplicação foi concebido de forma a constituir de dois
objetos virtuais: o primeiro objeto utilizado pelos
participantes para informar às emoções que estão sentindo e
o segundo objeto, um objeto principal que recebe as
emoções dos participantes e exibe o que chamamos de
Emoção Total (ET) do grupo. Tais objetos são nomeados
EmotionSender (ES) e EmotionMeter (EM),
respectivamente.
Para medir as emoções durante uma reunião é necessário
utilizar uma instância do objeto EM, que deve estar
localizado de maneira que todos os participantes possam
visualizar o valor da ET, e n instâncias do objeto ES, sendo
n o número de participantes da reunião, para que cada
avatar possa interagir com um e somente um ES.
O ES dispõe de seis opções de emoções que podem ser
escolhidas: aprovação, reprovação, contentamento,
descontentamento, satisfação e insatisfação. Estas emoções
fazem parte das emoções principais do modelo OCC e
foram escolhidas após análise dos resultados obtidos pelo
questionário do modelo do usuário. Cada uma das emoções
possui um valor base (VB) que é multiplicado pelo peso da
emoção (p), resultando no valor final da emoção (Tabela 1).
Emoção Valência Valor
Base
(VB)
Peso
(p)
Tempo de
Expiração
Aprova-
ção
+ 0.2 1 25 minutos
Reprova-
ção
- 0.2 1 25 minutos
Conten-
tamento
+ 0.2 2 10 minutos
Desconten
-tamento
- 0.2 2 10 minutos
Satisfação + 0.2 5 5 minutos
Insatis-
fação
- 0.2 5 5 minutos
Tabela 1. Constituição das emoções
Os valores utilizados como peso para as emoções são
baseados no trabalho de Poel et al. [10]. Ao enviar uma
emoção pelo ES, o valor da emoção pode incrementar ou
decrementar o valor da ET de acordo com a valência da
emoção. A Figura 1 apresenta o modelo da aplicação
proposta.
Figura 1. Modelo da aplicação
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 184](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-190-320.jpg)
![Figura 2. Storyboard do objeto EmotionSender
As emoções também possuem um tempo de expiração
associado que passa a contar a partir do seu time-stamp,
neste caso, o momento em que o participante envia a
emoção pelo ES. O tempo de expiração de cada emoção foi
definido de forma inversamente proporcional ao peso da
emoção, seguindo a idéia de Picard [9] de que emoções
mais intensas tendem a desaparecer mais rapidamente.
Logo, quando o tempo de expiração é atingido, o valor da
emoção é retirado ou acrescentado (de acordo com o oposto
da valência da emoção) do valor da ET. A Tabela 1 mostra
todos os valores associados a cada emoção.
Além do valor da emoção, o valor da representatividade do
participante perante o total de participantes da reunião é
considerado no cálculo da ET. O valor final incrementado
ou decrementado da ET é dado através da fórmula:
O valor da ET é representado como uma porcentagem, e ao
iniciar a reunião, o EM é iniciado com o valor de ET em
100% Ao longo da reunião, conforme os participantes
enviam as emoções, este valor varia, nunca ultrapassando o
limite superior, 100%, ou inferior, 0%. De acordo com o
valor da ET, o EM exibe uma cor diferente (Tabela 2),
como mais uma forma dos participantes identificarem a ET
da reunião. Este padrão cromático foi escolhido de acordo
com os resultados apresentados na seção sobre o modelo de
usuário.
A próxima seção apresenta com mais detalhes a interface
dos objetos ES e EM e como a interação entre os avatares e
os objetos é dada.
Os Objetos da Aplicação
O EmotionSender é o objeto utilizado pelos participantes
para informar as emoções que estão sentindo durante a
reunião. Ao interagir com o ES, além de poder selecionar
uma emoção para ser enviada, o usuário também pode
consultar a ajuda de utilização do objeto como mostra o seu
storyboard (Figura 2).
Valor
da ET
Cor Significado
0-24% Vermelha Mau sinal - os participantes
não estão gostando da reunião
25-49% Amarela Sinal de alerta - alguma coisa
está incomodando os
participantes
50-
100%
Verde Bom sinal - o grupo está
apreciando a reunião
Tabela 2. Padrão cromático do EmotionMeter
O EmotionMeter é o objeto principal com o qual os
participantes da reunião poderão visualizar a “temperatura”
da mesma, i.e., o valor da ET do grupo. Por esta razão, a
forma de um termômetro foi escolhida para representar este
objeto. O EM possui dois estados principais: ligado e
desligado. Quando desligado, o usuário pode ligar o objeto
e consultar a ajuda de utilização do objeto. O objeto
desligado não fica habilitado a receber emoções dos
EmotionSender’s presentes. Ao ligar o EM, o usuário é
solicitado a informar o número de participantes da reunião e
a partir desse momento o EM passa a exibir a ET e a
receber as emoções dos ES. Enquanto o EM está ligado, o
usuário tem as opções de reiniciar o objeto, desligar e
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 185](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-191-320.jpg)
![Figura 3. Captura de tela da execução de um dos testes no ambiente de reunião (EmotionSender’s na mesa, e EmotionMeter na
parede do ambiente de reunião)
consultar a ajuda. Ao reiniciar o EM, o valor da ET retorna
a 100% e o usuário é solicitado a confirmar o número de
participantes da reunião.
Devido a limitações de espaço, não apresentaremos neste
trabalho os storyboards do EM, o GOMS e modelos de
navegação dos objetos.
Implementação dos Objetos
Esta seção descreve alguns pontos importantes da
implementação dos objetos EM e ES, que foi feita
utilizando a linguagem LSL (para a criação de scripts no
ambiente SL).
A troca de mensagens entre objetos e avatares é um dos
pontos mais importantes no que diz respeito a
implementações em LSL, sendo a função llSay uma das
mais utilizadas para esse fim. Quando uma mensagem é
enviada utilizando esta função, ela pode ser ouvida por
avatares e objetos em um raio de até 20 metros de distância
a partir do ponto em que foi emitida. Nesta função são
passados como parâmetros o canal pelo qual se deseja
enviar a mensagem e a mensagem a ser enviada, essa tendo
até 1024 bytes. Para que um objeto receba as mensagens de
determinado canal, devemos programá-lo para escutar o
canal pretendido, essa definição é feita utilizando a função
llListen [11].
Na implementação dos objetos EM e ES foi fundamental
descriminar os tipos de mensagens trocadas pelos objetos e
agrupar cada tipo de mensagem em um canal diferente. A
Tabela 3 ilustra o cenário implementado, onde diferentes
mensagens trafegam por diferentes canais. Para a escolha
de canais, foi necessário observar como os mesmos
funcionam neste ambiente.
O SL disponibiliza 2.147.483.647 canais para comunicação
entre canais negativos e positivos. A utilização destes
canais é feita segundo a regra: canais com numeração
menor que zero são utilizados para comunicação somente
entre objetos; canais acima de zero são utilizados para
comunicação privada (tanto entre objetos quanto entre
objetos e avatares); e o canal zero é utilizado para
comunicação pública (broadcast).
Canal Objeto
Emissor
Descrição de uso
777 EmotionMeter Canal utilizado pelo EM
para informar o seu estado
(ex: ligado ou desligado)
para os ES
778 EmotionSender Canal definido para o envio
de emoções pelos ES
779 EmotionMeter Por esse canal, o EM retorna
para o ES o valor
relacionado a emoção
enviada que realmente foi
utilizado (somado ou
subtraído) na ET
800 EmotionSender Quando o tempo de
expiração de uma emoção
enviada é atingido, o valor
anteriormente enviado pelo
canal 779 pelo EM é
retornado a ele pelo ES para
que a ET seja atualizada
801 e
802
EmotionMeter Comunicação entre as partes
do próprio objeto para a
troca de cores.
Tabela 3. Troca de mensagens entre os objetos por diferentes
canais
Para a implementação, foram necessários utilizar canais
com numeração positiva, haja visto que estes objetos
poderiam trocar mensagens com os avatares. A numeração
alta foi utilizada para garantir que não houvesse outros
usuários (ou objetos) utilizando o mesmo canal no
momento de comunicação.
Entretanto, o SL não permite que canais sejam utilizados
exclusivamente por um usuário ou um objeto ou grupo de
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 186](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-192-320.jpg)







![tomou por base os estudos de Padovani e Moura (2008). A
seguir são apresentadas as imagens das infografias
selecionadas (fig. 13 e fig. 14) e, também, as respectivas
análises.
Figura 13. Infográfico sobre a gripe H1N1.
Fonte: site G1, 2009.
Figura 14. Infográfico sobre a gripe A H1N1.
Fonte: jornal ZH, 2009.
O tema dos infográficos em estudo trata da gripe A H1N1,
as telas das duas infografias (fig. 13 e fig. 14) são
compostas com textos, ilustrações, títulos, linhas, barras
coloridas, fundo e pictogramas. Conforme Lupton e Phillips
(2008), muitos destes elementos e fenômenos visuais como
ponto, linha e plano, até escala, cor, hierarquia e camadas,
entre outros, convergem no design de diagramas
[infografias], onde no “reino dos gráficos de informação, a
estética destes elementos, permanece importante”,
adquirindo significados específicos dependendo da forma
como são articulados e em função de suas marcas gráficas e
relações visuais (LUPTON E PHILLIPS, 2008, p. 199).
Sobre a interatividade dos infográficos digitais
Quanto ao tipo de interatividade apresentada, os
infográficos (fig. 13 e fig. 14), são classificáveis na
categoria instrução, porque permitem a interação do usuário
por meio de botões.
O infográfico do site G1 (fig. 13), além dos botões,
apresenta também abas superiores que, tecnicamente,
desempenham as mesmas funções que os botões, porém
oferecem uma visão geral do sistema, permitindo que o
usuário mude de seção de forma mais rápida.
Nenhum dos infográficos estudados (fig. 13 e fig. 14)
oferecem possibilidades interativas dos tipos identificados
como manipulação ou como exploração (fig. 15).
Níveis de interatividade
Infográficos Instrução Manipulação Exploração
G1 (Fig. 13) X – –
ZH (Fig. 14) X – –
Figura 15. Tabela de níveis interatividade.
Fonte: Tabela dos autores.
Assim, também, não proporcionam ao usuário uma
experiência aprofundada de imersão, com possibilidades de
modificação ou personalização da interface. Além disso,
não propiciam, ainda, experiências com a interatividade que
é possibilitada nos ambientes web 3D.
Aspectos de navegação dos infográficos digitais
Considerou-se que os modos de navegação se dividem em
um número maior de categorias, com distinções sutis.
Portanto, desenvolveu-se uma investigação, na qual os
endereços eletrônico-digitais dos infográficos, foram
visitados e os objetos foram estudados diversas vezes. Nas
visitas e nos estudos, procurou-se as possíveis coincidências
entre os caminhos de navegação dos infográficos,
considerando os parâmetros de navegação propostos por
Padovani e Moura (2008).
De modo geral, o infográfico do G1 (fig. 13) não pode ser
classificado como End-of-branch, porque o usuário não
possui sinalização de links visitados.
Caso o usuário tenha um critério definido e queira, por
exemplo, verificar a primeira e a terceira aba do
infográfico, ficando satisfeito com as informações
adquiridas, a navegação no infográfico do G1 (fig. 13) pode
ser classificada como End-of-likely places, porque o usuário
definiu o sistema de busca e visitou apenas alguns nós da
rede ou sistema. O infográfico do G1 (fig. 13) permite
também os outros tipos subsequentes de navegação, exceto
o Map-node-map, porque o infográfico não apresenta um
mapa de navegação, como acontece comumente em um site.
No infográfico do jornal Zero Hora (fig. 14) também não há
sinalização de links visitados, portanto, não possibilita o
tipo de navegação End-of-branch. Contudo, possibilita a
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 194](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-200-320.jpg)



![Observações Etnográficas na Avaliação da Usabilidade de
Dispositivos Móveis de Coleta de Dados Estatísticos
Patricia Tavares
Departamento de Informática Aplicada
da Universidade Federal do Estado do
Rio de Janeiro (UNIRIO) e IBGE
patricia.tavares@uniriotec.br
Luiz Agner
Instituto Brasileiro de Geografia e
Estatística (IBGE) e UniverCidade
luizagner@gmail.com
Simone Bacellar Leal Ferreira
Departamento de Informática Aplicada
da Universidade Federal do Estado do
Rio de Janeiro (UNIRIO)
simone@uniriotec.br
RESUMO
O presente artigo apresenta o método, resultados e
conclusões preliminares de observações de campo
inspiradas em técnicas etnográficas. Foi analisada a
usabilidade do aplicativo desenvolvido para os PDAs
(Personal Digital Assistants) da Pesquisa Nacional por
Amostra de Domicílios Contínua do IBGE. A técnica foi
aplicada com a participação de entrevistadores que utilizam
PDAs, dispositivos móveis para coleta de dados durante as
pesquisas domiciliares do Instituto. As conclusões obtidas a
partir das “observações etnográficas” revelaram dados
qualitativos inusitados sobre a usabilidade. Os autores
reuniram relatos sobre o emprego do PDA no ambiente de
campo, apontando seus principais problemas de uso.
Palavras-chave
Usabilidade, PDA, metodologia, etnografia, design,
estatística.
ABSTRACT
This article presents the methodology, results and findings
of field observations where we analyzed the usability of the
software developed for PDAs of the IBGE National
Household Sample Continuous. Ethnography inspired field
observations were applied with the participation of users
who use mobile devices to collect data for statistical
research. The conclusions from field observation
qualitative data revealed to be surprising or unusual. To
register difficulty of use, the authors gathered reports of
interviewers on the use of PDA in the field environment,
pointing out its major problems.
Keywords
Usability, PDA, methodology, ethnography, design, statistics.
INTRODUÇÃO
Com o avanço da tecnologia da informação, as pessoas e as
organizações necessitam cada vez mais de sistemas
desenvolvidos com qualidade. Como é por intermédio das
interfaces que as pessoas se comunicam com os sistemas
para executar suas tarefas, elas precisam ser cada vez mais
projetadas com foco na usabilidade [6].
Existem diferentes métodos de avaliação de usabilidade: há
aqueles sem a presença de usuários - os “métodos de
inspeção” ou “métodos analíticos ou prognósticos”; e há
aqueles que envolvem usuários, chamados de “método de
observação” ou “testes com os usuários”. Estes podem ser
realizados em seu contexto de uso, no campo, ou em
ambientes monitorados, como os laboratórios de
usabilidade [4].
O método proposto neste trabalho representa o mix de
quatro abordagens diversificadas de avaliação: a observação
em contexto de uso (aqui referida também pela expressão
“observação etnográfica” – mas deixando claro que não se
trata do método tradicional da etnografia, tal como é
concebida e aplicada pelas ciências sociais), os testes de
usabilidade com emprego de laboratório portátil, as
entrevistas semi-estruturadas, e a inspeção heurística.
Na primeira fase do método, o usuário foi observado em
seu contexto primordial de uso, ou seja, utilizando o PDA
(Personal Digital Assistants) em visitas de campo, ao
entrevistar cidadãos em seus domicílios. A segunda fase
consistiu em uma observação feita em ambiente semi-
controlado, onde o usuário foi entrevistado e observado, em
local de trabalho, realizando tarefas que simulam situações
verdadeiras que ocorrem, com freqüência, nas suas
atividades de campo.
O método proposto aqui foi desenvolvido e aplicado para
avaliação de usabilidade de um software criado para o PDA
a ser utilizado pelos entrevistadores da Pesquisa Nacional
por Amostra de Domicílios Contínua (PNAD Contínua) do
Instituto Brasileiro de Geografia e Estatística (IBGE) [12].
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 198](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-204-320.jpg)
![Neste artigo, será dada ênfase especial à parte inicial do
método que trata da aplicação de observações etnográficas,
de caráter exploratório, e seus resultados. A segunda fase
do método já foi explorada em outros textos de
comunicação científica [12].
A TECNOLOGIA EM CONTEXTO DE COLETA DE
DADOS
Segundo Greene [5], a introdução de uma tecnologia pode
transformar o contexto de uma entrevista para coleta de
dados estatísticos e pesquisas domiciliares, contribuindo
para a sensação de que este é um evento importante para o
informante.
Em alguns casos, a curiosidade sobre a tecnologia pode
chamar mais pessoas para observar ou participar das
entrevistas. Às vezes isso ajuda a “quebrar o gelo”, ficando
mais fácil falar com outros membros de uma família ou da
comunidade. Em algumas raras situações, a tecnologia
poderá inspirar medo ou ansiedade [5].
Os métodos de coleta de dados assistida por computadores
são conhecidos pelos termos CADC (Computer-Assisted
Data Collection), ou pelo termo europeu CADAC, CASIC
(Computer-Assisted Survey Information Collection) e CAI
(Computer-Assisted Interviewing); os métodos tradicionais
de papel e lápis são muitas vezes denotados por PAPI
(Paper-And-Pencil Interviewing).
A característica principal das entrevistas apoiadas por
computador é que as perguntas são orientadas na ordem
correta, seguindo um algoritmo disponibilizado em um
programa interativo na tela do computador.
O software tem a capacidade de configurar a ordem e o tipo
de questões baseando-se nas respostas anteriores, ou na
informação que já dispõe sobre o entrevistado. As respostas
são inseridas diretamente neste computador por um
entrevistador ou pelo próprio entrevistado [7].
Como alternativa aos questionários em papel, a CADC é
bem aceita pelos entrevistados e pelos entrevistadores e a
qualidade dos dados melhora, especialmente quando os
questionários complexos são utilizados.
Em geral, os entrevistados reagem positivamente ao uso do
computador durante uma entrevista: eles atribuem um
maior grau de profissionalismo à pesquisa. A interação
social com o entrevistador é descrita como confortável [7].
A pesquisa que representa o objeto de estudo deste trabalho
– a PNAD Contínua – representa mais uma iniciativa do
Instituto Brasileiro de Geografia e Estatística no sentido de
integrar a tecnologia móvel para apoiar o processo de
entrevista e de coleta de dados sobre as condições de vida
da população brasileira - através do desenvolvimento e da
aplicação de um questionário eletrônico (figura 1), como já
ocorreu nos Censos 2007 e 2010.
A PESQUISA PNAD CONTÍNUA
A PNAD Contínua é uma nova pesquisa do IBGE, que
pretende permitir uma investigação contínua sobre trabalho
e rendimento da população. Ela é o resultado da fusão de
duas pesquisas do Instituto, a Pesquisa Mensal de
Empregos e a Pesquisa Nacional por Amostra de
Domicílios [8].
O IBGE começou a testar a metodologia e o sistema, a
partir de outubro de 2009, nos estados do Pará,
Pernambuco, Rio de Janeiro, São Paulo, Rio Grande do Sul
e no Distrito Federal, prosseguindo com o teste, no ano de
2010, no Rio de Janeiro. Em 2011, a pesquisa será
oficialmente lançada em todo o País [9].
A PNAD Contínua é realizada a partir de uma amostra de
aproximadamente 179.000 domicílios e tem como núcleo
básico questões sobre trabalho e rendimento. Além disso,
vai investigar temas adicionais, como: educação de jovens e
adultos, migração, educação profissional, trabalho infantil,
fecundidade, mobilidade social, nupcialidade, saúde,
segurança alimentar, tecnologia da informação e
comunicação, transferências de renda e uso do tempo [8].
Para a sua coleta de dados, foram desenvolvidos sistemas
para PDA e sistemas de gerenciamento dos dados. Este
estudo de usabilidade analisou a facilidade de uso do
aplicativo desenvolvido para o dispositivo móvel com o
objetivo de gerar recomendações para torná-lo mais
eficiente e adequado, aprimorando a qualidade e a
satisfação na coleta de dados.
Figura 1 - Detalhes da interface do protótipo da PNAD
Contínua para dispositivo móvel, versão 1.0.9.
O método de avaliação de usabilidade aplicado no presente
trabalho, batizado por nós de entrevistas baseadas em
cenários e tarefas, procurou preservar as características
essenciais de um método científico, para emprestar
credibilidade às suas conclusões e à apresentação dos seus
resultados. Este método foi desenvolvido para atender às
condições e às peculiaridades do contexto do IBGE e já
havia sido experimentado anteriormente na avaliação da
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 199](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-205-320.jpg)
![usabilidade de um aplicativo para o Censo Demográfico
2010, tendo sido apresentado e discutido em comunicações
científicas anteriores [12].
A pesquisa, de caráter qualitativo, teve seis etapas: (a)
pesquisa bibliográfica e documental; (b) observações
etnográficas; (c) seleção da amostra de participantes; (d)
entrevistas baseadas em cenários e tarefas; (e) análise dos
resultados; (f) comunicação dos resultados.
Neste paper, serão apresentados os detalhes e alguns
resultados qualitativos reunidos durante a etapa de
“observações etnográficas”. Deixamos claro, entretanto,
que este termo proposto não deve ser confundido com a
aplicação tradicional do método etnográfico, tal como é
compreendido por outras disciplinas, como explicaremos a
seguir.
TÉCNICAS ETNOGRÁFICAS EM IHC
Segundo Cooper [3], etnografia é um termo tomado
emprestado da Antropologia que significa um estudo
imersivo e sistemático de culturas humanas. Segundo Burke
e Kirk [1], a etnografia não é um método, é mais
propriamente uma categoria de pesquisas em Interação
Humano-Computador.
Tendo sido adotada na Antropologia e na Sociologia, a
etnografia se baseia na observação de interações humanas
em um dado ambiente ou atividade social. Pode ser descrita
como a observação de pessoas em seu contexto cultural.
Uma cultura é formada por determinados valores, práticas,
relações e identificações. Deste modo, um ambiente de
trabalho (como um escritório ou uma fábrica) pode ser
descrito como uma cultura, pois é caracterizado por
padrões, práticas de negócios (formais ou informais), e por
relações entre colegas de trabalho e com os gerentes.
De acordo com os autores acima citados, há uma série de
razões pelas quais a etnografia passou a ser importante para
o projeto de interface. Essas razões são as seguintes:
1 - o estudo etnográfico é um meio poderoso de identificar
as necessidades do usuário e enxergar o sistema pelo olhar
do usuário.
2 - descobre a verdadeira natureza do trabalho realizado: é
muito comum os usuários desempenharem suas tarefas de
modo diferente daquilo que foi prescrito. No caso de uma
coleta de dados assistida por computador, por exemplo, nós
descobrimos que o estudo etnográfico poderá ser útil ao
evidenciar se os usuários enunciam as perguntas da
entrevista empregando linguagem informal ou popular, de
modo diverso do que é proposto no questionário eletrônico
oficial. Ou, ainda, será possível observar se desenvolvem
confiança no dispositivo, ou se freqüentemente procuram
realizar um bypass no seu funcionamento normal, com o
intuito de evitar lentidão, travamentos ou perda de
informações.
3 – outra vantagem do estudo etnográfico é que o
pesquisador obtém um alto grau de compreensão do usuário
e pode desempenhar o seu papel em sessões de projeto
participativo.
4 - a natureza aberta (não enviesada) da etnografia habilita
o registro de revelações surpreendentes sobre como o
sistema é utilizado no campo.
Como nos estudos sociológicos, os etnógrafos precisam
estar imersos na cultura do usuário para melhor entender o
que se passa em torno dele. Assim, os etnógrafos devem
olhar, participar e perguntar sobre as atividades do seu dia-
a-dia. Sob o ponto de vista do projeto, deve-se começar a
raciocinar como um usuário.
Se o objetivo da etnografia social é compreender como o
indivíduo ou grupo interage dentro de sua cultura, na
etnografia para o projeto de sistemas, por outro lado, o
objetivo é verificar como o sistema é realmente utilizado.
Visa a identificar problemas na maneira como é usado,
assim como os efeitos do sistema na cultura específica do
local de trabalho, para descobrir possibilidades de
desenvolvimento, dentro daquela atividade ou local.
Os métodos etnográficos podem descobrir fatos inusitados e
valiosos que jamais seriam identificados por métodos in
house. A maior parte dos dados do estudo etnográfico é
elicitado através de observação pessoal, entrevistas ou
gravações em áudio e vídeo. Seus resultados são
informações qualitativas como declarações, impressões,
opiniões e descrições do ambiente ou local.
Segundo Burke e Kirk [1], há termos empregados em IHC
que são praticamente sinônimos de etnografia como:
1 - estudos de campo: termo alternativamente utilizado no
sentido de etnografia;
2 - investigação contextual (contextual inquiry): método
ligeiramente mais específico, focado no modo de dirigir
perguntas ao usuário;
3 - estudo observacional: significa simplesmente olhar o
usuário em seu contexto de trabalho, sem dirigir-lhe
quaisquer perguntas;
4 - observação participante: focada em realizar as
atividades cotidianas de trabalho, lado a lado com o
usuário.
Para Cooper [3], estudos contextuais desenvolvidos no
processo do design de interação devem trazer o espírito da
pesquisa social etnográfica e aplicá-lo em um nível micro.
Em vez de tentar compreender comportamentos e rituais
sociais de uma cultura inteira, seu objetivo deve ser
compreender comportamentos e rituais de grupos de
pessoas que interagem com produtos específicos.
Hugh Beyer e Karen Holtzblatt (apud [3]) foram os
pioneiros na aplicação de uma técnica de “entrevistas
etnográficas”, a que eles denominaram contextual inquiry
(investigação contextual). Esta técnica se tornou
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 200](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-206-320.jpg)
![rapidamente uma referência na indústria de software. O seu
método foi baseado no modelo mestre-aprendiz, ou seja, o
entrevistador observava e fazia perguntas como se fosse um
principiante e o usuário, o seu mestre.
Os dois autores citados enumeraram quatro princípios
básicos que notabilizam o seu método etnográfico:
1 - Contexto: em vez de entrevistar usuários em uma sala
branca e asséptica, a observação e a interação devem se dar
no seu ambiente comum de trabalho, fornecendo o contexto
apropriado para o produto.
2 - Parceria: a entrevista deve ocorrer de modo a ser uma
exploração colaborativa com o usuário, alternando-se entre
a observação do trabalho e a discussão sobre a sua estrutura
e detalhes.
3-Interpretação: a maior parte do trabalho do pesquisador
será ler nas entrelinhas o que acontece a partir dos dados
reunidos sobre o comportamento dos usuários, o que eles
declaram e como se relacionam com o seu ambiente.
4-Foco: o designer deve sutilmente direcionar a entrevista
para captar dados relevantes ao projeto do software.
Cooper et al. [3] enumeram os seguintes melhoramentos
emprestados por sua equipe à técnica original da
investigação contextual de Beyer e Holtzblatt, visando a
maior eficiência na sua prática projetual:
- Encurtamento: a investigação contextual propõe
entrevistas de dia inteiro, mas Cooper considera suficiente
realizar entrevistas de campo com não mais que uma hora
de duração, com cerca de seis usuários bem-selecionados;
- Equipes enxutas: apesar de Beyer e Holtzblatt proporem
uma equipe grande, Cooper et al. sugerem ser mais eficaz
realizar observações, seqüencialmente, com uma equipe de
trabalho enxuta formada por duas ou três pessoas. Todos os
observadores devem interagir com os usuários além de
analisar e compilar os dados;
- Identificação de objetivos: a identificação e a priorização
dos objetivos dos usuários devem ser realizadas antes de
relacionadas as tarefas específicas;
- Pesquisar além do contexto corporativo: a “entrevista
etnográfica” pode buscar informações e ser aplicada
também fora do contexto corporativo.
Cooper et al. explicam que as suas “entrevistas
etnográficas” podem ser agrupadas de modo a refletir
diferentes fases cronológicas, com foco mais abrangente e
amplo, no início, passando a abordar funções e tarefas
específicas nas últimas etapas. Os stakeholders podem ser
acionados para agendar entrevistados adequados a cada fase
do ciclo de entrevistas.
Para Cooper, as regras básicas das “entrevistas
etnográficas” são: entrevistar no local onde a interação
acontece; evitar perguntas fixas; focar em objetivos
primeiro, só depois em tarefas; evitar transformar o usuário
em designer de interface; evitar discussões sobre
tecnologias; encorajar a contação de histórias; solicitar a
demonstração dos artefatos pelo usuário; não formular
perguntas que geram vieses nas respostas.
Após cada “entrevista etnográfica”, a equipe de projetistas
deve se reunir, comparar e discutir as observações,
verificando se questões levantadas pelas entrevistas
anteriores foram respondidas. As fotos e os vídeos devem
ser revisados e postados em um local público, como um
mural. Será útil utilizar esses dados na preparação da
estratégia a ser adotada durante as próximas observações.
ACOMPANHAMENTO DE TRABALHO DE CAMPO
Os autores agendaram acompanhamentos com equipes em
trabalhos de campo da PNAD Contínua, onde o dispositivo
móvel de coleta de dados pode ser observado em seu
contexto real de uso. O objetivo foi reconhecer os
problemas e compreender as dificuldades e as vantagens da
coleta de dados assistida pelo PDA e como o dispositivo
impacta o comportamento do entrevistador e do informante.
Para compreender melhor como o entrevistador da PNAD
Contínua realiza seu trabalho, os autores acompanharam
três equipes do IBGE em entrevistas domiciliares reais da
pesquisa.
Em primeiro lugar, participaram de uma visita de campo no
bairro do Leblon. Em seguida, acompanharam uma equipe
de trabalho do IBGE em diversos bairros no subúrbio
carioca (Encantado, Piedade, Bonsucesso e Higienópolis).
Em outra ocasião, os autores realizaram visita a uma
agência de coleta. Depois disso, foi empreendida visita de
campo a Tanguá (figura 2), no interior do Estado do Rio de
Janeiro, uma área com características rurais.
Figura 2 - Registro de observações etnográficas:
entrevistador aborda um domicílio selecionado em Tanguá,
setor com características rurais no Estado do Rio de Janeiro.
As nossas observações etnográficas realizadas durante o
acompanhamento dessas equipes no campo foram
registradas em imagens, entrevistas em áudio e vídeo, e
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 201](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-207-320.jpg)
![anotações, apresentando a visão do usuário sobre a
interação com o dispositivo móvel no campo.
Como conclusão mais evidente dos acompanhamentos em
contexto de uso, percebeu-se a importância da usabilidade
na construção de aplicativos para os PDAs. Tais
equipamentos possuem limitações físicas, como telas e
teclados reduzidos. A navegação intuitiva e a identificação
eficiente de conteúdos textuais são necessidades absolutas
em dispositivos móveis em situação de pesquisa.
Em geral, usuários em ambientes fixos concentram-se
melhor enquanto que, em ambientes móveis, tendem a se
distrair em função de atividades que acontecem no
ambiente [10].
Os autores do artigo puderam verificar que, como são
utilizados em ambientes externos, os PDAs precisam
suportar condições ambientais adversas (calor, frio,
umidade, seca, luz natural e artificial), dependendo do local
de uso. Concordamos com Simões et al. [11] que o público-
alvo é um desafio, pois o trabalho de campo é realizado
com milhares de pessoas de variados perfis e localizações
geográficas.
A mobilidade impõe limites físicos, visuais e cognitivos ao
usuário [2]. Somam-se a estes fatores a dificuldade de
acesso a domicílios (áreas de alto risco, distantes ou rurais,
em condomínios classe média alta), onde cada vez mais o
informante tem restrições de receber o entrevistador. Para
registrar tais dificuldades, os autores reuniram relatos dos
entrevistadores sobre o uso do dispositivo móvel no
ambiente externo, apontando seus problemas.
O contraste de cores da tela do PDA com a luz solar foi o
problema mais citado nestes relatos: os pesquisadores
fotografaram o dispositivo sob a incidência da luz do sol e
puderam comprovar a gravidade desse problema, que
impede a leitura do questionário (figura 3).
Figura 3 - O dispositivo da PNAD Contínua sob a
incidência da luz solar: legibilidade prejudicada.
RELATÓRIOS DE OBSERVAÇÕES
Nos três textos a seguir, apresentamos partes selecionadas
dos relatórios elaborados pelos autores a partir das
observações etnográficas relacionadas à fase de testes da
pesquisa PNAD Contínua. Os textos representam sínteses
gerais das observações dos pesquisadores; todos os nomes
de indivíduos citados foram alterados para preservação de
privacidade.
Relatório de Trabalho de Campo no Leblon
Numa ensolarada tarde de outono, fomos acompanhar o
trabalho de campo de um dos entrevistadores da pesquisa
PNAD Contínua, no Leblon, um bairro nobre da zona sul
do Rio de Janeiro.
Estávamos em campo eu, Manuela, que trabalha junto à
Diretoria de Informática e integra a da equipe de
desenvolvimento do aplicativo do PDA, Roberto, um
supervisor da pesquisa, responsável pela área, e Reinaldo,
o entrevistador destacado para acompanharmos, que iria,
nesse dia, trabalhar numa rua do alto Leblon.
Esta área apresenta a característica de possuir muitos
edifícios residenciais de famílias de classe média alta que,
não raro, moram em grandes apartamentos ou em
coberturas de luxo.
Após cerca de dez tentativas infrutíferas de abrir domicílios
para aplicar o questionário da PNAD Contínua, finalmente
conseguimos entrar em uma residência a ser pesquisada. O
supervisor Reinaldo ficou nos aguardando na portaria e
subimos pelo elevador até uma das coberturas, onde fomos
recebidos por dona Marlene, que estava em casa
acompanhada da empregada. Reinaldo apresentou-me e a
Manuela como supervisores e perguntou se poderíamos
acompanhar a entrevista, no que obtivemos a anuência da
dona da casa, embora não sem demonstrar certa surpresa
quanto ao número de pessoas a entrar em sua casa.
Ao entrarmos, dona Marlene nos encaminhou para uma
ampla varanda, decorada com vasos de plantas e muito
bom gosto, onde havia dois sofás, cadeiras e uma mesa de
centro. Reinaldo sentou-se no local indicado pela
entrevistada, mas logo foi forçado a reacomodar-se devido
à luminosidade solar que incidia sobre o seu PDA,
impedindo a visibilidade de sua operação.
A entrevista iniciou-se às 11h25min e terminou por volta
das 12h25min. Durante a observação da entrevista e do uso
do dispositivo de mão, eu e Manuela pudemos registrar por
escrito diversos detalhes da interação com o informante.
A maior parte das perguntas dirigidas à entrevistada foi
enunciada de modo informal. Observamos que o
entrevistador (considerado pela chefia um dos seus
melhores funcionários) adaptou, à sua maneira, as
perguntas que a pesquisa apresentava na tela do PDA,
empregando linguagem bastante coloquial. Tal estratégia
contribuiu para descontrair a entrevista, aproximando-a de
uma conversação comum.
A entrevistada passou a conversar em tom informal com o
entrevistador, dando mais detalhes do que o que estava
sendo estritamente perguntado. Isso gerou a necessidade de
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 202](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-208-320.jpg)


![aparentando ter uns quarenta anos. Mais tarde, revelou ser
lavrador.
Ubiratan buscou uma sombra na varanda, sentando-se na
sua mureta, tendo sido acompanhado pelo dono da casa.
Após solicitar e beber um copo d’água, ele ligou o seu
PDA, começou a usá-lo silenciosamente; o informante
estava com paciência e, ao mesmo tempo, mostrava
curiosidade, esperando pelas perguntas. A entrevista
começou por volta de 12:15h.
Ubiratan foi empregando palavras simples e assim
conseguiu ganhar a confiança do informante para obter os
dados que precisava.
O informante ficou um pouco envergonhado ao falar o
quanto ganhava por mês. Disse que era lavrador, mas que
muitas vezes não ganhava nada porque perdia toda a
lavoura. Ele respondeu com educação a todas as
perguntas, mas não compreendeu aquela que indagava se
ele gostaria de trabalhar mais horas.
Ubiratan gastou um tempo explicando o propósito desta
pergunta para o homem, mas ele não conseguiu entender.
Gláucio também tentou explicar, mas ele e a esposa
continuaram com dúvidas. Como iria alguém querer
trabalhar mais se já trabalhava tanto?
Na hora de responder ao questionário relativo à sua
esposa, o lavrador a chamou para ajudar. Ela disse que
voltou a estudar à noite e que ia de bicicleta para a escola.
Era empregada doméstica; ganhava cerca de R$ 350,00
por mês. Ubiratan não perguntou quem era o responsável
pelo domicílio, por isto, não sabemos se ele apontou o
lavrador ou a esposa. Enquanto ocorria a entrevista, eu e
Carlos íamos registrando nossas observações por escrito.
Percebemos que as pessoas eram simples, mas educadas e
não cometiam muitos erros de linguagem. Um segundo
homem de meia idade que não se identificou e a filha do
casal, de cerca de uns dez anos, uniram-se ao grupo da
varanda, demonstrando curiosidade. No quintal da casa,
circulavam galinhas e patos e o galo cantava. Pareceu-nos
que a família consumia quase tudo o que plantava.
A entrevista durou cerca de 45 minutos. Nos despedimos,
tiramos fotos e fomos embora. Respondendo a uma
indagação de Carlos, Ubiratan disse no carro que as
últimas alterações realizadas no PDA, sugeridas pelos
estudos de usabilidade, melhoraram a interação e que o
novo teclado virtual havia ficado bem melhor.
PARA EFEITO DE CONCLUSÃO
O presente artigo apresentou a parte exploratória do método
de observações envolvendo usuários, para avaliação de
usabilidade de um dispositivo móvel de coleta de dados de
entrevistas domiciliares, com ênfase em técnicas de
observações etnográficas. Ele foi desenvolvido para ser
aplicado junto aos entrevistadores que utilizaram PDAs
durante a versão experimental da Pesquisa Nacional por
Amostra de Domicílios Contínua (PNAD Contínua).
O método de avaliação apresentou essencialmente duas
etapas: a primeira consistiu em acompanhar os usuários do
PDA em seu contexto de uso no campo (“observações
etnográficas”), e a segunda envolveu gravações e registros
sistemáticos de tarefas realizadas enquanto os usuários
interagiam com o PDA em um laboratório de usabilidade
portátil.
A segunda etapa do método foi discutida em outras
comunicações científicas [12], ficando o presente texto
reservado especificamente à apresentação de detalhes e
resultados qualitativos das observações etnográficas do
trabalho do usuário no campo.
O impacto desse tipo de entrevista apoiada por computador
na qualidade dos dados tem sido avaliado sistematicamente
por institutos de pesquisas de outros países. Sua principal
característica é que as perguntas são orientadas pelo sistema
na ordem correta, seguindo um algoritmo disponibilizado
em um programa interativo apresentado na tela do
computador. As respostas são inseridas diretamente, neste
computador, com dados digitados pelo entrevistador ou
pelo entrevistado.
Como foi visto, a etapa exploratória do trabalho incluiu
procedimentos de observação em campo inspiradas nas
técnicas da pesquisa etnográfica incorporada à IHC. Tendo
sido adotada na Antropologia e na Sociologia, o estudo
etnográfico se baseia na observação de interações humanas
em um dado ambiente de trabalho ou em uma atividade
social.
A nossa experiência demonstrou que a observação
etnográfica, tal como proposta, pode ser considerada muito
importante para o projeto de interface, pois este tipo de
estudo habilita o projetista a enxergar o sistema pelo olhar
do usuário, revelando a natureza real e não idealizada do
trabalho.
Uma série de conclusões foi obtida dos resultados dessas
observações, muitas das quais revelaram dados
surpreendentes ou inusitados. A mobilidade impõe limites
físicos, visuais e cognitivos ao usuário. Para registrar tais
dificuldades, os autores reuniram relatos de entrevistadores
sobre o uso do PDA no ambiente externo, apontando seus
principais problemas.
O contraste de cores da tela do dispositivo com a luz solar
foi um dos problemas mais citados nestes relatos: os
pesquisadores puderam conferir, na prática, a gravidade
deste evento que impacta seriamente a legibilidade do texto
das perguntas do questionário.
Somou-se a esses fatores a dificuldade de acesso a
domicílios que podem estar em áreas de risco, rurais, ou
distantes. No caso de condomínios classe média alta, cada
vez mais o informante impõe restrições de diversas ordens
para receber o entrevistador.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 205](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-211-320.jpg)
![Nas observações etnográficas que realizamos ficou também
evidente que o entrevistador - não raramente - realiza suas
tarefas de modo diverso ao que lhe foi prescrito no
treinamento. Por exemplo, utiliza linguagem coloquial e
popular para formular as perguntas, em vez de lê-las
formalmente, e inverte a ordem das questões propostas pelo
software de questionário eletrônico, com o objetivo de
reduzir a duração da entrevista, ou torná-la menos
entediante e mais natural para o entrevistado.
Evidências reunidas nos estudos de campo embasaram e
reforçaram conclusões obtidas nos testes com o emprego de
laboratório de usabilidade portátil, em ambiente semi-
controlado, paralelamente realizados. Isto nos permite
afirmar que as duas técnicas têm grande potencial quando
são aplicadas de modo complementar.
Na fase de comunicação dos resultados, as conclusões do
estudo, assim como as recomendações técnicas para a
solução de problemas de usabilidade, foram repassadas para
a equipe de desenvolvimento do software visando
implementações e correções técnicas.
Além de artigos científicos, as conclusões do presente
estudo foram apresentadas em seminário para outras
equipes internas, visando a disseminar e institucionalizar o
emprego da metodologia de avaliação de usabilidade em
dispositivos móveis, com o objetivo de contribuir para
tornar mais eficientes e seguros os processos de coleta de
dados estatísticos.
REFERÊNCIAS
1. Burke, J.; Kirk, A. Choosing Human-Computer
Interaction (HCI) Appropriate Research Methods –
Ethnographic Methods [online]. Disponível em:
http://otal.umd.edu/hci-rm/ethno.html Acesso em:
14/06/2010.
2. Burzagli, L., Billi, M., Palchetti, E., Catarci, T.,
Santucci, G., Bertini, E. Accessibility and Usability
Evaluation of MAIS Designer: A New Design Tool for
Mobile Services. Universal Access in HCI, Part II, HCII
2007, LNCS 4555, pp. 275–284, 2007.
3. Cooper, A.; Reimann, R.; Cronin, D. About Face 3: The
Essentials of Interaction Design. Indianapolis, IN; Wiley
Publishing, Inc., 2007.
4. Dias, C. Usabilidade na Web: criando portais mais
acessíveis. 2ªEd., R.J, Alta Books, 2007.
5. Greene, P.D. Handheld computers as tools for writing
and managing field data. Field Methods, 13(2):181-197.
2001. Disponível em: http://fmx.sagepub.com/content/
13/2/181. Acesso em: 02 de setembro de 2010.
6. Leal Ferreira, S.B., Nunes, R. e-Usabilidade, Rio de
Janeiro, LTC, 2007.
7. Leeuw, E.D.; Hox, J.J.; Snijkers, G. The effect of
computer-assisted interviewing on data quality. A
review. Pp. 173-198 in B. Blyth (ed.) Market Research
and Information Technology. ESOMAR Monogaph.
Amsterdam: Esomar. 1998. Disponível em:
http://igitur-archive.library.uu.nl/dissertations/2006-
1024-200101/c3.pdf. Acesso em: 02 de setembro de
2010.
8. IBGE - Instituto Brasileiro de Geografia e Estatística.
Quinto Fórum do Sistema Integrado de Pesquisas
Domiciliares por Amostragem. Disponível em:
http://www.ibge.gov.br/home/estatistica/indicadores/si
pd/quinto_forum/PNAD_Continua_Questionario.pdf.
Acesso em: 15/12/2008.
9. Leitão, M. Brasil terá um retrato da nova dinâmica do
trabalho. Disponível em: http://oglobo.globo.com
/economia/miriam/posts/2009/08/05/brasil-tera-um-
retrato-da-nova-dinamica-do-trabalho-211361.asp.
Acesso em: 29/03/2010.
10.Loureiro, A. A. F. et al. Comunicação Sem Fio e
Computação Móvel: Tecnologias, Desafios e
Oportunidades. Minicurso apresentado no Congresso da
Sociedade Brasileira de Computação. Campinas, SP.
Ago. 2003. Disponível em: http://homepages.dcc.
ufmg.br/~loureiro/cm/docs/jai03.pdf. Acesso em:
11/06/2008.
11.Simões, et al. Experiência: Coleta de dados por
computadores de mão para censos de proporções
continentais. Concurso Inovação na Gestão Pública
Federal. Disponível em: http://inovacao.enap.gov.br/
index.php?option=com_docmantask=doc_viewgid=
277. Acesso em: 11/06/2009.
12.Tavares, P.; Agner, L.; Leal Ferreira, S. B. Avaliação de
Usabilidade de Dispositivos Móveis de Coleta de Dados
Domiciliares Através de Entrevistas Baseadas em
Cenários e Tarefas. IHC 2010 – IX Simpósio Sobre
Fatores Humanos em Sistemas Computacionais.
October 5-8, 2010, Belo Horizonte, MG, Brasil.
NOTAS
Os autores agradecem aos apoios das equipes da Unidade Estadual do IBGE do Rio de Janeiro, da CODES (Diretoria de
Informática) e da Diretoria Executiva do IBGE, sem os quais esta pesquisa não teria sido possível. As opiniões emitidas neste
artigo são de exclusiva e inteira responsabilidade dos autores, não exprimindo, necessariamente, o ponto de vista do IBGE.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 206](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-212-320.jpg)
![Metodologia Projetual no Ensino de Design Digital Interativo
Paula Rigo Tramujas – Universidade Positivo /
EMBAP
Luciane Hilú – PUCPR / Universidade Positivo
RESUMO
Este presente artigo tem por objetivo apontar algumas
teorias de metodologia utilizadas para o ensino de design
em universidades, discutindo sua aplicabilidade ao universo
do design digital interativo e traçando um comparativo com
a metodologia usada na prática em uma empresa de design
americana – IDEO. Tendo este aporte teórico-comparativo
questionar-se pela possibilidade de incorporação desta no
âmbito de ensino de universitário design.
Palavras-chave do autor
Metodologia, design, ensino, universidade.
Palavras-chave de Classificação ACM
D.2.2 Methodologies: D.2.10 Design
INTRODUÇÃO
Para evidenciar a ligação íntima entre o processo de
desenvolvimento de produtos de design com o tema
metodologia, e discutir sobre os parâmetros metodológicos
necessários de serem cobertos no ensino projetual de design
digital, busca-se neste texto trazer a tona alguns conceitos
essenciais que evocam esta ligação e que podem
proporcionar o vislumbre de um caminho para a construção
do ensino neste âmbito. Com isto objetiva-se delinear
concepções específicas de metodologia para aplicação no
ensino de design digital.
Historicamente, a cada evolução do processo de
desenvolvimento de um produto, verifica-se que o design,
independente da natureza do produto que gera, como
qualquer área do conhecimento científico, sempre
demandou aporte a teorias capazes de embasar sua
produção, seus métodos de projetação e possibilitar
familiaridade com as situações de contextualização nas
quais é utilizado. Sendo assim, a aproximação da
metodologia com o design é resultado da necessidade
constante de se estabelecer um método específico para esta
área, a partir da análise dos já existentes, que possa dar
conta do desenvolvimento de um projeto específico.
Vários autores defendem a existência uma prática projetual
de design permeada por uma metodologia sinequanon, onde
as idéias são pesadas juntamente com os requisitos e
restrições inerentes ao produto a ser executado e ao
problema a ser solucionado, e são geradas e selecionadas
alternativas de solução, de forma crítica.
Desta forma, ter um projeto e uma metodologia de trabalho
bem desenvolvidos e estruturados se tornou um requisito
fundamental para o design alcançar seus objetivos. O
produto final de design se torna, pois, o resultado lógico de
um projeto que envolve métodos que visam atender à
proposta de resolver da melhor maneira todos os
componentes de um dado problema.
Porém, questiona-se se as metodologias desenvolvidas e
utilizadas como base teórica para ensino nas universidades
de design, já discutidas e sedimentadas na academia, são
passíveis de dar conta das necessidades atuais de
desenvolvimento de produtos nesta área, que envolve
atualmente outros níveis de problemática e de construção,
como o caso do design digital, que envolve desde produtos
de natureza estática quanto em movimento, incorporando
por muitas vezes o elemento interação, que traz toda
especificidade ao pensar “fazer design” atual.
“Y es que la tecnologia está permitiendo poner en
marcha planteamientos educativos que intentan
romper con las barreras establecidas por las
instituciones dedicadas e instruir a los futuros
diseñadores, en general demasiado rígidas y no
adaptadas a la realidad de los nuevos medios” [5]
ENSINO DE METODOLOGIA NOS CURSOS DE DESIGN
No âmbito universitário, tanto professor quanto o aluno
precisam utilizar algum tipo de metodologia para a solução
de seus problemas: ao professor cabe o ensino de uma
metodologia para ajudar a nortear este aluno que, para
aprender e evoluir, precisa de um caminho; ao aluno cabe a
aplicação de um método transmitido por meio do professor
em situações onde seja requisitada uma solução de
problema, que se utiliza de uma metodologia de ensino
parametrizada e aprovada pela universidade.
Especificamente na área do Design, onde as soluções de
problemas se concentram na atividade projetual, o aluno, ao
formar-se na universidade e entrar no mercado de trabalho,
de posse do conhecimento de tais metodologias poderá ou
não aplicar aquela ensinada pelo professor para atuar em
sua área de conhecimento. Com o tempo se utilizará de um
método próprio, que deverá ser influenciado pelas
referências que teve ao longo do aprendizado e experiência
no ensino superior.
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA.
Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
1
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 207](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-213-320.jpg)
![Neste sentido é imprescindível a discussão de quais
metodologias ou quais elementos metodológicos deverão
ser apresentados a este aluno durante sua permanência na
Universidade a fim de formar-lhe um arcabouço
teórico/prático e uma formação basilar de consistência para
o desenvolvimento futuro de suas particularidades no seu
próprio processo de desenvolvimento projetual.
Discussões acerca desta temática são comuns e recorrentes
ao longo da história do ensino de design, desde a Escola de
Ulm. A adoção, a partir destas discussões, de métodos
específicos na área de design é, pois, uma prática já
estabelecida. A própria história do “fazer design” ao longo
do último século, aliada à complexidade crescente de
fatores envolvidos nos projetos desta natureza passou a não
permitir mais que seu desenvolvimento se fundamentasse
apenas na intuição ou na experiência adquirida,
principalmente com o crescente desenvolvimento de nichos
de design específicos e particularizados, como o design
gráfico, o de produto e afins.
Consolidou-se, pois, um consenso geral de que, no ato
criativo de qualquer produto de design, a aplicação de
processos metodológicos é essencial para a produção de
resultados coerentes com as necessidades e expectativas
aventadas, especialmente na busca de soluções de
problemas determinados.
Estendendo as concepções de aplicação de metodologia
como item relevante na solução de problemas buscando um
alto nível criativo, verifica-se que a tendência para a
objetivação das atividades criativas se alimenta do anseio
do uso de uma metodologia que possa automaticamente
conduzir a resultados originais e perfeitos, servindo de base
primordial, mas não de verdade absoluta. Nota-se desta
forma que a criação denota em si o gérmen do saber fazer,
que é compreendido também por meio de métodos
aplicados que devem ser repassados para os estudantes na
academia como forma de estímulo à criatividade e
inovação.
Aliando estes aspectos, firmando a necessidade do ensino
da aplicação de métodos no projeto de design, a fim de
dotar os alunos de capacidade de produzir produtos que
atendam às expectativas e necessidades, e que o façam de
uma forma a criá-los originais e criativos, as discussões
teóricas que tiveram lugar ao longo do século XX sobre
design e ensino de design levaram ao estabelecimento de
“caminhos projetuais” mais ou menos similares entre si,
compostos freqüentemente por etapas lineares também
similares e concordantes:
“design é transformar objetivos em objetos. Isso
implica um processo de trabalho que, seja curto ou
longo, se desenvolve com começo, meio e fim:
abrange as etapas de Levantamento / Estudos /
Anteprojeto / Projeto executivo. Quando não é
assim, quando é instantâneo, não é design [...]. O
processo de desenvolvimento do projeto define,
portanto, a própria natureza do design.” [1]
Segundo a concepção geral de produção de design e sua
decorrente aplicação ao ensino, pode-se verificar, pois a
possibilidade de organizar o processo projetual em três
macro etapas, derivadas da observância da proposta
seqüencial de Começo, Meio e Fim de um projeto,
refletidas nos termos gerais: Problema, Projeto e
Realização.
Inúmeras discussões acadêmicas sobre a construção de
teorias metodológicas baseadas nestes três termos tiveram
lugar. O diferencial entre elas se encontra basicamente nas
suas subdivisões ou processos que comportam, sendo que
cada teórico aponta um número de ações e natureza das
mesmas variadas em cada uma destas etapas, segundo o
foco do produto ou da filosofia projetual utilizada.
Amplamente discutidas, estas etapas são valiosas para o
desenvolvimento de produtos de natureza já estabelecida e
de domínio do âmbito do design e devem ser repassadas no
ensino do design na academia. A questão é se, dentro destas
etapas, as suas subdivisões, ou seus enfoques internos,
explicitadas nas teorias particulares, são suficientes para dar
conta da demanda de soluções digitais interativas.
Alerta-se que a cada dia surgem novas demandas de
produção de design em produtos digitais interativos
complexos, que acabam por demandar também
procedimentos de trabalho, pesquisa e desenvolvimento de
design que devem atender necessidades específicas
projetuais e que solicitam do designer um incremento nos
procedimentos das etapas citadas.
Nesta perspectiva busca-se compreender estas
especificidades projetuais e, por meio de um mapeamento
das teorias já existentes e aplicadas no universo de design,
apontar um possível caminho de construção metodológica
que dê conta desta nova ordem.
CAMINHOS METODOLÓGICOS
Apontada a necessidade do ensino metodológico projetual
nos curso de design e a necessidade de se buscar uma
adequação à demanda de design digital atual, deve-se
esclarecer quais teorias tem sido utilizadas e como podemos
atualizá-las para as necessidades de solucionamento de
problemáticas atuais voltadas ao âmbito digital.
A priori faz-se necessário mapear o âmbito da metodologia
em termos mais gerais e amplos, a fim de verificar qual
linha mais se adéqua ao ensino de projetos de design e,
posteriormente, levantar alguns teóricos desta mesma que
podem ser utilizados como parâmetros para mapeamento e
construção de uma metodologia mais voltada para a
atualidade.
Algumas teorias já estabelecidas podem ser citadas como
exemplos para aplicação em disciplinas de metodologia do
design nas universidades. A primeira linha versa sobre as
derivadas do método cartesiano, desenvolvido por René
Descartes (1637), e que se apóia sucintamente na idéia de
que o todo pode ser dividido em partes para uma melhor
2
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 208](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-214-320.jpg)

![certas configurações basilares. O método é passível de
modificações ao longo do processo, caso outros valores
objetivos sejam encontrados que o melhorem, mas se apóia
em pontos importantes sedimentados a serem observados. A
constante evolução e adequação verificada advêm, muitas
vezes não só do objeto de design específico a ser projetado,
ou da situação de projeto encontrada, mas da criatividade
do designer, que aplica sua própria personalidade à sua
maneira de projetar.
Esta conformação metodológica é a atualmente mais
comumentemente ensinada nas escolas de design,
direcionadas ou adequadas mais ou menos segundo a
natureza do produto a ser desenvolvido, seja ele gráfico ou
de produto.
DESIGN DE INTERAÇÃO/CENTRADO NO USUÁRIO
Porém, o universo digital trouxe novas demandas
projetuais, os produtos pedindo por um pensamento
projetual que desse conta das disparidades de percepção
próprias do meio, necessitando de uma nova forma de
pensar o design e sua metodologia. O enfoque desta nova
postura é por um design mais interativo e interdisciplinar.
As metodologias sedimentadas na academia que
compartilham uma maneira lógica e seqüencial de se
projetar um produto, baseadas em um método lógico e
racional, se demonstram não adequadas ao universo
projetual atual interativo e interdisciplinar, não podendo ser
simplistas como não o é qualquer processo relacionado com
o comportamento humano. Esta constatação foi levantada já
antes do advento do design digital, por meados da década
de 1970, quando se verificou que os métodos racionais de
design proporcionavam segurança, reduzindo margens de
erros, mas reduziam também as possibilidades de soluções
em consonância com a necessidade cultural e simbólica do
usuário, além de estarem distantes de uma prática real de
projeto. O discurso de uma metodologia única se esvaiu
com esta constatação, o que permitiu que todas as formas
de projetar fossem tidas como válidas, cada qual aplicável a
um universo de projeto em particular [7].
Porém, se a racionalidade dos métodos no inicio do século
XX foram inadequados às novas necessidades de projeto de
design digital interativo, de alguma maneira se encontra
uma volta à ela mesma, porém de uma outra forma por
meio da inclusão forte do usuário no processo de
desenvolvimento.
Apesar de já existir nas primeiras discussões sobre
metodologia de design a preocupação com o usuário,
verifica-se que atualmente, a produção de design, tem
voltado seu foco para este elemento central, com uma
ênfase maior, explicitando esta ser necessária à produção de
produtos que possam efetivamente ser adequados e usáveis
em todas as suas possibilidades.
Coelho [1], citando Gui Bonsiepe, afirma que um designer
cria formas para atender às necessidades do homem. E que
para atender tais necessidades é preciso estabelecer formas
de conhecer este homem e seu entorno. Por outro lado, o
design de interação, que busca desenvolver produtos
interativos que sejam utilizáveis, ou seja, fáceis de
aprender, eficazes no uso, que proporcionem ao usuário
uma experiência agradável [8] apregoa um conhecimento
amplo do homem-usuário e o do seu entorno.
Enriquecendo a proposta de uma metodologia mais
adequada ao design interativo, Preece, Rogers e Sharp [8]
defendem que o processo de design de interação pode ser
dividido em quatro etapas essenciais e básicas: 1)
identificação das necessidades e estabelecimento de
requisitos, que pode ser compreendida como espelho da
macro fase “Problema” dos teóricos consagrados do século
XX; 2) desenvolvimento de designs alternativos que
preencham estes requisitos, que pode ser incorporada na
macro etapa do “projeto”, 3) construção de versões
interativas dos designs de maneira que possam ser
comunicados a analisados, também incorporada na macro
etapa de “projeto” e 4) avaliação do que está sendo
construído durante o processo. Esta última poderia ser
incorporada em um ou outro autor na etapa de “realização”,
porém, sua característica de empregabilidade não linear ou
seqüencial, a coloca como um termo extra sem
comparativos ou paralelos nas metodologias sedimentadas
do século XX.
Além das etapas básicas, segundo as autoras citadas, o
design de interação deve preencher três características
básicas: 1) os usuários devem estar envolvidos no
desenvolvimento do projeto; 2) a usabilidade específica e as
metas decorrentes da experiência do usuário devem ser
identificadas, claramente documentadas e acordadas no
início do projeto; 3) a iteração em todas as quatro atividades
é inevitável.
Traçando um paralelo das concepções do design de
interação neste aspecto com as metodologias apontadas,
verifica-se um fraco foco nestes três itens, o que claramente
expõe a fragilidade do ensino das mesmas para o aluno de
design digital.
Verifica-se, pois, uma lacuna teórica na construção de
metodologias claramente identificadas no meio acadêmico
que possam ser ensinadas para o estudante de design digital.
Com esta carência acadêmica, busca-se encontrar
manancial em outra área, especificamente a mercadológica,
verificando quais empresas tem tido sucesso no
desenvolvimento de produtos de design com estas
características e se estas possuem uma metodologia clara de
projeto.
Dentre as diversas experiências de empresas que optam por
adotar o design de interação sob a formatação apontada e
que tem uma metodologia claramente definida, pode-se
citar a IDEO, cuja marca particular sempre foi a inovação
em produtos de design e o design centrado no usuário,
filosofia que coloca o usuário no centro de todo o processo
d desenvolvimento de um produto, ou seja, os objetivos do
produto, seu contexto de uso e todos os aspectos das tarefas
4
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 210](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-216-320.jpg)
![que o produto irá suportar são derivados a partir da
perspectiva do usuário.
METODOLOGIAS MERCADOLÓGICAS DE DESIGN –
IDEO
“solo o equilíbrio entre las emociones y la
racionalidad de la ciencia, entre un hacer prático y
un saber bien afirmado, puede realmente
ayudarnos”.[7]
Com esta frase, Edward Schrincker abre a perspectiva para
a proposta de trazer para o ensino da metodologia de
design, conhecimentos tirados de prática in loco.
Com esta abertura, ao verificar a práxis do projeto de
design no mercado de trabalho, podem-se encontrar
metodologias que trazem em si a criatividade própria e
particular, que, confrontadas e aliadas às metodologias já
sedimentadas de teóricos da área, podem servir de espelho
para a evolução de uma teoria metodológica passível de ser
aplicada no ensino do projeto do design em suas
configurações atuais.
Cabe relembrar que as teorias sedimentadas da área de
design foram também espelhadas em teorias de outra
ordem, e, com a análise crítica efetuada pelos teóricos,
puderam se conformar e adequar-se à produção de design.
A mescla das teorias ou de etapas trazidas de outra ordem
então é possível, desde que resulte em maior ganho para o
projeto naquela determinada etapa do processo.
Diante deste cenário e da complexidade dos atuais projetos
de design, busca-se responder a questão de como
instrumentalizar o aluno e desenvolver nele habilidades que
lhe permitam atuar de maneira adequada em projetos de
design no mercado de trabalho? Como criar um ambiente
mobilizador e gerador de conhecimentos, transformando as
aulas de projeto em um laboratório de ideias? Os alunos
precisam de fundamentação teórica para então “fazer
design” [6].
Ao observar grandes escritórios ou empresas de design
mundiais, verifica-se a grande aceitabilidade e relevância
que a empresa IDEO tem no mercado, justamente por sua
maneira peculiar de resolver problemas, utilizando para tal
o design.
A IDEO é uma consultoria de design e inovação localizada
em Palo Alto (EUA) com escritórios na Inglaterra,
Alemanha e China. É uma das referências mundiais em
inovação e design, voltada a desenvolvimento de produtos,
serviços e experiências digitais, sendo que a sua própria
estrutura organizacional esta permeada por um alto grau de
inovação.
Seu foco consiste em poder inovar em todas as propostas de
solução de problemas por meio do design, advindo do
reconhecimento da inovação como ponto central das
estratégias e iniciativas corporativas. Verificou uma grande
sede das empresas do mercado por conhecimento,
especialização, metodologias e práticas de atuação em torno
da inovação e, com base nesta premissa, discutiu e
desenvolveu uma metodologia que possibilitasse o
incremento da inovação para atender às necessidades das
empresas. Esta foi elaborada por meio da sua própria
experiência direta e imediata, adquirida por meio da
aplicação prática e cases de sucesso sendo extremamente
bem desenvolvida e continuamente aprimorada, o que faz
com esteja sempre em consonância com as necessidades
vigentes. Seu pensamento reside na idéia de que o seu
sucesso não advém somente do que se faz, mas como se faz.
Suas conquistas no âmbito do design são, freqüente e
amplamente, associadas a metodologias e ferramentas
específicas desenvolvidas e aplicadas em seus escritórios,
se tornando tão sedimentadas internamente que passaram a
serem passíveis de utilização em outros contextos. Neste
plano, a empresa passou a prestar consultoria para áreas e
empresas além do design, explicitando os métodos de
trabalho para atingir objetivos inovadores e adequados ao
cenário atual.
“Há pouco tempo, conforme a fama da IDEO ia se
espalhando cada vez mais rápida e intensamente, a
empresa recebeu clientes implorando por
conselhos, não apenas para um ou dois produtos,
mas no modo de inovar. A IDEO respondeu a
altura. Boa notícia para os leitores. Isso significa
que a metodologia não funciona apenas para a
IDEO – pode ser aplicada em outras
organizações.” [2]
Tendo por base estas assertivas, buscam-se na metodologia
desenvolvida pela IDEO, alguns métodos ou ferramentas
que possam ser incluídos no ensino acadêmico do design, a
fim de construir um profissional mais próximo às
tendências e necessidades reais de mercado.
“Vagamente descrita, essa metodologia tem cinco
etapas básicas:
1.Compreender o mercado, o cliente, a tecnologia
e as limitações identificadas do problema. [...]
2.Observar pessoas reais em situações de vida real
para descobrir o que modifica o comportamento: o
que as confunde, do que gostam, o que detestam,
onde tem necessidades latentes não atendidas pelos
produtos e serviços atuais. {...}
3.Visualizar conceitos novos para o mundo e para
os clientes que os usarão. [...]
4.Avaliar e aprimorar os protótipos numa série de
interações rápidas [...] nenhuma idéias é tão boa
que não possa ser aperfeiçoada [...]. Obtemos as
opiniões de nossa equipe interna, da equipe do
cliente, de pessoas bem informadas não
diretamente envolvidas no projeto e de pessoas
que constituem o mercado-alvo.[...]
5.Implementar o novo conceito para
comercialização. [...]”
5
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 211](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-217-320.jpg)
![Temos demonstrado que essa metodologia
ilusoriamente simples funciona para tudo, desde a
criação de simples brinquedos infantis até o
lançamento de empresas de comércio eletrônico.”
[2]
Ou seja, se baseia nas seguintes premissas: Observação,
Brainstorming, Prototipação Rápida, Refinamento e
Implementação.
Análise da metodologia IDEO
Traçando um paralelo entre as premissas colocadas pelo
IDEO considerando-as como sendo processos que podem
ser incluídos em macro etapas, verifica-se que a
metodologia desenvolvida pela empresa compartilha das
fases primordiais verificadas nas teorias acadêmicas de
design, abarcando as três fases básicas: – PROBLEMA –
PROJETO – REALIZAÇÃO, o que reafirma a validade de
se pensar neste três termos em projeto de design de
qualquer natureza (Ver Tabela 3 no final do documento).
No detalhamento dos processos internos a cada etapa ou
premissa (Ver Tabela 4 no final do documento)., verifica-se
um grande foco na compreensão do usuário e de seu
entorno, ou seja, a filosofia do projeto é sempre do design
centrado no usuário. Isto faz com que, nesta metodologia,
exista um debruçar maior sobre o mapeamento deste
usuário, mais do que o normalmente sugerido nas
metodologias acadêmicas sedimentadas. Usualmente a
metodologia da empresa comporta inicialmente uma fase
inicial de análise preliminar do problema, identificando o
usuário, seus objetivos, as tarefas e o ambiente. Segue-se a
esta análise uma pesquisa de campo para mapear existentes
similares ao produto a ser desenvolvido no mercado. Este
mapeamento avança em testes que envolvem não só a
utilização do produto, mas entrevistas a usuários ou
envolvidos de alguma forma com aquele determinado
produto entendendo melhor o problema apresentado.
Após a delimitação do problema, as especificações do
projeto são estruturadas para elaboração de propostas na
fase de prototipação inicial, que serão apresentadas e
testadas, verificando seus aspectos mais relevantes para a
combinação das melhores soluções e montagem do
protótipo. As propostas são geradas por meio de técnicas de
criatividade, especificamente a de brainstorming.
Na apresentação do protótipo, este é testado, sendo feita
uma avaliação de usabilidade para então a versão final ser
apresentada ao cliente totalmente conceituada dentro da
análise inicial do problema. A fase de prototipação pode
envolver três níveis de prototipagem, de baixa, média ou
alta fidelidade, o que permite avaliações constantes no
desenvolver do processo de design, também no tocante à
aceitabilidade pelo usuário e alcance das expectativas
quanto à experiência do usuário.
O usuário é envolvido em todas as etapas, sendo
constantemente requisitado para contribuir no
desenvolvimento do projeto.
Após o aceite pelo cliente, o projeto é enfim implementado
para comercialização.
ANALISE COMPARATIVA DAS METODOLOGIAS
Ao se confrontar a metodologia da empresa IDEO com as
dos teóricos levantados neste texto, observam-se algumas
confluências e outras lacunas em cada uma das três etapas
básicas descritas a seguir.
Problema
Apesar da etapa do problema da IDEO incorporar um
grande esforço na compreensão do usuário, do contexto e
dos similares, ainda carece de uma determinação mais clara
da definição do problema a ser resolvido em si. Esta etapa
possui um paralelo na etapa semântica do Maser, que
reponde à questão “o quê”, à Análise da situação do
Gugelot e à coleta e análise de dados de Bruno Munari
(identificada não como etapa de Problema, mas de Projeto).
Porém, falta a discussão ou incorporação de
questionamentos observados nos procedimentos específicos
da etapa pragmática do Maser, que responde à questão
“por quê” (finalidades e objetivos gerais do projeto), e da
Colocação do problema e Definição do problema e
objetivos do Gugelot. Da metodologia de Bruno Munari
verifica-se a falta da definição do problema e de seus
componentes. Quase toda a fase 1 do Gui Bonsiepe não está
detalhada nesta etapa da IDEO, somente a análise de
soluções existentes.
Projeto
Ao se traçar um paralelo da fase de Projeto da IDEO com a
dos teóricos analisados neste texto, verificamos uma maior
similaridade entre os procedimentos. Observa-se uma
lacuna na definição do aspecto sintático do Maser, que
reponde à questão “como”, que envolve basicamente o
planejamento do projeto (tempo, equipe de trabalho, verba,
etc). Somente figura o desenvolvimento das alternativas e
avaliação e escolha das mesmas, embora Maser não
explicite de que maneira isto acontece. De Gugelot percebe-
se uma equivalência, excetuada pela prototipação rápida da
IDEO, inexistente na metodologia do teórico. Bruno
Munari compartilha da metodologia da IDEO com o
procedimento de Criatividade + Idéias, paralelamente ao
brainstorming da empresa, mas apregoa a definição dos
materiais e tecnologias que não aparece na metodologia da
IDEO. Aparece em sua metodologia algo similar à
prototipagem e refinamento, nos procedimentos de
experimentação, modelo e verificação, paralelamente à da
empresa IDEO, porém na sua etapa final, de Realização. O
modelo de Gui Bonsiepe, por seu lado, se assemelha
bastante ao modelo da IDEO, embora tenha mais
detalhamento dos processos.
Realização/implementação
Apesar se ser considerada uma empresa que trabalha nos
aspectos de metas de usabilidade e de experiência de
usuário, não aparece na fase final de
realização/implementação da IDEO aspectos relacionado à
6
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 212](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-218-320.jpg)

![de Orientação Gráfica Organizacional, 2010.
(http://www.logo.ufsc.br/observacao.pdf) 2005.
8._________________. Os estudos das linguagens como
apoio aos processos metodológicos do design. In:
COELHO, Luiz Antonio Luzio (org). Design Método. c.1
Rio de Janeiro; Teresópolis: PUC-Rio; Novas Idéias, 2006.
p. 17 a 38.
TABELAS
Metodologias
Teóricos
Problema Projeto Realização
Bruno
Munari
[4] *
- Problema;
- Definição do
problema;
- Componentes do
problema;
- Coleta de
dados;
- Análise de
dados;
- Criatividade
+ idéia;
- Materiais e
tecnologia;
-Experimentação;
- Modelo;
- Verificação;
- Finalização;
- Solução.
Gui
Bonsiepe
- FASE 1 -
estruturação do
problema
Descobrimento de
uma necessidade;
Valorização de
uma necessidade;
Formulação geral
de um problema;
Formulações
particulares do
problema;
Fragmentação do
problema;
Hierarquização
dos problemas
parciais;
Análise das
soluções
existentes.
- FASE 2 -
Desenvolvim
ento do
Projeto
Desenvolvim
ento das
alternativas;
Verificação e
seleção das
alternativas;
Detalhament
o e
otimização
da solução
adotada;
Construção e
prova do
protótipo;
Fabricação
em série.
- FASE 3 -
Realização do
Projeto
Tabela 1. Quadro comparativo das Metodologias – Bruno
Munari X Gui Bonsiepe
Metodologias
Teóricos
Problema Projeto Realização
Siegfried
Maser
1- Análise:
1.1 - Aspecto
pragmático (por
quê?):
1.2 - Finalidades;
1.3 - Objetivos
gerais do projeto
em si, inclusive
restrições.
2- Aspecto
semântico (o
quê?):
2.1 - Descrição do
problema e
contexto;
2.2 -
Levantamento;
2.3 - Análise.
1- Aspecto
sintático
(como?):
2 -
Planejamento
do caminho do
processo
(macro-
estrutura);
4 -
Planejamento
do tempo;
5 - Constituição
do grupo/forma
de trabalho;
6 -
Financiamento
do projeto;
7 - Definição do
problema;
8 -
Desenvolviment
o das
alternativas;
9 - Avaliação
das
alternativas/esco
lha.
1 - Realização
do projeto
2 -
Implantação
Hans
Gugelot
- Colocação do
problema
- Análise da
situação
- Geração de
alternativas
- Planificação
da produção
- Avaliação e
seleção
- Definição do
problema e
objetivos
Tabela 2. Quadro comparativo das Metodologias – Siegfried
Maser X Hans Gugelot
8
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 214](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-220-320.jpg)
![Metodologia
Teóricos
Problema Projeto Realização
IDEO
1.Compreender o
mercado, o
cliente, a
tecnologia e as
limitações
identificadas do
problema. [...]
2.Observar
pessoas reais em
situações de vida
real para descobrir
o que modifica o
comportamento: o
que as confunde,
do que gostam, o
que detestam,
onde tem
necessidades
latentes não
atendidas pelos
produtos e
serviços atuais.
{...}
3.Visualizar
conceitos
novos para o
mundo e para
os clientes
que os
usarão. [...]
4.Avaliar e
aprimorar os
protótipos
numa série de
interações
rápidas [...]
nenhuma
idéias é tão
boa que não
possa ser
aperfeiçoada
[...]. Obtemos
as opiniões
de nossa
equipe
interna, da
equipe do
cliente, de
pessoas bem
informadas
não
diretamente
envolvidas
no projeto e
de pessoas
que
constituem o
mercado-
alvo.[...]
5.Implementar o
novo conceito
para
comercialização.
[...]”
Tabela 3. Quadro da Metodologia utilizada pela IDEO –
conceito.
Metodologia Detalhamento
Problema
1. Observação
Utiliza os seguintes processos ou técnicas:
- Shadowing
- Observação do público alvo em todas as ações que
realizam em sua interação produtos ou serviços.
- Mapeamento do comportamento
- Registro fotográfico do público alvo usando o
produto ou serviço, mapeando ações relevantes.
- Jornada do consumidor
- Traçado de todas as interações que o público alvo
tem com o produto ou serviço
- Câmera Journals
- Solicitar ao público alvo que façam diários visuais
de suas atividades ou impressões relacionadas ao
produto.
- Entrevistas
- Descobrir, por meio de entrevistas, tudo o que o
público alvo sabe ou não sabe sobre o serviço
oferecido e sua relação com o mesmo avaliando sua
experiência com o mesmo.
- Contação de histórias
- Pedir para que o público alvo conte histórias
particulares sobre suas experiências como
consumidor.
- Grupos não focais
- Entrevistar ou buscar informações com pessoas
diversas do público alvo
Projeto
2. Brainstorming
Um processo intenso de sessão de geração de idéias
baseada na análise de dados obtida na etapa anterior.
3. Prototipação rápida
Realizar protótipos de trabalho a fim de visualizar
possíveis soluções e agilizar as decisões de design e
inovação.
4. Refinamento
Restringir as escolhas a poucas possibilidades,
utilizando, entre outras, as seguintes técnicas:
aplicação de brainstorming de seleção, prototipação
focada e engajamento do cliente.
Realização
5. Implementação
Efetiva implementação final do produto para
comercialização no mercado
Tabela 4. Quadro da Metodologia utilizada pela IDEO –
detalhamento.
9
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 215](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-221-320.jpg)


![Figure 1. Tesco Automated store at Northampton
“The most profound revolutions are not the ones trumpeted
by pundits, but those that sneak in when we are not
looking”. What Mark Weiser formulated over ten years ago
accurately describes the current atmosphere surrounding the
field of pervasive computing. While personal gadgetry in
the form of Smartphone’s and Internet fridges continues to
bedazzle the press, industry has quietly begun setting its
sights on the enormous business potential that technologies
such as wireless sensors, RFID tags, and positioning
systems have to offer. Analysts call it the real-time
economy or now-economy where more and more entities in
the economic process, such as goods, factories, and
vehicles, are being enhanced with comprehensive methods
of monitoring and information extraction. Ultimately, the
whole lifecycle of products, beginning with the “birth” of
their components and ending with their complete
consumption (or recycling), can be witnessed (and, to some
extent, even controlled) in real time. Two important
technologies form the core of these new economic
processes and applications: the ability to track real-world
entities, and the introspection capabilities of smart objects.
Tracking objects in real-time allows for more efficient
business processes, while objects that can monitor their
own status via embedded sensors allow for a range of
innovative business models.
STORE SHOWCASES
At [4] it is possible to observe that sales are dependent on
the space but we are interested in whether increases in
space produce linear, increasing or diminishing returns. To
test this they examined if variations in retail space
(measured in square inches) produced variations in sales
(measured in sales of SKUs). Sections of twenty
independent fashion and department stores in the UK were
used. These stores did not normally stock watches. This
environment ensured that there was no immediate effect
from competitor brands. The sections used varied in size
from 1,600 to 2,890 square feet of retail space. Display
showcases ranging from 144 square inches to 7,012 square
inches were allocated to sections. As the size of the
showcase increased, there was a corresponding increase in
SKUs from 6 to 289. Allocation was random subject to a
constraint; not all store sections could accommodate the
largest cabinets, so these went to bigger sections. Because
of this constraint, it is possible that section size affected the
sales figures for large cabinets. Data were collected by sales
staff, who conducted stock checks of individual SKU’s over
a four week period.
Figure 2. Scatter plot of space level and G-Shock unit
sales
Increase in showcase size generated an increase in product
sales. The Pearson correlation coefficient between the two
variables was 0.88 (p = 0.00). The scatter plot in Figure2
shows that the relationship between space and sales appears
to be curvilinear with accelerating gains from increased
display space, though this assessment rests on relatively
few cases. In the second investigation they examined
whether window and in-store displays in the same store
produced more sales gain than equivalent window and in
store displays in different stores. The sample for this
Investigation consisted of 66 stores of the H. Samuel retail
chain. The selection of this retailer gave geo-demographic
representation across the UK population (H. Samuel have
428 stores with a presence in every major town in the
United Kingdom). The chain accounts for 10 per cent of
watch sales in the UK. The 66 stores were assigned
randomly to one of three treatments groups, as shown in
Table 1. Each display contained the same 42 G-shock lines
with the brand name clearly displayed on a placard. The
way in which products were presented (e.g. solus window)
was held constant in each display treatment. Other factors
such as pricing, stocking and display of other products
remained constant over the period of the experiments.
Inventory management obviously benefits from accurate,
real-time information on the location and condition of
goods, equipment, and manpower. If a company does not
know the location and condition of its stock, and how long
it has been in the warehouse, significant costs are incurred.
Missed profits, oversized inventories, and the devaluation
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 218](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-224-320.jpg)

![Figure 4. Visual Inspection System.
Recently, researchers in human-computer interaction have
been exploring interactive tabletops for use by individuals
and groups, as part of multi-display environments, and for
fun and entertainment. A key challenge of surface
computing is that traditional input using the keyboard,
mouse, and mouse-based widgets is no longer preferable;
instead, interactive surfaces are typically controlled via
multi-touch freehand gestures. Whereas input devices
inherently constrain human motion for meaningful human-
computer dialogue, surface gestures are versatile and highly
varied—almost anything one can do with one’s hands could
be a potential gesture. To date, most surface gestures have
been defined by system designers, who personally employ
them or teach them to user-testers .Despite skillful design,
this results in somewhat arbitrary gesture sets whose
members may be chosen out of concern for reliable
recognition. Although this criterion is important for early
prototypes, it is not useful for determining which gestures
match those that would be chosen by users. It is therefore
timely to consider the types of surface gestures people
make without regard for recognition or technical concerns.
What kinds of gestures do non-technical users make? In
users’ minds, what are the important characteristics of such
gestures? Does number of fingers matter like it does in
many designer-defined gesture sets? How consistently are
gestures employed by different users for the same
commands? Although designers may organize their gestures
in a principled, logical fashion, user behavior is rarely so
systematic. As McNeill writes in his laborious study of
human discursive gesture, “Indeed, the important thing
about gestures is that they are not fixed. They are free and
reveal the idiosyncratic imagery of thought”.
All those gestures and human activities when using the
surfaces are tracked using vision based solutions, namely as
blob recognition and tracking for associating an id and a
movement to each finger and therefore it is possible to use
this information to analyze which gesture was done
comparing it to predetermined gestures.
Figure 5. Microsoft Surface Configuration
Figure 6. User Gestures for Input
Figure 7. User interacting with Project natal
SYSTEM OVERVIEW
Setup
The configuration of the 3S(Smart-Store Showcase) system
used in the present study is described in Figure 1. The
system consists of a big store showcase, whose surface is
composed of glass, transparent for the camera. A camera
that captures the images from the customers. The captured
images are processed by a computer running the Image
Processing Core(IPC). Usually, to get better results, it is
necessary to calibrate and make some adjustments on some
parameters, like camera focus, parameters, in addition to
software adjustments, like equalize and balance light. From
captured images, software detects interesting characteristics
for further analysis of customer behaviour. The IPC was
implemented using the C++ language and the Open Source
Computer Vision Library (OpenCV []).
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 220](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-226-320.jpg)
![.
Figure 8. Setup of the Smart Store Showcase.
Customer Recognition
Using Haar-Like Features Classifier from the OpenCV it is
possible to detect the presence and the position of a face on
the image, according to the classification formulas below.
(1)
Recognition of Faces Features
Interesting Face Features to be recognized are eyes, mouth
and nose. Those help on the geometry analysis to find
position and rotation of the customers face[15][18]. Those
characteristics are also found using Haar-like features and
classifiers.
Geometrical Analysis
Geometrical analysis consists of finding the values of
angles between the lines in the triangle formed from lines
leaving from the center of the eyes, passing by the center of
the mouth and the center of the nose. Equation (2)
calculates the tangent of the angle between two lines.
(2)
where,
(3)
Figure 7. Degrees of Freedom of Human Head.
Figure 9. Degrees of Freedom of Human Head.
Figure 10. Geometry of Human Face
Analyzing this information according to figure 11 it is
possible to determine the behavior of the customer to the
showcase, meaning that the customer can be, for example,
looking to a product, not looking at all, or even somehow
looking at an avoidance manner to it(figure 12).
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 221](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-227-320.jpg)
![Figure 11. Customer Patterns when looking to the Showcase
Figure 12. Real-data patterns analysis
The final step of the image processing core is to use a K-
Nearest Neighbor[17] algorithm to associate an id to each
customer to be able to check for how long it keeps looking
to the showcase, and also get a detailed report associating
customer to product.
Figure 13. K-Nearest Neighbour algorithm applied to find the
most probable face according to last position.
Application
TUIO Protocol
The TUIO Protocol [7] is a simple protocol designed to
meet the requirements of table-top tangible user interfaces.
We have adapted the TUIO messages to this type of
application. The 3S is considered as a host that becomes
available to clients, running on a computer attached to it.
With this information the management software is able to
generate a log and a daily spreadsheet relating products
shown on the showcase and the customers’ behavior during
the day.
CONCLUSION
We have characterized and implemented a system for
automating the capture of customers’ behavior when
looking to a store showcase and also, a system to analyze
this data to optimize sales on stores. Our system aims to
incorporate consolidate Vision methods to the field of smart
stores. With this information the store owner would be able
to organize its showcase with a more careful planning. And
also, to see the direct relation between products advertised
on the showcase and products bought. The proposed
solution opens a wide variety of opportunities for future
work, ranging from adapting it to stereo vision, better
tracking algorithms, and Human Factors of this Human
Computer Interface. The new directions of the project are to
develop a system to correlate the elapsed time between
looking and buying, to augment the number of cameras, and
products. Incorporate gaze tracking for measuring attention.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 222](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-228-320.jpg)



O documento apresenta a segunda edição do congresso internacional de design de interação, destacando a importância da interação humana e a troca social promovida por artefatos, serviços e interfaces. Também discute o papel da hipermídia adaptativa na educação a distância, buscando adaptar sistemas de forma personalizada para atender necessidades de diferentes perfis de usuários. O evento busca fomentar novas perspectivas e laços na área de design de interação na América do Sul.














![Sistema de Rastreamento da Mão Humana Utilizando
Visão Computacional
Rodrigo Fernandes Freitas, Paulo César Cortez, Rodrigo C. S. Costa, Antônio C. da S. Barros
Laboratório de Engenharia de Sistemas de Computação
Campus do Pici S/N, Bloco 723,
rodrigo@gihm.info, cortez@gihm.info
RESUMO
O mercado de dispositivos portáteis tem crescido muito nos
últimos anos, o que os tornou parte importante da vida
diária da maioria da população. Porém, a interação
usuário com eles ainda é baseada em teclados pequenos e
incômodos. Com o avanço do poder
desses dispositivos, eles agora conseguem executar pesados
aplicativos como navegadores de internet e manipuladores
de imagens, os quais se beneficiariam bastante de novas
formas de interação. Este trabalho propõe um sistema de
interação para dispositivos portáteis através do rastreamento
da mão baseado em Visão Computacional. Os resultados
obtidos demonstram que este sistema apresenta uma boa
taxa de processamento, bem como é invariante à rotação da
mão e consegue reconhecer todos os gest
Author Keywords
Rastreamento da Mão, Dispositivos Portáteis
Interação.
ACM Classification Keywords
I.4.9. I.4.9. Image processing and computer vision:
Applications.
INTRODUÇÃO
O mercado dos dispositivos portáteis, como os telefones
celulares e smartphones, tem tido um grande crescimento
nos últimos anos. Tanto a diminuição dos custos e do
volume de hardware quanto o aumento da capacidade de
processamento e armazenamento ajudaram
tipo de dispositivo mais popular, fazendo deles parte
indispensável da rotina diária da maioria
cada geração são desenvolvidos dispositivos cada vez
menores e com maior poder computacional, como visto na
Figura 1 [28].
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA.
Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Sistema de Rastreamento da Mão Humana Utilizando
Computacional para Aplicações Embarcadas
, Paulo César Cortez, Rodrigo C. S. Costa, Antônio C. da S. Barros
Laboratório de Engenharia de Sistemas de Computação, Universidade Federal do Ceará
, Bloco 723, Cx. Postal 6015, CEP 60455-970 – Fortaleza
cortez@gihm.info, rodcosta@gimh.info, carlos@gimh.info
O mercado de dispositivos portáteis tem crescido muito nos
últimos anos, o que os tornou parte importante da vida
da população. Porém, a interação do
ainda é baseada em teclados pequenos e
de processamento
desses dispositivos, eles agora conseguem executar pesados
aplicativos como navegadores de internet e manipuladores
de imagens, os quais se beneficiariam bastante de novas
. Este trabalho propõe um sistema de
para dispositivos portáteis através do rastreamento
da mão baseado em Visão Computacional. Os resultados
obtidos demonstram que este sistema apresenta uma boa
taxa de processamento, bem como é invariante à rotação da
mão e consegue reconhecer todos os gestos propostos.
Dispositivos Portáteis, Sistemas de
Image processing and computer vision:
O mercado dos dispositivos portáteis, como os telefones
, tem tido um grande crescimento
nos últimos anos. Tanto a diminuição dos custos e do
quanto o aumento da capacidade de
processamento e armazenamento ajudaram a tornar este
tipo de dispositivo mais popular, fazendo deles parte
maioria da população. A
cada geração são desenvolvidos dispositivos cada vez
menores e com maior poder computacional, como visto na
Figura 1. Evolução dos celulares.
Apesar do avanço significativo na performance e nas
capacidades dos dispositivos portáteis, as interfaces com os
usuários ainda são largamente baseadas no conjunto
pequena e teclado. O uso
pode às vezes ser incômodo, pois o número de botões é
limitado e deve-se pressionar as teclas várias vezes para se
obter o resultado desejado [13
suficiente para modos mais simples de interação, como
originar e receber chamadas telefônicas; aplicações mais
complexas exigem técnicas de interação mais intuitivas
Por causa do seu aumento de capacidade computacional, os
dispositivos portáteis são agora capazes de processar
aplicações que antes somente
plataformas de maior poder computacional, como os
Computadores Pessoais (PCs) e
gráficos como jogos, navegadores de internet e
manipuladores de imagens são cada vez mais comuns em
dispositivos portáteis. Muitas dess
beneficiar largamente da presença de um dispositivo de
entrada mais intuitivo [28].
Nas últimas décadas tem havido uma pesquisa muito
intensa para o desenvolvimento de novas formas de
interação com dispositivos portáteis, com vários
tecnologias sendo propostas, tais como telas de toque,
reconhecimento de voz e sensores de movimento
como visto na Figura 2.
Permission to make digital or hard copies of all or part of this work for
classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
istribute to lists, requires prior
9, 2009, Boston, Massachusetts, USA.
7/09/04...$5.00.
Sistema de Rastreamento da Mão Humana Utilizando
para Aplicações Embarcadas
, Paulo César Cortez, Rodrigo C. S. Costa, Antônio C. da S. Barros
Federal do Ceará - UFC
Fortaleza - CE
carlos@gimh.info
. Evolução dos celulares.
Apesar do avanço significativo na performance e nas
capacidades dos dispositivos portáteis, as interfaces com os
usuários ainda são largamente baseadas no conjunto tela
pequena e teclado. O uso de teclados não-ergonômicos
pode às vezes ser incômodo, pois o número de botões é
se pressionar as teclas várias vezes para se
[13]. Esse tipo de abordagem é
suficiente para modos mais simples de interação, como
riginar e receber chamadas telefônicas; aplicações mais
complexas exigem técnicas de interação mais intuitivas [3].
Por causa do seu aumento de capacidade computacional, os
dispositivos portáteis são agora capazes de processar
aplicações que antes somente eram possíveis em
plataformas de maior poder computacional, como os
Computadores Pessoais (PCs) e notebooks. Aplicativos
gráficos como jogos, navegadores de internet e
manipuladores de imagens são cada vez mais comuns em
dispositivos portáteis. Muitas dessas aplicações podem se
beneficiar largamente da presença de um dispositivo de
Nas últimas décadas tem havido uma pesquisa muito
intensa para o desenvolvimento de novas formas de
interação com dispositivos portáteis, com vários tipos de
tecnologias sendo propostas, tais como telas de toque,
reconhecimento de voz e sensores de movimento [15],
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 9](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-15-320.jpg)
![Figura 2. Exemplos de novas formas de interação com
dispositivos portáteis: (a) Exemplo de utilização através de tela
de toque. (b) Exemplo de utilização através de sensor de
movimento.
Contudo, essas soluções apresentam várias limitações. Com
as caras telas de toque é necessário que o usuário opere o
aparelho com ambas as mãos. O reconhecimento de voz
peca às vezes pela falta de confiabilidade. Já para os
sensores de movimento, precisa-se da inclusão de hardware
extra no dispositivo móvel, o que acarreta em um acréscimo
no custo do aparelho [12].
Hoje em dia câmeras digitais de baixa resolução vêm
integradas à maioria dos dispositivos portáteis produzidos
com o objetivo de obter-se fotografias e vídeos [25].
Dessa forma é interessante o desenvolvimento de formas de
interação com dispositivos móveis baseados em Visão
Computacional, os quais não sofrem das limitações
apresentadas anteriormente e utilizam as câmeras já
embutidas nos aparelhos, evitando aumento de custo do
produto pela adição de hardware extra [1].
Com a capacidade de processamento atual dos dispositivos
portáteis, é possível processar as imagens capturadas pelo
aparelho e oferecer novas formas de interação ao usuário
através de técnicas de detecção de movimento, detecção de
cores e reconhecimento de gestos, dentre outras [2].
Dentre as formas de interação citadas anteriormente, a área
de reconhecimento de gestos e rastreamento da mão
humana tem sido bastante pesquisada nos últimos anos para
o desenvolvimento de aplicações para computadores
pessoais [26, 8, 18] e recentemente também tem sido
estudada para o desenvolvimento de interações com
dispositivos portáteis [12, 10, 27].
O objetivo geral deste trabalho é descrever o
desenvolvimento de um sistema de rastreamento da mão
humana, possibilitando o uso da câmera como dispositivo
sensor para interação com sistemas embarcados.
FUNDAMENTAÇÃO TEÓRICA
Esta seção descreve alguns fundamentos da área de
processamento de imagens necessários para um melhor
entendimento deste trabalho e também descreve as etapas
que constituem um sistema de Visão Computacional.
Figura 3. Etapas constituintes de um Sistema de Visão
Computacional.
Um sistema de Visão Computacional é composto pelas
etapas mostradas na Figura 3, descritas em maiores detalhes
a seguir.
A etapa de aquisição consiste na captura das imagens por
um elemento sensor, gerando uma matriz com valores
discretos à qual podem ser aplicadas diversas operações. O
processo de aquisição pode ser realizado através de uma
ampla gama de dispositivos, tais como webcams, câmeras
de infra-vermelho, câmeras digitais, dentre outros [11].
As imagens fornecidas pelos dispositivos sensores citados
na seção anterior tendem a apresentar uma degradação da
sua qualidade pela introdução de ruído, deformação
geométrica ou borramento devido ao movimento do objeto.
A etapa de pré-processamento consiste na aplicação de
métodos para melhorar a qualidade da imagem e reduzir as
degradações introduzidas pelos elementos sensores [24].
A etapa de pré-processamento pode se dar através de dois
tipos de técnicas: restauração e realce. As técnicas de
restauração preocupam-se principalmente com a
reconstrução ou recuperação de uma imagem que foi
degradada e um conhecimento prévio sobre o fenômeno de
degradação pode ser utilizado para este propósito. As
técnicas de realce melhoram a qualidade subjetiva das
imagens aguçando certos atributos delas, tais como bordas e
contraste, e reduzindo o ruído [11].
Tanto as operações de restauração quanto as de realce
podem ser vistas como filtros digitais bidimensionais.
Dentre as diversas técnicas disponíveis na literatura, uma
das técnicas de restauração no domínio espacial mais
utilizada é a aplicação do filtro da média, o qual consiste
em uma janela deslizante de tamanho 2N+1 x 2N+1, em
que o pixel (x,y) da imagem (I) em que a janela está
centrada é substituído na imagem filtrada (J) através de:
, = ∑ ∑ + , +
(2)
A segmentação de uma imagem consiste em dividí-la em
um certo número de regiões, em que cada região tem um
alto grau de uniformidade em algum parâmetro específico,
tal como brilho, cor, textura ou mesmo movimento [7].
O nível de detalhes no qual essa sub-divisão da imagem se
baseia depende do problema a ser resolvido. A acurácia da
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 10](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-16-320.jpg)
![Figura 4. Exemplo da aplicação do processo de limiarização
sobre um histograma.
segmentação determina o eventual sucesso ou fracasso do
sistema de processamento de imagens, de forma que deve-
se dedicar considerável cuidado para aumentar a
probabilidade de segmentação correta [11].
Dentre as diversas técnicas de segmentação existentes, a
limiarização é muito utilizada na literatura devido às suas
propriedades intuitivas, facilidade de implementação e
baixo custo computacional [11]. O funcionamento deste
método pode ser entendido através da Figura 4.
Considere o histograma da Figura 4 como correspondendo
ao histograma de uma imagem qualquer, composta de
objetos claros e um fundo escuro. Uma maneira fácil de
extrair os objetos do fundo é selecionar um limiar T que
separe os dois agrupamentos. Assim, qualquer ponto (x,y)
na imagem tal que f(x,y) T é chamado de um ponto do
objeto; caso contrário, o ponto é chamado de ponto do
fundo [8]. Dessa forma, a imagem segmentada g(x,y) é dada
por:
, =
1, , ≥
0, ,
(3)
Após a segmentação de uma imagem em suas regiões
componentes, o conjunto resultante de pixels deve ser
representado e descrito de forma adequada para o
processamento computacional subsequente. Basicamente, a
representação de uma região pode ser realizada de duas
maneiras: a primeira é representar a região em termos de
suas características externas (seu contorno); a segunda é
representar a região em termos de suas características
internas (os pixels que compreendem a região) [11].
Escolhe-se uma representação externa quando o foco
principal do problema reside nas características da forma,
tais como cantos e inflexões. A representação interna é
escolhida quando se deseja observar as propriedades locais
do objeto, tais como cor e textura [21].
Na categoria de representação externa, o algoritmo de
código em cadeia é uma abordagem muito utilizada. Uma
região geralmente descreve um conteúdo (ou pontos
internos) rodeado por uma borda, chamada de contorno.
Um ponto é definido como estando no contorno se ele faz
parte da região e se há pelo menos um pixel na sua
vizinhança que não é parte da região [22].
Figura 5. Principais tipos de análise de conectividade: (a)
conectividade-4; (b) conectividade-8.
Figura 6. Conectividade no código em cadeia.
Dessa forma, o código em cadeia é formado concatenando-
se o número que designa a direção do próximo pixel. Isto é
repetido para cada ponto do contorno até se alcançar o
ponto inicial [24]. O código em cadeia pode ser realizado
com base em conectividades do tipo 4 e 8 (como visto na
Figura 5). As direções tanto na conectividade-4 que na
conectividade-8 podem ser atribuídas como mostrado na
Figura 6.
Após o processo de representação de um objeto, a tarefa
seguinte é a de descrição ou seleção de atributos, de forma
a extrair atributos dos dados representados que resultem em
alguma informação quantitativa de interesse ou que sejam
básicos para diferenciar uma classe de objetos de outra;
essa diferenciação ocorre na fase seguinte de
reconhecimento [14].
De modo a terem utilidade para a etapa de reconhecimento,
os descritores selecionados devem possuir um conjunto de
importantes propriedades: dois objetos devem ter os
mesmos descritores apenas se eles tiverem as mesmas
características; objetos similares devem ter descritores com
valores similares; os descritores devem ser invariantes a
mudanças no objeto como escala, rotação, translação e
perspectiva; e os descritores devem representar a essência
de um objeto de forma eficiente, contendo informações
apenas sobre o que torna aquela objeto único ou diferente
dos outros objetos [22].
A partir da representação do contorno originada pelo código
em cadeia, um descritor que pode-se extrair dele são os seus
pontos críticos. Pontos críticos ou cantos são pontos muito
importantes de um objeto, visto que a informação sobre
uma forma se concentra em seus cantos [20]. Pontos
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 11](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-17-320.jpg)
![críticos são definidos como pontos em que a linha do
contorno da região apresenta uma variação brusca na sua
direção, ou seja, é um ponto com alto valor de amplitude no
sinal de curvatura [23].
A curvatura k(t) de uma curva paramétrica c(t) = (x(t), y(t))
é definida como:
=
!#!#!!
!$%!$
$
'
(4)
Fica claro pela equação que para estimar a curvatura é
necessário o cálculo das derivadas de x(t) e y(t). Devido ao
fato do contorno ter natureza discreta (ou seja,
espacialmente amostrado) o cálculo das derivadas se torna
um problema computacional, dificultando a utilização
direta desta fórmula [6].
Uma abordagem básica que evita o cálculo da fórmula é a
definição de medidas de curvatura alternativas baseadas nos
ângulos entre vetores definidos em termos dos elementos
discretos do contorno. Considere c(n) = (x(n), y(n)) como
sendo uma curva discreta. Os seguintes vetores podem ser
definidos [6]:
() = ) − ) − , ) − ) − (5)
+) = ) − ) + , ) − ) + (6)
Esses vetores são definidos entre o atual ponto do contorno
e os vizinhos para a direita e para a esquerda, como
mostrado na Figura 7.
O modelo digital de pontos de alta curvatura proposto por
Johnston e Rosenfeld (1973) [17] é definido pela seguinte
equação:
,) =
-./0./
||-./||||0./||
(7)
em que ,) é o cosseno do ângulo entre os vetores ()
e +). Dessa forma, temos que −1 ≤ ,) ≤ 1, com
,) = −1 para linhas retas e ,) = 1 quando o ângulo
se torna 0° (o menor ângulo possível). Neste sentido, ,)
pode ser utilizado como uma medida capaz de localizar
pontos de curvatura alta, ou seja, maiores que um certo
limiar.
Finalmente, a etapa de reconhecimento consiste do
processo de atribuir um rótulo para um objeto baseado em
seus descritores [11].
Figura 7. Indicação da curvatura baseada no ângulo.
METODOLOGIA
Nesta seção são apresentados, inicialmente, os
equipamentos e os ambientes de simulação e
desenvolvimento utilizados neste trabalho e, em seguida, o
algoritmo de interação proposto.
Equipamentos Utilizados
No desenvolvimento deste trabalho os algoritmos são
inicialmente desenvolvidos em um Computador Pessoal
(PC) e, em seguida, adaptados e embarcados em um
dispositivo portátil. Os equipamentos utilizados no
desenvolvimento deste trabalho são resumidamente
descritos na Tabela 1.
Para a realização dos experimentos foram utilizados um PC
e um aparelho celular. O computador possui como
acessório uma câmera Microsoft NX-3000. O aparelho
celular não possui Unidade de Ponto Flutuante (FPU).
Todos os cálculos em ponto flutuante são feitos através de
software no processador de ponto fixo (inteiro). O uso de
ponto flutuante aumenta o custo computacional,
necessitando a adaptação do código para ponto fixo.
Simulação
As simulações realizadas seguem a estrutura ilustrada na
Figura 8. O primeiro passo, a aquisição, é realizado pelo
pacote de aquisição de imagens presentes no Simulink.
O último passo, a exibição dos resultados, é realizado pelo
pacote de processamento de vídeo e imagens do Simulink,
Computador Pessoal
Telefone
Celular
Fabricante IBM Samsung
Modelo MT-M 8212-G4P SGH-A706
Processador Intel Pentium D
ARM9 à
143MHz
RAM 2GB -
OS
Windows XP com
SP2
Qualcomm
REX
Câmera
1.3 MPix Microsoft
NX-3000 2MPix
Tabela 1. Equipamentos utilizados no desenvolvimento do
trabalho.
Figura 8. Etapas na simulação do processo de Visão
Computacional.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 12](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-18-320.jpg)
![exibindo no monitor ou salvando em arquivo a saída do
sistema.
Os processamentos intermediários são implementados
utilizando os blocos padrões de operações diversas
Desenvolvimento
O diagrama da implementação em C ANSI dos métodos de
interação baseados em visão é mostrado na Figura 9. Nesta
figura, as setas representam o acesso de informações. Os
algoritmos de VC desenvolvidos neste trabalho possuem
um acesso indireto ao hardware, devido à necessidade de
utilização do método proposto em várias plataformas
(Windows e REX). Os códigos desenvolvidos são
implementados em C ANSI e utilizam apenas comandos
presentes nas bibliotecas padrões.
Após as simulações, os algoritmos são implementados em
C ANSI e em seguida embarcados e testados no dispositivo
portátil. Para cada plataforma, é desenvolvido um conjunto
de comandos de acesso ao meio físico dependente de cada
plataforma. Por exemplo, para os testes realizados no PC, a
interface de acesso ao hardware da câmera é feita utilizando
comandos existentes na Interface de Programação de
Aplicativos (API) do OpenCV que, ao fim do
processamento, converte os frames adquiridos em um vetor
em ponto fixo (inteiro) [16].
Para testar os algoritmos, foi desenvolvida uma aplicação
em C++ que realiza a execução do código. Esta aplicação
inicia os algoritmos de rastreamento da mão e entra em um
laço que adquire um frame da câmera, executa o algoritmo
proposto e exibe os resultados até que uma tecla seja
pressionada. Após sair do laço, a aplicação fecha os
algoritmos de VC.
No ambiente REX, os algoritmo são compilados em C
ANSI e enviados para o grupo de desenvolvedores do
Samsung Instituto de Desenvolvimento para Informática
(SIDI). Os desenvolvedores implementaram a interface de
acesso ao hardware e integram o algoritmo em uma
aplicação nativa do sistema operacional, deixando
disponível o conjunto de algoritmos para serem testados e
avaliados.
Figura 9. Diagrama da implementação em C dos algoritmos.
Método Proposto de Interação para Dispositivos
Portáteis
Este trabalho propõe um método com baixo esforço
computacional capaz de identificar um conjunto de gestos
padronizados para formar um sistema de interação com
dispositivos portáteis através do rastreamento da mão
humana.
O sistema proposto segue o processo de um Sistema de
Visão Computacional descrito na seção de Fundamentação
Teórica. A seguir são detalhadas as técnicas utilizadas em
cada uma das etapas que formam o sistema proposto.
A etapa de aquisição do método proposto é realizada pela
câmera embutida do dispositivo móvel. A imagem
fornecida pelo telefone celular para a realização dos testes
encontra-se no espaço de cores YCbCr.
Para a realização da etapa de pré-processamento foi
escolhida a aplicação do Filtro da Média sobre a imagem
adquirida pela câmera. O objetivo com isso é atenuar o
ruído presente na imagem, de forma a melhorar a etapa
seguinte de segmentação.
Vários testes foram realizados e foi observado que a
utilização de uma janela 5x5 para o Filtro da Média
apresenta o melhor equilíbrio entre custo computacional e
desempenho de filtragem.
O objetivo da etapa de segmentação é identificar a região
da imagem filtrada que corresponde à mão do usuário. Para
realizar essa segmentação, é utilizada a técnica de
limiarização no espaço de cores YCbCr.
A técnica de limiarização foi escolhida devido ao seu baixo
custo computacional. Ela é realizada no espaço de cores
YCbCr para evitar o processo de conversão da imagem para
outros espaços de cores, o que acarretaria em
processamento adicional.
Os limiares utilizados para a segmentação da pele são
propostos por Chai e Ngan (1999) [4], em que são
classificados como pele os pixels da imagem cujas
intensidades se encontrem na faixa de valores 77 a 127 para
o canal Cb e na faixa de valores 133 a 173 para o canal Cr.
O restante dos pixels da imagem é classificado como sendo
fundo da imagem. O processo de limiarização de pele
utilizado pode ser representado pela seguinte expressão:
, =
1, 77 45 127 8 133 4, 173
0, :;= :=),á, =
(7)
onde g(x,y) é a imagem segmentada e Cb e Cr são os
valores nos canais Cb e Cr, respectivamente, dos pixels
(x,y) da imagem filtrada.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 13](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-19-320.jpg)
![Figura 10. (a) Imagem filtrada na etapa anterior de pré-
processamento. (b) Imagem segmentada de acordo com a
equação 7.
Na Figura 10 é representado o processo de limiarização. Na
Figura 10(a) é mostrada a imagem filtrada obtida na etapa
anterior, composta da mão do usuário, um objeto circular de
cor semelhante à da pele e um fundo cinza. Na Figura 10(b)
é mostrado o resultado da limiarização, com a mão e o
objeto circular tendo sido segmentados.
Para a representação dos dados da imagem segmentada na
etapa anterior, utiliza-se a representação através do
algoritmo de código em cadeia, a qual é uma representação
baseada no contorno do objeto, visto que se deseja obter
informações sobre as inflexões deste contorno para
identificar as pontas dos dedos da mão usuário.
O primeiro passo é a extração do contorno. Um ponto P é
definido como um ponto de contorno (c(x,y) = 1) quando
este é um ponto de fundo (g(x,y) = 0) e pelo menos um
ponto do objeto de interesse pertence à sua vizinhança
g(x,y) = 1. Na Figura 11(a) é mostrada a imagem
segmentada obtida na etapa anterior e na Figura 11(b) é
mostrada o resultado da extração do contorno da imagem.
O algoritmo de código em cadeia é então aplicado sobre a
imagem do contorno. Descarta-se os menores contornos da
imagem e preserva-se apenas o maior contorno encontrado
pelo código em cadeia, armazenando-se as suas
coordenadas x e y.
Na Figura 12(a) é mostrado a imagem de contorno obtida
na etapa anterior e na Figura 12(b) é mostrado o resultado
da aplicação do algoritmo de código em cadeia na imagem
do contorno, em que restou apenas o maior contorno (o
contorno da mão) e foi descartado o menor contorno (o
contorno do objeto circular).
Figura 11. (a) Imagem segmentada na etapa anterior do
sistema. (b) Imagem com o contorno extraído das regiões
segmentadas da imagem.
Figura 12. (a) Imagem do contorno obtida anteriormente. (b)
Imagem com o maior contorno armazenado na lista encadeada
gerada pelo algoritmo de código em cadeia.
Para a descrição dos dados representados, utiliza-se como
atributos a curvatura e os pontos críticos do contorno da
mão do usuário, os quais podem ser utilizados para localizar
as pontas dos dedos da mão, como proposto no trabalho de
Leal et al. (2009) [19]. O cálculo da curvatura é realizado
sobre o contorno da região da mão seguindo a abordagem
mostrada na seção de Fundamentação Teórica.
Na Figura 13(a) é mostrado o contorno representado pela
lista do algoritmo de código em cadeia. Na Figura 13(b) são
mostradas em cor cinza escuro as regiões de alta curvatura
encontradas, que correspondem às regiões ao redor das
pontas dos dedos e dos vales entre os dedos da mão.
Dentro de cada uma dessas regiões de alta curvatura,
seleciona-se o ponto central de cada uma delas como sendo
o ponto crítico representado a ponta dos dedos e dos vales.
Apenas as pontas dos dedos são interessantes para o
método, por isso deve-se eliminar os pontos críticos que
representam os vales. Isso é feito identificando o ponto
médio do segmento de reta formado pelos dois pontos
extremos da região de alta curvatura.
Caso esse ponto se encontre sobre uma região de pele, o
ponto crítico corresponde a uma ponta de dedo. Caso
contrário, o ponto crítico corresponde a um vale e é
descartado do processamento.
O resultado dessa etapa de descrição é representado na
Figura 14. Na Figura 14(a) são mostradas as regiões de alta
curvatura encontradas e na Figura 14(b) os pontos críticos
definidos a partir dessas regiões de alta curvatura, os quais
correspondem às pontas dos dedos da mão do usuário.
Figura 13. (a) Imagem com o maior contorno da imagem. (b)
Imagem com as regiões de alta curvatura do contorno em
cinza escuro.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 14](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-20-320.jpg)
![Figura 14. (a) Imagem com as regiões de alta curvatura do
contorno em cinza escuro. (b) Imagem com os pontos críticos
(pontas dos dedos) do contorno localizados.
A etapa de reconhecimento consiste em
que o usuário está realizando para a câmera. O sistema
desenvolvido reconhece gestos para seis ações pré
definidas: Apontamento (Figura 15(a)),
15(b)), Zoom-out (Figura 15(c)), Rotação Horária (Figura
15(d)), Rotação Anti-Horária (Figura
(Figura 15(f)). O fluxograma do processo de
reconhecimento é mostrado na Figura 16
Primeiramente o sistema verifica a quantidade de pontas de
dedos identificados na etapa anterior de descrição. Caso o
número de dedos reconhecidos seja igual a 1, o sistema
identifica o gesto do usuário como sendo de apontamento e
armazena a posição x-y da ponta de dedo encontrada.
Caso o número de dedos reconhecidos seja igual a 2, o
sistema pode identificar dois tipos de gestos: gesto p
ação de zoom ou de rotação. Para diferenciar entre os dois,
verifica-se o ângulo da reta formada pelas pontas dos dois
dedos reconhecidos.
Caso o ângulo da reta formada pelas pontas dos dedos seja
de aproximadamente 90°, o sistema identifica o gesto
realizado como sendo de zoom. Caso o ângulo seja de
aproximadamente 45° ou 125°, o sistema identifica o gesto
realizado como sendo de rotação. Caso o ângulo assuma
quaisquer outros valores, o sistema identifica o gesto como
sendo inválido.
Caso o gesto realizado seja de zoom, deve
referente a zoom in ou zoom out. Isso é feito calculando
o tamanho do segmento de reta formado pelas pontas dos
dois dedos do usuário. Se essa distância for maior que um
certo limiar, o gesto é de zoom in; se essa distância for
menor que um certo limiar, o gesto é de
Caso o gesto realizado seja de rotação, deve
se ele é referente à rotação horária ou anti
feito verificando-se o ângulo da reta formada pelas pontas
dos dois dedos do usuário. Caso o ângulo seja de
aproximadamente 45°, o gesto é de rotação horária; caso o
ângulo seja de aproximadamente 125°, o gesto é de
anti-horária.
Caso o número de dedos reconhecidos seja igual a 3, o
sistema identifica o gesto como sendo de Arrastar e
armazena a coordenada da ponta do dedo central.
(a) Imagem com as regiões de alta curvatura do
contorno em cinza escuro. (b) Imagem com os pontos críticos
(pontas dos dedos) do contorno localizados.
em identificar o gesto
que o usuário está realizando para a câmera. O sistema
desenvolvido reconhece gestos para seis ações pré-
), Zoom-in (Figura
), Rotação Horária (Figura
Horária (Figura 15(e)) e Arrastar
). O fluxograma do processo de
6.
Primeiramente o sistema verifica a quantidade de pontas de
dedos identificados na etapa anterior de descrição. Caso o
econhecidos seja igual a 1, o sistema
identifica o gesto do usuário como sendo de apontamento e
y da ponta de dedo encontrada.
Caso o número de dedos reconhecidos seja igual a 2, o
sistema pode identificar dois tipos de gestos: gesto para a
ou de rotação. Para diferenciar entre os dois,
se o ângulo da reta formada pelas pontas dos dois
Caso o ângulo da reta formada pelas pontas dos dedos seja
de aproximadamente 90°, o sistema identifica o gesto
. Caso o ângulo seja de
aproximadamente 45° ou 125°, o sistema identifica o gesto
realizado como sendo de rotação. Caso o ângulo assuma
quaisquer outros valores, o sistema identifica o gesto como
, deve-se identificar se é
. Isso é feito calculando-se
o tamanho do segmento de reta formado pelas pontas dos
dois dedos do usuário. Se essa distância for maior que um
se essa distância for
menor que um certo limiar, o gesto é de zoom out.
Caso o gesto realizado seja de rotação, deve-se identificar
rotação horária ou anti-horária. Isso é
se o ângulo da reta formada pelas pontas
dos dois dedos do usuário. Caso o ângulo seja de
aproximadamente 45°, o gesto é de rotação horária; caso o
ângulo seja de aproximadamente 125°, o gesto é de rotação
Caso o número de dedos reconhecidos seja igual a 3, o
sistema identifica o gesto como sendo de Arrastar e
armazena a coordenada da ponta do dedo central. Caso o
Figura 15. Gestos suportados pelo sistema. (a) Gesto de ação
de apontamento. (b) Gesto de ação de
ação de zoom out. (d) Gesto de ação de rotação horária. (e)
Gesto de ação de rotação anti
arrastar.
Figura 16. Fluxograma do processo de reconhecimento dos
gestos.
número de dedos reconhecidos seja algum outro que não
1,2 ou 3, o sistema não reconhece nenhum gesto válido.
O método de interação para dispositivos portáteis baseado
em rastreamento da mão descrito
no sistema proposto no trabalho
Formas de Avaliação
O algoritmo proposto neste trabalho será avaliado em três
critérios distintos: custo computacional, quantidade de
Gestos suportados pelo sistema. (a) Gesto de ação
apontamento. (b) Gesto de ação de zoom in. (c) Gesto de
. (d) Gesto de ação de rotação horária. (e)
Gesto de ação de rotação anti-horária. (f) Gesto de ação de
arrastar.
Fluxograma do processo de reconhecimento dos
gestos.
número de dedos reconhecidos seja algum outro que não
1,2 ou 3, o sistema não reconhece nenhum gesto válido.
para dispositivos portáteis baseado
em rastreamento da mão descrito neste trabalho é baseado
no sistema proposto no trabalho de Cortez et al. (2008) [5].
O algoritmo proposto neste trabalho será avaliado em três
: custo computacional, quantidade de
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 15](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-21-320.jpg)



![Virtual Wheel: Proposta de Um Método de Interação
Gestual para Jogos de Corrida
Rodrigo Fernandes Freitas, Paulo César Cortez, Rodrigo C. S. Costa, Antônio C. da S. Barros
Laboratório de Engenharia de Sistemas de Computação, Universidade Federal do Ceará - UFC
Campus do Pici S/N, Bloco 723, Cx. Postal 6015, CEP 60455-970 – Fortaleza - CE
rodrigo@gihm.info, cortez@gihm.info, rodcosta@gimh.info, carlos@gimh.info
RESUMO
A indústria de jogos eletrônicos ou video games é hoje uma
das maiores indústrias do mundo, com lucros anuais da
ordem de dezoito bilhões de dólares. Tradicionalmente, a
forma de interação do ser humano com os video games é
realizada através de dispositivos físicos como joysticks,
mouse e teclado. Contudo, existe uma tendência de
mercado em criar formas mais intuitivas para realizar esta
interação, como por exemplo através de métodos de visão
computacional. Este artigo apresenta o Virtual Wheel, um
método de reconhecimento de gestos para interação com
jogos de corrida. O método proposto consiste na localização
e reconhecimento das mãos do usuário, o qual simula o uso
de um volante real e realiza movimentos para a esquerda e a
direita, além de poder acionar comandos especiais erguendo
os polegares. Os resultados mostram que o sistema é
possível de ser utilizado em conjunto com jogos de corrida.
Author Keywords
Interação por gestos, Segmentação de pele,
Reconhecimento de gestos.
ACM Classification Keywords
I.4.9. Image processing and computer vision: Applications.
INTRODUÇÃO
Atualmente, a indústria de jogos eletrônicos (games) é uma
das maiores do ramo de entretenimento, com lucros anuais
entre 18 e 25 bilhões de dólares, e também é uma das que
mais crescem, com uma taxa de crescimento de 15 a 25%
por ano [7, 16]. A indústria de games também possui uma
presença crescente no Brasil, com uma arrecadação de 80
milhões de reais em 2008 no país [1].
A maior parte dos jogos para computador é controlada por
dispositivos de entrada convencionais como joystick,
teclado e mouse. Tais jogos não permitem que o jogador
faça uso de seus movimentos naturais para interagir com os
mesmos, o que implica que ele deve aprender a controlá-
los, ou seja, associar sequências de apertos de botões e
movimentos de eixos a ações dentro do jogo [15].
Existem vários motivos para um jogador desejar mudar a
forma de interação com um jogo. Usar um dispositivo de
entrada diferente ou uma nova forma de interação (por
exemplo, através de sons captados por um microfone ou por
reconhecimento de gestos) pode tornar a experiência de
jogar mais realista e divertida. Além disto, o
reconhecimento de gestos é uma forma de interação mais
intuitiva, podendo tornar o jogo acessível a usuários com
necessidades físicas especiais [14].
Um exemplo de método de interação a partir do
reconhecimento de gestos é o Kinect, produzido pela
Microsoft. O Kinect consiste em uma nova tecnologia para
o console Xbox 360, sem fios ou controles físicos,
reconhecendo o movimento do usuário através de uma
câmera especial, a ZCam. Através do processamento de
vídeo é realizado o mapeamento completo do corpo, além
do reconhecimento comandos de voz [12]. Sua utilização é
mostrada na Figura 1.
Figura 1. Kinect sendo utilizado em conjunto com um jogo de
corrida.
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA.
Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 19](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-25-320.jpg)
![Figura 2. Playstation Move da Sony em funcionamento.
A Sony realiza o desenvolvimento um controle sensível a
movimento, o Playstation Move, que conta com o auxílio
de esferas coloridas para que seu movimento possa ser
rastreado pelo Playstation Eye, a câmera do console
Playstation 3 [13], como mostrado na Figura 2.
No trabalho de Paula et al. (2006) [11] é proposto o
Camera Kombat, jogo de luta que, através do emprego de
Visão Computacional, possibilita aos usuários jogarem
utilizando o próprio corpo nos combates. Através de
técnicas de subtração de fundo, os jogadores são
identificados, possibilitando o reconhecimento das ações
realizadas por eles, como soco, chute ou esquiva, como
mostrado na Figura 3.
Figura 3. Camera Kombat em funcionamento,
detectando os jogadores e os movimentos realizados por
estes.
Figura 4. Demonstração do GeFighters, com a utilização de
marcadores para indicar a localização das mãos direita e
esquerda.
Teixeira et al. (2006) [15] propõem o GeFighters, outro
jogo de luta em que o usuário utiliza seus próprios
movimentos, mas diferente do Camera Kombat, o sistema é
baseado em marcadores para a identificação das mãos
esquerda e direita, como mostrado na Figura 4.
Estes trabalhos descritos na literatura são capazes de
reconhecer os movimentos do jogador e permitem a
interação com os jogos de maneira bastante efetiva. Porém,
eles sofrem de algumas limitações. O Kinect e o Playstation
Move são dependentes da utilização de câmeras especials, a
ZCam e o PlaystationEye respectivamente, restringindo seu
uso aos usuários que possuam tal dispositivo de hardware,
além de só poderem ser utilizados nos consoles para os
quais foram desenvolvidos, o XBox 360 e o Playstation 3,
respectivamente. O Camera Konbat e o GeFigthers podem
ser utilizados com câmeras de vídeos comuns, no entanto o
primeiro exige que o fundo permaneça estático e qualquer
variação de luminosidade causará falhas na detecção dos
movimentos. Já o segundo requer a existência de objetos
padronizados, no caso os marcadores que indicam a mão
esquerda e direita, para o reconhecimento dos movimentos.
Este trabalho tem como objetivo apresentar um sistema de
Visão Computacional (VC) que captura imagens através de
uma webcam comum e permite ao usuário controlar um
jogo de corrida qualquer através de gestos manuais. O
sistema dá a impressão ao usuário de estar segurando um
volante de automóvel, podendo girá-lo para a esquerda ou
para a direita, similarmente ao movimento feito ao dirigir
um veículo. Além disto, o sistema proposto permite o
acionamento de comandos especiais através do
reconhecimento dos dedos polegares, possibilitando o envio
de informações, similar ao realizado pelos botões de um
controle de video game.
O trabalho está organizado em 5 seções. A próxima seção
descreve os métodos que compõem o sistema de VC, em
seguida, a metodologia proposta é descrita. Na seção 4 são
descritos os resultados obtidos a partir da metodologia
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 20](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-26-320.jpg)
![Figura 5. Diagrama de blocos das etapas de um Sistema de
Visão Artificial.
proposta e, por fim, a seção 5 descreve as conclusões e as
perspectivas de trabalhos futuros.
FUNDAMENTAÇÃO TEÓRICA
Um sistema de Visão Artificial é composto das etapas
mostradas na Figura 5, as quais são detalhadas a seguir.
Aquisição da Imagem
A etapa de aquisição consiste da captura das imagens por
um elemento sensor, gerando uma matriz com valores
discretos à qual podem ser aplicadas diversas operações. A
imagem adquirida pode ser representada em diversos
espaços de cores, tais como YCbCr, RGB e HSV [4].
Pré-Processamento
A etapa de pré-processamento consiste no processo de
manipular uma imagem de modo que a imagem resultante
seja mais apropriada do que a imagem original para uma
aplicação específica. Ou seja, a principal meta é melhorar
uma imagem em algum sentido pré-definido, de modo a
recuperar uma imagem dos danos sofridos na etapa de
aquisição [4].
Há uma infinidade de técnicas de pré-processamento na
literatura. Uma técnica muito utilizada é a aplicação do
filtro da média, o qual consiste em uma janela deslizante de
tamanho 2N+1 x 2N+1, em que o pixel (x,y) da imagem (I)
em que a janela está centrada é substituído na imagem
filtrada (J) através de:
, = ∑ ∑ + , +
(1)
Segmentação de Imagens Digitais
O processo de segmentação de uma imagem digital consiste
em subdividir uma dada imagem em regiões ou objetos com
base em características destas regiões, as quais são
compostas por um conjunto de pixels satisfazendo um dado
critério [4].
Existem diversas técnicas capazes de segmentar um objeto
em uma imagem digital. Uma das técnicas muito utilizadas
é a segmentação por limiarização. Este tipo de segmentação
é baseado na distribuição dos níveis de cinza da imagem e
possui um baixo custo computacional [8].
A limiarização funciona através do estabelecimento de um
limiar T que separa a imagem em duas regiões. Os pixels da
imagem f(x,y) cujos valores são maiores que T são
classificados como pontos do objeto e os pontos da imagem
f(x,y) cujos valores são menores que T são classificados
como fundo. Dessa forma, pode-se criar uma imagem
segmentada g(x,y) em que, por exemplo, os pixels
referentes ao objeto recebam um valor 1 (branco) e os
pixels referentes ao fundo recebam um valor 0 (preto) [3].
O processo de limiarização pode ser então representado
pela seguinte expressão:
, =
1, , ≥
0, ,
(2)
Representação e Descrição
Após a segmentação de uma imagem, o conjunto resultante
de pixels deve ser representado e descrito de forma
adequada para o processamento computacional
subseqüente. A representação pode se dar na forma de
contornos ou de regiões completas [4].
Feita a representação, vem o processo de descrição ou
seleção de atributos, de forma a extrair atributos dos dados
representados que resultem em alguma informação
quantitativa de interesse ou que sejam básicos para
diferenciar uma classe de objetos de outra [5].
Um dos algoritmos existentes para a representação é o
algoritmo de elementos ou componentes conectados.
Elementos conectados são um conjunto de pixels agrupados
cujos valores de intensidade satisfazem um certo critério de
similaridade (no caso de imagens binárias, se seus valores
de intensidade são iguais). Esse algoritmo tem o objetivo de
identificar e rotular todos os agrupamentos de pixels
conectados presentes na imagem [4]. A Figura 6 mostra
uma região com três elementos conectados.
A partir da representação por elementos conectados, um
atributo importante de descrição que se pode extrair é o
centro de massa de um objeto. Uma das técnicas existentes
para o cálculo do centro de massa de um objeto é baseada
na Transformada da Distância, descrito no trabalho de
Morris e Elshehry (2002) [10]. Neste trabalho, a
Transformada da Distância é utilizada para calcular a
posição do centro de massa da região da mão por apresentar
maior robustez à presença do antebraço na imagem do que
as outras técnicas de cálculo do centro de massa.
Figura 6. Região com três elementos conectados.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 21](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-27-320.jpg)
![No trabalho de Leal et al. (2009)
algoritmo de representação e descrição para a detecção de
pontos críticos da mão humana. O algoritmo consiste, na
fase de representação, da aplicação de um algoritmo de
código em cadeia, o qual armazena em uma lista uma
sequência de segmentos conectados de modo a representar
o contorno da mão. Na fase de descrição, utiliza
informação do valor da curvatura dos pontos do contorno
para a identificação dos pontos críticos da mão, os quais
correspondem às pontas dos dedos e aos vales entre os
dedos.
Os pontos correspondentes aos vales entre os dedos são
descartados, restando somente os pontos correspondentes às
pontas dos dedos.
Reconhecimento e Decisão
Reconhecimento é o processo de atribuir um rótulo a um
determinado objeto baseado nos seus descritores, indicando
o seu significado. Já decisão é o processo de verificar qual
ação o sistema deve efetuar com base nos objetos que foram
reconhecidos [4].
METODOLOGIA
Esta seção apresenta o sistema de Visão
proposto, bem como detalha a metodologia utilizada para
desenvolvê-lo. O algoritmo proposto segue o mesmo
processo de um sistema de Visão Artificial mostrado na
Figura 5, na seção de Fundamentação Teórica
Aquisição
A etapa de aquisição da imagem é feita utilizando uma
webcam, fornecendo uma imagem representada no espaço
cores YCbCr. Para a captura da imagem da
utilizada a biblioteca OpenCV [6], que contém uma série d
funções na área de processamento de imagem. Com a
imagem adquirida, realiza-se todo o processo de
segmentação, extração do contorno e localização dos
centros de massa.
Pré-Processamento
Para a realização da etapa de pré-
escolhida aplicação do Filtro da Média sobre a imagem
adquirida pela câmera. Vários testes foram realizados e foi
observado que a utilização de uma janela 5x5 para o Filtro
da Média apresenta o melhor equilíbrio entre custo
computacional e desempenho de filtragem.
Segmentação
Neste trabalho, é segmentada a região da pele formada
pelos braços do usuário. Para isso, utiliza
limiarização descrita na seção anterior
YCbCr. Uma vantagem de realizar a segmentação neste
formato de cores consiste em evitar o esforço
computacional de converter a imagem para outro espaço de
cores, como RGB ou HSV.
Os limiares utilizados foram propostos por
(1999) [2]. Os pixels que estiverem nas faixas de valores do
canais Cb = [77,127] e Cr = [133,173] s
como pele.
(2009) [8] é descrito um
algoritmo de representação e descrição para a detecção de
pontos críticos da mão humana. O algoritmo consiste, na
, da aplicação de um algoritmo de
código em cadeia, o qual armazena em uma lista uma
sequência de segmentos conectados de modo a representar
o contorno da mão. Na fase de descrição, utiliza-se a
informação do valor da curvatura dos pontos do contorno
a identificação dos pontos críticos da mão, os quais
correspondem às pontas dos dedos e aos vales entre os
correspondentes aos vales entre os dedos são
descartados, restando somente os pontos correspondentes às
Reconhecimento é o processo de atribuir um rótulo a um
determinado objeto baseado nos seus descritores, indicando
o seu significado. Já decisão é o processo de verificar qual
ação o sistema deve efetuar com base nos objetos que foram
isão Computacional
proposto, bem como detalha a metodologia utilizada para
lo. O algoritmo proposto segue o mesmo
processo de um sistema de Visão Artificial mostrado na
seção de Fundamentação Teórica.
A etapa de aquisição da imagem é feita utilizando uma
, fornecendo uma imagem representada no espaço
cores YCbCr. Para a captura da imagem da webcam é
, que contém uma série de
funções na área de processamento de imagem. Com a
se todo o processo de
segmentação, extração do contorno e localização dos
-processamento foi
ção do Filtro da Média sobre a imagem
adquirida pela câmera. Vários testes foram realizados e foi
observado que a utilização de uma janela 5x5 para o Filtro
da Média apresenta o melhor equilíbrio entre custo
computacional e desempenho de filtragem.
a região da pele formada
pelos braços do usuário. Para isso, utiliza-se a técnica de
no espaço de cores
YCbCr. Uma vantagem de realizar a segmentação neste
em evitar o esforço
computacional de converter a imagem para outro espaço de
Os limiares utilizados foram propostos por Chai e Ngan
. Os pixels que estiverem nas faixas de valores do
canais Cb = [77,127] e Cr = [133,173] são considerados
Uma das vantagens da utilização dos limiares propostos por
Chai e Ngan (1999) é a sua capacidade de segmentar
corretamente os mais variados tons de pele
ser visto na Figura 7.
Representação e Descrição
Neste trabalho é desenvolvido um método capaz de
reconhecer os gestos mostrados na Figura
Figura 7. Os limiares propostos por Chai e Ngan (1999)
conseguem segmentar corretamente os mais variados tons de
pele
Figura 8. (a) Gesto com as mãos
câmera. (b) Gesto com as mãos fechadas apontadas para a
câmera rotacionadas para a esquerda. (c) Gesto com as mãos
fechadas apontadas para a câmera rotacionadas para a
direita. (d) Gesto com as mãos fechadas e com o polegar
esquerdo erguido. (e) Gesto com as mãos fechadas e com o
polegar direito erguido.
Uma das vantagens da utilização dos limiares propostos por
Chai e Ngan (1999) é a sua capacidade de segmentar
corretamente os mais variados tons de pele, conforme pode
Representação e Descrição
Neste trabalho é desenvolvido um método capaz de
reconhecer os gestos mostrados na Figura 8.
Os limiares propostos por Chai e Ngan (1999)
conseguem segmentar corretamente os mais variados tons de
pele.
. (a) Gesto com as mãos fechadas apontadas para a
câmera. (b) Gesto com as mãos fechadas apontadas para a
câmera rotacionadas para a esquerda. (c) Gesto com as mãos
fechadas apontadas para a câmera rotacionadas para a
direita. (d) Gesto com as mãos fechadas e com o polegar
do erguido. (e) Gesto com as mãos fechadas e com o
polegar direito erguido.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 22](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-28-320.jpg)
![Na Figura 8(a) é mostrado o gesto com as mãos do usuário
fechadas e apontadas para a câmera. Na Figura 8(b) é
mostrado o gesto com as mãos fechadas apontadas para a
câmera rotacionadas para a esquerda. Na Figura 8(c) é
mostrado o gesto com as mãos fechadas apontadas para a
câmera rotacionadas para a direita. Na Figura 8(d) é
mostrado o gesto com as mãos apontadas para a câmera e o
dedo polegar esquerdo erguido. Na Figura 8(e) é mostrado
o gesto com as mãos fechadas apontadas para a câmera e o
dedo polegar direito erguido.
Para o reconhecimento destes gestos, aplica-se sobre a
imagem segmentada através do método de limiarização o
algoritmo de elementos conectados descrito na seção
anterior a fim de localizar os dois objetos com tom de pele
de maior área na imagem, correspondendo às regiões dos
braços do usuário. O objeto segmentado localizado mais à
direita é considerado o braço direito, e o objeto localizado
mais à esquerda é considerado o braço esquerdo.
Em cada uma dessas regiões são calculadas as coordenadas
do centro de massa (xd e yd para o braço direito e xe e ye
para o braço esquerdo), bem como as coordenadas das
pontas dos dedos polegares, caso eles estejam erguidos,
através do método descrito em [8].
Na próxima seção é descrito o método para o
reconhecimento dos gestos apresentados na Figura 8.
Reconhecimento dos Gestos
Para a utilização do sistema proposto, o usuário deve
simular estar segurando um volante e apontar as mãos para
a câmera, como representado na Figura 8(a). Com base nas
coordenadas dos centros de massa das duas mãos,
calculadas a partir do método descrito na sub-seção anterior
e os quais são mostrados como círculos verdes na Figura
9(a), é possível definir um eixo de rotação do volante
virtual, formado pela reta que une os centros de massa das
duas mãos, conforme mostrado na Figura 9(a). Com base
nesse eixo, define-se o ângulo de rotação do volante que o
usuário simula estar segurando, como mostrado na Figura
9(b).
Para reconhecer os gestos de rotação à direita e à esquerda
utiliza-se o ângulo θ do eixo com a horizontal, o qual é
dado por:
= tan!
#$#%
$%
' (3)
Figura 9. (a) Identificação dos centros de massa de cada uma
das mãos e construção do eixo de rotação. (b) Giro do volante
definido a partir do ângulo do eixo de rotação.
A partir do valor deste ângulo, o movimento do volante
virtual para a esquerda ou para a direita é realizado
utilizando a seguinte expressão:
()* +,-.) = /
0,-.1), −20° 20°
5678,19:, ≥ 20°
; 1, .:, ≤ −20°
(4)
Acionamento de Comandos Especiais
Além dos movimentos para esquerda e direita, o sistema
desenvolvido é capaz também de identificar dois comandos
especiais (A e B) que simulam dois botões de um controle
de um video game.
Para acionar o comando especial botão A e o comando
especial botão B, o usuário deve erguer o polegar esquerdo
e direito, respectivamente, conforme mostrado nas Figuras
8(d) e 8(e).
Envio de Comandos doTeclado
Neste trabalho, utiliza-se o movimento do Volante Virtual
reconhecido para fazer a interação com um jogo de corrida.
Para isto, os movimentos reconhecidos acionam teclas
específicas e que são importantes para o jogo.
Isto é feito através da função nativa do Windows
keybd_event, a qual sintetiza o pressionar de um botão do
teclado. A função recebe como parâmetros o código ASCII
da tecla desejada e o estado dela (pressionada ou liberada)
[9]. Há cinco comandos que podem ser enviados pelo
sistema desenvolvido:
• Aceleração: comando enviado ininterruptamente
ao computador, exceto quando acionado o
comando Desacelera visto a seguir, codificado pela
tecla 'X';
• Esquerda: comando enviado quando o usuário
gira o volante para a esquerda, codificado pela
tecla 'L';
• Direita: comando enviado quando o usuário gira o
volante para a direita, codificado pela tecla 'R';
• Desaceleração: comando enviado quando o
usuário ergue o polegar esquerdo, acionando o
comando Botão A, fazendo com que o veículo
do jogo pare de acelerar.
• Item: comando enviado quando o usuário ergue o
polegar direito, acionando o comando Botão B,
indicando o uso de um item especial, codificado
pela tecla 'Z'.
RESULTADOS
Esta seção apresenta os resultados alcançados na
implementação do sistema proposto. Primeiramente são
descritos os resultados do reconhecimento dos gestos
propostos. Em seguida, são descritos os resultados da
utilização do sistema proposto em conjunto com um game
comercial. Por fim são descritas algumas limitações
presentes no método proposto.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 23](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-29-320.jpg)



![Design de interação aplicado a modelos colaborativos na
cobertura jornalística em eventos de calamidade pública
RESUMO
O artigo apresenta uma análise dos modelos de colaboração
utilizados pelos principais sites noticiosos do Brasil em
eventos de calamidade pública, em especial na cobertura
das fortes chuvas que provocaram enchentes e uma série de
transtornos no estado do Rio de Janeiro em abril de 2010. A
partir do estudo de caso dos modelos colaborativos de dois
dos principais portais jornalísticos do país, este artigo
pretende apontar as principais características e deficiências
das ferramentas atuais, propondo um novo modelo baseado
em mapas geográficos, que avance a questão do design de
interação no que diz respeito a relação do jornal com o
leitor-usuário, bem como no aproveitamento desse
conteúdo gerado pela colaboração na geração de uma base
de dados para políticas públicas que possam resultar em
uma série de medidas para o controle de situações de
calamidade futuras.
Author Keywords
Design, Colaboração, Mapas, Jornalismo, Interface,
Interação, Colaboração, Usuário
ACM Classification Keywords
DESIGN
INTRODUÇÃO
Nos últimos anos, a popularização das tecnologias digitais e
a ampliação das formas de acesso à Internet, além da queda
progressiva do custo de computadores e de conexão, vêm
criando um cenário propício à ampliação das práticas
comunicativas na Rede. Essa tendência vem modificando o
fluxo de informações na rede e inspira e justifica o
surgimento de experiências de jornalismo participativo,
processo em que os próprios internautas passam a atuar na
produção da notícia. Segundo BRAGA (2007, p.4), “os
fenômenos comunicacionais, na sociedade contemporânea,
apresentam uma diacronia muito dinâmica – não apenas
conseqüência do avanço tecnológico, mas também dos
processos sociais interativos que se diversificam
correlatamente”.
Permitir ao leitor a interação e o registro de sua 'voz'
qualifica enormemente a notícia. Como coloca
DALMONTE (2009, p.193), a efetiva participação do
leitor, ou a possibilidade de participação, desempenham
importante papel para o desenvolvimento do efeito de real,
pois as notícias não estão distantes, dispersas no mundo
virtual. Ao interagir com um produto jornalístico, o leitor
agrega àquela peça informativa não apenas suas impressões,
mas seus dados pessoais. O recurso jornalístico de uso de
personagens [personagem, no jornalismo, refere-se a
alguém que tenha vivenciado, ou vivencia, o fato narrado.
Este personagem, por meio da particularização, permite
ilustrar e dar densidade àquilo que é reportado, coloca o
autor] é ampliado, pois além das fontes selecionadas para a
composição do texto, outras vozes são agregadas, fazendo
com que a matéria se torne mais polifônica. Sob a
perspectiva de diversos olhares, vai além da instância de
produção.
Em função disso, muitos sites noticiosos estão se adaptando
a essa nova realidade. Há um interesse dos grandes jornais
online em expandir a participação e a interação com o
leitor, porém a grande maioria ainda mantém o controle das
fases da produção informativa nas mãos de jornalistas e
editores. Aliado ao fato de ser uma funcionalidade
relativamente nova, o conteúdo enviado pelo leitor ainda é
aproveitado de maneira incipiente pelos jornais. Na grande
maioria dos casos observados e exemplificados ao longo
deste artigo, a participação do leitor é feita através de um
formulário preenchido textualmente e publicada ou como
comentário a alguma notícia previamente publicada, ou
como matéria jornalística completa, com o leitor ocupando,
individualmente, o papel de um jornalista. Não existe, até o
momento, a idéia de formar um conteúdo verdadeiramente
coletivo a partir da colaboração de leitores, em um formato
que possa complementar o conteúdo oferecido pelos sites
jornalísticos, mas que fuja do formato tradicional de texto
noticioso, seja no processo de envio da colaboração, seja no
momento da publicação do conteúdo enviado.
Um exemplo de inovação nesse sentido se dá, por exemplo,
na possibilidade de utilização de mapas e ferramentas de
natureza georreferenciada como complemento ao processo
noticioso. Num momento em que o uso de ferramentas
desse tipo, como, por exemplo, o Google Maps, torna-se
cada vez mais usual entre os usuários domésticos, a idéia de
agregar conceitos de jornalismo participativo ao caráter
intuitivo e até mesmo lúdico dos mapas apresenta-se como
uma alternativa bastante interessante e desafiadora.
Para tanto, faz-se necessário o aperfeiçoamento da
integração dos dados e metadados gerados a partir da
colaboração de leitores com mapas temáticos, com o intuito
de melhorar o entendimento e a leitura das informações na
interface do modelo de colaboração, passando desde o
momento do envio da colaboração por parte do internauta
até as inúmeras possibilidades de aproveitamento dos dados
em ações de estratégia, de negócios ou mesmo de utilidade
pública.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 27](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-33-320.jpg)







![situação surgiram alguns modelos de jornalismo
colaborativo no Brasil, como o desenvolvido pelo Jornal O
Globo no Rio de Janeiro, com a criação do site Bairros.com
[http://www.oglobo.globo.com/rio/bairros/]; o papel do
cidadão [é] fundamental na difusão de conteúdos
hiperlocais, porque, por questões estruturais e econômicas,
a cobertura jornalística não pode alcançar tal amplitude.
Temos, assim, uma mudança de escala no trato do espaço
público, passando a trabalhá-lo não mais na visão
cartográfica lato sensu, mas alcançando a escala humana e
seu referenciais próximos, como a divisão por bairros, ruas,
quarteirões, prédios e espaços. Para o cidadão comum, essa
mudança permite uma melhor compreensão dos aspectos
abordados, uma vez que a visualização se aproxima
bastante da visão de mundo que ele possui, facilitando a
manipulação das informações e a contribuição com dados
próprios.
Georreferenciar uma entrada significa contextualizá-la e,
dessa forma, torná-la mais precisa. Ainda mais quando
agrupada a outros depoimentos de mesma natureza,
passamos a vislumbrar a realidade de determinada região
(2). Dessa forma, é possível mapear os tipos de problemas
característicos de cada região e qual as deficiências
presentes de modo geral. A ação de avaliação não necessita
de uma abstração e memória do local citado, já carregando
junto de si a informação da área tratada e suas questões
contíguas. Sendo assim, tanto numa percepção quantitativa
(certamente afetada pelos hábitos de determinada
população, pelas possibilidades e interesse de interação com
o modelo jornalístico) das ocorrências, quanto na
qualitativa, existe uma melhoria considerável na apreensão
destas informações.
Por último, a organização das informações a partir de uma
mapa facilita não apenas a busca mas também recuperar
determinada informação (4). Segundo PREECE, ROGERS
e SHARP (2005), nossa interação com qualquer interface se
estabelece também dentro de nossos padrões e capacidade
cognitivas, sendo um desses processos o de memória, sobre
o qual as autoras citam a pesquisa de Mark Lansdale,
psicólogo britânico, estudioso do problema de recuperação
de informação. Em relação a esta questão afirmam:
Ele [Lansdale] sugere ser interessante olhar para esse
processo como composto de dois processos da memória:
recuperação direta, seguida de verificação baseada em
reconhecimento. A primeira refere-se a utilizar informações
memorizadas sobre o arquivo que se deseja, para chegar o
mais próximo possível dele. (...) A segunda ocorre quando a
recuperação não conseguiu produzir o resultado que o
usuário esperava, exigindo, pois, que se consultem todos os
diretórios ou arquivos. (...) Lansdale propõe que os sistemas
de gerenciamento de arquivos devem ser projetados visando
a otimizar os dois tipos de processo da memória. Em
particular, os sistemas devem ser projetados de forma a
deixar que os usuários utilizem a memória que têm para
limitar a área que está sendo pesquisada e então representar
a informação nessa área da interface de forma a ajudá-los
ao máximo a encontrar o que precisam. (PREECE,
ROGERS e SHARP, 2005, p. 103)
Se expandirmos um pouco o conceito acima e substituirmos
a idéia de arquivo pela de notícia ou informação,
perceberemos como a organização e filtragem das
informações colabora para a navegação do usuário.
Tendo em vista todas essas questões, fica evidente a
utilidade de tal modelo no fomento de um arcabouço para a
discussão por parte da população das questões deficitárias
no que tange o espaço público e sua [in]capacidade de
abrigar aqueles que nele habitam; identificando quais os
problemas estruturais e quais os ocasionais, permitindo uma
conscientização e um aprendizado, além de ferramentas de
fiscalização da gestão pública. Todas essas questões podem,
ainda, ser aproveitadas pelo próprio veículo de
comunicação, seja gerando reportagens em resposta à
questionamentos dos leitores, seja em função da detecção
de padrões e outros interesses que possam gerar notícia
jornalística. Dessa forma, a colaboração do leitor na
construção da narrativa do jornalística se torna plena, pois
não apenas sua participação é publicada como serve de base
para direcionar as próprias editorias do jornal na busca de
conteúdo noticioso propício aos interesses e necessidades
de seus leitores
Sob o ponto de vista das ferramentas de webjornalismo que
se apresentam frente não só às novas tecnologias, mas
também por conta da familiarização da comunidade para
com elas, o modelo aqui proposto apresenta características
que o incluem no bojo dos aprimoramentos da chamada 4ª
geração do webjornalismo (BARBOSA, 2007 apud
DALMONTE, 2009, p. 123). Isso porque sua estrutura de
georeferenciamento armazena as informações em bases de
dados que reconfiguram a visualização da informação em
função da busca do usuário -- aqui, como o fez
DALMONTE (2009, p.227), é importante diferenciar banco
de dados e base de dados: [Para] Ribas (2005, p.7), tomado
por referência Colle (2002), (...) 1) banco de dados é o
conjunto de informações, o conteúdo armazenado em uma
base de dados; 2) e base de dados é a estutura lógico-
matemática que permite o armazenamento e a estruturação
dos conjuntos, de modo que os dados são independentes e
podem ser modificados, representados ou consultados de
diversas maneiras. Percebe-se, assim, a atualidade das
questões aqui levantadas, em um sistema que abarca quase
todas as características apontadas por Palacios (2002) como
sendo as representativas do webjornalismo, a saber: 1)
multimidialidade, 2) interatividade, 3) hipertextualidade, 4)
personalização, 5) atualização e 6) memória.
CONCLUSÃO
Como apresentado ao longo do artigo, o enfoque no design
de interação das ferramentas colaborativas permite o
desenvolvimento de modelos que aproveitem melhor a
potencialidade existente na relação do leitor com o site
noticioso.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 35](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-41-320.jpg)

![O design de material jornalístico: do impresso ao
virtual - os desafios da interatividade
RESUMO
O jornalismo sempre foi um dos campos mais tradicionais
do design. Com a popularização da internet e dos sites de
notícias, este campo se tornou mais abrangente e
heterogêneo. Este artigo apresenta o processo de transposi-
ção do meio impresso para o meio hipermidiático que o jor-
nalismo vem sofrendo desde os anos 1990. É feita uma
apresentação do workflow de produção de notícias, que
passa pela apuração, criação e publicação de notícias na mí-
dia tradicional impressa e sua transposição e adequação pa-
ra a internet, algumas soluções existentes hoje para o acesso
a matérias jornalísticas em webistes e leitores digitais. No
fim é feita uma proposta de um programa utilizando cons-
truído sob o padrão de programação MVC, visando facilitar
o trabalho do designer na criação de layout para conteúdo
jornalístico para diferentes mídias.
Palavras-chave
Design de notícias, interação, hipermídia, mvc
ACM Classification Keywords
H5.4. Information interfaces and presentation: Hypertext /
Hypermedia.
INTRODUÇÃO
A internet e as mídias eletrônicas apresentam hoje uma
realidade que há alguns anos era impensável: um enorme
volume de informação acessível a todos. A rede mundial de
computadores se tornou um dos principais veículos de in-
formação e notícias, divulgadas de maneira quase instantâ-
nea. Mídias eletrônicas permitem conteúdo rico, adicionan-
do sons, vídeos e conteúdo interativo ao texto jornalístico.
Atualmente, todos os principais jornais e revistas têm suas
versões online, que muitas vezes não exploram todas as
possibilidades destes novos meios de comunicação. Este
artigo pretende analisar algumas soluções de adaptação e
transposição do conteúdo jornalístico para as novas mídias,
além de apresentar uma alternativa de solução para uma
reportagem originalmente publicada na edição impressa da
revista Veja.
O SURGIMENTO DA INTERNET
Em 1969 foram ligados dois centros de pesquisa através de
uma rede de computadores a uma grande distância na Cali-
fórnia, EUA, dando início a Arpanet. De uso estritamente
militar, com o objetivo de cobrir todo o território norte-
americano para troca de informações sobre a segurança na-
cional do país e resistir a possíveis ataques inimigos, a rede
começou a incorporar outros centros de pesquisa e univer-
sidades dos EUA a partir de 1970.
Em 1973 foi criada a primeira conexão internacional,
ligando a Arpanet à Universidade de Londres. Em 1978
foram incorporadas redes de outros países e, em 1981, a
rede internacional cobria os EUA, Canadá, Reino Unido,
Europa e Austrália. Em 1988 começa a exploração comer-
cial da rede: serviços de email foram conectados e provedo-
res comerciais de serviços, os chamados ISP (Internet
Service Providers) foram criados. Outras redes separadas -
como Usenet e BITNET - foram conectadas ao que já se
chamava de internet.
No entanto, o acesso ainda era limitado. Em 1991 o
laboratório europeu CERN introduziu a World Wide Web,
criação de Tim Berners Lee, que permitia a utilização de
sistemas e ferramentas para criação e visualização de infor-
mação em sistemas hipermídia. A criação da linguagem
HTML (Hypertext Markup Language) permitiu a exibição
da informação através de uma estrutura de hipertexto e o
navegador Mosaic trouxe uma interface gráfica que
facilitava a navegação. Posteriormente, os navegadores
Netscape e Internet Explorer tiveram um importante papel
na popularização da rede [12].
Em 2004 surgiu o conceito de Web 2.0, que ao contrário do
que o nome sugere não usa uma nova versão de protocolos
ou novas tecnologias, mas procura criar aplicativos basea-
dos na web focados em na troca de informação, interope-
rabilidade, design centrado no usuário e colaboração, usan-
do tecnologias conhecidas como linguagens de script rodan-
do no servidor (PHP, ASP.NET, Java) com Javascript, uma
linguagem de programação que roda no computador do
usuário [27]. A Web 2.0 permite uma maior participação do
usuário, permitindo que ele desempenhe um papel ativo na
construção do conteúdo.
Hoje no Brasil o acesso à Internet chega a 63,2 milhões de
pessoas [2] o que demonstra sua importância como meio de
comunicação.
Jornalismo na internet
Com a abertura comercial da internet e o acesso da po-
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 37](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-43-320.jpg)
![pulação em geral à rede, começaram a surgir os websites
comerciais, preocupados em manter uma presença online,
mas ainda receosos em relação ao potencial comunicacional
e às possibilidades de retorno financeiro. O Chicago
Tribune em 1992 foi o primeiro jornal a publicar uma
edição online, uma cópia da sua edição impressa. O New
York Times lançou sua versão em 1994, e no fim do século
todos os principais jornais estavam online [19]. No Brasil, o
primeiro jornal a criar uma versão online foi o Jornal do
Brasil. Outros jornais criaram suas edições online em
seguida, como a Folha de São Paulo, o Estado de São Paulo
e O Globo.
A transposição do material jornalístico da mídia impressa
para a internet passa por três fases distintas [23]: Na
primeira fase, chamada transpositiva, os sites jornalísticos
apresentavam transposições de partes de suas matrizes,
apresentando uma ou duas matérias de suas principais edi-
torias, atualizadas uma vez por dia, acompanhando a produ-
ção e a publicação das edições impressas. Nesta fase, o
trabalho do designer não tinha uma fronteira definida e
frequentemente era feito por profissionais de informática
que criavam as páginas como um todo, do layout à
programação.
Em um segundo momento, conhecido como metáfora, os
produtos jornalísticos começam a explorar as possibilidades
oferecidas pela internet de maneira experimental, sem se
distanciar de sua versão impressa. Nesta fase diminui o
intervalo de atualizações das notícias, começam a surgir de
formas de interação com o autor ou com outros usuários
através de ferramentas como email ou fóruns de debate. A
criação do conteúdo jornalístico passa a levar em considera-
ção os recursos de hipermídia na internet. O designer passa
a ter uma atuação mais específica, na criação de templates,
material gráfico e adequação do conteúdo ao layout.
No terceiro momento o webjornalismo se distancia de vez
do modelo de mídia tradicional, deixando de ser apenas
uma versão da mídia tradicional e passando a explorar as
verdadeiras possibilidades oferecidas pela rede, facilitado
pela melhora da tecnologia de transmissão de dados
possibilitando a transmissão mais rápida de sons, imagens e
vídeos. Muitos websites jornalísticos no Brasil estão hoje
na segunda fase: seu conteúdo principal é uma versão da
edição impressa, com o acréscimo de alguns elementos
extra em multimídia. As equipes se tornam maiores, com
funções mais específicas; surgem novas áreas para o design
como, por exemplo, design de interação. Alguns exemplos
de jornais que possuem características da terceira fase no
mundo são o Telegraph, da Inglaterra [4], o El País da
Espanha [5] e a MSNBC, dos EUA [17].
Segundo GUERRERO e HUERTA [24] as fases do de-
senvolvimento da imprensa online não são três, mas quatro.
Na primeira, há uma reprodução do conteúdo textual im-
presso, sem imagens. Nesta fase não havia quase nenhum
recurso destinado à internet nas editorias dos jornais. Na
segunda fase, começam a ser incorporados recursos de
hipertexto e multimídia, como links, imagens, vídeo e
áudio. Neste momento começa a separação entre o
webjornalismo e o jornalismo impresso. Na terceira fase há
um incremento de recursos multimídia, acréscimo de
serviços de entretenimento, comunidades e serviços sociais.
Há o início de oferta de comércio eletrônico. Na quarta fase
é que se encontra o conteúdo produzido exclusivamente
para a internet. Elementos interativos como chats e
enquetes são incorporados às reportagens. Há uma reserva
de recursos e profissionais exclusivos para a produção de
conteúdo online. Ainda segundo os autores, é possível que
uma mesma publicação possua características que a inclua
em mais de uma fase. O designer desempenha nestas fases
papéis similares aos apresentados nas fases anteriores.
PERSPECTIVAS DO JORNALISMO
A abertura comercial da internet aconteceu de forma muito
abrupta, fazendo com que todas as empresas buscassem um
lugar no ciberespaço sem planejamento prévio. Estar na
internet era importante, afinal os concorrentes também cor-
riam para ter um site. No caso dos jornais principalmente as
estratégias de negócios se provaram inadequadas. No come-
ço, a nova mídia foi vista ceticismo em relação as suas
possibilidades de geração de renda. As direções de alguns
jornais não perceberam na rede uma oportunidade de novos
negócios, mas sim uma oportunidade de atrair novos
leitores para os jornais impressos, principalmente leitores
mais jovens, que vêm deixando de ler jornais [8]. Em outros
casos pensou-se que a disponibilidade do conteúdo integral
gratuitamente para os leitores na internet possibilitaria um
retorno com publicidade. O retorno nunca veio e os leitores
se acostumaram a ter de graça o mesmo conteúdo pelo qual
teriam que pagar para ler no jornal impresso [3]. Acabou se
criando um círculo vicioso, porque se o jornal passa a
cobrar pelo conteúdo perde leitores para os concorrentes,
onde o conteúdo é gratuito, e se continua disponibilizando
material gratuito continua atuando no vermelho.
Ainda assim muitos jornais cogitaram ou fizeram
experiências com a cobrança de acesso às notícias online,
de certa maneira paradoxal em relação à vontade de se re-
crutar jovens leitores. O New York Times chegou a cobrar
o acesso a seu conteúdo até 2007, quando aboliu a cobrança
procurando gerar mais renda com um aumento no número
de anunciantes. O editor-executivo do jornal, Bill Keller,
anunciou que o jornal estudava voltar a cobrar o acesso de
seus leitores em 2010 para diminuir os prejuízos. Rupert
Murdoch, o diretor da News Corp., empresa que reúne
jornais como o The Times e o The Sun, ingleses, e o norte-
americano New York Post, afirmou que todos os jornais da
empresa terão um modelo de cobrança onde parte do
conteúdo é gratuito e parte é paga. Este modelo é baseado
no utilizado pelo site do jornal sobre economia Wall Street
Journal, que também faz parte da News Corp. e é hoje um
dos poucos grandes webjornais que apresenta lucro. Alguns
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 38](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-44-320.jpg)
![críticos a cobrança afirmam que o único motivo de sucesso
do Wall Street Journal é que os leitores tendem a estar de
acordo com a cobrança quando buscam notícias especia-
lizadas, como é o caso deste jornal.
O The Times começou com o sistema de cobranças em
meados de 2010, e após três semanas a estimativa de queda
no número de leitores era próxima de 90% [7]. O jornal se
dividiu em dois na internet, em referência ao Times, que
circula de segunda a sábado, e o Sunday Times, que circula
somente aos domingos. A assinatura do primeiro custa uma
libra esterlina por dia, enquanto do segundo custa duas
libras esterlinas por semana, com assinaturas gratuitas para
bibliotecas cadastradas. No primeiro mês de cobrança o
jornal teve um declínio de 48% nos pageviews além de cair
609 posições no ranking Alexa, que mede a popularidade de
websites no mundo todo. Essa queda levou muitos leitores
aos jornais concorrentes como o Guardian e o Telegraph ou
mesmo a outros jornais que não são concorrentes diretos do
Times, como o tablóide Daily Mail.
Apesar de tudo, segundo Borges [3], a internet não é a prin-
cipal culpada nessa queda no número de leitores do jornal
impresso, que vem acontecendo desde o final dos anos 80,
antes da popularização da grande rede. O autor cita como
uma das causas o fato de que muitos jornais, que
tradicionalmente tinham uma administração familiar, passa-
ram a ser dirigidos por grupos de investimento como a já
citada News Corp. Nestes grupos a pressão por lucro é
maior, podendo levar em alguns casos a redução de recur-
sos, de custos e de pessoal, refletindo em uma queda na
qualidade do produto jornalístico.
No Brasil, O Globo Online disponibiliza as notícias de
última hora e outras notícias exclusivas da versão online
gratuitamente. O conteúdo do jornal impresso, incluindo as
colunas de opinião, só podem ser acessados por assinantes
da versão impressa. Não há assinatura exclusiva para a
versão eletrônica. Segundo Borges [3], O Globo Online não
se sustenta com propaganda e é um dos poucos jornais
online lucrativos graças à publicação dos chamados produ-
tos editoriais, ou seja, matérias pagas por empresas que bus-
cam a divulgação de seu ramo de atividade e atingir o pú-
blico consumidor do jornal.
O Jornal do Brasil recentemente publicou um comunicado
que devido suas dívidas o jornal deixará de circular como
impresso, sendo publicado exclusivamente na internet a
partir do dia 1º de setembro de 2010.
Porém nem tudo está perdido para o jornalismo. Os
smartphones, celulares modernos, com recursos como
agenda, acesso à internet e possibilidade de instalação de
aplicativos que aumentam suas funcionalidades, se tor-
naram um dos principais tipos de dispositivo de consumo
de mídia no mundo inteiro. Mais recentemente surgiram
também os leitores eletrônicos, e-readers em inglês, apare-
lhos voltados especificamente para a leitura de livros, jor-
nais ou revistas. Os jornais passaram a publicar conteúdo
também para estes dispositivos, através de assinatura ou
venda de exemplares avulsos, como faz o jornal O Globo
para a plataforma Kindle, da Amazon. A Esquire lança suas
edições simultaneamente nas bancas e como aplicativo para
o celular iPhone, da Apple. Muitos jornais e revistas já lan-
çaram aplicativos e edições para o leitor de ebooks iPad,
também da Apple. As perspectivas de lucros com venda de
conteúdo para estes dispositivos são promissoras, as
empresas estão empolgadas com o segmento e vêm
planejando modelos de cobrança pelo conteúdo desde o
início, diferente do que foi feito na web.
ESCRITA IMPRESSA VS. ESCRITA ELETRÔNICA
A escrita passou por milhares de anos de evolução com
quase nenhuma mudança. O papel, que só como suporte da
escrita impressa é utilizado a cerca de 500 anos, hoje cede
terreno para suportes eletrônicos de escrita, que possuem
características distintas que refletem na forma como o texto
é lido. Hoje se cria conteúdo para a escrita eletrônica sem
considerar estas características, como se estes suportes se
comportassem da mesma maneira que o papel.
Na leitura tradicional a imagem é formada pela reflexão da
luz no papel. A resolução os textos e imagens, medida em
DPI (pontos por polegada, em inglês), é de 300 no caso das
revistas e de 150 a 200DPI no caso dos jornais. Essas duas
características são as principais responsáveis pelo conforto
da leitura do papel, que pode ainda ser dobrado e facilmente
carregado no bolso ou em uma bolsa, ter suas margens
usadas para anotações a lápis ou caneta e seus cantos
dobrados para a marcação de páginas. Alguns usuários afir-
mam sentir a falta de uma relação física com o texto ele-
trônico [16]. Os impressos não precisam de eletricidade
para ser lidos, bastando um pouco de luz ambiente.
Leitores eletrônicos
Os leitores eletrônicos ou digitais podem ser de dois
principais tipos: monitores CRT ou LCD e telas de E-Ink.
Monitores de CRT ou LCD
Monitores de CRT e LCD possuem características bastante
parecidas. Os primeiros eram mais comuns há algum
tempo, mas são maiores, pesados e consomem mais ener-
gia. Os monitores de LCD, mais portáteis, ficaram popu-
lares e estão presentes em computadores, laptops, televiso-
res, telefones celulares e outros dispositivos. Ambos pos-
suem baixa resolução de tela (72 a 100 DPI), com a imagem
formada através de emissão de luz, por isso têm não pos-
suem a riqueza de detalhe da impressão em papel e causam
maior incômodo na leitura. A iluminação ambiente também
influencia na leitura em dispositivos deste tipo: são quase
impossíveis de serem lidos sob incidência de luz direta
como a da luz do sol. Sua autonomia de bateria também é
considerada baixa em relação aos dispositivos de E-Ink.
Sua principal vantagem é a possibilidade de uso de imagens
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 39](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-45-320.jpg)
![coloridas e vídeos em conjunto com o texto escrito.
Monitores de E-Ink
A tecnologia de E-Ink (tinta eletrônica em inglês) surgiu
para fazer com que a leitura eletrônica ficasse mais próxima
da leitura no papel. Sua imagem é formada por micro
esferas que possuem um lado claro e outro escuro. Através
de uma descarga elétrica essas micro esferas se orientam
para formar a imagem, como no papel, através da reflexão
de luz. Sua resolução é maior que a dos monitores de LCD
e CRT – o leitor eletrônico Kindle possui uma resolução
próxima a de um jornal – e sofrem menos influência da
iluminação direta. Os leitores de tinta eletrônica em comer-
cialização hoje não são coloridos nem têm a possibilidade
de uso de vídeo.
Leitores digitais no mercado
Os dois leitores eletrônicos portáteis mais conhecidos à
venda hoje são o Kindle, da Amazon, e o iPad, da Apple. A
Amazon contou com sua relação com as editoras para a
disposição de um grande número de títulos em um leitor de
e-ink, o mais similar possível à leitura tradicional. Já a
Apple apostou em um leitor baseado na tecnologia LCD,
podendo assim vender tanto livros como jogos e filmes já
disponíveis em sua loja online. Sendo assim, o Kindle é ex-
clusivamente um leitor eletrônico, enquanto o iPad é um
dispositivo para consumo de mídia em geral, inclusive li-
vros, jornais e revistas eletrônicos. Existem alguns outros
leitores eletrônicos de menor expressão produzidos pela
Sony e pela Barnes Noble também com tela em e-ink. No
Brasil a Positivo lançou um leitor eletrônico em meados de
2010 e a livraria online Gato Sabido vende seus leitores
eletrônicos chamados Cool-er, ambos com tela de E-Ink.
Os leitores eletrônicos em geral possuem algumas funções
que buscam mimetizar os impressos, como a possibilidade
de se marcar ou sublinhar trechos do texto, marcar páginas
para posterior consulta e anotações laterais. Estas funções
em geral precisam de um mínimo de aprendizado sobre o
funcionamento do dispositivo em questão.
Leitura eletrônica
Com as diferentes características dos suportes eletrônicos, a
leitura ocorre de maneira diferente na tela e no monitor.
Alguns estudos indicam que ela ocorre de maneira até 30%
mais lenta nos monitores LCD e CRT [16]. Em outro
estudo conduzido [18] os leitores atribuíram notas altas em
relação à satisfação de leitura tanto no iPad quanto no
Kindle, apesar de levarem de 7 a 10% a mais de tempo para
lerem um texto eletrônico nos aparelhos em relação à uma
versão impressa. À leitura na tela do computador foram
atribuídas notas muito baixas.
O usuário de textos eletrônicos corre o olho pela tela, prin-
cipalmente pela parte superior, buscando imagens e texto
em destaque para decidir o que gostaria ou não de ler. A
arrumação do conteúdo em seções, com cabeçalhos e textos
em destaque também facilita esta seleção, assim como fra-
ses curtas e diretas. Como no papel, blocos de texto muito
largos fazem com que o leitor se perca ao passar para a
linha seguinte. Porém, este é um fator mais crítico no
monitor, pois as linhas podem extrapolar o limite da tela,
fazendo com que o uso da barra de rolagens horizontal seja
necessário e se torne ainda mais difícil achar a próxima
linha.
Algumas regras de escrita são similares às de estilo jornalís-
tico, outras são novas ou adaptações para melhor adequar a
leitura ao monitor. Deve-se procurar manter os parágrafos
pequenos, com no máximo 100 palavras cada um. As linhas
de texto também não podem ser muito compridas, para que
o leitor não se perca, e jamais deve ficar maior que a largu-
ra da tela, para que não haja necessidade do uso da barra de
rolagem. Algumas outras observações devem ser tomadas,
como manter a ordem direta nas sentenças e evitar palavras
ou linguagem rebuscada, mantendo a leitura o mais simples
possível [13, 28].
O corpo da fonte de texto também é um fator importante a
ser levado em consideração. Os usuários em geral costu-
mam estar a uma distância maior da tela de computador do
que a distância em que seguram um livro ou outro impres-
so, portanto o texto no computador não pode ter uma fonte
com o mesmo tamanho de corpo que num impresso. Um es-
paço entrelinhas maior, que deixa o texto “respirar” tam-
bém facilita a leitura em suportes eletrônicos.
Smartphones e leitores eletrônicos costumam ser segurados
a uma distância similar da dos livros, porém nos primeiros,
devido ao tamanho reduzido da tela, as linhas de textos ten-
dem a ficar muito curtas, fazendo com que a leitura seja
mais lenta.
JORNALISMO E TECNOLOGIA
O webjornalismo possui algumas características que o
diferenciam do jornalismo impresso tradicional, sendo uma
das principais a interatividade. O leitor se relaciona dire-
tamente com o autor e com outros leitores, através de chat,
email, sistema de comentário (e opinião) dos leitores e fó-
runs de discussão. O leitor pode passar a se sentir como par-
te integrante do processo e pode construir a publicação. Ele
tem uma atitude ativa, é um coautor ou editor da matéria.
Sem ele, não há narrativa.
Este processo de construção leva a uma customização ou
personalização do conteúdo jornalístico. O usuário constrói
sua narrativa, se aprofundando ou não em determinados
temas. As publicações têm a possibilidade de fornecer
conteúdos individualizados de acordo com o interesse do
usuário, através da pré-seleção dos assuntos por parte do
leitor ou de maneira automática, através da análise de seus
padrões de navegação [19].
Outro fator que diferencia o webjornal do jornalismo tradi-
cional é a facilidade de atualização. A periodização é uma
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 40](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-46-320.jpg)

![Figura 1: O jornal O Globo em sua versão para o Kindle –
foto de Michel Filho para O Globo
possui algumas características que diferenciam seus méto-
dos de publicação. A principal diferença é que o jornal onli-
ne diminui o tempo entre o ocorrido e sua publicação. As
notícias em tempo real trazem uma agilidade que só é
possível nessa mídia. O repórter envia para a redação ou
publica remotamente notas curtas durante o dia, conforme
as ocorrências, que posteriormente podem ser reutilizadas e
desenvolvidas para se tornar pequenas notícias, dependendo
da relevância ou repercussão. Frequentemente a repercus-
são determina que notícias serão mais trabalhadas para a
versão impressa do jornal.
Os jornais online normalmente têm um corpo menor de
repórteres e é comum que repórteres da versão impressa
sejam utilizados na versão online. Os repórteres do jornal
online têm maior autonomia e devem decidir que notícia
devem aprofundar. No caso de um notícia inicialmente apu-
rada por um repórter da versão impressa, é de responsabili-
dade do repórter do webjornal de averiguar os fatos e fazer
o aprofundamento. O editor do jornal online deve estar
sempre atento para atualizar notas, matérias e chamadas, as-
sim como decidir a o que dar destaque, pois um webjornal
está em constante fechamento.
No jornal online o espaço para publicação é virtualmente
infinito. O editor do jornal impresso tem uma preocupação
com o tamanho das páginas, a publicação de anúncios e sua
influência no layout, que não são as preocupações do editor
online. No webjornal notícias podem ser mais aprofunda-
das, outros temas que sofreram desgaste podem ser tra-
balhados e outras informações que no impresso seriam des-
cartadas podem ser publicadas com fotos, vídeos e até links
para notícias antigas, ajudando a dar o aprofundamento e
entendimento que o leitor desejar.
Segundo alguns analistas, a velocidade de publicação dos
webjornais deve empurrar os jornais impressos para uma
posição mais analítica, sem se ater aos acontecimentos em
si e mais ao seu contexto [3].
O Globo e o Kindle
O jornal O Globo lançou uma versão de seu jornal para o
leitor eletrônico Kindle, da Amazon. Esta edição eletrônica
só pode ser adquirida, em formato avulso ou por assinatura,
através da livraria online, em dólares e com cartão de crédi-
to internacional. O conteúdo é quase o mesmo da edição
impressa. Por uma restrição da Amazon deve ser enviada a
edição internacional do jornal a ser publicado. No caso do
Globo isso significa retirar informações localizadas como
as editorias de bairro e informações sobre eventos culturais.
Também por restrição da livraria eletrônica são retirados
todos os anúncios.
O jornal O Globo utiliza um software de gerenciamento e
arquivamento de reportagens, padrão no mercado editorial,
em que foi feita uma adaptação para gerar, junto com o
último clichê uma versão em XML que será enviada para a
Amazon para ser convertida em seu formato proprietário.
As fotos utilizadas são versões em baixa resolução em
formato JPG, as mesmas usadas no site do jornal.
O aparelho está agora em sua segunda versão e foi pensado
inicialmente para livros, não conteúdo jornalístico. Talvez
por isso a Amazon tenha fixado regras rígidas na publi-
cação e vinculado essa edição eletrônica a uma edição im-
pressa. Pode ser que no futuro o aparelho possa ter algumas
funções que permitam uma frequência maior de atualização
e talvez uma conexão com o site do jornal, permitindo a in-
clusão de hiperlinks e outros recursos hipermídia no apa-
relho.
A Esquire e o iPhone
Em Janeiro de 2010 a revista Esquire lançou sua edição
impressa com uma versão em formato de aplicativo para
iPhone, usando uma plataforma para a publicação de
revistas para o smartphone da Apple chamada Everest, cria-
da pela empresa ScrollMotion e vendida na época por
U$1,99, contra U$4,99 da versão impressa.
A versão para iPhone foi lançada não como uma edição
especial, mas como sendo a própria revista, com o conteúdo
integral à disposição do leitor para a leitura no smartphone.
Com exceção de uma pesquisa do tipo Quizz, a seção de
cartas e pequenos boxes de texto suplementar em alguns
artigos, tudo está presente nesta versão digital. Após este
número da revista a editora Hearst lançou uma versão do
leitor digital que oferece edições avulsas e assinaturas
trimestrais, semestrais e anuais. O aplicativo pode ser lido
no iPad, mas não foi desenvolvida explorando o maior es-
paço em tela do aparelho.
A edição eletrônica analisada, de janeiro de 2010, tem
como único anunciante a marca de desodorantes Axe em
pequenos banners após os artigos ou apresentada como uma
matéria, no fim do sumário. Como material bônus, um ví-
deo da “mais sexy mulher do mundo”, como eleita pela re-
vista em uma edição anterior.
O aplicativo é aberto com uma imagem da capa, exatamente
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 42](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-48-320.jpg)


















![Reconhecimento de Fonemas usando Predição Linear
para movimento labial de modelos faciais humanóides
virtuais
Raphael T. S. Carvalho, Rodrigo C. S. Costa, Paulo C. Cortez
Universidade Federal do Ceará, Brazil
Dept. de Engenharia de Teleinformática
Grupo de Interação Homem Máquina
raphael, rodcosta, cortez@gihm.info
ABSTRACT
Linear predictive analysis is a technique widely used in the
recognition of phonemes. In this article, we discuss the
different aspects of their applications in vowel recognition
of the Portuguese language and lip movements of a virtual
humanoid facial model. LP analysis is used to extract
features of the shape of the vocal tract, which is correlated
with the phoneme being spoken. The vectors of extracted
features are classified into a set of seven vowels using
artificial neural networks. The computational effort and
performance classification of this technique are analyzed.
The information extracted from the vowel can be applied to
the lip movement in entertainment applications and avatar
animation in virtual environments.
Author Keywords
Linear Predictive Analysis, vowel recognition, avatar
animation, lip movements.
1. INTRODUÇÃO
Personagens animados por computador podem ser
representados em duas ou três dimensões. Conhecidos
como humanóides virtuais ou avatares, podem ser
controlados por diferentes técnicas. Nas indústrias de jogos
são tradicionalmente manipulados através de joysticks.
Também é possı́vel animá-los através da utilização de
comandos presentes em interfaces gráficas, nas quais o
usuário deve escolher os comandos dentre um conjunto
finito de botões ou através de um mouse ou teclado [12].
Existem várias metodologias para animar um modelo facial
humanóide virtual, podendo ser baseadas em parâmetros
matemáticos, nas caracterı́sticas fı́sicas da face, em visão
artificial e no processamento da voz [1].
Geralmente, os métodos baseados em visão artificial se
Submetido para Interaction South America 2010.
concentram em apenas detectar a boca, por exemplo, aberta
ou fechada. Por outro lado, uma forma para realizar a
animação dos movimentos labiais de forma mais realista é
utilizar o reconhecimento de fonemas e palavras, a partir
do processamento da voz [8]. Em virtude disso, o objetivo
deste trabalho é realizar o estudo da técnica baseada em
Predição Linear usada no reconhecimento da fala para
aplicar na animação do movimento labial de um modelo
facial humanóide virtual.
O reconhecimento da fala consiste em identificar fonemas,
sı́labas, palavras para formar a mensagem original, ou
uma informação na qual existe uma seleção mais direta
da resposta, sem interpretação dela. Assim, uma ação
pode ser executada diretamente quando um padrão falado é
reconhecido [9].
O reconhecimento automático da voz consiste no processo
de extrair automaticamente a informação lingüı́stica do sinal
da fala, a qual está codificada. Este processo normalmente
acontece em três etapas conforme mostrado na Figura 1 [9].
A primeira etapa consiste em obter digitalmente o sinal de
áudio e convertê-lo para um padrão a ser utilizado pelas
etapas seguintes.
Figure 1. Etapas do processo de reconhecimento de voz.
A segunda etapa realiza a extração das caracterı́sticas que
descrevem adequadamente o sinal de voz ou o representam
de forma mais compacta. Esta etapa é necessária devido ao
fato do sinal de voz não ser usado diretamente para alimentar
a etapa de reconhecimento, exceto quando sub-amostrado.
Geralmente, o sinal de voz é ruidoso e pode possuir
milhares de amostras, tornando difı́cil seu armazenamento
e aumentando a complexidade do classificador.
A etapa de reconhecimento da fala consiste em classificar
essas caracterı́sticas e, em geral, é dividida em treinamento
e classificação. No treinamento, as caracterı́sticas dos
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 61](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-67-320.jpg)
![fonemas são utilizadas para determinar um modelo que
represente cada classe. A etapa de classificação usa o
modelo gerado no treinamento para determinar qual fonema
é pronunciado.
Baseado no processo de reconhecimento da voz, este artigo
está dividido em 9 seções. A Seção 2 apresenta os
fundamentos da produção da fala. A Seção 3 descreve a
ferramenta matemática utilizada para realização do trabalho.
A Seção 4 apresenta a técnica de extração de caracterı́sticas
para reconhecimento de fonemas. As Seções 5 e 6
descrevem o conjunto de dados e a metodologia de
simulação utilizados no trabalho, respectivamente. A Seção
7 descreve os resultados dos testes e por fim, a Seção
8 apresenta as considerações finais e as perspectivas de
trabalhos futuros.
2. MODELAGEM DA PRODUÇÃO DA FALA
A fala é uma das capacidades ou aptidões que os
seres humanos possuem de comunicação, manifestando
seus pensamentos, opiniões e sentimentos através dos
vocábulos. Consiste no principal sinal entre os distintos
sinais abordados pela linguagem natural, como por exemplo,
ideogramas, gestos, gritos, trejeitos e outros tipos de
linguagem corporal [9].
Existem duas principais fontes de caracterı́sticas da fala
especı́ficas aos locutores, as fı́sicas e as adquiridas (ou
aprendidas). As caracterı́sticas fı́sicas relacionam-se
principalmente ao trato vocal, estrutura formada pelas
cavidades que vão das pregas vocais até os lábios e o nariz
[11]. A Figura 2 ilustra o conjunto de órgãos que formam o
trato vocal e compõem o sistema de produção da fala.
Figure 2. Sistema de produção da fala [11].
Na produção da fala, as cordas vocais situadas na laringe são
excitadas pelo ar vindo dos pulmões. A vibração das pregas
vocais geradas devido à passagem do fluxo de ar produz
um som fraco e constituı́do de poucos harmônicos, que é
amplificado quando passa pelas cavidades de ressonância
(laringe, faringe, boca e nariz) e ganha “forma” final
quando é articulado através de movimentos de lı́ngua, lábios,
mandı́bula, dentes e palato [11].
Essa passagem pelas cavidades do trato vocal altera o
espectro do som devido às ressonâncias, que formam picos
de energia no espectro de frequência conhecidos como
formantes. Através da análise espectral da fala produzida
é possı́vel estimar a forma do trato vocal.
Uma classificação comum dos eventos sonoros é feita quanto
ao estado de vibração das cordas vocais. Adota-se uma
convenção de três estados: silêncio, vozeados (sonoros) e
não-vozeados (surdos). O silêncio representa a etapa em
que nenhum som é produzido. Os sons ou fonemas sonoros
são aqueles em que as cordas vocais são tensionadas e
vibram de maneira aproximadamente periódica. Os sons
surdos são produzidos quando não há vibração das cordas
vocais, de modo que o som é formado basicamente nas
cavidades do trato vocal, resultando em um sinal com
natureza não-periódica ou aleatória [11].
São ilustrados na Figura 3 exemplos de sons vozeados e
não-vozeados, em que se pode observar na Figura 3(a) a
natureza aleatória dos sons não-vozeados e, na Figura 3(b),
a forma quasi-periódica de um fonema vozeado.
(a) Elocução do fonema
/s/: Som não-vozeado.
(b) Fonema /z/: Som
vozeado
Figure 3. Exemplo de eventos sonoros vozeados e não-vozeados [11].
Os sons vozeados não devem ser confundidos com os
fonemas da lı́ngua portuguesa, uma vez que, o som é
entendido como uma complexa realidade fı́sico acústica
de cada unidade sonora da fala, enquanto que os fonemas
correspondem a percepção eclética e interpretativa realizada
pelo falante e ouvinte, respectivamente [9].
O fonema é a menor unidade sonora (fonética) de
uma lı́ngua que estabelece contraste de significado para
diferenciar palavras. Os fonemas, na lı́ngua portuguesa, são
classificados em vogais, semi-vogais e consoantes.
As vogais são sons produzidos sem obstáculos para a
passagem de ar, que passa livremente pela boca, oriundo
do pulmão. Sua emissão é independente de outro fonema,
por isso constitui a base da sı́laba. Os sons das vogais
produzem-se a partir de diferentes posicionamentos dos
músculos da boca, constituı́dos pela lı́ngua, pelos lábios e
pelo palato.
Na produção das vogais, a forma do trato vocal é constante
com o tempo e uniforme, com as vibrações sustentadas das
cordas vocais. Assim, para as vogais, o trato vocal pode ser,
aproximadamente, modelado como uma concatenação de
uma série de tubos cilı́ndricos de área transversal uniforme
[5].
Uma aproximação simples do modelo que consiste em 𝑚
tubos acústicos é ilustrado na Figura 4. Os tubos têm as áreas
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 62](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-68-320.jpg)
![Figure 4. Representação esquemática do sistema vocal e aproximação
por tubos concatenados [5].
transversais 𝐴1 a 𝐴𝑚. Embora estes valores têm grande
variação de pessoa para pessoa, a distribuição é semelhante
em relação a uma dada vogal.
As semi-vogais sempre acompanham uma vogal, formando
sı́laba com ela. Na lı́ngua escrita, as semi-vogais são
representadas pelo i e u, podendo em alguns casos serem
representadas pelo e e o.
As consoantes são fonemas produzidos através da obstrução
do ar proveniente do pulmão, precisando de uma vogal para
ser emitidos. Esses obstáculos podem ser totais ou parciais,
a partir da posição da lı́ngua e dos lábios.
Com base no conhecimento sobre as caracterı́sticas
da formação da fala humana, é possı́vel entender os
fundamentos da técnica de extração de caracterı́sticas
descrita na próxima seção.
3. PREDIÇÃO LINEAR
Predição Linear (LP) é uma operação matemática em que os
valores futuros de um sinal de tempo-discreto são estimados
como uma função linear de amostras passadas.
Em Processamento Digital de Sinais (PDS), LP é
freqüentemente chamada Codificação Linear Preditiva
(LPC) e pode então ser vista como um sub-conjunto de teoria
de filtros.
Para um sinal discreto 𝑠𝑛, LP consiste em modelar o sinal
como a saı́da de um sistema com entrada desconhecida 𝑢𝑛,
representado matematicamente por [7]
𝑠𝑛 = −
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ˆ
𝑠𝑛−𝑘 + 𝐺 ⋅
𝑞
∑
𝑙=0
𝑏𝑙 ⋅ 𝑢𝑛−1, 𝑏0 = 1 (1)
em que 𝑎𝑘, 1 ⩽ 𝑘 ⩽ 𝑝, 𝑏𝑙, 1 ⩽ 𝑙 ⩽ 𝑞, e o ganho 𝐺 são os
parâmetros do sistema hipotético. Esta equação mostra que
a saı́da 𝑠𝑛 é uma função linear de saı́das passadas e entradas
presentes e passadas.
A equação 1 pode também ser especificada no domı́nio
da freqüência aplicando-se a Transformada Z em ambos
os lados dessa equação, obtendo com isso a função de
transferência 𝐻(𝑧) do sistema [7]
𝐻(𝑧) =
𝑆(𝑧)
𝑈(𝑧)
= 𝐺
1 +
𝑞
∑
𝑙=1
𝑏𝑙 ⋅ 𝑧−𝑙
1 +
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ 𝑧−𝑘
, (2)
em que 𝑈(𝑧) é a Transformada Z da entrada desconhecida
𝑢𝑛 e 𝑆(𝑧) é a Transformada Z de 𝑠𝑛 dada por
𝑆(𝑧) =
∞
∑
𝑛=−∞
𝑠𝑛 ⋅ 𝑧−𝑛
. (3)
Quando 𝑏𝑙 = 0 para 1 ⩽ 𝑙 ⩽ 𝑞, tem-se um modelo chamado
de todo-pólo, também conhecido como Auto-Regressivo
(AR) [7].
3.1 Estimação dos parâmetros
O modelo todo-pólo é utilizado nos sinais da fala, em
que o sinal de entrada 𝑢𝑛 pode ser considerado como
desconhecido. Desta forma, o sinal 𝑠𝑛 pode ser predito
somente através do somatório ponderado linearmente das
amostras passadas. A aproximação de 𝑠𝑛 por ˜
𝑠𝑛 é dada por
˜
𝑠𝑛 = −
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ˆ
𝑠𝑛−𝑘. (4)
A estimação dos parâmetros desse modelo pode ser feita
através do Método dos Mı́nimos Quadráticos (MMQ), em
que assumi-se que o erro 𝑒𝑛, entre o valor atual 𝑠𝑛 e o valor
predito ˜
𝑠𝑛, é dado por
𝑒𝑛 = 𝑠𝑛 − ˜
𝑠𝑛 = 𝑠𝑛 +
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ˆ
𝑠𝑛−𝑘. (5)
No MMQ, os parâmetros 𝑎𝑘 são obtidos com o resultado
da minimização do Erro Quadrático Médio (MSE-Mean
Squared Error) ou do erro total em função de cada um
dos parâmetros. A análise pode ser realizada através de
duas abordagens. A primeira assume 𝑠𝑛 como um sinal
determinı́stico e a segunda como um processo aleatório.
Na primeira abordagem, o erro quadrático 𝐸 é dado por [7]
𝐸 =
∑
𝑛
𝑒𝑛
2
=
∑
𝑛
(
𝑠𝑛 +
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ˆ
𝑠𝑛−𝑘
)2
, (6)
podendo ser minimizado utilizando a expressão
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 63](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-69-320.jpg)
![∂𝐸
∂𝑎𝑖
= 0, 1 ⩽ 𝑖 ⩽ 𝑝 (7)
A partir das equações 6 e 7, obtém-se o seguinte conjunto de
equações
𝑝
∑
𝑘=1
𝑎𝑘
∑
𝑛
𝑠𝑛−𝑘 ⋅ 𝑠𝑛−𝑖 = −
∑
𝑛
𝑠𝑛𝑠𝑛−𝑖. (8)
O MSE total, denotado por 𝐸𝑝, é obtido expandindo a
equação 6 e substituindo na equação 8, resultando em
𝐸𝑝 =
∑
𝑛
𝑠𝑛
2
+
𝑝
∑
𝑘=1
𝑎𝑘
∑
𝑛
𝑠𝑛 ⋅ 𝑠𝑛−𝑘 (9)
Existem dois métodos para estimar os parâmetros
dependendo do intervalo de duração do erro: o método de
autocorrelação e método da covariância.
No Método de Autocorrelação, o erro é minimizado para um
intervalo infinito −∞ 𝑛 ∞. Assim, as equações 8 e 9
são reduzidas a [7]
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ 𝑅(𝑖 − 𝑘) = −𝑅(𝑖), 1 ⩽ 𝑖 ⩽ 𝑝 (10)
𝐸𝑝 = 𝑅(0) +
𝑝
∑
𝑘=1
𝑎𝑘𝑅(𝑘), (11)
em que
𝑅(𝑖) =
∞
∑
𝑛=−∞
𝑠𝑛𝑠𝑛+1, (12)
é a função de autocorrelação do sinal 𝑠𝑛. Note que 𝑅(𝑖) é
uma função par, ou seja, 𝑅(−𝑖) = 𝑅(𝑖). Os parâmetros
𝑅(𝑖 − 𝑘) formam o que é conhecido como matriz de
autocorrelação. Na prática, o sinal 𝑠𝑛 é conhecido ou
utilizado apenas em um intervalo finito 0 ⩽ 𝑛 ⩽ 𝑁 − 1.
Desta forma, a função de autocorrelação é dada por
𝑅(𝑖) =
𝑁−1−𝑖
∑
𝑛=0
𝑠′
𝑛𝑠′
𝑛+1, 𝑖 ⩾ 0. (13)
No Método da Covariância, o erro é minimizado para um
intervalo finito 0 ⩽ 𝑛 ⩽ 𝑁 − 1. Assim, as equações 8 e 9
são reduzidas a
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ 𝜑𝑘𝑖 = −𝜑0𝑖, 1 ⩽ 𝑖 ⩽ 𝑝 (14)
𝐸𝑝 = 𝜑00 +
𝑝
∑
𝑘=1
𝑎𝑘𝜑0𝑘, (15)
em que a covariância do sinal 𝑠𝑛 no dado intervalo é dada
por
𝜑𝑖𝑘 =
𝑁−1
∑
𝑛=0
𝑠𝑛−𝑖𝑠𝑛−𝑘. (16)
Os coeficientes 𝜑𝑘𝑖 na equação 14 formam a matriz de
covariância. A partir da equação 16, pode-se mostrar que
a matriz de covariância 𝜑𝑖𝑘 é simétrica, ou seja, 𝜑𝑘𝑖 = 𝜑𝑖𝑘.
Com base na equação 16, observa-se que os termos ao longo
da diagonal principal estão relacionados com o coeficiente
anterior através da relação
𝜑𝑖+1,𝑘+1 = 𝜑𝑖𝑘 + 𝑠−𝑖−1𝑠−𝑘−1 − 𝑠𝑁−1−𝑖𝑠𝑁−1−𝑘. (17)
A partir da equação 17, verifica-se que para determinar os
valores do sinal 𝑠𝑛, para −𝑝 ⩽ 𝑛 ⩽ 𝑁 − 1, deve ser
conhecido um total de 𝑝 + 𝑁 amostras. O método de
covariância reduz-se ao método de autocorrelação quando
𝑁 tende ao infinito.
A segunda abordagem considera o sinal aleatório e o erro 𝑒𝑛
na equação 5 também é um processo aleatório. Pelo MMQ,
minimiza-se o valor esperado ℰ do quadrado da erro, ou seja
𝐸 = ℰ(𝑒𝑛
2
) = ℰ
(
𝑠𝑛 +
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ˆ
𝑠𝑛−𝑘
)2
. (18)
Aplicar a equação 7 na equação 18 resulta em
𝑝
∑
𝑘=1
𝑎𝑘 ⋅ ℰ(𝑠𝑛−𝑘𝑠𝑛−𝑖) = ℰ(𝑠𝑛𝑠𝑛−𝑖), 1 ⩽ 𝑖 ⩽ 𝑝. (19)
O erro médio mı́nimo é então dado por
𝐸𝑝 = ℰ(𝑠𝑛
2
) +
𝑝
∑
𝑘=1
𝑎𝑘ℰ𝑠𝑛𝑠𝑛−𝑘. (20)
A forma de resolução das equações 19 e 20 depende se o
processo 𝑠𝑛 é estacionário ou não estacionário. No caso em
que 𝑠𝑛 é um processo estacionário, tem-se que
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 64](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-70-320.jpg)
![ℰ(𝑠𝑛−𝑘𝑠𝑛−𝑖) = 𝑅(𝑖 − 𝑘), (21)
em que 𝑅(𝑖) é a autocorrelação do processo. Com isso, as
equações 19 e 9 reduzem-se a equações idênticas a 10 e
11, respectivamente. A única diferença é que, neste caso,
a autocorrelação é de um processo estacionário em vez de
um sinal determinı́stico. O caso estacionário fornece a
mesma solução para os coeficientes 𝑎𝑘 que o método de
autocorrelação no caso determinı́stico [7]. Além disso, se
o processo é estacionário e ergódico, a autocorrelação pode
ser calculada para um tempo médio.
Se 𝑠𝑛 é um processo não-estacionário, tem-se que
ℰ(𝑠𝑛−𝑘𝑠𝑛−𝑖) = 𝑅(𝑛 − 𝑘, 𝑛 − 𝑖), (22)
em que 𝑅(𝑛 − 𝑘, 𝑛 − 𝑖) é a autocorrelação não-estacionária
entre os tempos 𝑛−𝑘 e 𝑛−𝑖. Assumindo-se que a estimação
de parâmetros de interesse ocorre no tempo n=0, as equações
19 e 9 podem ser reescritas como
𝑝
∑
𝑘=1
𝑎𝑘𝑅(−𝑘, −𝑖) = 𝑅(0, −𝑖), (23)
𝐸′
𝑝 = 𝑅(0, 0) +
𝑝
∑
𝑘=1
𝑎𝑘𝑅(0, 𝑘). (24)
respectivamente, em que 𝐸′
𝑝 é o erro médio mı́nimo do
processo não-estacionário.
Na estimativa dos coeficientes de autocorrelação
não-estacionário do sinal 𝑠𝑛, nota-se que os processos
não-estacionários são não ergódicos e, portanto, não se pode
substituir a média do conjunto por um tempo médio.
No entanto, para uma determinada classe de processos
não-estacionários, conhecidos como processos localmente
estacionários, é razoável estimar a função de autocorrelação
com relação a um ponto no tempo como um tempo médio
de curto prazo. Exemplos de processos não estacionários,
que podem ser considerados localmente estacionários, são
de sinais da fala e de Eletroencefalograma(EEG) [7].
De maneira análoga ao caso estacionário, estima-se
𝑅(−𝑘, −𝑖) através de 𝜑𝑖𝑘 utilizando a equação 16. Usar
esta aproximação para a autocorrelação de um processo
não-estacionário conduz a uma solução para os parâmetros
𝑎𝑘 na equação 23 que é idêntico ao que é dado pela
equação 14 no método de covariância para o caso
determinı́stico. Observa-se que, para um sinal estacionário,
𝑅(𝑡, 𝑡′
) = 𝑅(𝑡 − 𝑡′
) e, portanto, as equações 23 e 24 são
reduzidas e resultam nas equações 10 e 11.
3.2 Cálculo dos Parâmetros Preditivos
Para cada uma das duas abordagens de predição linear
apresentada anteriormente, os coeficientes preditivos 𝑎𝑘,
1 ⩽ 𝑘 ⩽ 𝑝, podem ser calculados resolvendo um conjunto
de 𝑝 equações em que 𝑝 é desconhecido. Essas equações são
mostradas na equação 10 para o método de autocorrelação
(estacionário) e na equação 14 para o método da covariância
(não-estacionário).
Existem diversos métodos para otimizar os cálculos
necessários para solução dessas equações, por exemplo, o
método de redução ou eliminação de Gauss e o método
de redução de Crout [7]. Estes métodos gerais requerem
𝑝3
/3 + 𝑂(𝑝2
) operações (multiplicações ou divisões) e 𝑝2
locais de armazenamento.
Entretanto, evidencia-se através de 10 e 14 que a matriz
de coeficientes em cada caso é uma matriz de covariância.
Matrizes de covariância são simétricas e, em geral,
semi-definidas positiva, embora na prática são, geralmente,
definidas positiva.
Portanto, as equações 10 e 14 podem ser solucionadas
mais eficientemente através do método de decomposição de
Cholesky. Este método requer 𝑝3
/6 + 𝑂(𝑝2
) cálculos e
𝑝2
/2 armazenamento, ou seja, representa metade do esforço
computacional dos métodos gerais [7].
É possı́vel reduzir mais o armazenamento e o tempo de
cálculo, analisando a forma especial da equação 10. Esta
equação pode ser expandida na forma matricial
⎡
⎢
⎢
⎣
𝑅0 𝑅1 . . . 𝑅𝑝−1
𝑅1 𝑅0 . . . 𝑅𝑝−2
.
.
.
.
.
.
...
.
.
.
𝑅𝑝−1 𝑅𝑝−2 . . . 𝑅0
⎤
⎥
⎥
⎦ =
⎡
⎢
⎢
⎣
𝑎1
𝑎2
.
.
.
𝑎𝑝
⎤
⎥
⎥
⎦ = −
⎡
⎢
⎢
⎣
𝑅1
𝑅2
.
.
.
𝑅𝑝
⎤
⎥
⎥
⎦ .
(25)
Através desta equação é possı́vel observar que a matriz de
autocorrelação 𝑝 × 𝑝 é simétrica e os elementos ao longo de
qualquer diagonal são idênticos.
[6] propôs um procedimento recursivo para solucionar esse
tipo de equação. O procedimento foi mais tarde reformulado
por [10]. Este método supõe que o vetor coluna no
lado direito da equação 25 é um vetor coluna genértico.
Um outro método, proposto por [3], considera que este
vetor coluna compreende os mesmos elementos encontrados
na matriz de autocorrelação, possuindo um desempenho
computacional duas vezes maior que o método de [6]. O
método requer apenas 2𝑝 locais de armazenamento e 𝑝2
+
𝑂(𝑝) operações: uma grande redução de complexidade em
relação aos métodos gerais.
O procedimento recursivo de Durbin pode ser especificado
através das seguintes equações [7]:
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 65](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-71-320.jpg)
![𝐸0 = 𝑅(0), (26)
𝑘𝑖 = −
𝑅(𝑖) +
𝑖−1
∑
𝑗=1
𝑎
(𝑖−1)
𝑗 𝑅(𝑖 − 𝑗)
𝐸𝑖−1
, (27)
𝑎
(𝑖)
𝑖 = 𝑘𝑖, (28)
𝑎
(𝑖)
𝑗 = 𝑎
(𝑖−1)
𝑗 + 𝑘𝑖 ⋅ 𝑎
(𝑖−1)
𝑖−𝑗 , 1 ⩽ 𝑗 ⩽ 𝑖 − 1, (29)
𝐸𝑖 = (1 − 𝑘2
𝑖 )𝐸𝑖−1. (30)
Estas equações 27 a 30 são solucionadas recursivamente
para 𝑖 = 1, 2, . . . , 𝑝, cuja solução final é dada por
𝑎𝑗 = 𝑎
(𝑝)
𝑗 . (31)
O cálculo dos coeficientes de autocorrelação ou de
covariância requer 𝑝 ⋅ 𝑁 operações, que podem influenciar o
tempo da computação se 𝑁 𝑝, como é freqüentemente
o caso.
A solução da equação 25 não é afetada se todos os
coeficientes de autocorrelação são multiplicados por uma
constante. Em particular, se todos 𝑅(𝑖) são normalizados,
isto é divididos por 𝑅(0), são formados os coeficientes de
autocorrelação normalizados 𝑟(𝑖)
𝑟(𝑖) =
𝑅(𝑖)
𝑅(0)
. (32)
em que ∣𝑟(𝑖)∣ ⩽ 1.
Um sub-produto do algoritmo recursivo de [3] é o cálculo
do erro mı́nimo total 𝐸𝑖 em cada etapa. Pode-se facilmente
mostrar que o erro mı́nimo 𝐸𝑖 diminui à medida que a ordem
da predição aumenta. Neste caso 𝐸𝑖 não é negativo, logo, é
um erro quadrático. Portanto, tem-se que [7]
1 ⩽ 𝐸𝑖 ⩽ 𝐸𝑖−1, 𝐸0 = 𝑅(0). (33)
Se os coeficientes de autocorrelação são normalizados
utilizando a equação 32, então o erro mı́nimo 𝐸𝑖 é também
dividido por 𝑅(0), sendo conhecido como erro normalizado
𝑉𝑖, dado por
𝑉𝑖 =
𝐸𝑖
𝑅(0)
= 1 +
𝑖
∑
𝑘=1
𝑎𝑘𝑟(𝑘). (34)
Considerando-se a relação descrita na equação 33 é possı́vel
observar que
1 ⩽ 𝑉𝑖 ⩽ 𝑝, 𝑖 ⩾ 0. (35)
Também, utilizando as equações 30 e 34, o erro normalizado
final 𝑉𝑝 é dado por
𝑉𝑝 =
𝑝
∏
𝑖=1
1 − 𝑘𝑖
2
. (36)
As quantidades intermediárias 𝑘𝑖, 1 ⩽ 𝑖 ⩽ 𝑝, são conhecidas
como coeficientes de reflexão, também denominados de
coeficientes de correlação parcial. O coeficiente 𝑘𝑖 pode
ser interpretado como a correlação parcial (negativa) entre
𝑠𝑛 e 𝑠𝑛+1, mantendo 𝑠𝑛+1, ⋅ ⋅ ⋅ , 𝑠𝑛+𝑖−1 fixos. O uso
do termo “coeficiente de reflexão” vem da teoria de linha
de transmissão, em que 𝑘𝑖 pode ser considerado como
coeficientes de reflexão no limite entre duas seções com
impedâncias 𝑍𝑖 + 𝑍𝑖+1, sendo dado por [7]
𝑘𝑖 =
𝑍𝑖+1 − 𝑍𝑖
𝑍𝑖+1 + 𝑍𝑖
. (37)
Assim, a função de transferência 𝐻(𝑧) pode então ser
considerada como uma seqüência de seções com taxas de
impedância, usando a equação 37, sendo dada por
𝑍𝑖+1
𝑍𝑖
=
1 + 𝑘𝑖
1 − 𝑘𝑖
, 1 ⩽ 𝑘 ⩽ 𝑝. (38)
A mesma explicação pode ser dada para qualquer tipo
de situação em que existe transmissão de onda plana
com incidência normal, em um meio consistindo de uma
seqüência de seções com diferentes impedâncias. No caso
de um tubo acústico com 𝑝 seções de igual espessura, a
taxa de impedância reduz ao inverso da taxa de áreas de
seção-transversal consecutivas. Este fato pode ser usado na
análise da fala.
4. EXTRAÇÃO DE CARACTERı́STICAS
Para identificar o fonema, alguma de suas caracterı́sticas
no tempo/frequência ou em algum outro domı́nio devem
ser conhecidos. Assim, uma caracterı́stica pode ser
definida como uma unidade mı́nima, que distingue fonemas
maximamente próximos [4].
Através da extração de caracterı́sticas, o espaço de dados
é transformado num espaço de caracterı́sticas que possui
a mesma dimensão do espaço de dados original, porém
é representado por um número reduzido de caracterı́sticas
efetivas [2].
O método baseado em Predição Linear realiza a extração
da informação da forma do trato vocal, utilizando a análise
proposta por [13]. O método compara um modelo do filtro
acústico, representado na Figura 4 pelos tubos conectados,
com o modelo de produção da fala.
A comparação entre o modelo de tubo acústico e o modelo
derivado da LP conduz a seguinte conclusão. Os coeficientes
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 66](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-72-320.jpg)
![de reflexão 𝑘𝑖, calculados como um subproduto do algoritmo
recursivo de LP, estão diretamente relacionados com a
variação da área do trato vocal, conforme o modelo do tubo
concatenadas, através da equação [5]
𝑘𝑖 =
𝐴𝑖−1 − 𝐴𝑖
𝐴𝑖−1 + 𝐴𝑖
. (39)
Estes coeficientes de reflexão são usados como
caracterı́sticas para classificação. As caracterı́sticas
extraı́das fornecem a informação da forma do trato vocal
para vogais sustentadas, através da equação 39.
5. CONJUNTO DE DADOS
Para analisar a LP na extração de caracterı́sticas, utiliza-se
um conjunto de dados formado pelas amostras de áudio
dos fonemas do tipo vogal. Essas amostras são capturadas
de 13 pessoas, sendo uma do sexo feminino, pronunciando
cada vogal durante aproximadamente 3 segundos de forma
constante e sem pausas, variando-se apenas a distância para
o microfone. Para aquisição das amostras é utilizado um
microfone para computadores pessoais da marca Leadership.
As vogais pronunciadas consistem nas vogais da lı́ngua
portuguesa a, ê, é, i, ô, ó, u. No total, o conjunto de dados
possui 7 classes de vogais.
As amostras de áudio são extraı́das a uma taxa de
amostragem de 8kHz e 8 bits na quantização, ou seja, a
configuração mı́nima de digitalização de um sinal de voz.
Utiliza-se a configuração mı́nima para permitir uma melhor
análise da técnica de extração de caracterı́sticas, explorando
ao máximo o potencial desta técnica. Todas as amostras
foram gravadas em uma sala fechada com ruı́do proveniente
de condicionadores de ar e de forma espontânea.
6. METODOLOGIA DE SIMULAÇÃO
Para avaliar o desempenho dessa técnica são realizadas
simulações em um computador pessoal da marca Dell
com processador Intel Pentium D de 2,80 GHz e 2
GB de memória RAM com sistema operacional Windows
XP. Todas as simulações foram realizadas utilizando-se a
plataforma de simulação Simulink do Maltab versão 2006b.
A Figura 5 ilustra o fluxograma da metodologia do
reconhecimento de vogais usando Predição linear.
O sinal de voz é não-estacionário e ruidoso, de modo que
a analogia com filtros digitais somente é válida para um
perı́odo de tempo aproximadamente estacionário da fala, que
geralmente é em torno de 10 a 30 ms.
Para esse fim, implementa-se o janelamento do sinal
utilizando uma janela retangular que é movida ao longo do
sinal de voz sem sobreposição entre frames adjacentes. O
tamanho dessa janela nos testes é de 32ms, ou seja, 256
amostras de áudio por frame para um taxa de amostragem
de 8kHz.
Quanto à etapa de extração de caracterı́sticas, varia-se
Figure 5. Fluxograma do reconhecimento de vogais usando LP.
a quantidade de caracterı́sticas extraı́das por frame de
áudio. No método baseado em LP varia-se a quantidade de
coeficientes de reflexão de 8 a 28.
O classificador utilizado para avaliar as técnicas de extração
é a rede neural Perceptron Multicamadas (MLP) com 2
camadas, 1 camada de entrada com quantidade de neurônios
igual ao número de caracterı́sticas extraı́das e 1 camada de
saı́da com 7 neurônios referentes às classes das vogais. Os
parâmetros de treinamento da rede neural são escolhidos
para se obter um estudo mais preciso e são: 100 épocas de
treinamento, MSE desejado de 10−5
e passo de apredizagem
de 0, 01.
Para avaliar o desempenho de classificação, o conjunto de
dados é dividido em dois conjunto: um de treinamento e
outro de teste. As amostras são embaralhadas aleatoriamente
e 80% delas são atribuı́as ao conjunto de treinamento,
enquanto os 20% restantes são utilizados no teste.
A avaliação da técnica é feita com base nas taxas de acerto
média, máxima, mı́nima e desvio-padrão, e na matriz de
confusão. Além disso, o tempo total médio de treinamento
e de reconhecimento são determinados. Os resultados são
extraı́dos de 10 simulações independentes.
O resultado da classificação da rede neural é mostrado
no modelo facial humanóide virtual. Cada vogal tem
uma representação visual no modelo facial chamada de
visema, referente a um movimento labial especı́fico para a
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 67](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-73-320.jpg)


![Uma Visão da Interação além da Tecnologia
Milena Ribeiro Lopes
Instituto Nokia de Tecnologia
calma.milena@gmail.com
+55 61 81524819
Christina Maria Pedrazza Sega
Universidade de Brasília
segach@hotmail.com
+ 55 61 81318456
RESUMO
A área de design de interação surgiu em um contexto
essencialmente tecnológico que busca melhorar o uso dos
produtos portáteis com a reformulação da lógica de
comunicação entre homem e dispositivo. Por isso, muitos
autores que tentam definir os conceitos desta nova área
atrelam a disciplina à tecnologia. Temos visto, porém, que,
apesar de ter surgido neste âmbito, o Design de Interação
pode ser aplicado a muitos outros contextos e produtos, que
não necessariamente dependem de tecnologia. A interação é
tema de estudo em diversas áreas de conhecimento que
buscam entender o comportamento humano, mas é o
Design que propõe novas soluções de interação que poderão
beneficiar a todas elas. O Design de Interação é essencial à
computação, aos dispositivos móveis e a evolução dos
mesmos no mercado, mas pode também ser muito útil
quando aplicado a outras áreas, como Arquitetura, Cinema,
Marketing, entre outras.
Palavras-chave
Interação; design; contexto.
ACM Classification Keywords
H5.m. Information interfaces and presentation (e.g., HCI):
Miscellaneous.
INTRODUÇÃO
O cenário tecnológico no qual nos encontramos atualmente
tem sido berço para nascimento de muitas áreas de pesquisa
que visam acompanhar as inovações e as necessidades
humanas atreladas a elas.
A otimização da computação a tornou compacta, ubíqua,
portátil e possibilitou sua agregação a outros produtos de
uso pessoal, como PDAs e celulares. Esses produtos que
nos auxiliam diariamente em nossas tarefas são um grande
alvo de pesquisas para acompanhar as inovações
incessantes.
Os estudos a respeito dos novos adventos tecnológicos têm
sido tecidos por diversas áreas, como engenharia,
computação, psicologia e design, que colaboram
harmonicamente para as melhorias desses produtos e dão
origem a novas áreas de pesquisa que permeiam todas elas:
fatores humanos, usabilidade, interação homem-
computador, experiência do usuário, interface do usuário,
entre outras. O design de interação apareceu nesse mesmo
contexto, visando encontrar formas de melhorar a interação
e projetar interfaces inteligentes de forma nova e coerente.
As limitações a este cenário mercadológico momentâneo do
design de interação é o interesse particular desse estudo,
que visa analisar os conceitos e fundamentos atribuídos ao
mesmo e propor uma ampliação do contexto-foco da área,
para além da tecnologia.
CONCEITOS DE DESIGN DE INTERAÇÃO
O termo design de interação ainda é muito discutido por
especialistas que deram origem a vários conceitos nos
últimos anos, com diferentes reflexões a respeito dessa
nova área do design. A tentativa de encontrar os
fundamentos adequados para o design de interação visa
delimitar o campo de atuação dos pesquisadores e
profissionais deste ramo do design.
Bill Moggridge [15], que foi um dos primeiros a falar sobre
o assunto, e provavelmente o criador do termo, defende a
ideia de que o design de interação é o “design dos aspectos
subjetivo e qualitativo de todas as coisas; é ao mesmo
tempo digital e interativo, criando soluções que são
funcionais, desejáveis e acessíveis”. Sob essa perspectiva, o
design de interação se alinha aos propósitos do design na
função, estética e valor, e enfatiza o contexto tecnológico
no qual se insere. Dan Saffer [19] enquadra a disciplina nas
“artes aplicadas” e a define como “a arte que facilita as
interações entres os humanos por meio de produtos e
serviços que tenham algum tipo de consciência”. Deste
ponto de vista, a interação se destina a conectar humanos
com o auxílio de tecnologias inteligentes. Saffer [19]
explica muito bem o porquê de esta área seguir a
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 70](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-76-320.jpg)
![metodologia do design, reforçando que a forma de trabalhar
do design atende aos propósitos do design de interação,
como por exemplo, foco no usuário, prototipagem e
incorporação de emoção.
David Malouf [12], por sua vez, concordou com a linha de
raciocínio de Robert Reimann [18] e disse que os produtos,
serviços e sistemas devem responder aos estímulos criados
pelos seres humanos, e que essas respostas precisam ser
significativas, persuasivas e semi-previsíveis. Não muito
diferente disso, Nico McDonald [13] falou sobre a área que
definiria o relacionamento entre as ações do usuário e as
respostas para as mesmas.
Com base nessas definições e no contexto tecnológico no
qual o Design de Interação surgiu, é possível compreender
por que a disciplina está atrelada aos produtos e às
tecnologias mais recentes, e se destaca mais entre os
dispositivos móveis. Essa ênfase pode ser explicada pela
tendência de otimizar funções nos aparelhos e pela
necessidade crescente de tornar nossas atividades portáteis
e móveis. De acordo com Nico McDonald [13], o maior
desafio da área é projetar interações que são sensíveis à sua
localização e à sua atividade.
Uma das maiores preocupações discutidas pelos
especialistas, com o aparecimento desta nova disciplina, é
conseguir conceituá-la e delimitá-la para distingui-la das
outras disciplinas que compartilham temas, práticas e
teorias comuns.
Muitos dos elementos usados para descrever o design de
interação já são estudados por outras áreas e, às vezes, pode
parecer que este apenas reúne propriedades de outras
disciplinas em uma só. Saffer [19], por exemplo, apontou
componentes como o tempo, espaço, movimento, aparência,
textura e som como sendo os mais importantes em um
projeto. Esses componentes não são exclusivos do design
de interação, pois tempo, espaço, movimento e som já são
dimensões exploradas em todos os projetos com interfaces
digitais. Aparência e textura são elementos da arte e do
design como um todo e por isso não caracterizam uma nova
forma de arte por si só. Robert Reimann [18] afirma que
essa nova disciplina apropria-se das teorias do design
tradicional, da psicologia e engenharias e utiliza as técnicas
do design, apesar de ter seus próprios métodos de análise.
Analisando essas ideias e concatenando os elementos, é
possível entender que o Design de Interação é chamado de
Design devido à metodologia que utiliza (envolve técnicas
de pesquisa, geração de alternativas, análise e validação por
meio de protótipos), mas se diferencia por seu objetivo.
Diferentemente das outras subáreas do Design, ele se
preocupa em estudar e projetar respostas para as ações do
homem nos produtos cotidianos através de elementos
visuais, táteis e sonoros. Por essa diferenciação, o Design
de Interação é respeitado por muitos como uma nova
disciplina, apesar de utilizar parâmetros de usabilidade,
experiência do usuário, fatores humanos, design emocional
e psicologia cognitiva para a criação das soluções
interativas.
ESTUDOS DA INTERAÇÃO NA COMUNICAÇÃO
As interações sociais são estudadas há décadas por
comunicadores e sociólogos, que nos apresentaram os
estudos do comportamento do indivíduo e das massas na
sociedade, que possibilitaram um maior entendimento a
respeito das ações dos homens e das necessidades dos
mesmos. Esses estudos originaram pesquisas direcionadas
ao comportamento do consumidor, compartilhadas pelas
áreas da publicidade, marketing e psicologia, que teceram
estudos a respeito do processamento cognitivo e dos
estímulos sensoriais sinestésicos que podem ocasionar no
comportamento de um indivíduo.
De acordo com Sêga [20], para compreender o mundo e
ser por ele compreendido, o homem precisa integrar-se
nesse mundo. A autora defende a ideia de que através da
troca de experiências individuais e coletivas, os
significados dessas representações passam a ser
compreendidos mutuamente por todos, estabelecendo-se
as relações sociais e suas convenções. Esses conceitos nos
levam a refletir sobre as convenções impostas na interação
do homem com o mundo, do homem com o homem, de
acordo com Mead [14], do homem com o objeto, proposto
por Baudrillard [1], e do homem com ambientes.
O INTERACIONISMO SIMBÓLICO
As ideias interacionistas surgiram com a psicologia de
William James [8] e seus principais seguidores foram:
Charles Cooley [3], John Dewey [6] e George Herbert
Mead [14].
Os estudiosos do Interacionismo Simbólico compreendem
a linguagem como representação simbólica da realidade. O
mundo das linguagens é vasto, visto que há duas categorias
maiores de linguagens: a linguagem verbal e a linguagem
não-verbal. Dentro desta última categoria há uma gama de
outras formas de comunicação, como: a) pictorial
(desenhos, gravuras); b) auditiva (códigos de uma língua, a
sonora e a musical); c) gestual e expressiva (expressões
faciais).
O pai do interacionismo simbólico foi George Herbert
Mead [14] e seu maior discípulo foi Herbert Blumer [2],
criador do termo “interacionismo simbólico”, em 1937.
Embora Blumer concordasse com Mead, procurou ampliar
o campo do interacionismo, resolveu dar maior relevância
ao conceito de “significado” que, até então, havia sido
relegado ao segundo plano pelas ciências sociais da época.
Para ele, o universo dos indivíduos é constituído de objetos
e, para tanto, ele dividiu os objetos em: 1) físicos (coisas);
b) sociais; c) abstratos (ideias). Para ele, os objetos só
adquirem significado através da interação simbólica,
embora seus significados se diferenciem de pessoa para
pessoa, dependendo do contexto sócio-cultural dessas
pessoas.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 71](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-77-320.jpg)
![A realidade simbólica diz respeito sobre a maneira como
os indivíduos produzem símbolos e como esses indivíduos,
na categoria de receptores, assimilam outros símbolos
vindos de diferentes culturas. O símbolo busca uma relação
de identificação e de aproximação entre os membros de
uma dada sociedade, estabelecendo relações de interação
através da troca e compreensão da linguagem verbal ou
não-verbal, como a dos objetos. Como exemplo disso,
temos a guitarra elétrica simbolizando o “rock n’ roll”,
passando a ser um ícone desse gênero musical e assim
compreendido pelos seus adeptos.
Os meios de comunicação de massa, em especial a
televisão, vêm desempenhando a função de interagir os
indivíduos na sociedade de massa com determinados tipos
de programa, como por exemplo, os reality shows, com o
feedback do público telespectador.
No campo da mídia, a publicidade também vem cumprindo
com esse papel social de interação. Mesmo que ela atenda
aos interesses da economia, ela integra o indivíduo no
grupo em que pertence. Ultimamente, a publicidade vem
recebendo mais atenção e controle ético dos órgãos
responsáveis pela veiculação publicitária em vários países,
incluindo o Brasil. Separando os efeitos nocivos que ela
possa proporcionar aos indivíduos menos atentos a sua
manipulação, os produtos anunciados e destinados à venda
assumem o lugar da companhia ideal para o ser humano.
Tais objetos são capazes até de amenizar, mesmo que
temporariamente, a solidão de alguém. Se não fosse dessa
forma, as pesquisas de opinião pública não estariam
investigando o gosto do consumidor e até a compulsão
pelo consumo que algumas pessoas têm. Estudos pelos
quais os analistas do comportamento humano vêm se
interessando cada vez mais.
Ao anunciar um determinado produto e,
preferencialmente, a marca deste, o público-alvo, quer da
televisão, rádio ou mídia impressa, o elege como sendo
seu parceiro, sua cara-metade. Podemos ver isso nas
marcas de tênis e jeans usados pelos jovens, como forma
de auto-afirmação e de aceitação pelo grupo. Análises de
anúncios mostram que um homem, ao adquirir um carro,
está buscando, inconscientemente, a parceria ideal para
ele, ou seja, o relacionamento perfeito que ele gostaria de
ter ou a substituição de uma relação que já não o satisfaz
mais. Um carro não tem as reações humanas indesejáveis,
plenas de surpresas desagradáveis e que possam estar fora
de seu controle. À medida que a mídia dita os padrões
estéticos vigentes, a indústria automobilística procura
ajustar-se ao novo padrão estético e às necessidades
psicológicas e racionais do indivíduo. Consequentemente,
as indústrias automobilísticas, evidentemente com o apoio
de psicólogos e designers, projetaram os carros com
formas arredondadas lembrando as curvas do corpo
feminino, pois o formato redondo está mais relacionado à
emoção do que as linhas retas, sendo estas mais voltadas
para o raciocínio e a lógica, conforme Sêga (2005).
INTERAÇÃO MECÂNICA
No dia-a-dia, interagimos com objetos, com pessoas e com
o entorno em tempo integral, mas poucas vezes essa
interação é consciente. Quase toda a comunicação não-
verbal que realizamos é mecânica, fazemos por instinto ou
por aprendizado. Gazzaniza [7] afirma que em nosso
cotidiano temos 2% de consciência sobre as decisões que
tomamos e 98% de inconsciência, o que nos sugere que a
maior parte das nossas ações fazemos “adormecidos”.
De acordo com a teoria do cérebro tríplice de MacLean
[11], nosso cérebro humano é divido em três partes
relacionadas com fases da evolução da nossa espécie:
cérebro primitivo (instintivo, reptiliano), sistema límbico
(emocional, mamífero) e neocórtex (intelectual, primata),
mais evoluído e moderno, que compartilhamos com os
elefantes e cetáceos.
O cérebro primitivo está relacionado com a maneira como
gerenciamos a informação do presente e das sensações do
entorno. Para detectar as mudanças de informação
precisamos tê-las ordenadas, e em situações que existe
muita mudança de informação não detectamos bem o que
acontece ao nosso redor. Precisamos da ordem para
gerenciar a informação. Porém, quando recebemos sempre
os mesmos padrões, nos aborrecemos e nos desconectamos
do mundo exterior. Portanto, é importante que em nosso
cotidiano vivenciemos experiências que rompam com o
padrão, que tragam certo grau de complexidade para nossas
tarefas diárias.
O sistema límbico está relacionado com o passado, com a
memória e com a emoção. Ele se desenvolve em nossa
evolução quando começamos a viver em grupos e constituir
família, pois sem emoção e sem memória, uma mãe não
cuidaria de seus filhos (como os répteis que abandonam
suas crias). Os seres humanos são especialistas em
comunicação emocional, é como nos comunicamos não-
verbalmente a todo instante, detectando as emoções dos
outros. A interação que exercemos com o mundo ao nosso
redor faz parte dessa comunicação e está impregnada de
emoção. Infelizmente, interagimos mecanicamente em
nosso dia-a-dia, assistimos à televisão sentados no sofá,
fazemos compras com o carrinho percorrendo prateleiras,
abrimos portas para entrar nos lugares, tomamos banho em
pé, comemos sentados ao redor de uma mesa, pedimos
comida por meio de um cardápio, vemos o mundo através
de janelas, tudo de forma inconsciente, pois essas tarefas e
ações já não nos nutrem com novas experiências.
A parte moderna do cérebro, o neocórtex, está relacionada
com o futuro e com as habilidades artísticas, com a criação,
imaginação, compartilhamento de emoções, cooperação
social e experiências religiosas. Essa parte moderna do
cérebro sugere a constante necessidade que os humanos têm
de vivenciar novas experiências, reiterando a necessidade
do cérebro primitivo em oferecer certo grau de
complexidade de informação e do cérebro mamífero em
comunicar emocionalmente com o meio. Esses três cérebros
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 72](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-78-320.jpg)
![e suas características oferecem um questionamento sobre
como estamos interagindo com o meio, sobre a
mecanicidade de nossa comunicação, possibilidades a
serem exploradas nos três planos cerebrais através de novas
experiências interativas.
PRAZER, NOVAS EXPERIÊNCIAS
A construção de novas interações tem como objetivo
proporcionar prazer e satisfazer, principalmente, as
necessidades emocionais e intelectuais por meio da
ampliação da consciência da comunicação com o entorno.
Para entender melhor como funciona a nossa comunicação
com o meio, a nível biológico-psicológico, é necessário
analisar que tipos de pensamentos podemos ter quando
interagimos com o espaço ao nosso redor que estão
relacionados com as sensações processadas por nosso
cérebro e também compreender os tipos e os níveis de
prazer que esse tipo de interação poderia nos prover a nível
consciente e inconsciente. O pensamento produtivo é
definido por Joan Corbella [4] como o tipo de pensamento
que depende ao máximo de estímulos externos, percepções
do mundo exterior, e se ocupa das realidades do mundo e da
solução de problemas. O autor nos fala também do
pensamento criativo, relacionado com a imaginação e o
pensamento quimérico, relacionado com a fantasia e
obedecem apenas às leis da afetividade, deixando de lado a
realidade e a lógica.
O sistema afetivo faz julgamentos e nos permite saber
rapidamente o que é bom ou ruim em nosso entorno, pode
ser a nível inconsciente ou consciente. Já o sistema
cognitivo-emocional é consciente, nos permite interpretar e
dar sentido às coisas, ao mundo. De acordo com Damasio
[5], o afeto e a emoção são essenciais para o processo de
tomada de decisão, onde o afeto nos permite uma decisão
rápida e a emoção nos faz racionalizar conscientemente e
compreender as causas do afeto.
Donald Norman [17] defende a ideia de que as decisões
inconscientes não são capazes de uma manipulação
simbólica, de um raciocínio cuidadoso, pois o processo é
rápido, simples e automático. Já o processo consciente é
lento e trabalhoso, ponderamos as decisões e refletimos e
racionalizamos bastante para encontrar explicações.
Norman [16] propõe três níveis de processamento
relacionados com emoção e afeto que são aplicáveis ao
Design e aos objetos do nosso cotidiano, que são:
a) Nível visceral: Diz respeito à atração instintiva e ao
impacto emocional imediato. Não é racional e nos faz
gostar ou não de algo à primeira vista;
b) Nível comportamental: Relacionado com a
funcionalidade, efetividade, compreensão e sensação física
durante o uso dos objetos.
c) Nível Reflexivo: Relacionado com significado,
memórias, idéias, mensagens e valores que aportam os
objetos.
Com esses conceitos, podemos interligar o prazer que
sentimos quando vemos, utilizamos ou refletimos sobre um
determinado objeto com as necessidades instintivas,
emocionais ou cognitivas atreladas à natureza humana.
Experimentar e interagir com o entorno, realizando tarefas
cotidianas, de uma forma nova, significa instigar a pensar e
a racionalizar, de uma forma mais consciente (mesmo que
grande parte dessa comunicação ainda seja inconsciente) a
fim de obter prazer suprindo as necessidades emocionais e
intelectuais de nossa mente.
Para isso, é importante ressaltar que a ideia de re-projetar as
interações consiste em questionar a comunicação que existe
agora para melhorá-la e não apenas para promover
experiências novas. Ou seja, analisar como interagimos
com os objetos em determinadas situações e aperfeiçoar a
interação proporcionando uma comunicação mais intuitiva,
mais satisfatória e mais lógica, para que tenhamos mais
prazer, sensação que é reforçada pela complexidade do
novo (novos padrões/necessidades cerebrais) e pela
orientação do Design para emoção e afeto.
INTERAÇÃO PARA MÚLTIPLOS CONTEXTOS
O conceito de design de interação, apesar de ter sido
pensado para produtos tecnológicos, tem muitas aplicações
em produtos e ambientes não-tecnológicos, nos quais a
interação já vem sendo projetada de forma intuitiva.
De acordo com Jon Kolko [10] o design de interação é
reconhecido como um novo campo, porém as pessoas vêm
projetado interações há séculos. Ele afirma que a área tem
profundas raízes em muitas outras disciplinas existentes e
que por isso o assunto fica confuso nas outras áreas que
muitas vezes compartilham os mesmos nomes e as mesmas
técnicas.
Alguns estudos visam ampliar a visão inicial do design de
interação, incluindo estudos do corpo como produto, assim
como o ambiente e outros elementos que fazem parte de um
contexto. Karen Kortbek [9] afirma que o interesse na
inclusão do corpo no design de interação é crescente pela
comunidade de pesquisadores da interação homem-
computador. Em seu estudo de interação em espaços
públicos, a autora inclui técnicas de dramaturgia à
metodologia e explica que direção de atores e design de
interação podem se reabastecer mutuamente se o contexto
interativo, que inclui corpo, ambiente e a interação
propriamente dita, for “assistido” e “dirigido”.
Desta forma, percebemos que “projetar novas interações”
vai mais além da tecnologia e interfaces gráficas. O estudo
da interação pode ser tão importante para a produção de
aparelhos portáteis quanto para a arquitetura, artes plásticas,
design de produtos, entre outros. A área trata de re-projetar
a lógica de comunicação, antes de tudo, e pode ser
estendida a diversas outras áreas, onde a prática já existe
inconscientemente, sem o apoio de pesquisas, da
metodologia e espírito criativo.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 73](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-79-320.jpg)










![C.D.E. Uma Ferramenta para Análise de Jogos
Bruno William Carvalho Bulhões
Departamento de Design da Universidade Federal
do Paraná
460, General Carneiro, ed. Dom Pedro I,
Curitiba-PR
brunobulhoes@adugestudio.com
+55 41 96533274
Thiago de Souza Rodrigues Alves
Departamento de Design da Universidade Federal
do Paraná
460, General Carneiro, ed. Dom Pedro I, Curitiba-
PR
beto@adugestudio.com
+55 41 96265302
Rafael Pereira Dubiela
Departamento de Design da Universidade Federal do Paraná
460, General Carneiro, ed. Dom Pedro I, Curitiba-PR
rafaeldubiela@yahoo.com.br
+55 41 88423123
RESUMO
Neste artigo apresentamos uma abordagem formal e
aprofundada com o intuito de complementar o
conhecimento analítico do Design de Jogos. Baseado no
Framework MDA e em conceitos similares que se
aproximam das necessidades estruturais do nosso estudo,
criamos o Framework CDE (que significa Componentes,
Dinâmicas e Experiência). O Framework serve como uma
ferramenta capaz de fornecer uma visão estruturada
aprimorando tanto o estudo (do artefato – jogo digital)
quanto a prática (auxiliando no design). Componentes
representa o nível mais próximo do designer, onde este é
capaz de ter influência direta, ao passo que é o nível mais
abstrato para o usuário. Dinâmicas representa o nível cujas
interações acontecem, do sistema consigo, do sistema com
o usuário e dos usuários consigo. Experiência é o nível
menos tangível para o designer, porém, entendendo as
influências do sistema nesse aspecto é possível desenvolvê-
lo a fim de atender as necessidades do usuário, através do
entendimento das recompensas oferecidas, canais de
conforto e perfis de jogador. Acreditamos que essa
metodologia servirá para expandir o entendimento de jogos,
de acadêmicos a desenvolvedores.
Palavras Chave
Design de Jogos, Framework CDE, Componentes,
Dinâmicas, Experiência.
Classificação ACM
A.m. General Literature: Miscellaneous.
ABSTRACT
In this paper we present an indepth formal approach that
attempts to expand the analytical knowledge about Game
Design. Based on the MDA Framework and similar
concepts that approach its structural needs, we managed to
build the CDE Framework (standing for Components,
Dynamics and Experience). The framework serves as a tool
to provide a structured view that improves both the study
(of the artifact – digital game) and practical (helping with
the design). Components is the closest level to the
designer, where he directly take action, whereas it is the
most abstract level to the user. Dynamics is the level where
the interactions take place, from system-system to system-
user and user-user interactions. Experience is the least
tangible level to the designer, knowing its influences on the
system he may design it to fit to the user needs, through the
understanding of offered rewards, flow channels and player
profiles. We believe that this methodology will enhance the
understanding of games, from scholars to developers.
Author Keywords
Game Design, Framework CDE, Components, Dynamics,
Experience.
INTRODUÇÃO
Para estudar e desenvolver jogos existem diversas
abordagens e caracterizações que auxiliam os processos.
Um deles é a caracterização de Salen e Zimmerman [21]
que estrutura os jogos emtrês níveis, do formal ao abstrato:
rules, play e culture. Ele tem validade como ferramenta de
investigação, porem não tem a precisão necessária para
aplicação prática de design de jogos. De forma similar,
existe o framework Mechanics, Dynamics e Aestethics
(MDA) de Hunicke et al [13] que defende uma abordagem
do estudo e pratica do design de jogos nesses três níveis, do
formal ao abstrato. O framework MDA tem grande
funcionalidade pratica, e por sua vez não tem a
profundidade e abrangência necessária para estruturas
Permissiontomake digital or hard copies of all or part of this work for
personal or classroom use is grantedwithout fee provided that copies are
not made or distributedforprofit orcommercial advantage andthat copies
bear this notice andthe full citationonthe first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA.
Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 84](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-90-320.jpg)
![teóricas mais complexas. No entanto, este framework foi o
ponto de partida para o desenvolvimento do nosso próprio,
chamado Componentes, Dinâmicas e Experiência (CDE)
[2].
No framework CDE, componentes lidam com as unidades
que compõem o sistema. As regras, mecânicas, elementos
sensoriais, a narrativa e a interface do jogo são exemplos de
componentes. Componentes formam o nível formal do
framework.
Dinâmicas emergem das interações entre os componentes
do jogo entre si e com os jogadores que utilizam o sistema
de jogo. Portanto, emergem quando um ou mais jogadores
participam do sistema. Dinâmicas formam o nível
intermediário do framework.
Experiência é o ultimo nível, o qual diz respeito às
respostas sensoriais dos jogadores ao participarem de um
jogo. Experiência forma o nível abstrato do framework.
De modo similar ao MDA, o CDE estrutura-se de forma
que os componentes, durante o funcionamento do jogo,
contribuem para a emergência de dinâmicas de jogo, as
quais geram respostas sensoriais (experiência) no jogador.
Este fluxo é relacionado à perspectiva do designer.
O objetivo do framework é auxiliar o estudo e a pratica do
design de jogos ao encorajar os designers a visualizar a
relação de causa-efeito que existe entre cada componente de
um jogo e a experiência que os jogadores têmao jogar.
COMPONENTES
Os componentes dentro do framework CDE lidam com as
peças que compõem o artefato jogo. São o conjunto de
componentes que formam o jogo enquanto umobjeto e que
portanto existem independente do jogo estar sendo jogado
por jogadores ou não. Os componentes são os elementos
que o designer de jogos pode criar, moldar e alterar para
desenvolver o design do jogo.
Nós chegamos à definição dos componentes baseado na
definição de elementos de jogo de Jesse Schell [24] que
divide jogos como contendo quatro componentes:
tecnologia, regras, estética e história. A partir desta
definição, do modelo tipológico de Aarseth e Elverdam [1],
a própria definição de Mechanics de Hunicke et al [13] e da
definição do nível regras de Salen e Zimmerman [22]
chegamos à conclusão que os componentes dos jogos
podem ser caracterizados em três tipos: Regras, Narrativa e
Representação.
Antes de explicar com mais detalhes o que são cada umdos
três componentes é necessário explicar o conceito de half-
real:
“Jogos digitais são duas coisas completamente
diferentes ao mesmo tempo: jogos digitais são
reais no sentido de que eles são compostos por
regras reais que jogadores realmente interagem;
onde ganhar e perder um jogo é um evento do
mundo real. No entanto, quando se ganha umjogo
ao derrotar um dragão, o dragão não é um dragão
real, mas um dragão ficcional. Jogar um jogo
digital é portanto interagir com regras reais
enquanto imagina-se um mundo ficcional e um
jogo digital é um sistema de regras assim como é
um universo ficcional.” [18]
Expandindo este conceito, é possível afirmar que jogos são
ao mesmo tempo, um sistema de regras cuja interação e
desenvolvimento ocorre no mundo real, ao mesmo tempo
em que são uma peça de ficção quando a interpretação
destas regras reais moldam uma representação virtual.
Há claras implicações e discussões metafísicas a partir deste
conceito os quais não entraremos em detalhes neste
trabalho. O importante aqui é apenas salientar que este
conceito permeia nosso framework em todos os três níveis,
em especial neste nível o de componentes. Portanto,
citaremos o conceito de half-real diversas vezes durante a
apresentação de elementos do framework.
Dito isto, podemos prosseguir comas definições específicas
de cada componente.
Regras
Regras são um conjunto de premissas sistêmicas que ditam
o que existe e o que é possívelou não dentro do universo do
jogo. As regras são o principal componente de um jogo no
sentido em que sem elas o jogo não existe . Com base no
framework de Järvinen [17] que apresenta os conceitos de
Components, Procedures, Environments, Themes e
Interface, e a definição de sistemas de Salen e Zimmerman
[19] que apresenta Objects, Attributes, Internal
Relationships e Environments, como elementos de um
sistema em que jogos podem ser enquadrados. Portanto
concluímos que regras além de delimitar o contexto do
jogo, determinam a existência e função de todos os outros
componentes.
Regras são subdividas em quatro categorias, Procedurais,
Contextuais, Composicionais e Operacionais.
Procedurais são as regras que pautamos objetivos, estados
de jogo e como este é controlado, bem como seu começo e
fim. Tais procedimentos ditam o ritmo e a estrutura do jogo.
Contextuais são as regras que definem o espaço de jogo,
física, limites, etc. Essa categoria diz respeito ao espaço de
possibilidades do jogo. As regras determinam este espaço
criando um contexto e um fluxo de jogo.
Composicionais são as regras que delimitam e quantificam
os objetos de jogo, determinando seus atributos, bemcomo
suas relações como sistema.
Operacionais são as regras que definem as ações que cada
agente de jogo pode realizar para alterar o estado do jogo.
Tais regras alteram diretamente o estado do jogo; são as
mecânicas de jogo.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 85](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-91-320.jpg)
![Procedurais (Conditions)
Baseado nos conceitos de Rules, Control e Player Structure
de Aarseth [1], Procedures de Järvinen [17], chegamos à
classificação que compreende Estrutura de jogo, Controle
do Estado de Jogo e Objetivo. Essas são as regras que
determinam as condições fundamentais para existência,
manutenção e conclusão do jogo.
a. Estrutura de jogo: delimita quantos e quais agentes
existem no jogo, quais são as condições que devem ser
atendidas para o início da sessão de jogo e quais condições
necessárias para atingir o estado de fim de jogo. O estado
de fim de jogo pode ser desejável, quando o jogador
cumpre seus objetivos, obtendo vitória, ou indsesejável,
quando o jogador falha durante o percurso do jogo, obtendo
derrota.
b. Controle do estado de jogo: diz respeito a como o
sistema do jogo permite o controle das variáveis de jogo, o
controle do espaço e do tempo. Por exemplo, em um jogo
de estratégia em tempo real, o jogador tem controle dos
recursos, da produção de unidades (objetos controláveis),
dá área visível e do tempo (alguns jogos permitem que o
jogador interrompa o andamento da partida para analisar o
estado atual da mesma).
c. Objetivo: diz respeito aos metas apresentadas e que
devem ser perseguidas durante o jogo. Tais regras podem
descrever um único objetivo que seja o ponto central do
jogo para atingir o estado desejável de fim de jogo, uma
série de objetivos que devem ser cumpridos a fimde atingir
o estado de fim de jogo ou objetivos secundários que não
levam o usuário a um estado desejável fim de jogo, mas o
levam a atingir uma recompensa desejada.
Contextuais (Space of Possibility)
Salen e Zimmerman [20] definem espaço de possibilidades
como todas as ações e estados possíveis que podem ser
conseguidos dentro de um determinado jogo.
Analogamente, Aarseth [1] apresenta os conceitos de Space
e Time. As regras contextuais descrevem o espaço, tempo e
limites do jogo.
a. Espaço: diz respeito ao universo constituinte do jogo, em
quantas e quais dimensões ele existe. Regras espaciais
também dizem respeito a constituição do level design
(configuração espacial do jogo). Por exemplo, no xadrez o
espaço do jogo é uma matriz 8x8.
b. Tempo: diz respeito a a todas as relações de tempo no
universo real. Por exemplo, em um jogo de turnos, quanto
tempo os jogadores têm para desempenhar suas ações,
quanto tempo dura cada turno, a relação do tempo real com
o tempo ficcional (a relação de tempo de jogo, como tempo
do universo do jogo). O tempo é uma dime
c. Física: diz respeito aos princípios físicos que regem o
universo real do jogo. Por exemplo, em um jogo de
plataforma (cujas mecânicas centrais são de movimento) a
física determina a aceleração do personagem, a gravidade
que incide sobre ele e até mesmo a possibilidade de
desempenhar ações que poderiam ser consideradas
“antifísicas” como pulo duplo.
Composicionais (Game Tokens)
Jogos são compostos diversos objetos, portanto vimos a
necessidade de uma categoria específica para tratar essa
diversidade de elementos. Por objetos compreende-se
quaisquer entidades que componham o jogo. Regras
composicionais são responsáveis pela determinação dos
atributos e as relações entre os objetos do jogo dentro do
espaço de possibilidades.
Quanto a classificação, regras composicionais estão
divididas de acordo com a relevância para conquista do
estado de fim de jogo e tipo de acordo coma influência dos
objetos em relação ao sistema.
Além disso, cada objeto tem regras que lhes definem
atributos que são interpretados pelas regras condicionais,
contextuais e operacionais que regem estes atributos. Por
exemplo um objeto de jogo pode ter como atributo sua
posição no espaço, seus pontos de saúde, sua existência ou
não dentro do jogo, a possibilidade de execução de uma
regra operacional ou não, etc.
a. Relevância
• Objetos primários: são objetos fundamentais para
condições de início e fim de jogo. Exemplo a peça do rei no
Xadrez, avatar do Mario em Super Mario Bros. (Nintendo,
1985).
• Objetos secundários: são objetos que existem dentro do
espaço de possibilidades, mas não têm influência direta, ou
não têm influência alguma para que se atinja o estado
desejável fim de jogo. Exemplo as demais peças no Xadrez,
barris explosíveis em Mass Effect 2 (BioWare, 2010).
b. Tipo
• Objetos controláveis: são objetos capazes de
desemepenhar ações controladas pelo jogador.
Em Baldur’s Gate 2: Shadows of Amn o personagem
principal e os demais personagens que podemfazer parte do
grupo, são exemplos de objetos controláveis.
• Objetos não-controláveis: são objetos capazes de
desempenhar ações, no entanto não são controladas pelo
jogador. Objetos não-controláveis são operados pelo
sistema do jogo.
É possível considerar, em geral, inimigos como exemplos
de objetos não-controláveis.
• Objetos inanimados: são objetos que não desempenham
ações, mas podem manipulados por objetos controláveis ou
não controláveis.
Em Super Mario Bros. os blocos quebráveis e os que
contém itens são exemplos de objetos inanimados.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 86](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-92-320.jpg)
![Operacionais (Mechanics)
Regras operacionais correspondem às mecânicas de jogo.
Sicart [25] classifica mecânicas como métodos invocado
por agentes, ou seja, ações executadas por agentes que
exercem alguma influência no jogo. Sem mecânicas um
jogo não existiria, pois sem elas os jogadores seriam
impossibilitados de exercerem influencia sobre o seu
resultado. O conjunto completo de todas as mecânicas em
um determinado jogo pode ser chamado de interface de
jogabilidade.
Mecânicas são categorizadas levando emconsideração dois
atributos: relevância, com base na classificação de Core,
Primary e Secondary Mechanics de Sicart [25], e tipo.
a. Relevância
• Mecânicas centrais: são usadas por umagente de jogo de
maneira relevante, obrigatória e recorrente para atingir o
estado desejado de fim de jogo. Por exemplo, no Super
Mario Bros. as mecânicas centrais são andar e pular. Estas
mecânicas são suficientes e obrigatórias para concluir o
jogo.
• Mecânicas primárias: são mecânicas de auxilio às
centrais podendo ser usadas recorrentemente a fim de
atingir o estado desejado de fim de jogo. No exemplo de
Super Mario Bros. (Nintendo, 1985) a mecânica de corrida
é uma mecânica primária que pode utilizada
recorrentemente para auxiliar a conclusão do jogo mas não
é obrigatória.
• Mecânicas secundárias: são mecânicas que não auxiliam
diretamente o a atingir o resultado desejado de final de
jogo, ou só se apresentam ocasionalmente, ou precisam ser
combinadas com mecânicas primarias. Continuando o
exemplo anterior, atirar bolas de fogo é uma mecânica
secundaria em Super Mario Bros. pois seu uso é ocasional e
contextual.
• Mecânicas acessórias: são mecânicas que não afetam o
resultado do jogo de forma relevante. No Super Mario Bros.
não existe exemplo de mecânicas acessórias, mas se o
personagem tivesse uma mecânica onde ele mostrasse uma
careta para a tela, isto seria um exemplo de mecânica
acessória.
Tipo:
• Mecânicas ativas: mecânicas nas quais o agente deve
oferecer input para que estas sejam realizadas. No jogo
Final Fantasy XII (Square Enix, 2006) a mecânica Attack
pode ser acionada pelo jogador a partir de um menu
contextual, caracterizando-a como uma mecânica ativa.
• Mecânicas passivas: mecânicas que independem de input
do agente para serem realizadas. Estas mecânicas são
acionadas pelas regras em situações projetadas. No mesmo
Final Fantasy XII um gambit programa o personagem a
utilizar a mecânica Attack automaticamente dentro de um
contexto caracteriza esta mecânica como uma mecânica
passiva. Vale portanto ressaltar que o tipo da mecânica não
esta atrelada a ela em si e sim ao contexto do seu uso.
Narrativa
A narrativa contribui com o universo ficcional que Jesper
Juul [18] diz estar presente em todos os jogos, e que faz a
contra-partida com as regras reais (correspondentes ao
universo real) destes. No âmbito da estrutura dos
componentes neste framework, a narrativa em conjunto
com os elementos sensoriais formariam este universo
ficcional.
No que diz que diz respeito ao universo real, esses
elementos e estrutura funcionam de uma maneira diferente.
O início da narrativa é ditado pelas condições de início de
jogo, o desenvolvimento da história é ditado pelo
andamento do jogo conforme suas interações nas diversas
instâncias de jogo e a conclusão da narrativa é quando o
estado de fim de jogo é atingido, seja através da vitória ou
da derrota.
No que diz respeito ao universo ficcioanl, sintetizamos as
classificações propostas por Dubiela [10], que destrincha os
elementos da narrativa emdiversas subcategorias a partir de
“história” e “discurso” e considerando como estrutura suas
definições de “formas de narrativas em jogos eletrônicos
informatizados”, chegamos às seguintes classificações:
Elementos
a. Personagens: são agentes que buscam transpor
obstáculos a fim de atingir o objetivo perseguido.
Personagens são o elemento principal das narrativas.
b. Universo: é o ambiente onde os personagens estão
inseridos e os eventos ocorrem.
c. Eventos: são as ações desempenhadas para que o objetivo
seja atingido. Eventos tambémpressupõemos conflitos que
se apresentamao longo da narrativa.
d. Discurso: é a relação entre drama e temporização, ou seja
a maneira como a narrativa estrutura as ações dramáticas a
fim de gerar expectativa , ao longo do tempo de jogo e
tempo narrativo.
Estrutura
a. Forçada: é um recurso de narração para apresentar
histórias concetadas à narrativa principal ou fragmentos
desta, bem como micro-histórias que se desenvolvem
paralelamente. A principal característica da narrativa
forçada é a de interromper as demais narrativas, bem como
a interação do usuário com o sistema do jogo.
Em Metal Gear Solid 4: Guns of the Patriots é comum o uso
de seqüências animadas como recurso para o
desenvolvimento da história.
b. Evocada: é a situaçõe onde a história a ser narrada já
existia, ou apresenta um episódio específico de uma
narrativa anterior ou está inserida emum universo já criado.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 87](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-93-320.jpg)
![Em American McGee’s Alice a narrativa é construída a
partir de um universo conhecido, criado por Lewis Carrol
em Alice in Wonderland.
c. Embutida: é a narrativa gerada com conteúdo embutido
em si, cujas informações podem ser inseridas em objetos,
artefatos ou até mesmo em espaços configurados para fins
de acessar tais informações. Narrativas embutidas podem
também ser apresentadas através de elementos
representacionais, como a caracterização de personagens,
por exemplo.
Em Singularity são encontradas diversas anotações que
contam histórias de pessoas que viveram no passado, em
relação à narrativa principal, tais anotações enriquecem a
narrativa e, em alguns casos, antecipam eventos que
ocorrerão no jogo.
d. Emergente: é o produto da interação do usuário com o
sistemas de regras do jogo somada a narrativa da história do
jogo. Este tipo de narrativa não possuem uma estrutura
linear ou pré-organizada e são em sua essência randômicas.
Em Gravitation, é possível fazer inferências sobre narrativa
a partir da observação das interações entre o jogador e o
sistema (dinâmicas procedurais).
No universo real, a narrativa, através dos procedimentos, se
dá de maneira semelhante à narrativa emergente, pois as
interações que ocorrem no sistema representam uma
seqüência de fatos. Entretanto o universo real, no que diz
respeito à narrativa, se diferencia da narrativa embutida
uma vez que um jogo pode não apresentar uma narrativa
explícita, mas seus procedimentos ainda configuram uma
história baseada em ma seqüência de acontecimentos que
podem ser interpretados como narrativa.
Em uma partida de Tetris, as peças utilizadas, a maneira
como foram dispostas, as peças eliminadas e a pontuação
obtida contam uma história única e correspondente àquela
partida.
Representação
São os elementos que comunicam aos sentidos (imagens,
som e roteiro) para tornar tangível e compreensível aos
jogadores as regras e apresentar, de fato, a narrativa e seus
elementos. As regras tendem a ser premissas e
procedimentos abstratos e, portanto, necessitam de
elementos sensoriais associados para se tornarem mais
compreensíveis por jogadores humanos. Os elementos
sensoriais são análogos ao alfabeto e a linguagemenquanto
os outros componentes são análogos à mensagem em si.
Assets visuais (elementos gráficos e animações) e sonoros
(música e efeitos sonoros) em jogos digitais bem como o
formato e cores das peças de xadrez são exemplos de
elementos sensoriais.
Baseado no Framework IEZA (Interface, Effect, Zone and
Affect) de representação sonora de Hulberts e van Toi, que
separa as categorias emquatro quadrantes dividos pelo eixo
de diegético e não diegético e pelo eixo de atividade e
ambientação, o segundo eixo é referente ao que motiva a
existência da representação. Considerando essa estrutura,
sintetizamos, a fim de torná-la mais abrangente e
compatível com outras representações além da sonora, em
duas categorias - tipo e função da representação. Tipo
corresponde à natureza da representação; se ela é diegética
ou não diegética. Função diz respeito ao papel dessa
representação, levando em consideração o tipo, e é dividida
entre contextual e informacional. No entanto essas
definições não são rígidas, uma vez que existem elementos
que podemnão se enquadrar em apenas uma função.
Tipo
Diegético: São todas as representações que existem dentro
do universo do jogo.
Não Diegético: São todas as representações que não
existem dentro do universo do jogo.
Função
Contextual: São representações que delimitamcontextos de
jogo. Representações contextuais ambientam o jogo e
caracterizam seus elementos.
A fala dos personagens em Mass Effect é uma
representação contextual sonora e de roteiro, além de fazer
parte do universo do jogo, portanto diegética. Entretanto, as
legendas dessas falas são representações contextuais não
diegética, uma vez que a representação do texto em si não
existe dentro do universo do jogo.
Informacional: São representações que tem como função
facilitar a comunicação do sistema de regras ao jogador.
HUDs (Heads Up Displays) são exemplos de
representações informacionais. Em Shadow of the
Colossus, apesar do HUD representar gráficamente regras
composicionais referentes ao avatar e os inimigos, as
representações em si não fazem parte do universo de jogo,
portanto são não diegéticas. Já em Dead Space a
representação do HUD, além de informar regras
operacionais do avatar, faz parte do universo do jogo por
ser elemento integrado com o traje espacial do personagem,
portanto diegética.
DINÂMICAS
O nível de dinâmicas dentro do framework CDE diz
respeito às interações sistêmicas entre os componentes do
jogo e o jogador durante a instância de jogo. Por instância
de jogo nos referimos a uma partida de um determinado
jogo do começo ao fim.
No framework MDA, Hunicke et al. [13] definem o nível
Dynamics como a fluência do comportamento das
Mecânicas agindo sobre os inputs do jogador e os demais
outputs no decorrer do jogo.
A palavra chave para o conceito de Dinâmicas é
comportamento. Pode-se chamar de dinâmicas de jogo o
comportamento que emerge do sistema a partir da interação
dentre todas as partes do sistema de jogo e os jogadores
participantes. Isso inclui interações entre os componentes,
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 88](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-94-320.jpg)
![do jogador com os componentes e do jogador com outros
jogadores.
Antes de entrar na descrição das categorias de dinâmicas é
oportuno definir o conceito de interação.
Na língua inglesa o conceito que mais se aproxima do que
queremos dizer a respeito de interação é o interplay:
O efeito que duas ou mais coisas têm umas com as outras
[5].
Relação, ação ou influência recíproca. Exercer influência
em algo [8].
No entanto não há umequivalente direto para esse termo na
língua portuguesa, mas analisando as definições de
interplay podemos concluir que é um conceito análogo à
interação que significa:
Influência recíproca [9].
Portanto, o conceito de interação que utilizaremos é: ação,
relação e/ou influência recíproca entre dois agentes ou
objetos.
Nós categorizamos as dinâmicas em três tipos, de acordo
com quais interações são realizadas. Baseado emumestudo
anterior [2], chegamos a Dinâmicas Agenciais, que são as
dinâmicas que emergem da interação ativa do jogador com
o sistema de jogo (regras) e da própria interação entre os
jogadores; Dinâmicas Procedurais, que são as dinâmicas
geradas pelas interações entre as regras do jogo entre si e
com o resto dos componentes, narrativa e a representação;
Dinâmicas Estéticas, que emergem da interação entre
narrativa e representação, e da interação passiva do jogador
com estes componentes.
Dinâmicas Agenciais (Interação Ativa)
São as dinâmicas que surgem da interação do jogador com
as regras e dos jogadores entre si. São dinâmicas que
surgem da ação do jogador sobre outros jogadores, e sobre
o sistema, por isso, as chamamos de dinâmicas agenciais.
As regras operacionais são o principal mecânismo de
interação do jogador com o sistema, é por elas que o
sistema interpreta o input do jogador sobre o sistema, e, a
partir das dinâmicas processuais, geram um output
perceptível em resposta à ação do jogador. Vendo de uma
perspectiva mais profunda pode ser considerada a utilização
emergente dessas mecânicas, isto é, após a interpretação e
domínio da mecânica pelo jogador, este a utiliza com um
objetivo além do que foi proposto para o jogo pelo
designer.
Exemplos: Mockball, x-ray climb, infinite bomb jump são
exemplos de interações inventivas do jogador com as
mecânicas de Super Metroid (Nintendo, 1994); Utilizar o
casco verde como escudo no Super Mario Kart (Nintendo,
1992) também é um exemplo de uma interação inventiva
por parte do jogador.
A interpretação que o jogador infere sobre as outras regras e
o sistema em geral, a criação de regras pelo jogador que não
façam parte do sistema do jogo mas influenciam o
andamento deste, bem como a customização e a
flexibilidade que as regras permitem ao jogador manipular
são interações que desenvolvem outros variados níveis de
dinâmicas agenciais.
Exemplos: Gambitos de Xadrez são interpretação de regras
que, aparentemente, vão contra os objetivos do jogo, mas
com o conhecimento superior de um jogador podem se
tornar estratégias eficientes; O fair play em uma partida de
Futebol é uma regra criada por jogadores com intuito
político que gera uma situação amistosa na disputa;
Planejamento do level up dos personagens no Final Fantasy
X (Squaresoft, 2001) é uma manipulação direta do jogador
sobre as regras do jogo, neste caso os atributos dos
personagens.
As interações entre jogadores surgem a partir do contato
entre os agentes, que podem ou não ser humanos, ao jogar
uma partida de um jogo que possibilite múltiplos jogadores.
Podem haver interações a nível social, interações
psicológicas e interações de jogadores humanos com
jogadores artificiais.
Exemplos: Partidas amistosas de Super Smash Bros. (HAL
Labs., 1999) onde os jogadores estão mais interessados na
atividade social do que na competição; Jogos mentais em
partidas competitivas de jogos de luta; Luck manipulation
de geradores de números aleatórios, presentes na maioria
dos jogos digitais.
Dinâmicas Procedurais (Interação Processual)
São as interações que ocorrem com as regras entre si e as
interações das regras como universo ficcional representado
pelo jogo, narrativa e representação. Basicamente, todo o
sistema de regras e os sub-sistemas que os compõem, se
comportam proceduralmente durante uma instância de jogo
ao modo que esta avança de acordo com a agência dos
participantes. Este comportamento procedural afeta tanto as
regras e o estado de jogo, quanto os sistemas narrativos e
representacionais. Este comportamento procedural é de
extrema importância para a compreensão do conceito de
expressão procedural.
Podemos compreender dinâmicas procedurais como o
comportamento de um determinado jogo, a forma como o
jogo enquanto um sistema comporta-se. Como
explicaremos na seção de expressão procedural, este
comportamento de jogo não é apenas lógico, operacional, e
pode ser utilizado para a expressão através da metáfora ou
da retórica.
Primeiramente a interação entre regras se dá quando duas
regras geram uma terceira regra, quando regras procedurais
afetam a influência de outras regras, ou quando existem um
conjunto de sub-regras de variados tipos que juntas formam
a premissa de uma regra maior, inferida por este conjunto
de regras. Estas regras obscuras, nâo escritas, se traduzem
no conceito de metajogo.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 89](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-95-320.jpg)
![Exemplos: Resposta dinâmica de velocidade máxima em
jogos de corrida, em que os retardatários têm a velocidade
máxima aumentada e os líderes têm sua velocidade máxima
reduzida, a fim de aumentar a dramaticidade; Contraste de
regras entre as magias elementais de Final Fantasy X
(Square 2001), em que fogo e gelo se opõem mutuamente,
assim como água e eletricidade; Gravidade, atrito e
velocidade são regras composicionais por si só e se
complementam, através de suas interações, formando um
sistema de física.
Toda regra operacional é uma interação com uma regra
composicional ou contextual no momento em que é
exercida, uma vez que as mecânicas são fundamentadas
pelas regras procedurais. Alem disso existem mecânicas
cujo uso afeta diretamente as regras. Quando uma regra
procedural ou composicional determina a eficácia de uma
mecânica sobre outra, também se caracteriza interação entre
regras.
Exemplos: A habilidade Armor Break em Final Fantasy X
(Square, 2001) é um exemplo de mecânica que influencia o
estado de uma regra; Triangularidade mecânica presente
principalmente em jogos de luta em que defender supera
atacar, que supera agarrar, que, por sua vez, supera
defender é um exemplo de como outras regras interagem
com regras operacionais.
A profundidade mecânica, quando existemmuitos usos para
uma determinada regra operacional, de um jogo também é
resultante das dinâmicas procedurais. O conceito de
jogabilidade emergente, onde o jogo resulta em muito mais
do que a soma de suas partes (como, por exemplo, Go) é
uma clara manifestação do potencial das dinâmicas
procedurais.
Exemplos: A mecânica de charge shot em Super Metroid
(Nintendo, 1994), combinada com pulo, que a princípio não
inflige dano, modifica a mecânica de pulo gerando o pulo
chamado de pseudo-screwattack, capaz de infligir dano nos
inimigos; A impossibilidade de alterar a direção do pulo do
personagem Mario em Super Mario Bros. surge da
interação da mecânica correr/mover-se com a mecânica de
pulo.
As regras enquanto um sistema também definem toda a
representação e a narrativa no sentido de sua existência,
quando estas surgem e como estas evoluem e são
apresentadas. A relação entre as regras e o o universo
ficcional é direta, as regras determinam o que é possível
dentro daquele universo ficcional e o que este universo
representa, cosntruindo um significado através da
associação de símbolos.
Dinâmicas Estéticas (Interação Sensível)
São as interações que envolvemos componentes ligados ao
universo ficcional do jogo, ou os componentes sensíveis
(narrativa e representação). Ocorrem com as relações
internas entre cada componente, dentre narrativa e
representação, em si, entre ambos e com a interação do
conjunto destes componentes como jogador.
Estas dinâmicas são responsáveis por trazer uma
experiência estética mais impactante, próxima, perceptível,
ao jogador e são fundamentais para auxiliar a expressão
procedural, se forem capaz de reforçar a idéia representada
pelas dinâmicas procedurais.
EXPERIÊNCIA
O nível de experiência diz respeito ao a como o artefato
jogo oferece a satisfação aos jogadores. Como o jogador
busca a satisfação e como o jogo promove sensações que
levam a satisfação através de suas regras e dinâmicas.
É importante salientar satisfação como o objetivo de um
jogador com a atividade de jogar ao contrário da palavra
diversão, pois muitos jogos oferecem a satisfação aos
jogadores não pelo mero entretenimento, ou pelo caráter
lúdico, mas através de recompensas mais profundas, como
aprendizado e superação intelectual. Estes tipos de
recompensas e fontes de satisfação são desassociados da
idéia que se tem por diversão e por isso buscamos manter
distância desta palavra dentro do framework CDE.
Buccini [4] considera experiência como sendo
acontecimentos individuais que ocorrem como
resposta a algum estímulo. Estes acontecimentos
ocorrem, em geral, como conseqüência da
observação ou participação em acontecimentos
reais, imaginários ou virtuais. As experiências
não são fenômenos espontâneos, mas induzidos,
que possuem referencial (partem de algum lugar)
e intencionalidade (objetivam algo).
Portanto, nosso objetivo ao incluir o conceito de
experiência no Framework CDE é entender onde o artefato
contribui para o fenômeno da experiência e qual é a
influência de tal fenômeno nos jogadores.
Recompensas
Para que a satisfação ser atingida, é necessário que o
jogador se mantenha interessado na atividade de jogar e o
motor que mantém o jogador interessado a participar de um
jogo é a motivação. Enquanto um jogo motivar o jogador,
ele continuará jogando.
Segundo Buccini [4], quando um desejo, ou necessidade
humana é satisfeito, o ser humano passa a sentir outras
necessidades e desejos, daí a importância dos produtos
sempre estarem evoluindo visando agradar os usuários.
Buccini elucida o fato de que não basta apenas uma
manifestação que motive o jogador; a motivação precisa ser
realimentada. Um dos fatores importantes para a
manutenção da motivação é a recompensa. Baseado nas 8
formas de diversão apresentadas no capítulo Aesthetics do
Framework MDA (sensation, fellowship, fantasy,
discovery, narrative, expression, challenge e submission)
[13] e na lista de 14 formas de diversão (beauty, immersion,
intellectual problem solving, competition, social
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 90](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-96-320.jpg)
![interaction,comedy, thrill of danger, physical activity, love,
creation, power, discovery, advancement and completition,
application of an ability) de Garneau [11], foi possível
desenvolver um modelo que abrange 9 tipos de
recompensa: conquista, fantasia, drama, expressão,
descoberta, aprendizado, avanço, contemplação e interação
social.
Recompensas como dito, são o que motivam o jogador a
participar da atividade do jogar. Recompensas emjogos são
conquistadas através da superação dos obstáculos que o
jogo oferece ao jogador (seja obstáculos das próprias
regras, ou outros jogadores). A dificuldade em se adquirir
uma recompensa e a intensidade da recompensa afetam a
motivação. Uma recompensa pequena para um grande
esforço é desmotivadora, assim como uma grande
recompensa para um pequeno esforço.
Aprendizado
A construção do aprendizado requer um conjunto de
elementos, uma vez que o aprendizado não é um fenômeno
único. Dentro das correntes da filosofia do aprendizado, se
destaca o construtivismo. Analogamente, a filosofia
construtivista presume que as pessoas aprendam fazendo,
isto é, elas constroem seus conhecimentos em situações de
experiências cognitivas em atividades práticas [23].
Dessa forma, a interação com um jogo pode pressupor a
recompensa atingida com o aprendizado do jogador, isto é,
está ligada ao fato do jogo proporcionar um aprendizado
sobre algo relacionado ao próprio jogo ou ao ato de jogar.
Exemplos: Xadrez, Victoria 2 (Paradox Interactive, 2010),
McDonalds’s Videogame (Molleindustria, 2006).
Avanço
Com o momento da interação entre o usuário e a interface
do jogo digital, se constrói a percepção de recompensa a
partir do crescimento metafórico do personagem. Seria a
recompensa atingida com o acúmulo de riquezas e poder
dentro do universo do jogo ou fora dele. Muitos jogos dão
esta recompensa diretamente, dando objetos, mecânicas
novas ou aumento dos atributos do avatar do jogador.
Exemplos: Final Fantasy XII (Square Enix, 2006), Mass
Effect (BioWare, 2007), Prototype (Radical Entertainment,
2009).
Conquista
É a recompensa sentida pela superação de obstáculos que
apresentem umgrande desafio, que não se pode ser vencido
sem que o jogador domine os meios que se tempara superar
tal obstáculo. Este obstáculo pode, evidentemente, ser um
outro jogador concorrente.
Conquista como recompensa pode se manifestar de diversas
maneiras. Exemplos disso podem ser percebidos em jogos
como nas séries Ninja Gaiden e Contra, cujo ponto central
dos jogos é fazer a superação de cada fase ser uma grande
conquista. Super Metroid, além de outras recompensas,
oferece a possibilidade de jogar buscando a taxa mínima de
itens, ou jogado em ordem inversa, ambos são modos de
jogar que aumentam o desafio do jogo e consequentemente
a sensação de conquista.
Exemplos: Ninja Gaiden Trilogy (Tecmo, 1995), Contra III
(Konami, 1992), Street Fighter 3: Third Strike (Capcom,
1999).
Contemplação
É a recompensa a partir da experiência estética
experienciada pelos sentidos. Em geral, aspectos visuais e
sonoros são recompensas valorizadas por certos perfis de
jogador. A recompensa através dos sentidos se dá a partir
de como os elementos sensoriais do jogo são apresentados e
o quão o jogador se identifica com estes de forma similar as
outras mídias de entretenimento.
Um exemplo de jogo que recompensa jogadores através de
elementos sensoriais é Machinarium (Amanita Design,
2009) [26], onde conforme o jogo progride, novos
personagens e cenários detalhadamente desenhados são
apresentados ao jogador. Estas recompensas sensoriais são
motivadoras o suficiente para manter o jogador interessado
a progredir com o jogo.
Exemplos: Machinarium (Amanita Design, 2009),
Everyday Shooter (Quesay Games, 2007), Shadow of the
Colossus (Team Ico, 2005).
Descoberta
À medida que existe mais de uma forma da recompensa a
ser identificada, é nesse quesito que a recompensa seria
resultante do prazer da descoberta e exploração do
desconhecido. Aqui o usuário pode ter acesso a construção
de novas realidades a partir do princípio da conclusão.
A recompensa da descoberta está ligada ao novo, ao
desconhecido. A partir do desconhecido, cria-se o interesse
por este, em conhecê-lo, torná-lo familiar. Tornar o
desconhecido familiar é o processo que define a
recompensa da descoberta.
Pode-se considerar como uma recompensa pela descoberta,
também, as surpresas, os encontros súbitos com situações
ainda não exploradas, ou esperadas, misturando-se um
pouco à recompensa do drama neste sentido.
Exemplos: The Legend of Zelda: Majora’s Mask (Nintendo,
2000), The Path (Tales of Tales, 2009), Super Metroid
(Nintendo, 1994).
Drama
Aristóteles [3] definiu, em sua época, o drama como a
imitação de uma ação eminente onde os personagens atuam.
Encadeados segundo uma ordem previamente criada,
representam um evento que é uma relação de ações e
acontecimentos demonstrando situações de causa e efeito.
Todavia, no presente artigo, o drama é a recompensa gerada
através da experiência e da estética da narrativa. Logo,
qualquer tipo de jogador pode se sentir recompensado pelo
drama, por acontecimentos, pela exposição de uma história,
etc.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 91](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-97-320.jpg)
![Dessa forma, é possível identificar uma forma dos jogos
recompensarem o jogador sistematicamente com o drama,
separando trechos de jogo com breves sequências
cinemáticas (animações) ou de textos que expõem um
pouco mais o enredo que acompanha o jogo.
Para que a recompensa narrativa possa ser quantificada em
resultados, o jogador ao interagir com a narrativa, deve se
interessar por esta. Porém, para o presente estudo, não será
focado em qual tipo de narrativa ou técnicas são mais ou
menos eficazes como recompensas.
Exemplos: Metal Gear Solid 4: Guns of the Patriots
(Kojima Productions, 2008), Silent Hill 2 (Konami, 2001),
Final Fantasy Tactics (Square, 1997).
Expressão
É a recompensa atingida ao utilizar o jogo como forma de
expressão pessoal. Alguns jogos possibilitamque o jogador
faça as escolhas dentro do universo do jogo de acordo com
suas preferências. Em outras circunstâncias, possibilitam
que o usuário crie conteúdo para o jogo.
Em uma partida do jogo The Sims, o jogador pode
personalizar o lar dos sims ao seu gosto. O jogo Guitar
Hero permite que os jogadores interajam com suas músicas
preferidas, seja as que vêm inclusas no jogo original ou as
que podem ser adquiridas posteriormente. Em ambos os
casos, é possível adquirir conteúdo gerado por outros
usuários.
Exemplos: The Sims (Maxis, 2000), Guitar Hero
(Harmonix Music Systems, 2005), Audiosurf (Dylan
Fitterer, 2008).
Fantasia
É uma recompensa que premia quem busca a fuga da
realidade. Jogos produzem esta recompensa através da
imersão no universo ficcional. Essa imersão pode ser tanto
sensorial quanto interativa, fortalecendo a sensação de que
o jogador está dentro do jogo ou que o jogador é o próprio
avatar controlado. Qualquer perfil de jogador pode se sentir
recompensado pelo simulacro gerado por um jogo imersivo,
mas exploradores e sobreviventes buscam com maior
frequência este tipo de recompensa.
Exemplos: The Elder Scrolls IV: Oblivion (Bethesda Game
Studios, 2006), Zeno Clash (ACE Team, 2009), Crysis
(Crytek Frankfurt, 2008).
Interação Social
Alguns jogos digitais disponibilizam um vasto universo de
interação entre os jogadores. Nesses casos, é possível
estabelecer uma complexa rede de contatos. Essas relações
possuem seus códigos de conduta frequentemente tão ou
mais complexos que as relações interpessoais feitas no
mundo real. Essa forma de explorar novos contatos sociais
seria a recompensa através da interação social trazida por
uma atividade.
Exemplos: World of Warcraft (Blizzard Entertainment,
2004), Farmville (Zynga, 2009), Mario Party 8 (Nintendo,
2007).
Dessa maneira, observa-se que as experiências de
conquista, fantasia, drama, expressão, descoberta,
aprendizado, avanço, contemplação e interação social,
formam as estruturas de recompensas que contribuem para
a motivação dos jogadores com a atividade, bem como com
a obtenção da satisfação.
Canais de Conforto
O que esta sendo apresentado nós apresentamos aqui nesse
artigo como canais de conforto é uma adaptação da
Teoria do Fluxo de Mihaly Csikszentmihalyi [6], teoria esta
que defende que o estado emocional de uma pessoa ao
executar uma atividade depende da habilidade que a pessoa
tem sobre a execução desta atividade e a dificuldade que a
atividade exige para ser completada.
Dependendo destes dois fatores, diversos estados mentais
podem ser atingidos, durnte uma atividade, sendo o mais
importante deles, o de Fluxo, atingido ao se executar uma
atividade onde o participante tem uma grande habilidade e
para completá-la e há uma grande dificuldade imposta [7].
A teoria inicial, que apenas procurava entender o fluxo, foi
expandida, encontrando outros estados emocionais
conforme os níveis de habilidade e dificuldade são
exigidos. No nosso framework, a teoria do fluxo
compreende como o jogo cria um ambiente de conforto ao
dar ao jogador habilidades através da jogabilidade ou treino
e ao mesmo tempo lança desafios de diferentes níveis a este
jogador.
O balanço da habilidade, que no caso de jogos pode ser
reduzida ou ampliada através de regras (facilidades ou
dificuldades de jogabilidade) e da dificuldade apresentada
(os obstáculos do jogo que impedem o jogador de atingir
seu objetivo) ajudam a criar um estado mental para o
jogador durante a atividade. Este estado mental deve ser
confortável ao jogador. Confortável no sentido de ser um
estado mental que o jogador busca coma atividade, não que
este deva ser positivo.
Este estado mental confortável depende do perfil de jogador
e de como o jogo apresenta seu universo ficcional, porém,
um jogador que não se sente confortável dentro do estado
mental promovido pelo jogo, perderá o interesse pela
atividade e abandonará o jogo.
Dentro da teoria do fluxo, existem oito estados mentais,
todos estes estados mentais podem ser produzidos por um
jogo ao balancear habilidade do jogador e desafios
impostos. São eles: Apatia, Tédio, Apreensão,
Relaxamento, Ansiedade, Controle, Exaltação, Fluxo [6].
Obviamente cabe ao designer buscar os canais mais
positivos ou canais onde os jogadores daquele determinado
jogo se sentirão confortáveis.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 92](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-98-320.jpg)
![Em jogos a baixa habilidade pode ser traduzida em
mecânicas muito simples, ou muito difíceis de lidar, ou um
jogo com uma curva de aprendizado que impeça ao jogador
melhorar sua habilidade nele. Se o jogo depender demais de
fatores aleatórios, ou não for claro o suficiente em como o
esforço do jogador determina as alterações do estado do
jogo (falta de feedback) isso também incorre em “baixa
habilidade”. Mecânicas superficiais, que não permitem
avanço ou desenvolvimento de um repertório que torne o
jogador mais eficiente no uso delas, também podem
incorrer em um grau de habilidade baixo para o jogo. O
contrário de tudo isso, mecânicas com profundidade, com
pleno e claro resultado e que permitem que o jogador
desenvolva-as em usos mais eficientes incorre no jogo por
característica permitir um alto valor de habilidade ao
jogador.
O desafio pode ser traduzido em jogos nos obstáculos que o
jogo apresenta ao jogador para impedir que este consiga as
recompensas desejadas com a atividade (referentes ao
capítulo anterior). Há diversas formas de se criar desafios e
não entraremos nelas dentro do escopo deste artigo. Para
este artigo, cosideraremos o grau de dificuldade como emo
quão recorrente é o fracasso (perder o jogo)
contrabalanceado em o quão punitivo é este fracasso, entre
começar o jogo a partir do zero ou continuá-lo a partir de
algum ponto anterior.
Evidentemente canais de conforto variam mesmo dentro de
um determinado jogo, já que os obstáculos e a dificuldade
bem como as habilidades do jogador inerentes ou
permitidas pelo jogo podem variar de acordo comas regras.
Estas variações resultam em flutuações dos canais de
conforto promovidos.
Abaixo segue a descrição dos oito canais de conforto e
quais as condições para que estes emerjam.
Apatia
Apatia é o canal atingido quando a habilidade e os desafios
impostos são ambos baixos. Um jogo que promove a apatia
pode ser considerado como um passatempo quase passivo,
onde o jogador exerce muito pouco esforço para vencer e
não é contestado ou desafiado para tal.
Tédio
Tédio é o canal promovido quando a habilidade permitida é
razoável, mas os desafios impostos são baixos. Um jogo
entediante, portanto, é um jogo que não apresenta desafios
para o jogador e ao mesmo tempo lhe dá recursos razoáveis
para exercer esforço sobre este jogo.
Apreensão
Canal onde a habilidade permitida ou atingida pelo jogador
é baixa e os desafios são razoáveis. Um jogo pode
promover a apreensão como uma retórica estética, porém
não deve-se sustentar uma situação de apreensão por muito
tempo por não ser um estado mental positivo.
Relaxamento
Quando a habilidade do jogador é muito grande e os
desafios impostos são baixos o jogo promove a sensação de
relaxamento. A grande habilidade em contraponto aos
obstáculos leves permitem testes, despreocupação e
desapego, porém sem levar ao tédio, sendo assim, portanto,
um estado mental positivo.
Ansiedade
Jogos muito difíceis e nos quais o jogador não tem muita
habilidade ou não permitem ao jogador muita habilidade,
promovem a sensação de ansiedade. A ansiedade é uma
sensação negativa se persistir por muito tempo, porémpode
ser de grande auxílio retórico se promovida em pequenas
doses.
Controle
Controle é o canal atingido quando um jogo permite uma
grande habilidade para o jogador exercer em face a um
desafio moderado. O canal de controle é positivo a partir do
momento que ao se sentir no controle a maioria das pessoas
se sentem confortáveis com a situação, porémpode não ser
o que o jogador efetivamente esteja buscando.
Exaltação
Uma grande dificuldade como obstáculo a uma habilidade
moderada gera o canal de exaltação. É um estado mental
onde o jogador se sente estimulado, revigorado por estar
enfrentando algo maior do que ele, porém com recursos o
suficiente para superar o obstáculo. Consideramos umcanal
positivo para um jogo promover.
Fluxo
Quando a habilidade e a dificuldade são altas, promove-se o
estado de flow ou fluxo. É um estado mental positivo de
alta concentração, controle e estimulação, algo como a
mistura dos canais de Controle e Exaltação. O jogador se
intensifica e se sente mentalmente engolido pela atividade,
perdendo a sensação de tempo-espaço externos ao jogo.
Portanto, os canais de conforto dizem respeito a como o
jogo, através do balanço de habilidade e dificuldade
definidos pelo designer, constrói um ambiente emocional
para o jogador. Este ambiente deve ser confortável para o
jogador, ou este abandonará a atividade mesmo se as
recompensas forem interessantes.
Perfil do Jogador
O perfil de jogador mede como este tende a participar de
um jogo. O que o motiva a jogar, que expectativas ele tema
respeito do jogo e que tipos de dinâmicas e resultados o
divertem. O perfil é dependente e inerente do próprio
jogador. Para traçar o perfil dos jogadores dentro do nosso
framework, nós utilizamos o estudo Brain Hex [16].
International Hobo é uma empresa que estuda o perfil
demográfico dos jogadores de jogos digitais. O estudo
iniciou-se com o DGD-1 (demography game design 1) [14],
que foi atualizado para DGD-2 (demography game design
2) [15], que, por sua vez, foi utilizado como base para o
BrainHex.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 93](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-99-320.jpg)
![Os perfis que esse estudo contemplou foram: o audaz, o
conquistador, o colecionador, o social, o estrategista, o
sobrevivente e o explorador.
Os perfis são a parte mais importante na compreensão da
satisfação pois são os perfis de jogador que ditam quais
recompensas e quais canais de conforto determinado
jogador busca. Cada perfil tem diferentes ambições, busca
diferentes estímulos e requer diferentes combinações de
recompensas e canais de conforto para se satisfazer comum
jogo.
Audaz
O audaz procura ação eletrizante, radical e em alta
velocidade. O perfil tem como comportamento o foco na
busca pela ação, uso de reflexos e tomada de riscos [16].
O audaz, em geral, busca ser principalmente recompensado
com a conquista, a expressão e a fantasia. Mais do que
qualquer outro perfil, o audaz sente-se confortável no canal
de fluxo. Além do fluxo, o audaz prefere os canais de
exaltação e ansiedade, sentindo-se pouco estimulado nos
canais de controle e relaxamento.
Colecionador
O colecionador gosta de coletar tudo e fazer tudo que é
possível no jogo. O perfil tem como comportamento o
esforço para atingir a satisfação de completar tarefas e
coletas, além da intensa satisfação em cumprir objetivos
que se mostram muito distantes - o que pode se tornar
obsessivo [16].
O colecionador busca como recompensas principalmente o
avanço, o aprendizado, a expressão e a descoberta. O
colecionador sente-se confortável no canal de controle e
relaxamento, podendo também manter-se no canal de fluxo
e tédio, e até mesmo, apatia, se as recompensas forem
frequentes ou grandes o suficiente. Isso acontece pelo fato
do colecionador ser um jogador obstinado, indo além do
que lhe é confortável em prol das recompensas.
Conquistador
O conquistador se esforça ao máximo para atingir a vitória
e gosta de derrotar inimigos incrivelmente difíceis e vencer
outros jogadores. O perfil tem como comportamento a
voracidade que foca e motiva o jogador a conquistar a
vitória e permite intensas emoções ao atingí-la [16].
O conquistador sente-se plenamente recompensado pela
conquista, evidentemente, e também pelo aprendizado e o
avanço. O canal de conforto que o conquistador busca é o
de controle, acima de todos, porém se sentindo confortável
no canal de fluxo e exaltação. Ansiedade e apreensão
podem ser positivos para o conquistador, mas apenas
durante o início do jogo, nas etapas de aprendizado.
Estrategista
O estrategista gosta de resolver quebra-cabeças e
desenvolver estratégias. O perfil tem como comportamento
o foco na atividade mental caracterizada pela busca das
decisões mais eficientes [16].
O estrategista busca a recompensa da conquista, do
aprendizado e da descoberta. O estrategista tambémprocura
jogos que permitam a expressão através de diversas
maneiras de se resolver um problema ou superar um
obstáculo. Seu canal de conforto preferido é o de controle,
podendo também sentir-se confortável com o fluxo e com o
relaxamento.
Explorador
De acordo como estudo, o explorador é o jogador que gosta
de encontrar coisas estranhas e mesmerizantes ou re-
encontrar objetos familiares. O comportamento do
explorador se centra na curiosidade, interesse e no prazer de
estimular os sentidos [16].
O explorador busca o drama, a fantasia e especialmente a
descoberta e a contemplação como recompensas. O
explorador sente-se mais confortável nos canais de controle
e relaxamento, porém aceita doses pontuais de fluxo e
exaltação.
Sobrevivente
O sobrevivente gosta de escapar de ameaças aterrorizantes,
suspense e de riscos desconhecidos. O comportamento
deste perfil está relacionado com a sensação de medo: o
sobrevivente gosta de ser aterrorizado e se sentir seguro
novamente após responder a ameaças [16].
O sobrevivente busca como recompensa o drama, fantasia e
descoberta. O sobrevivente busca os canais de apreensão e
ansiedade, sentindo-se também confortável no canal de
exaltação. O sobrevivente abomina os canais de controle e
relaxamento.
Social
O social gosta de jogar com pessoas emque confia e ajudar
os outros. O perfil tende a ser aberto, mas não se dá bem
com quem abusa de sua confiança [16].
O jogador social busca como principal recompensa a
interação social, e também, fantasia, drama e expressão. O
canal mais procurado é o de relaxamento, porém, os canais
de controle e fluxo são também confortáveis se não
atrapalharem a interação entre os jogadores.
Além disso jogadores geralmente apresentam mais de um
destes perfis, em variados níveis de interesse. Há também
jogadores que apresentamaversão aos gostos de umdestes
perfis [16].
O que quisemos demonstrar é que a aplicação da parte de
experiência do nosso framework pode ser utilizada em
conjunto com outros estudos demográficos para se
descobrir aspectos da experiência de jogo desejados. Assim,
o designer pode compreender aspectos do jogo emrelação à
experiência e desenvolvê-los de acordo com os requisitos
do projeto.
CONCLUSÃO
Neste artigo formalizamos o Framework CDE em sua
totalidade, expandindo o framework MDA ao torná-lo
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 94](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-100-320.jpg)


![O USO DA METODOLOGIA DE PERSONAS NA
PRODUÇÃO DE PERFIS PARA HIPERMÍDIA ADAPTATIVA
Thiago Pinheiro
ESDI/UERJ
Rua Evaristo da Veiga, 95
Rio de Janeiro/RJ
t_pinheiro@yahoo.com
Barbara Szaniecki
ESDI/UERJ
Rua Evaristo da Veiga, 95
Rio de Janeiro/RJ
dolar.rj@terra.com.br
André Monat
ESDI/UERJ
Rua Evaristo da Veiga, 95
Rio de Janeiro/RJ
andresmonat@yahoo.com.br
RESUMO
Este artigo é parte integrante de um projeto em
desenvolvimento que visa construir uma hipermídia
adaptativa para auxiliar visitas guiadas em museus. Nele
analisaremos a importância da metodologia de personas
para o design centrado no usuário e descreveremos em
detalhes a utilização desta ferramenta na criação dos perfis
a serem atendidos pelo sistema proposto em sua fase de
implementação.
ABSTRACT
This paper is part of a project in progress for the production
of an adaptive hypermedia for guided visitation at
museums. Here we analyze the importance of the
methodology of personas in user-centered design and
describe in details the use of this tool for the creation of the
profiles to be assisted by the proposed system at the
implementation stage.
Palavras-chave
Personas, hipermídia adaptativa, visitas guiadas, museus.
ACM Classification Keywords
H5.4. Information interfaces and presentation:
Hypertext/Hypermedia.
INTRODUÇÃO
No início da era industrial, os processos de engenharia e
venda, por si sós, eram suficientes para gerar produtos que
fossem desejáveis aos olhos dos consumidores. Para que as
pessoas adquirissem alguma coisa, bastava que o bem
atendesse a seus critérios de utilidade, qualidade e que
oferecesse um preço razoável pelo qual estivessem
dispostas a pagar. Com o passar do tempo, a indústria
percebeu a necessidade de diferenciar seus produtos de
outros com igual funcionalidade e o design passou a figurar
como elemento de destaque nessa estratégia. Designers
gráficos passaram a ser contratados para desenvolver
embalagens e propagandas mais eficazes e designers
industriais se dedicaram progressivamente a projetar
produtos mais ergonômicos, eficientes e atraentes.
Nesse contexto de valorização do produto por adequação às
necessidades dos utentes, surgem a filosofia e as
metodologias do design centrado no usuário, do inglês
user-centered design (UCD).
O termo user-centered design foi cunhado por Donald
Norman [8], que o definiu como sendo uma filosofia
baseada nos interesses e necessidades do usuário para a
geração de produtos mais facilmente inteligíveis e usáveis.
A Usability Professionals’ Association (UPA) [11] define
UCD como uma abordagem em design que foca todos os
processos – planejamento, projeto e desenvolvimento – no
usuário.
Embora devesse ser o senso comum, centrar o design no
usuário não é um procedimento natural. Tendemos a ser
egocêntricos e acabamos por desenvolver produtos
baseados em nossas próprias vontades e necessidades,
mesmo que na maioria das vezes não sejamos o utilizador
final desses produtos. Às vezes, até mesmo procuramos
pessoas com perfis semelhantes ao nosso para pedirmos
opinião sobre nossos projetos – a conclusão é o nascimento
de um produto inadequado ao público a que vai servir.
Metodologias do UCD
À medida que a filosofia do design centrado no usuário
ganhou força, algumas metodologias surgiram para
concretizar os princípios por ela preconizados.
Mas foi apenas em 1999 que se deu o surgimento da
primeira e única normatização do UCD, instituída pela ISO
13407 (“Human-centred design processes for interactive
systems”) [6].
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 97](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-103-320.jpg)
![De acordo com essa norma, uma vez identificada a
necessidade de centrar os processos no usuário, quatro
atividades vão formar o ciclo principal de trabalho (Figura
1):
a) especificação do contexto: identifica-se quem utilizará o
produto, com que finalidade e sob que condições;
b) especificação dos requisitos: identificam-se as
necessidades comerciais e que necessidades do usuário
devem ser satisfeitas para que o produto seja bem-sucedido;
c) design das soluções: atividade onde o conhecimento
angariado é concretizado em diferentes protótipos que
serão testados junto aos usuários;
d) avaliação do processo: esta etapa leva em consideração o
feedback dos utentes e verifica-se o preenchimento dos
critérios percebidos na segunda fase. Aqui se avalia a
necessidade de modificações no produto, gerando mais uma
iteração do ciclo ou liberando o produto para o lançamento.
Apesar de não especificar métodos exatos, a norma serve
de base para várias metodologias do design centrado no
usuário, dentre as quais podemos citar também, outro
modelo de processos igualmente bastante conhecido – o do
ciclo de engenharia da usabilidade, proposto por Jakob
Nielsen [7]. Este sistema consiste em onze etapas, a saber:
1) conhecimento do usuário;
2) análise competitiva;
3) definição de metas de usabilidade;
4) design paralelo;
5) design participativo;
6) design coordenado;
7) análise heurística;
8) prototipagem;
9) teste empírico;
10) design iterativo;
11) coleta de feedback.
Como se percebe aqui, mesmo que descritas em alto nível,
as atividades são identificadas mais detalhadamente do que
no modelo proposto pela ISO. O fluxo básico é bastante
semelhante nos dois esquemas – ambos partem da pesquisa
sobre o usuário para identificação de requisitos/objetivos e
chegam à prototipagem e teste do design, explorando a
natureza iterativa do processo. Ambos os modelos também
reforçam que o feedback dos usuários deve ser considerado
desde cedo, já que alterações no design são notavelmente
menos custosas quando feitas nas etapas iniciais do
desenvolvimento.
Ainda embasada na normatização da ISO, se destaca a
metodologia de Personas, ferramenta estudada e utilizada
no desenvolvimento deste artigo, que descreveremos mais
minuciosamente adiante.
HIPERMÍDIA ADAPTATIVA
Este artigo é parte integrante de um projeto mais amplo
cujo objetivo é verificar a possibilidade da elaboração de
uma hipermídia adaptativa para auxílio a visitas guiadas a
museus.
Figura 1. Ciclo básico de atividades no design centrado no usuário segundo a ISO 13407.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 98](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-104-320.jpg)
![Cabe neste momento esclarecer o conceito de hipermídia,
que Freire [4] aponta como sendo semelhante ao hipertexto,
mas difere deste uma vez que as ligações (links) são
representadas também por elementos de diferentes
formatos, tais como imagens, gráficos, vídeos, áudios,
animações, etc. Sendo assim, a hipermídia constitui uma
base de dados na qual o usuário navega entre as
informações de forma interativa e não-seqüencial,
determinando seu próprio percurso de acesso e uso da
informação – características herdadas do próprio
hipertexto.
Peter Brusilovsky [1] aponta a hipermídia adaptativa como
uma direção relativamente nova na pesquisa sobre as
relações entre hipermídia e modelos de usuário. Essa
tecnologia promete sanar a limitação de aplicativos de
hipermídia tradicional, onde é apresentado a todos os
usuários um mesmo conteúdo de página e um mesmo
conjunto de links a uma população relativamente diversa.
Os sistemas de hipermídia adaptativa constroem um
modelo de objetivos, preferências e conhecimento prévio
de cada usuário individual e usam esse modelo ao longo da
interação com o usuário, a fim de se adaptar às
necessidades deste.
Sendo assim, o sistema auxiliar para visitas guiadas se
colocaria como um recurso para apresentar roteiros
personalizados que sugerissem as obras mais relevantes a
serem vistas pelos usuários do museu, levando em
consideração as preferências e a bagagem cultural de cada
um.
Para a geração dos perfis a serem atendidos pela hipermídia
proposta, optamos por utilizar a metodologia de personas,
exposta a seguir.
PERSONAS
A idéia de personas foi introduzida por Alan Cooper em
seu livro The Inmates are Running the Asylum [2].
Contrastando com a abordagem da norma ISO 13407, o uso
de personas compreende a aplicação de uma metodologia
completa, uma ferramenta com métodos bem definidos que
se propõe a tratar mais eficientemente a questão do design
centrado no usuário.
O termo persona é compartilhado com os profissionais de
marketing, onde serve a propósito diferente. A distinção
básica entre a persona do marketing e a persona do design é
que a primeira é baseada em dados demográficos,
influenciando nos processos de venda e distribuição; a
última se baseia puramente nos usuários e vai guiar o
processo de design [2]. Em outras palavras, a construção de
personas para o marketing obedece a um processo de
pesquisa quantitativa e estatística, enquanto no design
temos como direção a pesquisa etnográfica/qualitativa.
De acordo com Alan Cooper, personas são arquétipos
hipotéticos de usuários reais, definidos com rigor e precisão
significativos. Em outras palavras, trata-se de personagens
fictícios, construídos a partir da coleta de dados dos
usuários em potencial e que servirão para orientar o
desenvolvimento do produto.
John Pruitt [9] advoga que a metodologia de personas é de
grande potencial para concretizar o design centrado no
usuário. Para Pruitt, A utilização dessa metodologia serviria
não apenas de ligação entre a parte burocrática e a
execução do design, mas iria além, gerando empatia entre a
equipe de desenvolvimento e fazendo com que as
perspectivas do usuário fossem efetivamente levadas a
sério.
Cooper assume o uso de personas também como alternativa
para sanar o fenômeno que denominou “usuário elástico”.
O autor chama à atenção a imprecisão do termo usuário,
uma vez que numa equipe de desenvolvimento, cada
participante tem uma concepção diversa quanto às
características e necessidades do público-alvo. Em
momentos críticos do desenvolvimento dos projetos, esses
“usuários” assumem uma elasticidade para que se encaixem
convenientemente nos argumentos de quem quer esteja
decidindo. Isto confere a uma equipe de desenvolvimento, a
liberdade de projetar conforme queiram, enquanto
aparentemente servem ao “usuário” [3].
Vasara [12] reforça que as personas trazem à vida os tipos-
chave de usuários, especialmente para aqueles que não
participaram do levantamento de dados.
Nota-se que o investimento de tempo na realização da
pesquisa inicial é compensador uma vez que guia as etapas
conseguintes, atendo a equipe aos reais objetivos,
necessidades e limitações do usuário e evitando falhas cuja
correção posterior seria ainda mais dispendiosa em tempo e
em custos.
Com base nos fatores expostos, é comum o surgimento da
pergunta: por que não basear os perfis em pessoas de
verdade?
Pessoas reais tendem a ter peculiaridades que não se
aplicam ao público-alvo geral, o que poderia interferir no
design de forma negativa. Exemplificando, Alan Cooper
cita o presidente de uma companhia que, baseado em sua
preferência particular, determina que todos os softwares
produzidos pela empresa fossem operados apenas pelo
mouse. Projetar com esse usuário em mente excluiria todos
os demais que gostam de utilizar o teclado para a
manipulação de software.
Outro motivo para não serem usadas pessoas reais, jaz no
conceito “usuários não são designers”. Para Jakob Nielsen
[7], se pessoas reais fossem usadas no lugar de personas,
invariavelmente seriam solicitadas a opinar sobre questões
no design e, embora os usuários sejam hábeis em identificar
problemas, não são capazes de elaborar a soluções por não
serem designers.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 99](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-105-320.jpg)
![A metodologia de personas
Desde sua introdução por Alan Cooper em 1999, a
metodologia de personas vem ganhando destaque através
do estudo de outros autores e de sua crescente utilização no
desenvolvimento de produtos e serviços. Percebemos que
as técnicas usadas para produção das personas variam entre
os autores e de acordo com o contexto do planejamento,
constituindo um método bem definido, porém flexível.
Apesar de ser de comum acordo entre os autores que as
informações devem ser coletadas diretamente dos usuários
em potencial, a maioria não especifica as ferramentas
usadas – mesmo porque o contexto é único para cada
projeto. Em linhas gerais, concordam em dedicar sua
atenção à pesquisa qualitativa. Goodwin [5] explica que as
personas são baseadas primariamente em dados
etnográficos, sugerindo que a pesquisa deve ser
essencialmente baseada em dados qualitativos, coletados
através de entrevistas e observação.
Goodwin vai além e abranda o valor da pesquisa
quantitativa, propondo que esta seja usada apenas para
validar as descobertas da pesquisa qualitativa caso haja
tempo hábil e verba disponível para realizar a investigação
extra.
No desenvolvimento deste projeto, utilizamos os seis
passos propostos por Pruitt e Adlin conforme resumo a
seguir:
1º passo: identificar categorias de usuários que são
importantes para seu projeto, de forma a facilitar o
processamento dos dados e estabelecer uma ponte entre os
tipos de usuários e as personas a serem criadas.
2º passo: processar os dados para extrair informações
relevantes ao desenvolvimento do produto.
3º passo: identificar e criar esqueletos, diferenciando-os
através dos detalhes que caracterizam cada categoria.
4º passo: priorizar os esqueletos que serão efetivamente
desenvolvidos ao nível de persona.
5º passo: enriquecer os esqueletos selecionados com
detalhes, histórias, personalidades, contextos, etc.,
elevando-os efetivamente ao nível de persona.
6º passo: validar a as personas, checando se estas refletem
os dados coletados e se abrangem todas as possíveis
hipóteses.
APLICAÇÃO
Reconhecemos que nos diversos estudos de casos,
freqüentemente relatados nas obras para exemplificar a
aplicação da metodologia de personas, o objetivo era
definir prioridades e reduzir ao máximo o número de perfis,
delineando mais precisamente o público-alvo para o qual se
estava projetando.
Em oposição, este trabalho tem como prioridade abranger,
dentro do espectro de freqüentadores de museus, o mais
variado público possível. Para isto, utilizamos a exposição
“Virada Russa”, em cartaz na cidade do Rio de Janeiro
entre junho e agosto de 2009 no Centro Cultural do Banco
do Brasil (CCBB), como cenário para realização de
entrevistas a serem usadas como base para a identificação
do público freqüentador de museus.
Elaboramos um conjunto de perguntas (Anexo A) que
serviu de roteiro para as entrevistas. Consideramos as
seguintes variáveis:
Freqüência de visitação a exposições;
Motivo da visitação;
Nível de conhecimento prévio sobre o tema;
Nível de interesse por material multimídia;
Interesse pelo serviço de visita guiada.;
Necessidade de informações adicionais;
Tempo estimado de permanência no local;
Tempo efetivo de permanência no local.
Valorizando o aspecto qualitativo da metodologia
empregada, permitiu-se que os entrevistados falassem
livremente e as informações relevantes eram registradas
reservadamente em seguida. Naturalmente, o nível de
colaboração variou bastante entre os 33 visitantes
abordados e, dentre os que mais contribuíram, nove
apresentaram características peculiares que influenciavam
de forma significativa seu comportamento durante a
visitação.
Além do “usuário básico”, identificamos duas categorias
importantes de usuários: a que requeria informação
diferenciada e a que requeria apresentação diferenciada.
Tendo por base estes nove visitantes que se destacaram nas
entrevistas, elaboramos e categorizamos dez esqueletos
listados e descritos a seguir.
Entende-se por esqueleto os perfis que poderiam
potencialmente dar origem a uma persona devido a suas
singularidades (o mesmo que arquétipo, para Alan Cooper).
Categoria 1: usuários básicos
A leiga: Teve seu interesse por arte iniciado
recentemente e, por isso, tem pouco conhecimento e
opinião crítica sobre o assunto. Tenta assimilar, num
nível geral, toda informação a seu alcance. Peculiaridade:
tenta captar o máximo de informações gerais por ser
ignorante no assunto.
O visitante casual: Não tem qualquer interesse em se
aprofundar no assunto. Está presente na exposição por
acaso e seu tempo de permanência variará de acordo com
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 100](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-106-320.jpg)


![exposição. A hipermídia ofereceria inicialmente uma lista
padrão contendo as obras mais relevantes e, à medida que o
usuário percorresse a exposição com o dispositivo móvel, o
sistema armazenaria um histórico das obras visualizadas
que serviria de base estatística para distinguir a preferência
por certo estilo ou movimento artístico, atualizando a
listagem em concordância com as predileções do usuário e
de seu tempo disponível.
Ainda conforme os conceitos da adaptatividade, a
hipermídia empregaria os princípios propostos por
Brusilovsky adequando seu conteúdo através da adaptação
da linguagem e da modificação de fragmentos textuais [1].
CONCLUSÃO
Vimos o uso da metodologia de personas orientando a
pesquisa e a criação de perfis a serem atendidos por uma
hipermídia adaptativa para auxílio a visitas guiadas a
museus. Apesar da bibliografia ainda um pouco restrita,
muitos casos bem-sucedidos têm sido relatados,
demonstrando grande eficácia, especialmente no
desenvolvimento de software.
Mesmo tendo sido formalizada há relativamente pouco
tempo, a metodologia compreende conceitos já bastante
discutidos por pensadores do design, da ergonomia e, mais
recentemente, da usabilidade, demonstrando ser uma
ferramenta poderosa do design centrado no usuário.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 103](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-109-320.jpg)

![Estudo comparativo de extensões UML
nos artefatos do projeto de sistemas interativos
First Author Name (Blank if Blind Review)
Affiliation (Blank if Blind Review)
Address (Blank if Blind Review)
e-mail address (Blank if Blind Review)
Optional phone number (Blank if Blind Review)
Second Author Name (Blank if Blind Review)
Affiliation (Blank if Blind Review)
Address (Blank if Blind Review)
e-mail address (Blank if Blind Review)
Optional phone number (Blank if Blind Review)
RESUMO
Este trabalho analisa o problema de projetar e desenvolver
interfaces para sistemas interativos, sob o ponto de vista da
documentação gerada por esse processo. As representações
dos diversos aspectos do projeto geraram extensões UML.
No entanto nem todas as necessidades do projeto de
sistemas interativos são atendidas por essas extensões,
sobretudo, porque uma única representação não é suficiente
para contemplar os diversos níveis de abstração que
precisam ser abordados no projeto de sistemas interativos.
Dessa forma, este trabalho realiza uma análise comparativa
dessas soluções, no contexto de um projeto real. O
resultado desta análise é empregado na proposta de um
conjunto de artefatos para o projeto de sistemas interativos.
PALAVRAS CHAVE
Modelagem da interação; extensões UML; Interação
Homem-Computador; artefatos do processo de software.
ABSTRACT
This paper examines the problem of designing and
developing interactive interfaces to systems from the point
of view of documentation generated by this process. The
representations of the various aspects of the project
generated extensions UML. However, not all the needs of
the project, interactive systems are addressed by these
extensions, mainly because a single representation is not
sufficient to cover the various levels of abstraction that
must be addressed in the design of interactive systems.
Thus, this work performed a comparative analysis of these
solutions in the context of a real project. The result of this
analysis is employed in the proposal of a set of artifacts to
the project of interactive systems.
Keywords
Modeling the interaction, Extensions UML, IHC, Artifacts
of the process of software.
INTRODUÇÃO
Para permanecerem competitivas, as equipes de projetos de
software buscam na modelagem do sistema os diversos
níveis de abstração do processo de desenvolvimento de
software. O uso de modelos auxilia no entendimento e na
comunicação da equipe. A elaboração de modelos elimina
detalhes irrelevantes para o processo e serve como
catalisador, possibilitando a criação de visões simplificadas
de realidades complexas [24].
Como conseqüência do progresso na área de hardware e de
software, aumentaram as opções de estilo de interação e a
complexidade dos softwares projetados e diversificou-se o
perfil dos usuários, tendo ocorrido também o aumento da
busca por usabilidade.
Para facilitar a representação da interação e da interface de
sistemas interativos, autores, vêm estendendo a UML. No
entanto o projeto de sistemas interativos, como qualquer
projeto de software, é uma construção intelectual que passa
por diferentes níveis de abstração. A UML, útil para
capturar diversas abstrações do projeto de software, pode
ser adequada à representação das abstrações específicas da
interação homem-computador.
Na experiência profissional da autora como analista e
desenvolvedora de sistemas interativos, observou-se que a
representação da interação assume diferentes aspectos, a
saber:
representação do perfil dos diversos usuários que
interagem com o sistema;
representação do diálogo entre sistema e usuário;
representação da seqüência das telas e de sua navegação;
representação dos símbolos; e
representação das funções do sistema.
A consistência dessa representação e sua comunicabilidade
no ambiente de projeto são aspectos importantes, não
apenas para o sucesso do projeto de um sistema interativo,
mas também, para a eficácia e a produtividade de uma
equipe de projeto.
Contudo há a preocupação da comunidade de
desenvolvimento de software em garantir que a UML seja
completa para o desenvolvimento de software e que se
preencham todas as lacunas. Para tanto, autores, como
Page-Jones[20], Conallen [5], Silva e Paton [25] e Nunes
[16], dentre outros, utilizaram mecanismos de extensão, os
quais são elementos de modelagem que permitem
tratamento visual e especializado e definem como criar
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 105](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-111-320.jpg)
![novas semânticas na construção da interação do usuário
com o sistema.
ARTEFATOS DO PROCESSO DE DESENVOLVIMENTO
DE SISTEMAS INTERATIVOS
As atividades da Engenharia de Software, em geral,
envolvem uma grande quantidade e variedade de tipos de
artefatos, os quais são gerados durante o processo de
desenvolvimento de software. Um artefato pode ser visto
como qualquer informação gerada, alterada ou usada no
decorrer do processo de desenvolvimento [9]. Sendo assim,
um artefato pode estar na forma de um modelo, um
elemento do modelo (um gráfico, uma classe, um
subsistema etc), um caso de teste, uma ata de reunião, um
manual etc.
Quando os artefatos produzidos são claros, a tendência é a
de que os atores do desenvolvimento de sistema se
entendam. Por sua vez, um documento, ainda que esteja
bem escrito, pode causar dificuldades de entendimento a
quem o lê, por causa de determinada escolha ou decisão
para se constituir daquela maneira. Por esse motivo, são
produzidos diversos artefatos ao longo do processo de
desenvolvimento de sistemas interativos, algumas vezes,
com aspectos repetidos em diferentes níveis de
detalhamento e com relação entre si [1].
Esta pesquisa considerou os artefatos sugeridos por sete
diferentes trabalhos, os quais foram selecionados por vários
motivos: em primeiro lugar, porque todos tratam de
processos de desenvolvimento de sistemas interativos.
Nesse sentido, a coleção de trabalhos captura as diversas
gerações de processos de desenvolvimento de sistemas
interativos, surgidas ao longo dos últimos vinte anos –
desde o trabalho sobre a Engenharia Cognitiva, de Norman
e Draper [15], até a abordagem orientada a objetos de
Mayhew [13], passando por trabalhos clássico da
Engenharia de Usabilidade de Nielsen [14] e do ciclo
estrela, proposto por Hix e Hartson [7]. Este trabalho
considera também a posição da ISO sobre o referido
processo, em sua norma 13.407 [8].
Outro fator relevante para a seleção desses trabalhos foi o
fato de discutirem especificamente os artefatos gerados
pelos mesmos processos. Nesse sentido, contribuem
também: o trabalho de Mayhew [13], o qual revela uma
preocupação importante com os artefatos; o trabalho de
Paula e Silva [21, 25] que define um artefato da Engenharia
Semiótica e o trabalho de Brown [3], que detalha os
artefatos produzidos modernamente na documentação do
projeto de websites.
Nos trabalhos centrados no processo, considera-se que eles
sugerem atividades, das quais é possível extrair artefatos no
processo de desenvolvimento de software, os quais
expressam a necessidade dos projetistas na representação de
suas idéias. Os processos descritos pelos autores, e suas
respectivas atividades, não serão descritas neste artigo por
limitações de espaço.
SELEÇÃO DOS ARTEFATOS
A partir de uma leitura dos autores foi possível extrair os
artefatos para o desenvolvimento de sistemas interativos:
a) perfil dos usuários – é o documento que descreve o tipo
de usuários, perfil e atividades por eles desempenhadas;
b) cenários – são composições realistas da tarefa do usuário,
relacionadas com o objetivo da avaliação, as quais simulam
uma tarefa real, em que o usuário interage com o sistema e
onde é registrado cada procedimento tomado;
c) personas – são perfis de usuários fictícios, mas
representativos;
d) especificação de casos de uso – são narrativas de texto
do caso de uso. Caso de uso são descrições de interações
típicas entre os usuários e o sistema. Eles representam a
interface externa do sistema e especificam um conjunto de
exigências do que o sistema deve fazer;
e) protótipo – tem a função de demonstrar os requisitos de
um sistema;
f) plano de testes – consiste na definição das metas e dos
objetivos dos testes no escopo da iteração (ou projeto), os
itens-alvo, a abordagem adotada, os recursos necessários e
os produtos que serão liberados;
g) diagrama de tarefas – descreve detalhes de como o
processo é implementado, bem como, as instruções e ordens
para a sua execução;
h) questionário com o usuário;
i) manual de instalação – contém instruções para instalação
do sistema;
j) manual do usuário – contém instruções de como o
sistema pode ser operado pelo usuário;
k) tabela de signos – descreve os signos integrantes da
conversa usuário-preposto do designer;
l) diagrama de metas – especifica as metas que os usuários
terão ao utilizarem o sistema e a relação entre essas;
m) diagrama de interação – representa uma visão global das
possíveis conversas que podem ocorrer entre o usuário e o
preposto do designer para alcançarem as metas
representadas no diagrama de metas;
n) mapa do sistema (site maps) – organiza e estrutura o
conteúdo do sistema e seus acessos por meio de um mapa,
ampliando sua visualização e proporcionando modificações
em sua navegação;
o) fluxo de interação (flow charts) – trata tanto do fluxo da
interação das telas do sistema, quanto da interação entre o
sistema e o usuário; e
p) wireframes – desenvolve esboços das telas do sistema,
com pré-disposições e posicionamento de conteúdos e
funcionalidades.
ARTEFATOS UML NO PROCESSO DE MODELAGEM DE
SISTEMAS INTERATIVOS
Segundo Booch, Rumbaugh e Jacobson [2], no processo de
desenvolvimento de um software, é benéfica a produção
dos seguintes artefatos: requisitos, arquitetura, projeto,
código-fonte, planos de projetos, planos de testes,
protótipos e versões. Dependendo da cultura de
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 106](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-112-320.jpg)
![desenvolvimento, alguns desses artefatos são tratados de
maneira mais ou menos formal do que outros.
A partir do estudo dos modelos de processos realizados,
foram selecionadas três fases que contribuem para a
construção da camada interativa no processo de modelagem
e desenvolvimento de interface: análise de requisitos,
design e testes.
Análise de requisitos – São representados pelas descrições
de Caso de Uso , diagramas de Caso de Uso , diagramas de
classe e diagramas de seqüência.
Design – diagramas de atividades, diagramas de estado de
transição e diagramas de pacotes, contendo componentes de
design.
Testes – diagramas de classe e de compontes. Casos de uso
para orientar os testes de usabilidade.
Embora a UML não se refira primordialmente a elaboração
de teste, é possível fazer testes unitários por meio dos
diagramas de classe (Unit test), além de teste integrado com
os diagramas de componentes (component test).
EXTENSÕES DA UML PARA SISTEMAS INTERATIVOS
Alguns autores, preocupados em garantir que a UML seja
completa para o desenvolvimento de software e preencha
todas as lacunas de representação necessárias nesse
processo, utilizaram mecanismos de extensão para criar
novas semânticas necessárias para representar a interação
do usuário com o sistema, a análise de requisitos, a
construção de interfaces e a interação entre objetos que
compõem o sistema. Para representar essa preocupação, foi
feito um levantamento de extensões da UML, cujo
resultado é apresentado a seguir, na Tabela 1.
EXTENSÕES UML SELECIONADAS PARA UM ESTUDO
COMPARATIVO
Foi realizado um estudo comparativo das extensões UML
para representação da interação homem-computador, por
meio de uma análise comparativa aplicada a um projeto real
de software interativo, o qual não está descrito neste artigo
por limitações de espaço. O foco da comparação é a
representatividade da extensão em cada artefato, que deve
oferecer ao projetista um meio de expressar precisamente
suas intenções em todo o processo de desenvolvimento. As
extensões selecionadas foram: Page-Jones, UMLi, WAE e
Wisdom, [20,4, 25 e 16].
Page-Jones [20] desenvolveu dois diagramas adicionais
para representar a IU na UML, o diagrama para layout de
janelas, estendido do diagrama de caso de uso, e diagrama
para navegação de janelas, estendido do Diagrama de
pacote.
UMLi é um projeto de pesquisa desenvolvido pelo grupo de
gerência da informação da Universidade de Manchester, em
1998. Segundo Paton e Silva [4], a UMLi foi desenvolvida
para proporcionar interação amigável entre usuário e
sistema. Ela propõe dois novos diagramas UML para o
projeto de IU, descritos como Diagrama IU e Diagrama de
Atividade Estado de Seleção.
Extensão Ano Foco Autores Ref.
Diagramas
de Layout e
de
Navegação
de Janelas.
1996 Prototipação e
navegação de tela.
Page-Jones [20]
UMLi 1998 Modelagem de
interface e modelagem
do comportamento UI.
Paton e Silva [25]
WAE 1998 Internet Jim Conallen [5]
WISDOM 2000 Modelagem de
Sistemas Interativos –
prototipação evolutiva.
Nuno Jardim
Nunes
[15]
AUML 2000 Modelagem de
sistemas envolvendo
objetos e Modelagem
de comunicação entre
agentes (objetos).
Odell,
Parunak e
Bauer
[17]
Libra 2004 Comportamento de
elementos: objetos e
aspectos.
Chaves [4]
IMML 2003 Modelagem visual de
interfaces de usuário.
Descrição abstrata de
IU.
Jair
Cavalcante
Leite
[11]
TUML 1997 Modelos temporais. Svinterikou [26]
UMP²D 2000 Desenvolvimento de
aplicações paralelas.
André Luís
Olivete, Dr.
Onofre
Trindade
Júnior
[18]
Xchart 1997 Modelo de
Especificação e
implementação de
gerenciadores de
diálogo.
Fábio
Nogueira de
Lucena
[12]
UWE 2000 Extensão para modelar
Sistema Hipermídia
Adaptativa (SHAs).
Nora Parcus
de Koch
[10]
UML-MC 2002 Extensão da UML para
representar Mapas
Conceituais
Robinson e
Crespo
[23]
Tabela 1 – Extensões UML levantadas
Criada por Conallen [25], a WAE (Web Application
Extension for UML) estende a notação UML e traz novos
estereótipos com semântica e restrições adicionais,
permitindo a modelagem de elementos específicos da
arquitetura envolvida numa aplicação Web, incluindo-os
nos modelos dos sistemas. Conallen propõe Experiência do
Usuário (UX), a qual é apresentada por meio de um
conjunto de diagramas utilizados pra descrever a IU.
De acordo com Nunes [16], a arquitetura de IU WISDOM é
uma extensão do padrão de análise
interface/entidade/controle (model-view-controller, MVC)
da UML. Nunes propõe nove artefatos, são eles: Modelo
perfil do usuário estendido do diagrama de caso de uso,
Modelo de domínio/negócio estendido dos diagramas de
classe e diagramas de atividade, Modelo de casos de uso
essencial estendido do diagrama de caso de uso, Modelo de
Análise e Modelo de Interação ambos estendidos dos
diagramas de classe, Modelo de desenho estendido dos
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 107](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-113-320.jpg)
![diagramas de classe e diagramas de estado, Modelo de
diálogo estendido do diagrama de classe, Modelo de
Requisitos estendido do diagrama de classe e diagrama de
estado e Modelo de Implementação.
As extensões foram aplicadas em um projeto do Centro
XXXXXX do xxxxxxxx na Seção de XXXXXXX O
projeto visa ao desenvolvimento de um sistema interativo
denominado Sistema de Gestão de Árvores Urbanas
(SISGAU). O estudo comparativo analisa as extensões
UML nas fases de análise de requisitos, design e teste.
Nas extensões estudadas, foram encontrados para a fase de
análise de requisitos, o modelo de perfil do usuário e o
modelo de diálogo, ambos da WISDOM.
Modelo de Perfil do Usuário – é representado por um
diagrama de casos de uso, com os estereótipos de
classificação, ação e composição. Esse modelo segue a
perspectiva definida pelo mapa de papéis do usuário, ilustra
e organiza características dos usuários e seus papéis, tipo de
usuário, conjunto de interesses, comportamento,
responsabilidades e expectativas em relação ao sistema.
Essa extensão mostra – por meio do diagrama de casos de
uso – os usuários do sistema e seus papéis, acrescentando
descrições textuais para explicar responsabilidades,
expectativas e comportamentos.
Modelo de Diálogo – esse modelo especifica a estrutura de
diálogo da aplicação interativa, focando as tarefas e seus
usuários.
A Figura 2, a seguir, descreve esta situação: um grupo de
usuário (administrador e inspetor) pode consultar, cadastrar
e alterar as telas avaliação, diagnóstico e prospecção do
tronco, seguindo essa seqüência. No caso, a interface de
Avaliação do Tronco tem as seguintes funções:
InserirAvaliacaotronco(),alteraAvaliacao
tronco(),consultaAvaliacaotronco().
Nota-se que o usuário Consulta apenas consulta as telas
avaliação tronco, diagnóstico tronco e propecção tronco.
É interessante ressaltar neste modelo que, além de ele
demonstrar os tipos de usuários, suas tarefas (consultar,
alterar e cadastrar) e as telas que percorre, ele descreve
também as funções contidas em cada tela.
Os artefatos identificados como necessários para o Design
são: protótipos, mapa do sistema, fluxo de interação,
diagrama de interação e Wireframe. As extensões que se
aplicam a essa fase são:
a) Page-Jones – Diagrama de navegação de Janelas e
Diagrama de Janela;
b) UMLi – Interação do Fluxo de Telas e Diagrama IU;
c) WAE – Mapa de caminho de navegação, Descrição de
telas e conteúdo, Fluxo de navegação; e
d) WISDOM – Fluxo de telas – modelo de interação,
modelo de desenho ou apresentação.
Figura 2 - Modelo de diálogo – WISDOM.
Page-Jones [20] propõe o diagrama de navegação de
janelas, que é uma extensão do diagrama de estado da
UML, cujo objetivo é mostrar como os usuários podem
passar de uma janela para outra ao longo de rotas
expressivas e importantes na aplicação.
Seguindo o fluxo exposto na Figura 3 a seguir, verifica-se
que a interface (denominada pelo autor de janela)
Avaliação do Tronco foi acionada a partir da interface
Avaliação do Colo. Nessa interface, é executada a função
InserirAvaliacaoTronco e, a partir dos botões
diagnóstico e prospecção, é possível navegar para outras
duas telas: Diagnóstico ou Prospecção.
A interface Diagnóstico recebe os dados do tronco
(demonstrado pelo colchete diagnostico.tronco, da classe
diagnóstico) e a interface prospecção recebe os dados da
FendaRachadura (classe).
Caso o usuário escolha a interface Prospecção, ele terá de
passar necessariamente pela interface Diagnóstico e, se ele
escolher a interface Diagnóstico, a próxima interface que
ele percorrerá é a de Avaliação Copa.
Todos os estereótipos demonstrados na Figura 3 (cb, nav e
jn), inserida a seguir, fazem parte da extensão, segundo
proposta de seu autor.
Figura 3 – Diagrama de navegação de janelas –
Fonte: Page-Jones [20]
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 108](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-114-320.jpg)
![O que torna esta extensão atraente é o fato de ela ser
simples em demonstrar a navegação de telas (prisma), as
funções que a interface necessita para sua execução e os
eventos (botões). Outra vantagem é o fato de não haver
necessidade de uma ferramenta específica para desenhar
esse diagrama.
Outro diagrama proposto por Page-Jones [20] é o de
janelas, que tanto pode ser uma extensão do diagrama de
caso de uso como pode ser uma extensão do diagrama de
pacote, quando representa agrupamentos exclusivamente de
elementos.
Para desenhar o diagrama de janelas, foi utilizada a
ferramenta Microsoft Visio. Foi desenhado o diagrama de
caso de uso e, nesse, foi indicada uma interface denominada
Diagrama de Layout, exposto na Figura 4, a seguir.
No Diagrama de Layout – Figura 5, a seguir – foram
colocados os elementos da interface sem nenhum
refinamento.
Figura 4 – Caso de Uso Avaliação Tronco – Fonte:
Page Jones [20].
A proposta de Page-Jones é bem simples: ele estende o
diagrama de caso de uso da UML para demonstrar o
protótipo.
Na UMLi, Paton e Silva [25] propõem o diagrama de
Interação do Fluxo de Telas, o qual é uma alternativa para
representar o processo descrito por um caso de uso. Para
tanto, esse diagrama dispõe dos mesmos elementos dos
diagramas de estado, ou seja, eventos e estados, mas esses
não se restringem a um único objeto. O diagrama de
Interação do Fluxo de Telas é muito parecido com o
diagrama de navegação de janelas do Page-Jones [20].
Na Figura 6 a seguir, está demonstrada a seguinte situação:
os dados da interface Avaliação Colo (descrito pelo
estereótipo AvaliacaoColo.dados, classe
AvalicaoColo) são enviados, após confirmação, para a
interface Avaliação Tronco que é composta pela função
InserirAvaliacaoTronco e pelos dados do
diagnóstico, presentes na classe diagnóstico
(diagnostico.tronco) e da fendaRachadura,
presente na classe prospecçao
(prospeccao.fendaRachadura ).
Figura 5 – Diagrama de Janela – Avaliação Tronco.
De acordo com os dados recebidos, o sistema ativa a
interface Prospecção Tronco ou Diagnóstico Tronco e, se
ativar a interface Prospecção, a seqüência posterior será a
interface Diagnóstico Tronco e Avaliação Copa.
Assim, a extensão apresenta o nome das telas: Avaliação
Tronco, Prospecção Tronco e Diagnóstico Tronco; o fluxo
das telas; os eventos activates e confirms; as
funções InserirAvaliacaoTronco,
InserirDadosProspecçao e
InserirDadosDiagnostico; e os dados
dados.AvaliacaoColo, dignostico.tronco e
Prospeccao.fendaRachadura .
Figura 6 – Interação do Fluxo de Telas – UMLi.
Outro diagrama proposto por Paton e Silva é o UI, utilizado
para modelar interface. Esse diagrama é estendido a partir
do diagrama de classe da UML e as instâncias dessas
classes são os próprios objetos interagindo.
Para modelar o Diagrama IU, é necessário ter o diagrama
de classes da UML. O Diagrama IU, representado na Figura
7 a seguir, apresenta a interface Avaliação Tronco, na qual,
estão os objetos extraídos do diagrama de classe da UML,
e, nesse, constam os ícone editores, que é um ícone de
entrada de dados. Dentro da interface, há também dois
recipientes e, dentro desses recipientes, há informações
emitidas pelos usuários – do diagnóstico e da prospecção.
Essas serão utilizadas em outras interfaces. Há o símbolo
responsável por receber informações emitidas por usuários
tanto fora como dentro dos recipientes.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 109](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-115-320.jpg)
![Figura 7 – Diagrama IU.
Na WAE Conallen [5] propõe um novo conceito na
modelagem de sistemas e apresenta o modelo de
experiência do usuário (UX), o qual é usado para descrever
a equipe e as atividades dos responsáveis em manter a
interface com o usuário. Para a fase de Design, Conallen
propõe na UX quatro artefatos: Fluxo de tela, Mapa de
Caminho de Navegação, Descrição de Telas e Conteúdo e
Cenários do Roteiro.
a) Fluxo de Tela
Um artefato da UX é o Fluxo da tela, na Figura 8 a seguir, o
usuário inspetor acessa a interface Avaliação Tronco, por
meio de uma página client, que acessa uma página server a
qual contêm as funções do sistema: interferência,
fenda_rachadura e diagnostico_tronco.
Figura 8 – Fluxo da tela – WAE.
O fluxo de tela demonstra o tipo de usuário, a interface, as
funções executadas e o tipo de armazenamento – cliente ou
servidor.
b) Mapa de Caminho de Navegação
O artefato mapa de caminho de navegação é bem simples e
expressa o nome das interfaces e o caminho que o usuário
deve percorrer para navegar no sistema.
No SISGAU, não há um menu onde o usuário seleciona a
tela que ele quer cadastrar. Desse modo, ele tem de seguir
uma seqüência de telas (Wizard) e, quando modelada no
Mapa de Caminho de Navegação, essa seqüência de telas
tornou-se confusa.
c) Diagrama de Descrições de Telas e Conteúdo
Esse artefato do modelo UX é uma extensão do diagrama
de classe da UML. A interface é representada com uma
classe estereotipada, com ícones e atributos estereotipados,
como se vêem a seguir na Figura 10. O nome da interface é
usado como nome da classe – tem um símbolo indicando
que é uma interface – e a descrição da interface capturada é
usada como a descrição da classe. As classes podem ser
organizadas em pacotes. Neste estudo, são analisadas duas
interfaces: Avaliação Tronco e Diagnóstico Tronco, os
dados de entrada da interface são indicados pelo estereotipo
dexibido e os dados são gerenciados pelo estereotipo
dbanco.
Exemplificando, o diagrama de Descrições de telas e
conteúdo é um diagrama de classe da UML com
estereótipos indicando quais dados são de entrada – aqueles
produzidos pelo usuário – e quais dados são gerenciais –
aqueles produzido pelo sistema, além de um ícone,
indicando quais classes são interfaces.
Figura 9 – Descrição de Telas e Conteúdo – WAE.
d) Cenários do Roteiro
Conalen, no Artefato Cenários do Roteiro, descreve um
fluxo de telas com entrada de dados do usuário, visto a
seguir, na Figura 18. Nesse, o usuário fornece informações
sobre a interface (Avaliação do Tronco) e a navegação é
orientada para a próxima interface, desde que se tenha
obtido sucesso na inserção de dados. Ou, explicando
melhor, a Figura 10 demonstra esta situação: o usuário
inspetor acessa a interface Avaliação do Tronco, que
dispara a função InsereAvaliacao(). Se os dados forem
consistentes, aparece a interface Diagnóstico Tronco; caso
os dados estejam incompletos, aparece a interface Dados
Perdidos (interface de erro); e, se houver erro de
processamento (problemas externo ao sistema, por exemplo
conexão da rede), aparece a interface Erro de
Processamento.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 110](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-116-320.jpg)
![Figura 10 – Cenários do Roteiro – Fluxo de navegação
determinado pela entrada de dados do usuário.
Essa extensão apresenta um cenário de roteiro de forma
bem macro, sem muito detalhamento de interface e não há
descrições das funções do sistema nem dos eventos.
Na WISDOM, Nunes [16] propõe dois artefatos para essa
fase: modelo de interação e modelo de apresentação. O
modelo de interação é um fluxo de casos de uso. Na Figura
11, está demonstrada a seguinte situação: se o usuário
acessar o caso de uso localização, terá duas opções, incluir
ou alterar/consultar. Caso ele opte por incluir, ele segue
uma seqüência de telas até finalizar (wisard), caso
contrário, ele pode acessar a interface que quer alterar ou
consultar.
Figura 11 – Fluxo de Casos de Uso – Modelo de Interação –
WISDOM.
A proposta desse artefato não é descrever o fluxo de
interfaces, mas demonstrar a seqüência dos casos de uso.
Na modelagem desse fluxo, constatou-se que, quando os
casos de uso seguem obrigatoriamente uma seqüência que
independe da ação do usuário, fica inviável a sua
visualização.
Outra proposta de Nunes é o modelo de apresentação, uma
extensão do diagrama de classe. Esse modelo apresenta o
nome da Interface, seus eventos e objetos. Após modelar o
modelo de apresentação, é possível desenhar o protótipo da
interface.
A Figura 12, a seguir, expõe o modelo de apresentação, o
qual traz um diagrama de classe estereotipado, em que está
descrita a interface Avaliação Tronco. Essa possui dois
eventos: voltar ou prospecção. Dentro da interface
Avaliação Tronco, há três divisões: Interferência,
Diagnóstico e Fenda/Rachadura e os objetos que compõem
cada divisão. O protótipo é construído a partir do diagrama
de classe estereotipado.
Figura 12 – Modelo de desenho ou apresentação –
WISDOM.
Os artefatos identificados como necessários para o Teste
são: questionário com o usuário, documentação de testes,
manual de instalação e manual do usuário. Não há artefatos
para representação dessa fase nas extensões estudadas.
VANTAGENS E DESVANTAGENS DAS EXTENSÕES
Page-Jones
Os dois artefatos propostos por Page-Jones [20], o
Diagrama de Layout de Janela e o Diagrama de Navegação
de Janela, são artefatos simples de modelar e que não
precisam de ferramenta específica para desenhá-los.
O objetivo principal do Diagrama de Layout de Janela é
adicionar o protótipo aos diagramas UML. Esse protótipo
apresenta detalhes da interface que, muitas vezes, não são
descritos nos casos de uso nem nos diagramas de classe.
A vantagem principal que esse diagrama oferece é a de
detalhar o caso de uso por meio de um protótipo. Outra
vantagem é promover uma estrutura para uma posterior
especificação da interface, a qual inclui validações cruzadas
de campos requeridos, sincronizações entre campos,
verificações de banco de dados e assim por diante. Um
ponto negativo é que alguns requisitos não aparecem na
especificação, por exemplo, os requisitos não funcionais.
O objetivo do Diagrama de Navegação de Janela é mostrar
como os usuários podem passar de uma janela para outra ao
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 111](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-117-320.jpg)
![longo de rotas expressivas e importantes da aplicação. O
Diagrama de Navegação de Janela mostra as rotas de
interação para um caso de uso. A vantagem desse diagrama
está na representação da navegação e na opção de rotas
alternativas. Uma desvantagem é que não há descrição do
tipo de usuário.
UMLi
Os dois artefatos propostos por Paton e Silva [25] –
Diagrama UI e Diagrama de Atividade – são artefatos não
tão simples de modelar, pois requerem ferramenta
específica. Os autores desenvolveram a ARGOi, mas não
foi possível a sua utilização neste trabalho.
O objetivo do artefato Diagrama UI é modelar a interface
com o usuário e, para tanto, ele apresenta entradas e saídas
de dados, além dos objetos da tela.
Uma desvantagem é que somente quem conhece a
simbologia entende o que o diagrama quer demonstrar, pois
não se trata de algo ontológico.
O objetivo do Diagrama de Atividade é apresentar a
seqüência de estados e eventos da tela, deixando sua
aparência muito semelhante à de um fluxograma.
Uma vantagem desse artefato é que ele está diretamente
ligado ao Diagrama UI. Seguindo o Diagrama de Atividade
e interpretando o Diagrama UI, é possível compreender a
interação e projetar a interface. Outra vantagem desse
diagrama é o fato de ele apresentar um processo descrito
por um caso de uso.
WAE
Os artefatos propostos por Conallen [5] serão eficazes para
modelar a interface, se utilizados conjuntamente, pois um
completa o outro.
O objetivo do artefato Fluxo de Tela é descrever os
caminhos ao longo de todas as telas que participam dos
cenários e os caminhos de navegação esperados são
modelados com associações entre as telas.
Uma vantagem desse artefato é o fato de ser de fácil
modelagem e entendimento. Sua desvantagem é não dispor
de simbologia para demonstrar um fluxo alternativo.
O objetivo do Mapa de Caminho de navegação é apresentar
uma visão da aplicação cujo objetivo é mostrar como
usuários do sistema navegarão nele. Esse mapa é
representado em diagrama hierárquico em árvore.
Uma vantagem do Mapa de Caminho de Navegação é a
apresentação de rotas de navegação, juntamente com as
funcionalidades do sistema e os usuários.
O objetivo do artefato Descrição de Telas e Conteúdo é
apresentar os objetos de cada interface e as classes que
interagem com a mesma. E uma desvantagem desse artefato
é a não-apresentação de eventos (“voltar”, “próxima
página” etc.).
O objetivo do Cenário do Roteiro é compreender e
estruturar os cenários, mostrando o ponto de vista do
usuário.
A vantagem desse artefato é que ele conta a história da
aplicação por meio das telas. Outra vantagem é a oferta de
um esquema de roteiro mapeado para o modelo de caso de
uso. Sua desvantagem é fornecer visão pouco detalhada das
interfaces e da interação.
WISDOM
O objetivo do artefato Modelo do Perfil do Usuário é
apresentar os usuários do sistema, mediante descrição de:
tipo de usuário, comportamento, responsabilidades e
expectativas em relação ao sistema. A vantagem desse
diagrama é apresentar o usuário e suas tarefas aos
stakeholders.
O objetivo do Modelo de diálogo é especificar a estrutura
de diálogo da interface, ou seja, explicitar as seqüência das
tarefas e fornecer relações que assegurem consistência dos
diferentes elementos de apresentação.
A vantagem desse artefato é o fato de descreve as funções
contidas em cada tela, além de demonstrar os tipos de
usuários, suas tarefas (consultar, alterar e cadastrar) e as
telas por ele percorridas.
O objetivo do Modelo de Interação é organizar os
elementos da arquitetura do sistema, diretamente
relacionados com sua estrutura de utilização.
A vantagem desse artefato é que ele demonstra a seqüência
dos casos de uso. E uma desvantagem é que ele inviabiliza
a modelagem e sua visualização, quando os casos de uso
seguem obrigatoriamente uma seqüência.
O objetivo do Modelo de Apresentação é definir a parte
perceptível do sistema, ou seja, a interface, focando como
as diferentes entidades de apresentação estão estruturadas
de forma a realizar a interação com o usuário.
PROPOSTA DE ARTEFATOS
Analisando os artefatos levantados, os quais foram descritos
anteriormente, e a modelagem das interfaces em um projeto
real, verifica-se que não há necessidade de produzir todos
os artefatos na modelagem de sistemas interativos. A
pressão dos clientes por prazos menores obriga os
desenvolvedores a buscarem soluções de modelagem mais
rápidas, eficazes e que atendam às expectativas dos clientes
e da equipe de desenvolvimento.
Tendo em vista essas premissas, foram extraídos um
conjunto de artefatos classificados por esta pesquisadora, no
contexto da qualidade em uso, como eficazes, produtivos e
satisfatórios. Esses artefatos foram extraídos dos modelos
propostos pelos autores estudados e na aplicação das
extensões, esses artefatos estão descritos na Tabela 3.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 112](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-118-320.jpg)
![Verifica-se que uma parte expressiva dos artefatos
propostos foi extraída das extensões UML.
Fases e
visões
Artefatos Propostos Autores/
extensões
Análise de
Requisitos –
visão de caso
de uso.
Questionário com o usuário. [9]
Modelo de Perfil do usuário. [12]
Cenários. [7], [11], [10],
[ 9] e [15]
Tabela de signos. [15]
Modelo de tarefas. [11], [10], [6] e
[9]
Análise de
Design –
Visão lógica
e de
concorrência.
Definição da Arquitetura –
Deployment.
[2]
Validação e detalhamento do
cronograma de
desenvolvimento.
Experiência da
autora.
Diagrama de estado estendido
por meio do modelo de diálogo.
WISDOM [12]
Diagrama de Janela. Page-Jones [14]
Mapa de caminho de navegação. WAE [4].
Fluxo de telas. WAE [4].
Testes –
Visão de
componentes
e de
implantação
Programas bem documentados. Experiência da
autora.
Bibliotecas. Experiência da
autora.
Banco de dados – MER e
dicionário de dados.
Experiência da
autora.
Cenários do roteiro. WAE [4].
Manual de instalação e manual
do usuário.
[9]
Tabela 3 – Artefatos sugeridos para a modelagem de
projeto de sistemas interativos
CONCLUSÃO
Este trabalho levantou os artefatos dos modelos de
processo, tal como sugere a literatura – artefatos gerados
pela UML e artefatos das extensões UML – os quais são
propostas para modelagem de interação das interfaces, para
o desenvolvimento do sistema interativo.
Fez-se um estudo comparativo das extensões, por meio de
sua aplicação a um sistema real, no qual, o foco da
comparação foi a representatividade dos artefatos gerados,
de modo a oferecer ao projetista um meio de expressar
precisamente suas intenções em todo o processo de
desenvolvimento, medindo, em um contexto de uso, a
eficácia, a produtividade e a satisfação.
Uma das conclusões obtidas a partir deste trabalho é o fato
de os artefatos gerados pelos processos de desenvolvimento
de sistemas interativos não serem explícitos. Foi necessário
que a autora inferisse nos artefatos das atividades sugeridas
por vários dos autores pesquisados, porque não há
padronização de artefatos propostos pelos autores.
Outra conclusão apresentada neste artigo é a de que a
modelagem de sistemas interativos não pode se basear
somente em elementos definidos pelo metamodelo da
UML. A UML, por ser uma linguagem de modelagem, não
atende às necessidades de representação de um sistema
interativo, já que é originalmente destinada a oferecer uma
forma visual gráfica de comunicação para representação
dos principais conceitos e elementos de um sistema.
Entretanto uma das fortes características da linguagem de
modelagem unificada, presente em seu metamodelo é o
mecanismo de extensão que essa linguagem implementa.
Entende-se ser impossível modelar artefatos dos modelos
de processos de desenvolvimento de sistemas interativos
somente a partir de elementos da UML e seus diagramas.
Uma das alternativas, então, é utilizar extensões da UML
em conjunto com os diagramas da UML, tendo em vista
suas visões.
Os autores das extensões estudadas, [14, 18, 4 e 12],
recomendam a modelagem de sistemas interativos por meio
dos diagramas UML, aos quais eles acrescentam extensões
e adicionam artefatos para facilitar o entendimento dos
stakeholders.
De modo geral, a análise e a implementação dos artefatos
das extensões mostraram que:
o primeiro passo para promover o desenvolvimento de
softwares interativos com qualidade e fácil de utilizar
deve ser a garantia de que os envolvidos nos projetos
(stakeholders) gerem artefatos de qualidade e
compreendam essa atividade de forma contextualizada;
para modelar a interação, em geral, os autores adaptaram
o diagrama de estado da UML e incluíram estereótipos
(elementos de modelos), para facilitar a visualização e a
contextualização;
não há produtividade no desenvolvimento dos artefatos
propostos pelas extensões por faltarem ferramentas que
apóiem a modelagem com os elementos específicos das
extensões;
falta manual de instrução ou uma documentação
sintetizada que indique como aplicar as extensões em um
projeto de sistemas interativos;
as extensões têm, em geral, simplicidade na semântica;
as extensões possibilitam a construção de mecanismos
adaptados a necessidades específicas.
somente os artefatos das extensões não conseguem
satisfazer todas as fases do projeto de sistemas
interativos. A fase mais representada é a de Design.
Enfim, este estudo demonstrou que não há na literatura uma
regra. Ademais os autores estudados não fazem indicações
de quais artefatos são necessários para modelagem do
processo de sistemas interativos. Esse trabalho procurou
nos autores dos processos de desenvolvimento de software,
na UML e em suas extensões, o melhor dos artefatos
propostos e, assim, sugeriu uma lista desses que sejam
capazes de demonstrar especificação, visualização,
modelagem e documentação.
REFERÊNCIAS
1. Bombani, L.; Ciancarini, P.; Vitali, F. “Sophisticated
hypertext funcionalities for software engineering”. In:
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 113](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-119-320.jpg)


![Design’. Porém, nem tudo é Design e nem todos são
designers. O termo Design se refere a um potencial ao qual
cada um tem acesso e que se manifesta na invenção de
novas práticas da vida cotidiana. [.] Design é uma atividade
fundamental, com ramificações capilares em todas as
atividades humanas; por isso, nenhuma profissão pode
pretender o monopólio do Design.” (Bonsiepe, 1997, p.15).
Partindo de uma visão aberta à inclusão que caracteriza a
área do Design, no presente estudo defendo a idéia de que
existe no campo do Design um grande potencial para
trabalhos conjuntos com diversas áreas, com vistas a
atender a novas exigências da sociedade contemporânea.
Foi precisamente este entendimento que conduziu as
reflexões aqui realizadas sobre as possibilidades de um
diálogo interdisciplinar entre Design e Design de interação
como base para a discussão do papel do Design na
construção de interfaces digitais que disponibilizem
informações significativas e promovam experiências
agradáveis.
O Design é um processo ativo que influencia a sociedade
criando sua cultura material. Segundo essa ótica, Meurer,
citado por Frascara (1997) diz que o mundo em que
vivemos é mais que a matéria que se há solidificado como
forma, e que se deteve no tempo. Sua forma está definida
mediante a atividade e a ação é seu centro. Se o Design é
concebido orientado em direção a ação, entendida como
interação ativa e mudança criadora, ele não focará somente
o objeto como forma. Ao contrário, os designers se
preocuparão pelo desenvolvimento de modelo de processos
interativos, nos quais os objetos desempenham um papel
central indiscutível como meio para a ação. Segundo esta
visão, o Design se relaciona com a totalidade do espectro
concreto e intelectual da interação humana, da interação
entre as pessoas, dos produtos, e com o mundo em que
vivemos. (Meurer, apud Frascara, 1997, p. 220).
Tomando esta definição do Design como campo, que nas
palavras de Meurer, “se relaciona com a totalidade do
espectro concreto e intelectual da interação humana”, trago
aqui uma reflexão de questões que envolvem o Design no
contexto da interação.
DESIGN DE INTERAÇÃO: CRIAR EXPERIÊNCIAS
As tecnologias intelectuais vêm reformulando a visão do
homem sobre o mundo, vários aspectos da sociabilidade
humana estão emergindo por meio dos recursos das
tecnologias de informação e de comunicação, criando assim
uma nova paisagem de experiências e interações.
O AIGA (American Institute of Graphic Arts) coloca que
Design de Experiência possui a visão de um produto ou
serviço a partir do seu ciclo de vida completo com o
consumidor, de antes dele perceber a necessidade até o
momento de descarte; prioriza a criação de relações com
indivíduos, não mercados de massa. A preocupação com a
evocação e a criação de ambientes que se conectem em
níveis de valor ou emoção com o consumidor; construído
tanto sobre as disciplinas tradicionais de Design, quanto a
partir de um ambiente variado de outras disciplinas.
Para Winograd (1997), em uma visão tradicional da
interface, a interação acontece entre a pessoa e a máquina e
sobre o espaço que é sustentado entre elas. Entretanto, este
espaço é aberto e habitado por outras pessoas e outros
dispositivos, formando uma rede complexa de interações
que não se sustenta simplesmente na criação da melhor
ferramenta de trabalho dentro de um mundo pré-existente,
mas na criação de novos mundos onde os indivíduos sejam
capazes de perceber, agir e responder às experiências.
Para melhor explorar o tema sobre Design no contexto da
interação lanço mão de Shedroff (2010), que utiliza o termo
Information interaction Design, que é a intersecção das
disciplinas Design da Informação, Design de Interação e
Design Sensorial.
Segundo o autor, Design da Informação aborda a
organização e apresentação de dados: a sua transformação
em informações válidas e significativas. Embora a criação
desta informação é algo que todos nós fazemos, em certa
medida, ela só recentemente foi identificada como uma
disciplina com comprovados processos que podem ser
empregados ou ensinados. Enquanto o Design da
Informação centra-se principalmente na representação de
dados e sua apresentação, a ênfase em Design de Interação
é a de criar experiências agradáveis. E o Design Sensorial
refere-se ao emprego de todas as técnicas com as quais nós
nos comunicamos com os outros através dos nossos
sentidos.
Ou seja, uma categoria abrangente sobre as disciplinas
envolvidas com a criação e apresentação dos meios de
comunicação para as aplicações hipermídia, como; design
gráfico, animação, vídeo, tipografia, som, etc, Estes níveis
de compreensão são importantes porque definem os limites
com os quais podemos criar e comunicar. Para o
desenvolvimento de um projeto hipermídia, o design deve
estar atento para o visual, o verbal, o sonoro, o tátil e o
sinestésico que devem estar presentes de acordo com os
objetivos e as características dos usuários a que se destina o
projeto.
Citando Bonsiepe (1997), a interface deve ser entendida em
um caráter mais amplo desde sua ação instrumental,
relacionada a desenvolvimento de produtos até sua ação
comunicativa, uso de signos e informações. O autor ressalta
que uma das características da hipermídia que a torna
interessante é a interação dialógica do meio visual com o
discursivo, nela a informação pode vir sob a forma texto,
áudio, imagens, seqüências de vídeos, animações, música e
sons (Bonsiepe, 1997, p. 144). Entretanto estas formas
precisam ser elaboradas dentro do processo de
desenvolvimento de uma interface, pois se as possibilidades
abertas pela tecnologia de informação e comunicação
estarão ou não disponíveis dependerá da qualidade de
interface. Esta poderá inibir ou facilitar o acesso às
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 116](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-122-320.jpg)







![Influência do perfil do usuário na inteligibilidade de
interfaces de data warehouse
Mônica Gouvêa
IPT - Instituto de Pesquisas Tecnológicas do
Estado de São Paulo
Av. Prof. Almeida Prado, 532
05508-901 São Paulo SP
gouvea.monica@gmail.com
Lucia Vilela Leite Filgueiras
IPT - Instituto de Pesquisas Tecnológicas do
Estado de São Paulo
Av. Prof. Almeida Prado, 532
05508-901 São Paulo SP
lfilguei@gmail.com
RESUMO
A forma pela qual a informação extraída de um data
warehouse é visualizada pelo usuário final é de
fundamental importância, já que decisões são tomadas
com base na informação apresentada. Percebeu-se ser
necessário explorar as relações de dependência entre a
a compreensão de soluções de interface e o perfil de
seu usuário. Para realizar este estudo, fizemos uma
abordagem que se baseia em duas técnicas pouco
usadas, a de Human Dynamics para explorar o perfil
de usuário e a de Sense-Making para compreender a
dinâmica de uso das interfaces DW. Apresentamos
neste artigo os resultados deste estudo.
PALAVRAS-CHAVE
Interface de Data Warehouse, Sense-Making, Human
Dynamics.
1. INTRODUÇÃO
Data warehouses(DW) são arquiteturas de Banco de
Dados, estruturadas de forma a armazenar
informações históricas extraídas das atividades das
empresas, principalmente de seus dados transacionais.
As informações do DW destinam-se à geração de
relatórios e produção de tendências, de alta relevância
nos processos decisórios das empresas. A forma pela
qual a informação é extraída do DW e visualizada
pelo usuário final é de fundamental importância. A
interface de usuário de um DW está diretamente
relacionada com a ferramenta de front end, por meio
da qual se configura um conjunto de dados e a forma
de representação para demonstração. A ferramenta é
chamada de front end porque é através dela que os
usuários finais do DW interagem com as informações.
A ferramenta influencia na inteligibilidade da
informação e por isso, esta escolha deve levar em
conta o perfil do usuário que irá manipulá-la.
A experiência profissional da primeira autora na
implantação de DW em diversas empresas de
diferentes ramos de negócios - financeiro, logístico e
de telecomunicações - indica que, quando a decisão
da construção de um DW é tomada, vários fatores são
avaliados pelos altos gestores da companhia. Entre
esses fatores, considera-se o orçamento
disponibilizado para tal implementação, a empresa
responsável pela implementação da solução; o
Sistema Gerenciador de Banco de Dados (SGBD) que
será utilizado para o armazenamento das informações,
as ferramentas a serem disponibilizadas e a equipe
que irá responder pelo processo de desenvolvimento e
implantação do sistema.
O que se tem verificado é que, em geral, as soluções
de interface com o DW são propostas de acordo com a
empresa responsável por implementar a solução DW,
ou seja, geralmente, são soluções de interface que
utilizam produtos de propriedade da empresa. Para o
usuário final que utiliza a solução, cabe apenas aceitar
e adequar-se à interface selecionada.
No entanto, os desenvolvedores poderiam optar por
diferentes soluções, mais adequadas a suprir as
necessidades do usuário. Porém, as ferramentas de
front end são escolhidas e disponibilizadas,
normalmente sem levar em consideração o perfil do
usuário final que as irá utilizar.
Para Heckel, apud Araujo [1], “Quando os
computadores pessoais foram inventados...alguns de
nós éramos programadores; nossa especialidade era a
comunicação com computadores, uma atividade
substancialmente diferente da comunicação com seres
humanos”. O profissional de TI, afirma Araújo, acaba
por não mensurar os fatores humanos quando
desenvolve uma interface, esquecendo-se de pensar
nas expectativas do usuário final e na sua interação
com o sistema. Souza et al. [13] descrevem a
interação como um processo que engloba as ações do
usuário, sobre a interface de um sistema, e suas
interpretações e reações, sobre as respostas reveladas
por essa interface.
Para caracterizar a interface de DW, é necessário
conceituar o termo interface que será utilizado neste
trabalho. A interface é a camada por meio da qual o
usuário final obtém as informações necessárias do
DW, construída por meio de uma ferramenta de front
end, que permite a análise dos dados coletados.
Ainda com base na experiência profissional da
primeira autora, observa-se que a maioria dos esforços
para resolver o problema crescente da subutilização
ou de rejeição ao sistema DW, devido a sua interface,
tem sido concentrada no desenvolvimento de novas
ferramentas de front-end, o que enfrenta apenas parte
do problema da rejeição.
Quando do desenvolvimento de solução de uma
interface, é importante que o desenvolvedor de TI
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 124](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-130-320.jpg)
![concentre-se na forma pela qual vai disponibilizar a
solução para o usuário final. Para se produzir a
informação consolidada e adequada à decisão, a partir
do DW, existem camadas de dados e diversos
programas que processam a informação antes de gerar
a visão da informação que o usuário deseja. Essas
camadas são transparentes ao usuário, não ocorrendo
a necessidade de interação, sendo que a camada mais
importante para o usuário é a interface no front end.
Assim, o sucesso de um DW pode depender da
disponibilidade da ferramenta certa de front end para
as necessidades de seus usuários.
O que se observa, também, é que o usuário, muitas
vezes, rejeita a solução de interface DW pela perda da
liberdade em função das regras que, muitas vezes, ele
mesmo definiu e acaba por descartar essa solução,
mesmo que ela esteja implementada em uma
ferramenta ideal. As informações geradas pelo usuário
dependem da realidade dele, de sua necessidade
específica, conforme a demanda exigida em seu
negócio, de seu perfil, das tarefas que realiza de posse
da informação, de conhecimentos prévios, entre
outras necessidades. Estes fatores fazem com que a
opção pelas ferramentas mais simples apresente mais
flexibilidade, ao contrário das consultas
disponibilizadas pelo DW que, usualmente, não levam
em consideração o usuário como indivíduo e com
necessidades individuais.
Assim, o foco proposto neste estudo é o de considerar
o usuário final de DW como o mais importante e
influente fator para determinar necessidades de
informação, conforme análise de Ferreira [5],
baseando-se na análise do perfil do usuário final para
a geração de consultas para DW.
Para tanto, o presente artigo está organizado da
seguinte forma: na primeira seção apresentam-se
modelos de usuários de DW englobando os papéis dos
usuários, bem como os perfis de usuários vistos pelo
Human Dynamics. Na segunda seção descreve-se a
abordagem de Sense-Making usada para a
compreensão das necessidades dos usuários. Na
terceira seção descreve-se o experimento realizado e
em seguida, os resultados obtidos com aplicação dos
métodos propostos.
2. MODELO DE USUÁRIOS DW
O objetivo da modelagem de usuários é caracterizá-
los, para que o projeto possa ser adequado a eles. O
modelo dos usuários de DW deve levar em conta os
seguintes aspectos: o papel que ele exerce no
ambiente DW e de suas tarefas neste ambiente; suas
características individuais, pessoais, de formação,
de capacidade de abstração, de concentração e sua
atitude, a que denominamos aqui aquilo que define o
o tipo de comportamento humano em relação à
informação e à busca por ela.
O conhecimento sobre o usuário precisa ser traduzido
na forma de um modelo, compreensível e usável pelos
projetistas. Conforme Filgueiras e Aquino Jr.[6],
dentro do processo de modelagem de usuários,
podem-se distinguir duas facetas:
O papel realizado pelo usuário num sistema
computacional corresponde à função específica de
cada usuário, que é definida pelas tarefas que ele
realiza. Em uma organização, os indivíduos trabalham
juntos, porém de forma estruturada. Essa estrutura
define o relacionamento entre as pessoas, sendo que
os diferentes papéis de cada usuário são as diferentes
tarefas que eles realizam. Da mesma forma, no
relacionamento com um sistema computacional,
algumas tarefas podem ser exclusivas de usuários
específicos e outras tarefas podem ser comuns a
diferentes papéis de usuários.
O perfil é a visão estatística das características
individuais do usuário, em relação a aspectos
socioeconômicos e bagagem de conhecimento. Em
especial, uma característica relevante do perfil que
merece destaque neste trabalho é o comportamento do
indivíduo na busca por informação.
Desenvolver o modelo de usuário é desenvolver
arquétipos de usuários para representação de uma
população que realiza um determinado papel. O DW é
um gerador de informações para tomada de decisão e
acompanhamento de indicadores que visam auxiliar
na administração de um negócio, sob a perspectiva do
usuário final que vai fazer uso das informações
disponibilizadas. Identifica-se, pois, a importância de
se obter o modelo de usuários que buscam as
informações dentro dessa base de dados.
2.1. Papéis no ambiente DW
Soares [12] cita que o ambiente DW envolve, desde
profissionais de processamento de dados, até analistas
de negócios que podem ser considerados como
usuários do ambiente. Existe uma comunidade de
usuários do sistema DW, com diversos papéis.
Segundo Inmon [7], a geração atual de ferramentas de
front end tem transformado, muitas vezes, os usuários
finais em administradores de dados, o que esse autor,
descreve como não sendo o desejo do usuário.
Este trabalho preocupa-se com os usuários a quem se
denominou gestores da informação que se
relacionam com a interface de um DW, quando da
busca e extração de informações de acordo com suas
necessidades gerenciais. O que diferencia os gestores
da informação em relação a sua interação com a
interface DW é a forma de acesso à informação.
Adotando-se a nomenclatura usada na comunidade de
prática, há dois principais papéis, user e power user.
Enquanto user é o usuário que apenas consulta e
navega nos relatórios, o power user é o usuário que
pode criar e desenvolver novas consultas (queries)
2.2 Perfil segundo a experiência com uso da
ferramenta de interface
Cooper e Reimann [2] destacam três tipos de usuário
a que denominam Iniciantes, Experientes e
Intermediários. Os iniciantes tornam-se intermediários
muito rapidamente. Os indivíduos que ocupam o nível
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 125](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-131-320.jpg)
![de iniciantes tendem a migrar para o nível de
intermediário e se, por acaso, não o conseguem, a
tendência é a de buscarem outro produto ou atividade
que os eleve a um nível intermediário e não mais o
deixe na posição de iniciantes.
Observa-se existir aquele sentimento de frustração
descrito por Cooper e Reimann, de usuários mais
experientes em relação ao DW, pelo motivo de os
produtos disponibilizados serem criados baseados em
perfis de usuários iniciantes. Se, por um lado, a
tecnologia evoluiu rapidamente, levando o usuário
final à mudança no seu comportamento, por outro
lado, esse fator, ainda que considerado positivo, pode
ocasionar subutilização ou rejeição da interface DW.
Tendo como base o que foi descrito por Cooper e
Reimann, o usuário passa a ser exigido muito mais em
seu nível de conhecimento e, caso ocorra alguma
barreira que ele não consegue transpor e que possa
interromper sua comunicação com o sistema de
interface DW em sua busca por informação, ele,
muito provavelmente, tende a subutilizar, rejeitar e,
até mesmo, a buscar outro produto.
Esse fato nos levou a analisar as dinâmicas envolvidas
no relacionamento com a informação.
2.3. Perfil humano segundo Human Dynamics
A experiência prática da primeira autora mostrou que,
muito freqüentemente, uma mesma interface
desenvolvida para indivíduos com o mesmo perfil e o
mesmo papel não tinha o mesmo efeito de satisfação.
Observou-se que uma característica comportamental,
a atitude perante a busca da informação, tinha um
papel relevante.
Na interação com os DW, os comportamentos
humanos que interessam são a capacidade de
abstração, a capacidade de síntese e a tomada de
decisão.
Human Dynamics (HD) é uma teoria que identifica
grupos de comportamento comuns relacionados à
aprendizagem e à resolução de problemas e, dessa
forma, espera-se que essa técnica possa contribuir
para a identificação dos perfis de usuários. A teoria
nasceu na Suécia com Sandra Seagal e David Horne e
foi usada para tratar as crianças e suas características
individuais de aprendizagem, bem como em diversas
empresas para analisar as relações corporativas e
desenvolver as equipes. HD evidencia e documenta
diferenças inerentes no funcionamento de pessoas,
vendo-as como sistemas inteiros, com diferentes
“dinâmicas de personalidade”. Essas diferenças são,
segundo seus autores, mais fundamentais do que
idade, raça, cultura ou sexo; podem ser identificadas
desde a infância [11].
Nove sistemas humanos distintos foram identificados;
cinco deles, altamente predominantes. Cada sistema é
composto de três princípios organizadores básicos: o
mental, o emocional e o físico.
Estes princípios possuem uma dimensão quantitativa
(pessoal) e outra qualitativa (transpessoal), o que
forma nove sistemas possíveis. De acordo com Seagal
e Horne [10], verificou-se que cinco desses são mais
numerosos distanciando-se dos demais:
Mental-físico;
Emocional-mental ou emocional-objetivo);
Emocional-físico ou emocional-subjetivo);
Físico-mental e
Físico-emocional.
Em virtude de HD oferecer um novo paradigma de
compreensão do comportamento humano, tanto
coletivo quanto individual, acredita-se ser ela uma
forma adequada para segmentar em grupos os
indivíduos estudados. Diante da proposta deste
trabalho que é a de caracterizar os perfis de usuários
existentes, quando de sua interação com um DW,
verifica-se a necessidade de segmentar os usuários
identificados em grupos para facilitar o processo de
análise. Assim, neste estudo, os perfis de usuário
foram determinados com o uso de HD.
3. SENSE-MAKING NA COMPREENSÃO DAS
NECESSIDADES DOS USUÁRIOS
Esta seção é dedicada ao estudo de necessidades do
usuário gestor da informação de DW. O objetivo é
mostrar um método sistemático para realizar um
diagnóstico preciso das causas dos problemas
manifestados por tais usuários. Este método é usado
na pesquisa de campo com os usuários, visando
verificar as necessidades reais deles e a distância entre
essas necessidades e as ferramentas disponibilizadas
para acesso à informação.
O método escolhido para esta investigação é o Sense-
Making, de Dervin [4]. O conceito básico do Sense-
Making é que, durante a trajetória de um indivíduo,
barreiras podem surgir em seu caminho e as reações
de cada indivíduo a essas situações são de acordo com
as suas características individuais. Para a análise
dessa relação, no Sense-Making, desenvolveu-se o
trinômio situação-lacuna-uso, tradução para o original
situations-gaps-uses::
Situação: o evento e o tempo no contexto do
evento;
Lacuna: vazios que necessitam de pontes, cuja
transposição permite obter as informações
necessárias ou as respostas às questões que
indivíduos se propõem na situação estudada; as
lacunas se movimentam no tempo e no espaço;
Uso: é aquilo para o qual o indivíduo busca sentido,
criando novo senso.
No Sense-Making, o foco é dado no movimento
cognitivo do indivíduo através do tempo e do espaço,
na busca por vencer as descontinuidades (as lacunas)
usando qualquer sentido que tenha ele tenha
construído. A metodologia de Sense-Making
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 126](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-132-320.jpg)
![reconhece esses movimentos por informação de forma
holística, preocupando-se não apenas com os
conceitos, mas também com as atitudes, emoções,
visões. Um aspecto essencial do Sense-Making são os
movimentos, portanto. Percebemos que ao entender
os movimentos, e ao equacionar as forças que os
promovem ou impedem, somos capazes de entender a
forma como os indivíduos operam seus trinômios
situação-lacuna-uso.
Algumas situações e respectivos movimentos,
identificados por Dervin são:
Indeciso: estar em um ponto em que você precisa
escolher entre dois ou mais caminhos à frente.
Arrastado: ser arrastado por um caminho que não
foi da sua escolha.
Andando em círculos: não ter caminhos a seguir.
Perdendo o rumo: estar em um caminho e, de
repente, ele desaparecer.
Barreira: saber onde você quer ir, mas algo ou
alguém está bloqueando o seu caminho.
Sendo levado: seguir algo ou alguém porque ele/ela
sabe mais que você e pode mostrar-lhe o caminho.
Esperando algo: gastar tempo esperando alguma
coisa em particular.
Matando o tempo: gastar tempo sem esperar nada
em particular.
Desligando: perder a sintonia.
Observando: assistir ao que acontece sem se
preocupar com o movimento.
Em movimento: Ver-se progredindo sem bloqueio e
sem necessidade de observação.
Para obter dos usuários a sua visão do problema, a
metodologia de Sense-Making descreve diferentes
formas de entrevistas, que procuram capturar a
dinâmica dos trinômios situação-lacuna-uso, entre as
quais destacam-se as seguintes.
A Micro-Moment Time-Line Interview baseia-se em
uma linha do tempo que vai sendo construída na
entrevista, pedindo-se que o entrevistado explore o
que aconteceu em uma determinada situação
relevante, passo a passo, especificando o que
aconteceu primeiramente e assim por diante. Para
cada trinômio detectado, a entrevista procura
compreender as informações necessárias para criar o
entendimento e o movimento no tempo. A Micro-
Element Interview é baseada na identificação de fatos
relevantes e da exploração dos trinômios associados a
estes fatos. Na Life-Line Interview solicita-se ao
entrevistado que recorde uma série de situações que
ocorreram em sua vida, ou em uma extensão
significativa do tempo.
O procedimento para se iniciar uma entrevista,
segundo Márdero [8], tanto individual como em
grupo, é o de solicitar a narração da última vez que o
vivenciou determinada situação. O entrevistador deve,
naquele momento, tentar identificar três partes do
triângulo: a situação, a lacuna e o uso, ou ajuda.
4. METODOLOGIA PROPOSTA
Definiu-se o Sense-Making como linha mestra para
este trabalho, com vistas a aplicação de questionários
e entrevistas, por apresentar uma abordagem centrada
no usuário, o que permite reconhecer aspectos
individuais de cada usuário em seu processo de
extração de informações de um DW. Deseja-se
estudar como pessoas com diferentes dinâmicas de
personalidade exploram interfaces DW, evidenciando
as diferenças em seus movimentos de Sense-Making.
4.1. Atribuição do perfil HD
A atribuição dos perfis de usuário foi feita por meio
de auto-avaliação de cada sujeito envolvido na
pesquisa. Como HD não tem um questionário para a
atribuição dos perfis, mas depende do auto-
conhecimento, fornecemos aos participantes uma
descrição de cada perfil, bem como uma lista de
atributos que descrevem a dinâmica de personalidade.
Cada participante identificou-se com uma das
descrições, sendo este o perfil atribuído à pessoa.
Os sujeitos foram caracterizados pelos atributos:
Nome do indivíduo. Para garantia de privacidade,
eles são denominados por letras: A, B, C e D.
HD: informa o perfil Human Dynamics;
Papelque o indivíduo realiza, no uso de DW.
Perfil de conhecimento da tarefa: por meio de um
questionário, avaliou-se o grau de conhecimento do
indivíduo sobre a ferramenta de front end em uso.
No experimento, foi solicitado aos participantes que
realizassem três diferentes conjuntos de tarefas:
navegar por um relatório existente, modificar um
relatório existente, criar um novo relatório. A
interface apresentada aos usuários foi desenvolvida
sobre a ferramenta SAP BW– Business Warehouse.
A ferramenta de front end usada foi o BEx Analyzer.
Aplicou-se um protocolo de observação do
comportamento do usuário diante de situações
relativas à interação com o DW, após o que se passou
para uma entrevista micro-moment [3].
No instrumento de pesquisa desenvolvido, as
seguintes informações foram preenchidas.
Tarefa: Identifica o momento e descreve a tarefa
que estava fazendo.
Movimento: estado, segundo a relação apresentada.
5. RESULTADOS
O experimento envolveu quatro usuários. Como o
número é muito pequeno, os resultados são de
natureza qualitativa. Os resultados aqui apresentados
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 127](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-133-320.jpg)
![são os de dois dos indivíduos estudados, pertencentes
às dinâmicas de personalidade do HD emocional-
subjetivo e mental-físico. Dentre os papéis de usuário,
um é power user e o outro é classificado como user.
Para facilidade na demonstração dos resultados do
experimento, desenvolveu-se uma adaptação do
gráfico descrito por Sanchez et al. [9] para mostrar os
movimentos do indivíduo ao executar as tarefas
determinadas. Os eixos escolhidos por Sanchez foram
Arousal-Sleepiness e Pleasure/Displeasure. A
adaptação, mostrada na Figura 1, buscou mapear o
comportamento do indivíduo durante o experimento.
O eixo de iniciativa representa comportamentos em
que o usuário está no controle (pró-ativo) e
comportamentos em que o sistema está no controle. O
eixo de apreciação representa comportamento de
aceitação e de rejeição da situação. Sobre este gráfico,
representam-se os estados de movimento do indivíduo
na medida em que ele evolui nas tarefas.
Figura 1- Representação gráfica da observação de
situação de uso
A seguir, selecionaram-se alguns caminhos
percorridos pelo usuário para a representação gráfica
da observação da situação de uso. Nestes gráficos, a
usuária A (em vermelho) tem 32 anos, perfil HD
emocional-subjetivo e papel de power user; ela
trabalha como analista de DW. O usuário B (em azul)
tem 45 anos, perfil HD mental-físico e papel de user,
sendo um executivo usuário da informação gerencial.
Ambos usaram todas as três interfaces, porém aqui
apresentamos o resultado para a ferramenta Analyser.
A análise mostrada na Figura 2 é a dos participantes
realizando a tarefa 1, de navegar em um relatório já
existente. O usuário A, quando se depara com a
situação-gap-uso demonstra facilidade e age com
entusiasmo, o que é característica de seu perfil HD.
Contudo, ao se deparar com um ambiente impessoal,
com falta de oportunidade para se expressar
individualmente, ou seja, buscar a informação da
forma que imagina, gera o sentimento de ser arrastado
por caminhos que não foram de sua escolha.
Ao contrário do emocional-subjetivo, ao analisarmos
o comportamento do mental-físico, verificamos que o
usuário B demonstra ser “arrastado”, pois como tem
facilidade na visão do todo em um processo e não
consegue buscar a informação da forma que imagina,
a sensação de estar em caminhos que não foram sua
escolha o faz se sentir aborrecido. Em conseqüência
disso, ele se desliga, desconecta-se da atividade, sem
dar muita importância, por achá-la fácil em demasia.
Figura 2 - Observação de situação de uso para tarefa 1
(emocional- subjetivo X mental-fisico)
A figura 3 mostra o gráfico para a segunda tarefa, na
qual se solicita que os participantes modifiquem um
relatório existente. Note-se que o usuário A, indivíduo
emocional-subjetivo, continua se sentindo arrastado
pela especificação das tarefas, que não dá espaço ao
sua vontade de criar novas formas. A segunda tarefa é
dada ao indivíduo mental-físico que, ao se deparar
com barreiras durante a execução da tarefa, sofre
stress pela falta de tempo para completar a tarefa, e
busca comunicação objetiva com outra pessoa.
Figura 3- Observação de situação de uso para tarefa 2
(emocional-subjetivo X mental-físico)
A figura 4 mostra a terceira tarefa, de criar um novo
relatório. O indivíduo A tem facilidade e sente-se
confortável em criar soluções próprias, portanto,
mantendo-se em movimento e observando seus
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 128](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-134-320.jpg)

![Tecnologias para Assistir Pessoas com Deficiência
Auditiva: Levantamento e Discussão sobre seu Uso
Soraia Silva Prietch
UFMT/ Rondonópolis
Rodovia Rondonópolis-Guiratinga KM 06 (MT
270) Bairro Sagrada Família – CEP 78.735-901
soraia@ufmt.br
Lucia Vilela Leite Filgueiras
Escola Politécnica da Universidade de São Paulo
Av. Prof. Luciano Gualberto, nº 158, São Paulo –
SP – CEP 05508-900
lfilguei@usp.br
ABSTRACT
This work takes as a basis the definition of Assistive
Technology by performing a survey on this topic,
particularly on the implementation of the technologies
currently available to assist the deaf community, followed
by results and discussions formulated from reflection of the
materials found in the literature.
Keywords
Assistive Technology, Acessibility, Deaf Person.
1 INTRODUÇÃO
A maior barreira enfrentada por pessoas com deficiência
auditiva (seja esta parcial ou total) é a comunicação com
outras pessoas de seu convívio. Essa barreira, muitas
vezes, reprime uma grande quantia de pessoas, que
possuem déficit auditivo, sendo que uma parcela dessa
quantia não tem conhecimento de que, atualmente, existem
diversos recursos acessíveis para auxiliar a compreensão
do que está sendo realizado ou o atendimento de suas
necessidades. Neste contexto, as tecnologias assistivas
podem trazer grande auxílio para minimizar as
dificuldades que a barreira de comunicação proporciona,
pois tais tecnologias, geralmente, agregam conhecimentos
de diversos campos dos saberes, podendo ser representadas
em formatos de recursos variados com a finalidade de
promover a acessibilidade às pessoas com algum tipo de
deficiência em qualquer ambiente social, seja de educação,
de saúde, de moradia, de lazer, dentre outros.
Levando em conta o exposto, tem-se como objetivo, com
esta pesquisa, realizar um estudo bibliográfico, em
profundidade, sobre as tecnologias assistivas disponíveis
para apoio às pessoas com deficiência auditiva.
Além de levantar quais tecnologias assistivas estão
disponíveis, faz-se necessário identificar quais se
encontram em desenvolvimento, quais são os próximos
desafios, bem como discutir os pontos positivos e negativos
das pesquisas já realizadas e das perspectivas do que ainda
está por vir. Este é um trabalho em andamento, cujo
objetivo final é o de projetar recursos digitais com
propósito de auxílio ao processo de ensino-aprendizagem
de pessoas surdas. Desta forma, este levantamento
proporcionará subsídio para as decisões de projeto
necessárias, posteriormente.
As seções deste artigo se encontram organizadas da
seguinte maneira: a Seção 2 enfoca o levantamento
bibliográfico a respeito das tecnologias assistivas, sejam
propostas, pesquisas já concluídas, e desafios apontados; a
Seção 3 aborda os resultados e discussões referentes ao
conteúdo levantado na seção anterior; e, na Seção 4
constam as considerações finais deste trabalho.
2 TECNOLOGIAS PARA ASSISTIR PESSOAS SURDAS
Nesta seção é apresentado o resultado de um levantamento
bibliográfico e comercial, das tecnologias, atualmente
disponíveis, para assistir pessoas surdas no uso do
computador, desenvolvidas por grupos de pesquisadores
provenientes de diversos países.
2.1 Acesso remoto
A seguir, alguns trabalhos constam dispostos na Tabela 1,
os quais agrupam aplicações de tecnologias assistivas para
acesso remoto que possibilitam a ampliação da
comunicação de pessoas com necessidades auditivas
especiais, principalmente, via telefonia celular.
Tabela 1. Relação de trabalhos que tratam das tecnologias
assistivas, de acesso remoto, para pessoas surdas.
Tecnologias Artigos
Telefone de surdos [21]
Luva conversora para celular [46]
MobileASL [14], [15]
SignWriting em telefonia móvel [2]
Alertas visuais e táteis para telefones celulares [28]
O trabalho de Hersh et al [21] tem como objetivo discutir a
relação entre a legislação e o uso de espaços públicos por
pessoas com deficiência, evidenciando as adaptações feitas
a dispositivos projetados para o uso diário. Em especial, os
autores mencionam o design de telefones e alarmes,
processadores de fala portáveis, além de informar diversas
categorias de dispositivos eletrônicos.
Já no artigo de Sarji [46] é descrito um protótipo de luva
portável que traduz gestos (American Sign Language,
ASL) em fala (língua inglesa), de baixo custo, que utiliza
sistema embarcado, transferindo as informações de sinais
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 130](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-136-320.jpg)
![comunicadas através da luva com sensores, por meio de
Bluetooth, para telefone celular ou PDA, além disso,
utiliza aplicações COTS. Assim é enfatizado o uso de
interface natural e de mobilidade, cujas características são
exploradas para possibilitar o aumento da comunicação
entre pessoas surdas e ouvintes.
Em 2006, Cavender, Ladner e Roth [14] publicaram um
trabalho a respeito do MobileASL, que na época
mencionaram que o acesso a celulares nos Estados Unidos,
por pessoas surdas, era limitado a mensagens de texto, o
que ocasionava em uma pressão pela comunicação em
língua inglesa ao invés da Língua Americana de Sinais
(ASL), sua língua materna. Neste sentido, os autores
realizaram sua pesquisa, com o auxílio de pessoas surdas,
a fim de determinar as técnicas de compressão de vídeo
mais viáveis para explorar a natureza visual da língua de
sinais, já vislumbrando a possibilidade futura de acesso em
tempo real através do telefone celular. Com o passar de
alguns anos, no artigo de Cherniavsky et al [15], em
continuidade ao trabalho anterior, é descrito o sistema
MobileASL para comunicação de vídeo em tempo real
através da rede atual de telefonia celular dos EUA.
Segundo os autores, o objetivo do MobileASL é possibilitar
que as pessoas surdas se comuniquem em língua de sinais,
via celular, através de compressão e transmissão de vídeos,
em tempo real, da língua de sinais. O sistema foi avaliado
em um estudo de usuário com participantes fluentes em
ASL, os quais foram envolvidos em conversas irrestritas de
telefones celulares em um laboratório, tendo como
resultado que o dispositivo pode possibilitar o aumento da
comunicação visual entre pessoas surdas e ouvintes.
Contudo, de todos os artigos mencionados na Tabela 1 o
trabalho de Ketabdar e Polzehl [28], apesar de relatar uma
versão demo, se destaca por sua utilidade no dia-a-dia, pois
através do microfone do celular é captado o áudio do
ambiente, sobre o qual é realizada análise de contexto para
emissão de avisos de mudanças que ocorreram naquele
local.
2.2 Acesso direto/ local
Nesta subseção são abordados trabalhos que relatam o
projeto, o desenvolvimento e/ou a avaliação de tecnologias
assistivas de acesso direto ou local, as quais podem
proporcionar maior interação entre ouvintes e pessoas com
deficiência auditiva. Tais trabalhos podem ser
visualizados, de forma resumida, na Tabela 2.
Tabela 2. Relação de trabalhos que tratam das tecnologias
assistivas, de acesso direto/ local, para pessoas surdas.
Tecnologias Artigos
Processadores de fala portáteis [21]
Luva tradutora [7]
BSL para correios [16], [27]
Semi-transparência de vídeo em reuniões [35]
O trabalho de Bedregal, Dimuro e Costa [7] introduz o
reconhecimento de gestos de mão, durante a comunicação
na Língua Brasileira de Sinais, adquiridos por uma luva de
dados. O método usa um conjunto de ângulos das juntas
dos dedos e da separação entre os dedos para a
classificação das configurações de mão, e classificações de
segmentos de gestos de mão para a realização do
reconhecimento. Assim, considera-se que esta seja uma
aplicação interessante para locais onde ouvintes não
compreendem a língua de sinais, e a luva serviria como
um sistema tradutor. Contudo, algumas questões ainda
devem ser consideradas como, por exemplo, as expressões
faciais, o movimento do corpo e do braço, dentre outros
pontos de extrema importância para efetuar o
reconhecimento de uma comunicação em língua de sinais.
No artigo de Cox et al [16] é apresentado o TESSA, um
sistema experimental que objetiva auxiliar transações entre
uma pessoa surda e um funcionário dos Correios através da
tradução da fala do funcionário para a língua de sinais.
Um sistema reconhecedor de fala reconhece a fala do
funcionário e, então, o sistema sintetiza a sequência
apropriada de sinais na Língua Britânica de Sinais (BSL)
usando um avatar desenvolvido especialmente para esta
finalidade. Os resultados desta avaliação foram positivos,
apesar de alguns pontos que foram apontados, não haviam
sido ainda melhorados no sistema. Contudo, os autores
colocam, ainda, que a maioria dos aspectos identificados
para melhorias estava sendo planejada para serem
desenvolvidas mais adiante no projeto ViSiCAST.
Neste contexto, no artigo de Kennaway [27] é discutida a
experiência que os autores tiveram com o projeto
ViSiCAST, no qual foi utilizada uma descrição de gestos
de linguagem independente de avatar. Assim, foi
desenvolvido um software chamado Animgen, para
sintetizar animação de dados a partir de tais descrições,
juntamente com uma descrição de geometria do avatar
particular, primariamente se preocupado com o aspecto
não-linguístico. Nota-se que na ausência de um dos
sentidos do corpo humano, no caso a audição, outros
sentidos devem ser estimulados, neste caso, o visual por
meio de animação.
Para Miller et al [35], realizar reuniões é parte vital da
participação em atividades sociais, sendo que para uma
pessoa surda, que não entende a língua falada,
acompanhar um discurso em reuniões pode se tornar
confuso se existirem muitas fontes de informações
simultaneamente. Quando a pessoa se concentra em uma
das fontes de informação, esta perde as informações
provenientes de outras fontes; por exemplo, enquanto a
pessoa olha os slides de um apresentador, esta perde
informações advindas do intérprete de sinais. Assim, o
trabalho dos referidos autores relata o uso da tecnologia de
semi-transparência de vídeo, a partir da qual foram
desenvolvidas duas aplicações para assistir o surdo em
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 131](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-137-320.jpg)
![reuniões de grupos locais e reuniões de pessoas com acesso
remoto. Durante a realização desta pesquisa, as
características das aplicações foram projetadas
iterativamente, à medida que os feedbacks eram
incorporados a partir de indicações de pessoas surdas. Esta
pesquisa é uma extensão do projeto Facetop, descrito no
artigo de Miller, Culp e Stotts [34].
Percebe-se, com os trabalhos apresentados aqui, que a
questão da exploração visual se faz bastante presente.
Tanto no caso da luva [7], quanto no uso de avatar [27] e
da semi-transparência de vídeo [35] este sentido é
privilegiado, visto que é uma das formas de comunicação
mais eficientes para interagir com pessoas surdas.
2.3 Tradutores
Esta sub-seção aborda pesquisas sobre a conversão de uma
língua de sinais para uma língua oral-auditiva. Na Tabela
3, apresentam-se os trabalhos que tratam de tradutores.
Foram encontrados tradutores referentes às línguas dos
seguintes países: Espanha, Estados Unidos da América,
Brasil, África do Sul e Itália.
Tabela 3. Relação de trabalhos que tratam sobre tradutores, de
línguas, para pessoas surdas.
Tecnologias Autores
Língua Espanhola de Sinais (SSL) [45]
Reconhecedores automáticos de ASL [31]
Português para LIBRAS (Falibras-MT) [50]
SOTAC [9]
SWService [48]
BuscaSigno [19]
Língua Sul Africana de Sinais [52]
3DictSL: dicionário online de língua de sinais
internacional
[10]
No trabalho de San-Segundo et al [45] foi desenvolvida
uma proposta de arquitetura para tradução do espanhol
falado para a comunicação na Língua Espanhola de Sinais
(Spanish Sign Language, SSL) para pessoas surdas, a qual
compreende em quatro módulos: reconhecimento de fala,
análise semântica, geração de sequência de gestos e
animação dos gestos.
De acordo com Lu e Huenerfauth [31], gravações de
captura de movimentos de língua de sinais são usadas em
pesquisas de reconhecimento automático dessas línguas ou
animações de línguas de sinais genéricas, as quais
possuem aplicativos de acessibilidade para usuários surdos
com baixos níveis de alfabetização em linguagem escrita.
Luvas de captura de movimento são usadas para registrar a
configuração de mão do usuário. Infelizmente, estas luvas
requerem um consumo de tempo e um processo de
calibração manual inexato cada vez que o usuário a utiliza.
Este artigo descreve o projeto e a avaliação de um novo
protocolo de calibração para luvas de captura de
movimento, o qual é projetado para tornar o processo mais
eficiente e ser acessível para participantes que são surdos e
utilizam a Língua Americana de Sinais (ASL). O
protocolo foi avaliado experimentalmente; pessoas surdas
que se comunicam em ASL usaram as luvas, foram
calibradas (usando o novo protocolo e usando uma rotina
de calibração fornecida pelo fabricante da luva), e foram
questionados a respeito do desempenho da sequência de
configuração de mão. O novo protocolo recebeu pontuação
significativamente mais alta do que a calibração padrão. O
protocolo tem sido disponibilizado livremente online, e
inclui direcionamentos para pesquisadores, imagens e
vídeos de como participantes movimentam suas mãos
durante o processo e direcionamentos para participantes
(como vídeos de ASL e textos em inglês).
O artigo de Tavares, Coradine e Breda [50] apresenta um
ambiente, chamado Falibras-MT, para a autoria de
tradutores automáticos de textos do Português para
LIBRAS, na forma gestual animada. Esse ambiente usa
memória de tradução para permitir que o tradutor a ser
especificado possa considerar o domínio de conhecimento
do texto inicial, além de outras características importantes,
tais como discurso e pragmática das línguas envolvidas. É
apresentada uma visão geral sobre o projeto do ambiente,
com suas principais funções e a arquitetura.
Em Breda et al [9] é apresentada uma análise do SOTAC
(Software of Automatized Translation based on
Knowledge), o qual tem como objetivo traduzir textos, de
forma automática, de português para LIBRAS e de
LIBRAS para português, baseado em conhecimento. É
apresentado o projeto e um protótipo de um sistema para
autoria e uso de tradução automática para suporte à
tradução. A saída traduzida é fornecida em uma linguagem
alvo e pode ser apresentada nas formas de texto, de vídeo,
ou de áudio. O artigo também apresenta uma análise de
usabilidade, navegabilidade, funcionalidade e
complexidade do sistema, assim como sua capacidade de
integração com outras tecnologias existentes.
O trabalho de Souza e Pinto [48] tem como objetivo
apresentar a SWService (SignWritting Service), uma
biblioteca que fornece os recursos necessários para que
softwares baseados na web possam utilizar a Língua
Brasileira de Sinais na forma escrita. A solução apresenta
como principal vantagem a utilização da tecnologia Web-
Services, o que permite seu uso sem necessidade de
desenvolvimento ou instalação local. Além disso, são
apresentados estudo de caso e pesquisa de opinião sobre o
Sign WebForum, um fórum de discussão que utiliza a
SWService para efetuar a escrita e a leitura de mensagens
em Português e LIBRAS. Já no artigo de Duduchi e
Capovilla [19] é descrita a construção de uma interface
computacional, denominada BuscaSigno, para o acesso ao
léxico da língua brasileira de sinais sem depender de
conhecimento da língua portuguesa. E neste mesmo ano,
van Zijl [52] relatou sua pesquisa sobre o projeto da
máquina de tradução da língua sul africana de sinais.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 132](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-138-320.jpg)
![Conforme Buttussi, Chittaro e Coppo [10], descrevem que
vários pesquisadores propuseram dicionários multimídia
para línguas de sinais de países específicos, mas existem
poucas propostas de dicionários multi-linguagem. Além
disso, os dicionários multimídias existentes sofrem várias
limitações, onde a maioria deles permite somente a
pesquisa de palavra para sinal, enquanto somente algumas
delas exploram parâmetros de sinais (isto é, configuração
de mão, orientação, localização e movimento) para
permitir uma busca de sinal para palavra. As soluções
atuais também usam imagens ou vídeos para representar
sinais e seus parâmetros, mas imagens 2D são
freqüentemente enganosas para uma identificação correta.
Desta forma, o trabalho de Buttussi, Chittaro e Coppo [10]
teve como objetivo enfrentar os problemas acima descritos,
explorando tecnologias Web3D, tais como X3D e H-Anim
humanoids, para melhor entender os sinais e simplificar a
busca de sinais para palavra, e de sinais para sinais,
propondo um dicionário online de língua de sinais
internacional, chamado 3DictSL. Assim, os autores
apresentam uma proposta de arquitetura cliente/servidor
do 3DictSL e ferramenta de autoria, a qual permite que
pessoas surdas ampliem o dicionário com sua própria
linguagem, além disso, a pesquisa também apresenta
detalhes da interface com o usuário do site e como as
tecnologias AJAX, ASP.NET, Javascript e X3D são
combinadas para desenvolver a proposta. Como o trabalho
se configura em um estudo de caso prático, o artigo
mencionado discute somente a implementação da Língua
Italiana de Sinais (LIS).
Destaca-se, dentre estes trabalhos, o artigo de Buttussi,
Chittaro e Coppo [10], pois apresenta vários aspectos
relevantes, a saber: a disponibilização de conteúdo online,
a proposição de um dicionário multi-linguagem
envolvendo diversas línguas de sinais e orais-auditivas de
uma gama de países, e a possibilidade de contar com
tecnologia de representação 3D para facilitar a animação
de gestos.
Nesta linha, existem vários desafios, a citar: questões
relacionadas aos regionalismos da língua de sinais dentro
de um próprio país; considerações de que uma língua de
sinais de um país possui estrutura gramatical diferente da
língua materna aos ouvintes, dentre outros.
2.4 Recursos de ensino-aprendizagem
Existem, hoje em dia, diversas iniciativas que incentivam a
presença de aprendizes surdos em ambientes educacionais,
e fornecem recursos facilitadores para o acesso e a
permanência destes estudantes nas diferentes etapas e
modalidades de cursos. Alguns destes exemplos são
mencionados na Tabela 4 e descritos na sequência.
Tabela 4. Relação de trabalhos que tratam das tecnologias
assistivas, como recursos de ensino-apredizagem, para pessoas
surdas.
Tecnologias Autores
Jogos educativos [1], [8], [20], [44]
Ambientes de aprendizagem [11], [18], [36],
[40], [49]
Apoio para a pessoa surda no ensino
superior
[13], [14], [29],
[43]
No artigo de Brashear [8], a autora descreve sobre o
CopyCat, um jogo sobre a Língua Americana de Sinais
(ASL) que a tecnologia de reconhecimento de gestos para
auxiliar crianças surdas a praticar suas habilidades na
ASL. A base de dados das amostras de sinais, utilizada no
jogo, foi coletada a partir de estudos com usuários
(crianças surdas), jogando uma versão do jogo Mágico de
Oz da Escola da Área de Atlanta para Surdos (EUA). No
artigo de Adamo-Villani e Wright [1] são descritas a
implementação e a avaliação da segunda versão do SMILE
(Science and Math in an Immersive Learning
Environment), um jogo de aprendizagem imersivo que
emprega um ambiente virtual de fantasia 3D para engajar
crianças surdas e com deficiência auditiva em tarefas
educacionais baseadas em matemática em ciências. Nesta
versão, (a) foram combinadas estratégias usadas em jogos
de computador comerciais com lições de pesquisas
educacionais em aprendizagem e motivação, bem como (b)
foram avaliados a usabilidade e o recurso através de um
estudo de usuário. Já em Saliés e Starosky [44], discute a
questão do uso de jogos, por uma criança surda durante
terapia de fala, no processo de aquisição da língua
portuguesa como sua segunda língua, e o artigo de
Henderson et al [20] enfoca o desenvolvimento de um jogo
que utiliza a ASL para crianças surdas.
No artigo de Drigas e Kouremenos [18] é apresentado um
Sistema de Gerenciamento de Aprendizagem (LMS), o
qual oferece vídeos na Língua Grega de Sinais (GSL,
Greek Sign Language) em correspondência a cada texto
contido no ambiente de aprendizagem. O sistema foi
projetado para adultos surdos com o propósito de formação
ao longo da vida profissional e educacional. No sistema, as
necessidades especiais dos aprendizes surdos são atendidas
da seguinte forma: informação bilingue (texto e linguagem
de sinais), alto nível de visualização, aprendizagem
interativa e exploratória, e aprendizagem com seus pares
através de vídeo conferência. O trabalho de Panselina,
Sigalas e Tzougraki [40] também trata do enfoque
educacional a estudantes surdos, contudo o mesmo aborda
o design e o desenvolvimento de uma ferramenta
multimídia bilingue (usando a GSL) para o ensino de
conceito de química.
Ainda no contexto de ambientes de aprendizagem, os
trabalhos brasileiros [11], [36] e [49] merecem destaque,
pois são três abordagens diferentes umas das outras, mas
que trazem contribuições bastante interessantes para o foco
de interesse da presente pesquisa. O primeiro apresenta um
sistema de autoria online para simplificação de textos, e
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 133](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-139-320.jpg)
![também discute as potencialidades do uso de tal
ferramenta no contexto educacional. O segundo trabalho
dispõe “um modelo de uma plataforma, de educação
baseado nos critérios de acessibilidade digital
considerando, a prióri, as características dos surdos”. E, no
terceiro artigo, os autores promovem a comparação entre a
avaliação de usabilidade e a avaliação de acessibilidade da
ferramenta HagáQuê, cujo recurso refere-se a um software
de autoria, com finalidade pedagógica, para a produção de
histórias em quadrinho.
Segundo Saksiri, Ferrell e Ruenwongsa [43], na Tailândia
existe uma grande necessidade de melhorar as
oportunidades educacionais para estudantes com
deficiência auditiva em idade de ingressar em cursos
universitários. Assim, esta pesquisa descreve dois aspectos
desta questão: (a) projeto e teste de uma ferramenta
instrucional com animações de sinais virtual para a Língua
Tailandesa de Sinais, e (b) investigação de como
instrutores que ministram aulas em universidades podem,
de maneira eficaz, ensinar estudantes surdos e avaliar seu
desempenho, particularmente utilizando esta ferramenta.
Para isso, foi realizada revisão de literatura, construído um
modelo 3D que inclui expressões faciais rudimentares, e
foi concebida uma estrutura para investigar o processo
instrucional.
Em sua pesquisa, Cavender [13] expõe que estudantes com
deficiência auditiva enfrentam barreiras com relação ao
acesso a universidades, tornando isso um desafio, e
considera que as tecnologias educacionais têm o potencial
para melhor incluir esses estudantes no meio acadêmico.
Neste contexto, a autora descreve sua proposta de trabalho,
a qual trata do desenvolvimento e da avaliação de uma
plataforma, utilizando conceitos de computação ubíqua,
para sala de aula para que estudantes com deficiência
auditiva possam acessar intérpretes e captionists
remotamente, evitando dispersão visual, e facilitando o
acesso, a interação e a permanência de pessoas surdas no
ensino superior. Discutindo ainda o ensino superior,
Cavender, Ladner e Roth [14] relatam sobre um curso
acadêmico de verão em computação, com nove semanas de
duração, para pessoas surdas, apresentando os problemas
que esses estudantes passam, bem como as lições
aprendidas pelos professores ao tentar contornar esses
problemas.
No artigo de Kheir e Way [29], os autores informam que
computadores, cada vez mais, estão se tornando presentes
em sala de aula, com os laptops dos estudantes se tornando
norma, ainda assim, alguns usos benéficos desta tecnologia
tão difundida estão sendo ignorados. Softwares de
reconhecimento de fala estão amadurecendo, e possuem o
potencial de fornecer notas em tempo real tendo
assistência em sala de aula, particularmente para
estudantes surdos. Assim, o artigo mencionado relata o
design e a avaliação do sistema Villanova University
Speech Transcriber (VUST) que, segundo os autores,
diminui custos comparando-se ao método tradicional e
aumenta a acessibilidade durante palestras de ciência da
computação para estudantes surdos usando um software de
reconhecimento de fala em tempo real.
Faz-se necessário destacar que o acesso à educação é um
dos direitos que todas as pessoas, com algum tipo de
deficiência ou não, possui, devendo ser respeitado e
priorizado. Os trabalhos mencionados aqui contribuem de
forma abrangente, no sentido de existir diversificadas
iniciativas de pesquisas (jogos, EAD, computação ubíqua,
dentre outras), sendo estas profundamente fundamentadas
nas necessidades educacionais especiais das pessoas
surdas, visto que estas contam com desejos, anseios e
aspectos de aprendizagem diferenciados.
2.5 Outros dispositivos de uso na vida diária
Além dos recursos já apresentados anteriormente nesta
seção, ainda podem ser citadas outras soluções que além de
bastante interessantes, ainda promovem a articulação entre
pessoas surdas e equipamentos/ dispositivos, que antes
eram restritos a pessoas ouvintes, em um formato criativo e
interativo. Alguns exemplos seguem relacionados na
Tabela 5.
Tabela 5. Relação de trabalhos que tratam das tecnologias
assistivas, para uso no dia-a-dia, para pessoas surdas.
Tecnologias Autores
Alarmes [21]
Percepção da música [26], [37]
Percepção de sons no ambiente de trabalho [22], [33], [51]
Legendas emotivas para TV [39]
Assistência à saúde [42]
A pesquisa de Nanayakkara et al [37] relata sobre um
protótipo de sistema projetado para tentar enriquecer a
experiência de música para as pessoas surdas. Este sistema
foi desenvolvido com base em um conceito inicial guiado
por informações obtidas a partir de um levantamento
aprofundado conduzido com 43 participantes surdos, cujo
resultado sugeriu que o protótipo melhora a experiência
musical de uma pessoa surda, sendo que os usuários
preferiram ou a cadeira háptica sozinha (54%) ou a cadeira
háptica com o display visual (46%). É interessante
mencionar que o trabalho descreve o uso de interface
multimodal (tátil e visual), buscando maior inclusão dos
surdos em ambientes que envolvem música.
Em linha de pesquisa semelhante à descrita no parágrafo
anterior, Karam et al [26] desenvolveram o Modelo
Humano de Cóclea (Model Human Cochlea, MHC) é uma
técnica de substituição sensorial para apresentação de
música como múltiplos canais de estímulos vibro-táteis. O
protótipo MHC foi introduzido para um grupo de cidadãos
idosos surdos em um centro comunitário, onde eles
poderiam testar a cadeira, e fornecer um feedback sobre
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 134](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-140-320.jpg)
![sua experiência. Os resultados deste trabalho sugerem que
o MHC pode, potencialmente, oferecer maior significado
para expressar a informação emocional básica a partir de
música em um display vibro-tátil quando os sinais se
aproximam mais aos elementos de percepção da música
tais como melodia e peças instrumentais.
Na pesquisa de Ho-Ching, Mankoff e Landay [22], os
autores desenvolveram dois protótipos, os quais consistem
em displays visuais para fornecer sensibilização do áudio
do ambiente para indivíduos surdos. A pesquisa foi
realizada no campo de trabalho, com participantes surdos e
ouvintes, a atenção foi concentrada no suporte à
sensibilidade de sons não ligados à fala, tais como
telefones tocando e sons de batidas, no ambiente de
trabalho. Em termos de design, foram utilizados dois tipos
de equipamentos: o primeiro, um (a) spectrograph, que
realiza o registro fotográfico de um espectro luminoso,
mostrando passo e amplitude, enquanto o segundo, um (b)
positional ripples, mostra amplitude e localização dos
sons, sendo que ambos suportam monitoramento e
notificação de sons, a descoberta de novos sons, e não
requerem um conhecimento a priori dos sons detectados.
Um experimento controlado envolvendo participantes
surdos resultou que nenhum display distrai
significativamente. Contudo, usuários preferiram o display
positional ripples, pois o consideraram mais fácil de
monitorar (notificações de sons foram detectadas com 90%
de sucesso no laboratório instalado).
No trabalho de Matthews, Fong e Mankoff [33] é
ponderado que sons constantemente ocorrem ao nosso
redor, nos mantendo alerta no ambiente e que pessoas com
deficiência auditiva têm dificuldade em manter essa
sensibilização dos sons. Desta forma, é apresentada uma
investigação de displays periféricos e visuais para auxiliar
pessoas surdas a manter essa sensibilidade de som do
ambiente. Assim, os autores apresentam duas
contribuições: primeiro, (a) é apresentado um conjunto de
preferências de design visual e requisitos funcionais para a
visualização dos periféricos de áudio sem fala que irão
auxiliar em melhorias em futuras aplicações. Sendo assim,
preferências de design visual incluem fácil interpretação,
capacidade de enxergar, e distrações apropriadas, e
requisitos funcionais incluem a capacidade de identificar
que som ocorreu, exibe um histórico de sons apresentados,
customiza a informação que é mostrada, e determina a
precisão da informação apresentada; e, segundo, (b) foram
projetados, implementados e avaliados dois protótipos em
pelo funcionamento que incorporam essas preferências e
requisitos, servindo como exemplo para futuros designers
na tentativa de promover o progresso em direção à
compreensão de saber qual a melhor forma de
proporcionar a sensibilização periférica de áudio para os
surdos.
Segundo Tomitsch e Grechenig [51], em trabalhos
anteriores já foi investigado o valor da visualização de sons
de ambiente para pessoas com deficiência auditiva. Este
trabalho foi construído com base nestes resultados e
especificamente explora a aplicabilidade do teto para tais
visualizações. Assim, foram reunidos requisitos de design
baseados em um processo de design participativo incluindo
entrevistas com especialistas, um questionário online, bem
como um workshop de design em uma organização local
para pessoas surdas. Os resultados do workshop mostraram
que as pessoas aprovaram a ideia do uso do teto para
visualização de ambiente. Contudo, eles também
expressaram uma forte necessidade de um display
tradicional suplementar para obter maiores detalhes das
informações sobre como ocorrem os sons. Os autores
expressam a intenção da criação de um protótipo com
aplicações de computação ubíqua e reforçam a importância
do levantamento de requisitos junto ao público-alvo.
Conforme Ohene-Djan, Wright e Combie-Smith [39],
muitas pessoas surdas ou deficientes auditivas usam
legendas para obter acesso ao conteúdo de áudio de
apresentações na TV e em filmes. Contudo, legendas
informam ao visualizador o que está sendo dito, e falham
ao comunicar como está sendo dito. Esta falha emocional
vivenciada pelo visualizador destaca um significante
prejuízo à apresentação da legenda em curso,
especialmente quando usado para aprendizagem por uma
pessoa surda. Portanto, no artigo mencionado, foi descrito
um sistema que demonstra a apresentação de legendas que
descreve as emoções por trás das palavras usadas na tela.
O sistema também oferece aos espectadores a habilidade de
personalizar e adaptar suas interações com as legendas,
para auxiliá-los em seu processo de aprendizagem. No
entanto, é válido refletir se esse tipo de recurso, ao invés de
auxiliar, não iria atrapalhar o leitor/usuário por aumentar
a quantidade de texto a ser lido.
O artigo de Piper e Hollan [42] descreve o projeto e a
avaliação da Interface Compartilhada de Fala (Shared
Speech Interface, SSI), uma aplicação para um display de
mesa (tabletop) multitoque interativo projetado para
facilitar conversações médicas entre um paciente surdo e
um ouvinte, onde o médico não possui domínio da língua
de sinais. Assim, foi empregado um processo de projeto
participativo envolvendo pessoas surdas, bem como
médicos e especialista. Sendo relatados os resultados a
partir de uma avaliação que compara a conversação
quando facilitada por: (a) uma mesa digital, (b) um
intérprete de língua de sinais humano, e (c) ambos. Essa
pesquisa revela que os displays de mesa têm propriedades
valiosas para facilitar a discussão entre os indivíduos
mencionados, bem como melhora a privacidade e
independência.
É importante destacar os trabalhos de Karam et al [26] e
de Nanayakkara et al [37], pois nos mesmos são relatados
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 135](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-141-320.jpg)
![projetos e experimentos inovadores, os quais possibilitam
às pessoas com necessidades auditivas especiais a sensação
musical, o que se imagina ser uma experiência
emocionante, intensa e diferenciada.
Além dos trabalhos acima descritos, existem muitos outros
que tratam de diversos temas interessantes a respeito de
tecnologias assistivas para pessoas surdas, alguns
exemplos, a saber: (a) Design e/ou avaliação de sistemas:
[4], [23] e [47]; (b) Soluções para a Web: [17], [24], [54];
(c) Reconhecimento facial ou de movimento de lábios:
[25], [41], [53]; (d) Computação vestível: [3], [12], [32].
3 RESULTADOS E DISCUSSÕES
Ao efetuar a busca pelas palavras-chaves deaf e hearing
impaired no The Guide to Computing Literature do ACM
Portal, foram apresentados 1.175 e 1.131 trabalhos
relacionados, respectivamente, sendo que destes foram
obtidos artigos que datam de 1970 até 2010, ou seja, o
interesse por pesquisas em tecnologias para assistir pessoas
surdas não é tema tão recente quanto se imagina, pois
constam registrados 40 anos de trabalhos realizados nesta
temática. É válido lembrar que dos mil cento e trinta e um
trabalhos localizados no guia, muitos destes foram listados
pelo fato de terem citado referências nos artigos com a
palavra-chave em questão, e não por tratar realmente do
assunto, sendo assim esta quantidade de trabalhos que
relacionam a computação e a surdez não é precisamente
concreta. Além destes termos de pesquisa e de base de
dados, também, foram localizadas outras fontes utilizando
diferentes termos de busca, os quais constam relacionados
no Apêndice, ao final deste artigo. E o que se percebe, no
que tange à quantidade de trabalhos publicados nesta
temática, é que nas bases literárias internacionais se
encontra um número muito maior e mais rico do que nas
bases nacionais observadas.
Retomando aos mencionados trabalhos da década de 70, se
percebe que naquele período as aplicações da computação
para o auxílio às pessoas surdas eram diferentes das atuais,
devido a uma série de fatores os quais não serão tratados
neste artigo, se preocupando com as primeiras
experiências, descritas por Newton e Vonhof [38], da
introdução do computador na educação de pessoas surdas,
com o relato de uso de softwares do tipo CAI, no artigo de
Barnes [5], com a atuação de pessoas surdas enquanto
profissionais da área de computação, no trabalho de Bates
[6], dentre outras. Contudo, hoje em dia, mesmo com
recursos mais avançados e conhecimentos acumulados
desde então, ainda existe uma constante busca em termos
de melhorias na assistência às pessoas com deficiência
auditiva que naquela época já havia sido iniciada.
Sendo assim, no contexto deste trabalho, tendo-se como
tema principal as tecnologias assistivas, verificou-se a
amplitude das pesquisas que vêm sendo desenvolvidas, no
mundo todo, para que pessoas surdas possam ter condições
iguais, ou o mais similares possível, de pessoas ouvintes
para o alcance de uma qualidade de vida, no mínimo,
adequada. Neste sentido, ao longo do texto exposto, na
Seção 2, se encontra a descrição de esforços no processo de
idealização, desenvolvimento e avaliação de sistemas com
aplicações de diversas naturezas, sejam sistemas de
tradução de uma língua oral para uma língua de sinais (ou
vice-versa), sejam sistemas de reconhecimento de fala,
jogos eletrônicos, animação de avatares para execução de
sinais, sistemas para telefonia celular, projetos que
envolvem computação ubíqua, dispositivos com interfaces
diferenciadas como as luvas para captura de gestos e as
cadeiras vibro-táteis, dentre outros.
Outrossim, conforme dito no parágrafo acima, ao
mencionar o mundo todo, é importante destacar que
existem pessoas surdas em qualquer país e, com isso, deve-
se lembrar que sua língua materna deve ser respeitada, a
qual não é a mesma língua oral que as pessoas ouvintes se
comunicam, sendo assim alguns destes exemplos também
constam no levantamento bibliográfico que são os casos da
Língua Brasileira de Sinais (LIBRAS) que não é a língua
portuguesa, a Língua Americana de Sinais (ASL) que não
é a língua britânica, dentre outras. Levando ainda essa
discussão em consideração, faz-se necessário acrescentar
que os estudos que envolvem aplicações em alta tecnologia
assistiva devem englobar conhecimentos de algumas áreas
como, por exemplo, linguística, computação, psicologia,
fonoaudiologia e pedagogia, sendo, portanto, uma rica
experiência para as pessoas que embarcam nesse processo.
Desta forma, é possível perceber através dos grupos de
pesquisadores, autores dos trabalhos estudados, que existe
uma formação multidisciplinar adequadamente
representada.
Além disso, foi possível observar algumas tendências nos
trabalhos mais recentes como os dispositivos móveis, as
interfaces naturais, as tecnologias de objetos interativos, as
redes sem fio, as interfaces multimodais, a computação
vestível, enfim, um universo de novas descobertas e outras
ainda por surgir, sendo que a tecnologia permeia toda essa
evolução e em alta velocidade, buscando ampliar a
mobilidade, a praticidade, a comunicação, a autonomia,
dentre outros. Com isso, inicia-se uma reflexão sobre os
desafios agregados a essas tendências, em especial, por se
tratarem de pesquisas que envolvem o ser humano como
público-alvo/usuário direto destas tecnologias, questões
como ética, segurança e privacidade entram em jogo, as
quais ainda devem ser largamente refletidas e debatidas.
Por fim, vale ainda ressaltar que se considera importante
que as pesquisas realizadas no meio acadêmico tivessem
algum incentivo no sentido de que os produtos e resultados
gerados se tornassem, amplamente, divulgados e aplicados
no uso prático diário, não sendo apenas engavetados. Uma
sugestão seria a formação de parcerias com grandes
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 136](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-142-320.jpg)
![empresas de tecnologia pudessem garantir a produção em
série de determinadas aplicações, após tempo determinado
de teste e avaliação baseada em critérios de qualidade
internacionais. Neste contexto, cabe mencionar a
existência da Lei da Inovação Tecnológica [30], a qual
“dispõe sobre incentivos à inovação e à pesquisa científica
e tecnológica no ambiente produtivo”, na tentativa de
promover a integração entre, por exemplo, Universidades e
empresas na produção de produtos inovadores.
4 CONSIDERAÇÕES FINAIS
As respostas obtidas, durante a realização deste trabalho,
significam que existe uma gama de possibilidades de
pesquisa a serem conduzidas sobre o assunto, visto que o
tema é bastante abrangente no que tange a áreas de
conhecimento envolvidas. Além disso, a temática de
tecnologias para assistência a pessoas com deficiência é
tópico de interesse em diversas subáreas da computação,
em especial, de interface homem-máquina, pois trata da
relação direta entre o usuário e os mais variados tipos de
tecnologia. Tais respostas ajudam a resolver o problema
em mãos, já mencionado anteriormente, que se refere à
limitação principal de pessoas surdas, a comunicação desta
com as pessoas ouvintes e, em alguns casos, com pessoas
com o mesmo tipo de deficiência que ainda não se
expressam através da língua de sinais de seu país.
Com relação às perspectivas de continuidade deste
trabalho, podem ser citados os seguintes: (a) a ampliação e
o aprofundamento das leituras sobre o tema em questão;
(b) o contato com pessoas surdas de local previamente
determinado, a fim de absorver detalhes da cultura e das
necessidades dessas pessoas tão especiais; (c) a proposição,
o desenvolvimento e a avaliação de um protótipo de
tecnologias assistivas voltadas para o auxílio de pessoas
com deficiência auditiva.
REFERÊNCIAS
1.Adamo-Villani, N.; Wright, K. SMILE: an immersive
learning game for deaf and hearing children. Intern.
Conference on Computer Graphics and Interactive
Techniques archive, ACM SIGGRAPH 2007, No. 17.
2.Ahmed, A.S.; Seong, D.S.K. SignWriting on mobile
phones for the deaf. Mobility '06.
3.Amemiya, T.; et al. Virtual Leading Blocks for the Deaf-
Blind: A Real-Time Way-Finder by Verbal-Nonverbal
Hybrid Interface and High-Density RFID Tag Space.
IEEE Virtual Reality 2004, p.165.
4.Barbacena, I.L.; et al. Comparative analysis of tactile
sensitivity between blind, deaf and unimpaired people.
International Journal of Advanced Media and
Communication, Volume 3, Issue 1/2, June 2009.
5.Barnes, O. D. CAI at the National Technical Institute for
the Deaf. ACM, SIGCUE, Vol.5, Issue 1, 1971.
6.Bates, R.L. The deaf in computer professions. ACM,
SIGCAPH Computers and the Physically Handicapped,
Issue 6, April 1972.
7.Bedregal, B.R.C.; Dimuro, G.P.; Costa, A.C. Interval
Fuzzy Rule-Based Hand Gesture Recognition. Scientific
Computing, Computer Arithmetic and Validated
Numerics. 12th GAMM, IEEE, 2006.
8.Brashear, H. Improving the Efficacy of Automated Sign
Language Practice Tools. ACM, SIGACCESS
Accessibility and Computing, Issue 89, Sept/2007.
9.Breda, W.; et al. SOTAC: A Software for Knowledge-
Based Automatic Translation. WCCE 2009.
10.Buttussi, F.; Chittaro, L.; Coppo, M. Using Web3D
Technologies for Visualization and Search of Signs in an
International Sign Language Dictionary. ACM, Web3D
2007, Italy, April 15–18, 2007.
11.Candido Jr, Arnaldo; et al. Supporting the adaptation
of texts for poor literacy readers: a text simplification
editor for Brazilian Portuguese. Proceedings of the
Fourth Workshop on Innovative Use of NLP for Building
Educational Applications, 2009.
12.Caporusso, N. A wearable Malossi alphabet interface
for deafblind people. ACM, AVI '08: The Working
Conference on Advanced Visual Interfaces, May 2008.
13.Cavender, A.C. Using Networked Multimedia to
Improve Educational Access for Deaf and Hard of
Hearing Students. ACM, SIGACCESS, Issue 89, 2007.
14.Cavender, A.C.; Ladner, R.E.; Roth, R.I. The summer
academy for advancing deaf and hard of hearing in
computing. SIGCSE '09.
15.Cherniavsky, N.; et al. Activity Analysis Enabling
Real-Time Video Communication on Mobile Phones for
Deaf Users. UIST’09, ACM, October 4–7, 2009.
16.Cox, S.; et al. TESSA, a system to aid communication
with deaf people. ASSETS 2002, July 8-10, 2002.
17.Debevc, M.; et al. Accessible Multimodal Web Pages
with Sign Language Translations for Deaf and Hard of
Hearing Users. DEXA '09.
18.Drigas, A.S., Kouremenos, D. An e-Learning
Management System for the Deaf people. WSEAS
Transactions on Advances in Engineering Education,
Issue 1, Volume 2, pp. 20-24, 2005.
19.Duduchi, M.; Capovilla, F.C. BuscaSigno: a construção
de uma interface computacional para o acesso ao léxico
da língua de sinais Brasileira. IHC, 2006.
20.Henderson, V.; et al. Development of an American
Sign Language game for deaf children Proposing a
speech to gesture translation architecture for Spanish
deaf people. IDC '05.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 137](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-143-320.jpg)












![disso, busca ressaltar as potencialidades do design da
informação e sua contribuição para a aprendizagem.
O POTENCIAL DO PROCESSO DE COLABORAÇÃO
A discussão sobre colaboração não é recente. Ela surge do
paralelo entre dois pontos importantes para a engenharia de
software, a colaboração e cooperação. É sutil a diferença
entre colaboração e cooperação. Esses termos expressam
formas levemente diferentes de trabalho. De acordo com
Kutova (2006) uma das definições mais antigas dentro da
área de informática, é a de James Bair (1989) que explica
colaboração como sendo a comunicação entre pessoas que
trabalham juntas e com um mesmo objetivo, porém essas
pessoas são avaliadas individualmente, e cooperação como
a comunicação em que não existe mais o conceito de
indivíduo, apenas o de grupo.
Kutova (2006) cita que num projeto colaborativo há mais
espaço para autonomia e para relacionamentos informais. A
permanência dentro do escopo pré-estabelecido é de difícil
controle e nem sempre desejada. Deve haver um estímulo à
interação entre os participantes. Já num projeto cooperativo,
existe uma interdependência positiva. As interações entre os
participantes são essenciais. É provável que surja
espontaneamente, ou de forma planejada, uma estrutura
social, com hierarquias e distribuição de responsabilidades.
As habilidades dos participantes devem ser complementares
para alcance do objetivo único do grupo. Assim, o processo
de colaboração abarca outra discussão: a interação e a
interatividade.
Segundo Silva (2008), o conceito de interação vem de
longe, entretanto o conceito de interatividade é recente.
Pode ter surgido no final dos anos 70 e início da década de
80 no contexto das novas tecnologias de informação. Um
dado que permite esta afirmação é a ausência do termo nos
dicionários de informática até meados dos anos 80.
Para Lemos (1997), a palavra interação está relacionada ao
contato interpessoal e direto chamado por ele “interação
social”; enquanto interatividade é “uma nova qualidade de
interação”, influenciada diretamente pelo meio. “Podemos
compreender a interatividade digital como um diálogo entre
homens e máquinas”.
Para Primo e Cassol (1999), a partir da definição de Steuer,
“[...] interatividade é uma extensão em que usuários podem
participar modificando a forma e o conteúdo do ambiente
mediado em tempo real”. Pode-se dizer então que
interatividade é uma forma de comunicação versátil que
permite que os usuários alterem o fluxo da informação
conforme desejarem. Primo e Cassol (1999) explicam que
para tanto, existem três fatores básicos a serem medidos. O
primeiro é a velocidade que o sistema responde ao usuário,
sendo que a resposta mais rápida permite uma maior
interatividade. O segundo fator é amplitude da interação, ou
seja, o número de elementos possíveis de serem alterados
pelo usuário. E por fim o mapeamento, que é o meio pelo
qual o usuário se conecta e se comunica com o sistema, por
exemplo, mouse, teclado ou gamepad.
Filatro (2008) propõe uma clara diferenciação entre
interação e interatividade. A interação diz respeito ao
comportamento das pessoas em relação a outras pessoas e
aos sistemas. Ela está ligada à ação recíproca pela qual
indivíduos e objetos se influenciam mutuamente. A
interatividade, por sua vez, ao descrever a capacidade ou o
potencial de um sistema propiciar interação, é um pré-
requisito para a interação (FILATRO, 2008).
PROCESSO COLABORATIVO NA EAD
As comunidades de discussão online são comumente usadas
nos sistemas de educação a distância e em cursos de
capacitação de classes presenciais (face-to-face classes).
Para encontrar o constante fluxo de mensagens pelos
instrutores é um desafio gratificante, e os estudantes estão
geralmente satisfeitos com a experiência. A essência da
aula virtual é um meio de facilitar a aprendizagem
colaborativa, muitas vezes com projetos.
A educação a distância para os alunos, permite o aumento
da sua capacidade de estar em constante comunicação uns
com os outros, e é uma forma de evidente benefício. Mas,
mesmo no campus de base dos cursos, a tecnologia
proporciona um meio muito rico para que o ambiente de
aprendizagem colaborativa ultrapasse a aula tradicional,
pela capacidade de conectar os alunos e tornar claro
materiais disponíveis em uma base de dados (HILTZ, 1992;
HAZEMI and HAILES, 2001).
A colaboração em cursos de EAD é caracterizada e
difundida pelos ambientes virtuais de aprendizagem (AVA)
ou ambientes hipermidiáticos de aprendizagem (AHA). Um
AVA consiste em uma opção de mídia que está sendo
utilizada para mediar processo ensino-aprendizagem à
distância. Nos últimos anos, os ambientes virtuais de
aprendizagem estão cada vez mais utilizados no âmbito
acadêmico e corporativo como uma opção tecnológica para
atender esta demanda educacional. Diante do exposto,
destaca-se a importância de um entendimento mais crítico
sobre o conceito que orienta o desenvolvimento ou uso
desses ambientes, assim como, o tipo de estrutura humana e
tecnológica que oferece suporte ao processo ensino-
aprendizagem (CYBIS, 2007).
Os AVAs, sintonizados com os novos paradigmas
epistemológicos da educação, privilegiam a aprendizagem
colaborativa, a construção compartilhada do conhecimento,
a interação, a subjetividade, a autonomia e o
desenvolvimento de uma consciência crítica nos estudantes.
Atraídos pelo potencial sócio-técnico dos ambientes de
aprendizagem, que fazem do digital seu suporte e pela
possibilidade de constante atualização, muitos educadores
têm se utilizado do ciberespaço como um meio para a
renovação de suas práticas pedagógicas (CIBYS, 2006). A
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 150](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-156-320.jpg)
![Interação Homem Computador (IHC) é um campo de
estudo interdisciplinar que tem como objetivo entender
como e porque as pessoas utilizam (ou não) as tecnologias
da informação (PADOVANI, 2002).
Os AVAs são projetados de acordo com a necessidade de
seus usuários. A premissa básica do design centrado no
usuário é a de que suas necessidades sejam levadas em
consideração durante todo processo de design e
desenvolvimento, o que pode ser alcançado avaliando-se o
design em vários estágios de seu desenvolvimento e
corrigindo-o para que se adapte às necessidades dos
usuários (GOULD e LEWIS, 1985). O design, portanto,
progride em ciclos interativos de design – avaliação – novo
design (redesign) (PREECE, et. al. 2005).
Os usuários preferem sistemas que sejam fáceis de aprender
e utilizar assim como eficazes, eficientes, seguros e
satisfatórios. É também essencial que alguns pontos sejam
agradáveis, atraentes, desafiadores, etc. Saber o que avaliar
a importância de avaliar e quando avaliar são, portanto,
tarefas fundamentais. Desse modo, a avaliação é necessária
para a certificação de que os usuários podem vir a utilizar o
produto e apreciá-lo (PREECE, 2002). Além disso, hoje os
usuários procuram muito mais do que um sistema usável,
como aponta a Nielsen Norman Group, uma empresa de
consultoria de usabilidade:
“A experiência do usuário” abrange todos os aspectos da interação do
usuário final... o primeiro requisito para uma experiência exemplar do
usuário consiste em encontrar as necessidades exatas do cliente, sem
ansiedade ou incomodação. A seguir, vem a simplicidade e a elegância,
que produzem produtos bons de se ter e de utilizar.
ESTRATÉGIAS (OU MODALIDADES) QUE
POTENCIALIZAM A COLABORAÇÃO
Através da interface2
Para a educação a distância a colaboração apresenta certa
amplitude de troca de saberes e contribui para o
aprendizado autodirigido. Schneidermann e Plaisant (2005)
apresentam modalidades de colaboração classificados por
eles como fatores de compartilhamento online. Quando bem
gráfica, o design de informação é
apresentado ao usuário, e que através dos sistemas de
informação, pode-se obter a colaboração do mesmo. A
colaboração online é capaz de potencializar o design da
informação através da troca e articulação do conhecimento
de seus usuários. Por este motivo, o processo colaborativo
na internet pode ser classificado de várias maneiras. A
colaboração é a articulação do usuário com a interface
gráfica e sistemas de informação.
2
A interface atua como uma espécie de tradutor realiza a
mediação entre duas partes, tornando uma sensível para a outra.
Em outras palavras, a relação governada pela interface é uma
relação semântica, caracterizada por significado e expressão
[...]Em seu sentido mais simples, a palavra interface se refere a
softwares que dão forma à interação entre usuários e o
computador. (JOHNSON, 2001, p. 17-18).
implementados, esses pontos caracterizam a interação entre
o usuário/sistema de forma qualitativa. A seguir, essas
modalidades são destacadas e comentadas.
Focada em parcerias (focused partnerships): segundo os
autores, a colaboração focada em parcerias permite o
compartilhamento através da parceria online por correio
eletrônico, bate-papo, mensagem instantânea, telefone,
mensagem de voz, vídeo conferência e outras combinações
de tecnologia.
Palestra ou demo (lecture or demo): conforme os mesmos
autores, a palestra ou demo são formatos onde a pessoa
pode compartilhar informações com o maior número de
usuários em locais remotos. A hora de início e a duração é
mesma para todos, as questões podem ser levantadas pelos
participantes. Não é necessária a manutenção do histórico
do assunto, mas a capacidade de se ter um replay é útil para
a posterior análise daqueles que não puderam comparecer –
afirmam eles.
Conferências (conferences): as conferências permitem a
comunicação de grupos distantes ao mesmo tempo (o que a
torna síncrona) ou separados ao longo do tempo (de
maneira assíncrona). Os recursos de colaboração de
conferências são utilizadas para reuniões, planejamentos,
discussões de estudos, problemas com os deveres de casa,
monitoria, etc.
Processo de trabalho estruturado (stuctured work
process): o processo de trabalho estruturado permite que as
pessoas colaborem com os papéis distintos da Organização
onde atuam em tarefas diferentes. Por exemplo, no
desenvolvimento de uma revista científica on-line um editor
projeta a apresentação, outro faz as revisões, outro a
publicação; e assim por diante. Ben Schneidermann e
Catherine Plaisant (2005) ainda dão um exemplo desse tipo
de colaboração em uma agência de seguro-saúde que recebe
notificações, e reembolsa ou rejeita as contas médicas, e até
em uma universidade que efetua admissões por comissão de
registros, opiniões ou aplicações.
Reunião de apoio à decisão (meeting and decision
support): essa colaboração pode ser realizada numa reunião
“face-to-fece” (onde todos estão presencialmente online),
em que cada usuário, utilizando o computador pode fazer
contribuições simultâneas, compartilhar idéias e arquivos e
discutir em janelas diferentes da principal de reunião.
Segundo eles, essa colaboração é ideal para votações.
Comércio eletrônico (electronic commerce): a colaboração
do comércio eletrônico é uma das mais caracterizadas e
utilizadas na web. Ela permite que as pessoas façam
pesquisas de preço, compartilhem suas opiniões sobre
produtos, sobre atendimento, sobre a, venda, serviços de
pós-venda, etc.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 151](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-157-320.jpg)




![5. JOHNSON, S. Cultura da interface: como o
computador transforma nossa maneira de criar
e comunicar. Rio de Janeiro: Zahar. 2001
6. KUTOVA, Marcos A. S. Colaboração x
Cooperação. Das minhas leituras, 9 de outubro de
2006. Disponível em:
http://blog.kutova.com/2006/10/09/colaboracao-
x-cooperacao/ Acesso em: 10 abr. 2009.
7. LEMOS, A. L. M. Anjos Interativos e
Retribalização do Mundo. Tendência Xxi,
Lisboa, v. 2, p. 19-29, 1997.
8. PADOVANI, S. Avaliação ergonômica de
sistemas de navegação em hipertextos fechados.
In: Design e avaliação de interface. Rio de
Janeiro – RJ: IUsER, 2002.
9. PEREIRA, Alice T. AVA em Diferentes
Contextos. Rio de Janeiro – RJ: Ciência Moderna,
2007.
10. PREECE Jeniffer. ROGERS, Ivonne. SHARP.
Helen. Design de Interação. São Paulo – SP:
Bookman, 2005.
11. PRIMO, A. F. T. AND CASSOL, M. B. F., 1999.
Explorando o conceito de interatividade:
definições e taxonomias. [online]. Disponível em:
http://usr.psico.ufrgs.br/~aprimo/pb/pgie.htm
12. SHNEIDERMAN, Ben; PLAISANT, Catherine.
Designing the user interface. Strategies for
effective Human-Computer Interaction.
Pearson, 2005.
13. SILVA, M. Que é interatividade? Boletim
Técnico do SENAC, Rio de Janeiro, v. 24, n. 2, p.
27-35, 1998.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 156](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-162-320.jpg)
















![Implementando Acessibilidade em um Sistema de Gestão
de Aprendizagem através do Design Centrado no Usuário
Virgínia Chalegre, Fabrício Teles, Audrey Vasconcelos
Centro de Informática, Universidade Federal de Pernambuco
Caixa Postal 7851 CDU Recife PE 50732-970, Brasil
{vcc, fst, abv}@cin.ufpe.br
ABSTRACT
The era of digital inclusion has made accessibility a
requirement increasingly essential to Web pages, since this
environment plays a key role in the daily life of people with
special needs. This paper presents the first results towards
the accessibility of a learning management system, through
the user centered design, taking into account expectations
of visually impaired users, and accessibility guidelines
proposed by the WAI/W3C.
RESUMO
A era da inclusão digital tem tornado a acessibilidade um
requisito, cada vez mais, essencial para as páginas Web,
uma vez que este ambiente desempenha papel fundamental
no cotidiano das pessoas com deficiência. Este artigo
apresenta os primeiros resultados rumo à acessibilização de
um sistema de gestão da aprendizagem, através do design
centrado no usuário, levando em consideração as
expectativas de usuários com deficiência visual, bem como
as diretrizes de acessibilidade propostas pela WAI/W3C.
Palavras-chave
Acessibilidade, Learning Management System, Design
Centrado no Usuário.
ACM Classification Keywords
H.5.3 [HCI]: Web-based interaction.
INTRODUÇÃO
Estabelecer normas gerais e critérios básicos para a
promoção da acessibilidade a pessoas com deficiência é o
objetivo da Lei Federal Brasileira de Acessibilidade (Lei Nº
10.098, de 19 de dezembro de 2000). Apesar de seu
razoável tempo de vida, ainda são poucas as ações práticas
para sua operacionalização na sociedade. Especificamente
no ramo da educação, a acessibilidade muitas vezes é
negligenciada, sendo considerada como desejável, quando
deveria ser tratada como essencial.
De acordo com o Censo do IBGE de 2000 [6], estima-se
que 24,5 milhões de pessoas, em torno de 14,5% da
população brasileira, possuem algum tipo de deficiência.
Desse montante, o principal grupo é dos deficientes visuais
que abrange 48,1% do total, sendo incluídas as pessoas
cegas ou com baixa visão.
Levando-se em consideração esse significativo número de
pessoas com deficiência, entende-se a importância de
propor soluções de inclusão em todos os níveis do processo
de educação. Acredita-se que os sistemas de gestão da
aprendizagem (Learning Management System – LMS)
virtuais possam atuar como um facilitador nesse processo,
desde que sejam concebidos com base em requisitos bem
fundamentados de acessibilidade para Web. Nesta
perspectiva, a WAI1
tem desenvolvido especificações,
guias, software e ferramentas em busca da padronização de
tais definições [10].
Entretanto, tornar esses sistemas virtuais acessíveis não é
uma tarefa fácil, visto que geralmente os envolvidos com o
desenvolvimento de ambientes Web conhecem pouco das
necessidades das pessoas com deficiência, como também
muitas vezes não possuem prática com a implementação
dos padrões propostos pela WAI. Alinhado a isso, há ainda
o fato de não se considerar diretrizes de acessibilidade
durante todo o ciclo de desenvolvimento do LMS. Esta
prática propaga inconsistências e causa retrabalho, uma vez
que a validação da acessibilidade geralmente é feita apenas
ao final do desenvolvimento.
O objetivo deste estudo foi desenvolver uma proposta para
um LMS acessível, seguindo a perspectiva do Design
Centrado no Usuário. O grupo de usuários abordado foi o
dos deficientes visuais, por se tratar do maior e mais
representativo subconjunto das pessoas com deficiência.
Avaliou-se como as necessidades de acessibilidade
poderiam ser atendidas em um LMS, tanto pela visão do
1
O World Wide Web Consortium (W3C) é um consórcio
internacional responsável por desenvolver padrões a serem
adotados na Web, sendo a Web Accessibility Initiative
(WAI) um grupo de trabalho da W3C responsável pelas
ações de acessibilidade.
Cópias digitais ou impressas deste artigo são permitidas desde que sejam
para uso pessoal ou em sala de aula e com as devidas referências, não se
prestando para fins comerciais. Por favor, mantenha este aviso na primeira
página.
Interaction South America 2010 - 2 a 4 de dezembro, Curitiba - Paraná -
Brasil
Copyright 2010 IxDA Curitiba.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 173](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-179-320.jpg)
![usuário quanto pela visão da WAI, considerando mais
especificamente as diretrizes Web Content Accessibility
Guidelines (WCAG 2.0).
AMADEUS
Baseada no conceito de blended learning, que reune ensino
à distância (e-learning) e ensino presencial, a plataforma
Amadeus apresenta-se como o primeiro LMS de segunda
geração [2]. A solução, disponível no Portal do Software
Público Brasileiro [7], permite estender as experiências dos
usuários de EaD para diversas plataformas (Internet,
desktop, celulares, PDAs e TV Digital) de forma integrada
e consistente.
O objetivo do Amadeus é ampliar as possibilidades de
trabalho dos professores e proporcionar formas criativas de
relacionamento, promovendo a comunicação e colaboração
entre os participantes. Essa ampliação das formas de
interação dos usuários com os conteúdos e entre os próprios
usuários permite a implementação de novas estratégias de
ensino e de aprendizagem orientadas por teorias
construtivistas ou sociointeracionistas do desenvolvimento
humano. A Figura 1 ilustra a tela principal desse LMS.
Figura 1. Tela Principal do Amadeus.
Apesar do promissor potencial da plataforma, diretrizes de
acessibilidade nunca foram consideradas em sua concepção,
por exemplo, conteúdos não textuais (vídeos, imagens, etc)
não possuem seu respectivo descritivo textual, dificultando
e muitas vezes invializando a utilização de tais conteúdos
por parte dos deficientes visuais, neste caso.
O cenário atual do Amadeus, onde estas dificuldades de
acessibilidade estão presentes, motivou a aplicabilidade da
pesquisa apresentada neste trabalho. Ao utilizar como
estudo de caso esta plataforma, a pesquisa em questão visa
ampliar o grupo de usuários da ferramenta, incluindo os
portadores de deficiência.
DESIGN CENTRADO NO USUÁRIO
Conforme mencionado, o presente estudo foi desenvolvido
com base na abordagem Design Centrado no Usuário, ou
seja, seguiu-se um processo baseado nas quatro fases do
design da interação: Pesquisa, Brainstorm, Avaliação e
Prototipação [8], no qual o ponto central foi a experiência
do usuário.
Nas próximas sub-seções será descrita, detalhadamente, a
execução de cada uma dessas fases no âmbito deste estudo.
Fase 1 - Pesquisa
A metodologia de pesquisa qualitativa utilizada foi a
Grounded Theory [9]. A ideia básica desta metodologia é
ler um banco de dados textual (por exemplo, notas de
campo e transcrições de entrevistas) para descobrir ou
nomear variáveis (denominadas de categorias, conceitos e
propriedades) e seus relacionamentos. A partir daí é
construída uma teoria sobre o fenômeno; neste caso, a
acessibilidade para deficientes visuais nos sistemas de
gestão de aprendizagem.
A formulação das questões de pesquisa, em termos
concretos, foi guiada pelo objetivo de esclarecer o que os
entrevistados revelaram. Os principais questionamentos
respondidos foram:
• Como se dá a interação dos usuários DVs (Deficientes
Visuais) e quais as suas maiores dificuldades no acesso
dos ambientes na Web em geral.
• Relatos de episódios onde o DV enfrentou dificuldades
no acesso às informações nos ambientes Web/EaD.
• Descrições de como funciona a interação do DV com o
professor nos ambientes de EaD.
Dentro da metodologia de pesquisa utilizada foram
definidas duas fontes de dados:
• Entrevistas com usuários com deficiência visual total.
• Documentação da WCAG 2.0.
Tais fontes de dados passaram pelo processo de coleta,
análise e interpretação de dados. A partir da análise e
interpretação da primeira fonte de dados (entrevistas com os
usuários), foram destacados alguns conceitos, a partir das
sugestões de acessibilidade que emanaram das entrevistas
realizadas. A seguir há alguns exemplos destes conceitos,
os quais estão devidamente justificados por trechos
transcritos das entrevistas:
a. Descrever o formato da página e estruturá-las por frames,
cabeçalhos e tabelas, facilitando a navegação, uma vez
que o leitor possui recurso para passar de um componente
para outro.
“... possa fazer a estruturação por frames, pode ser feito
por texto de cabeçalho (header) também - isso facilita (a
navegação) porque os leitores de tela fornecem recursos
para ’pular’ de um frame para outro, para ’pular’ de
uma tabela para a próxima tabela”.
b.Localizador rápido de conteúdo.
“Deve-se criar caminhos/alternativas/soluções diferentes
para pessoas diferentes chegando objetivamente e
diretamente no que interessa, no mesmo conteúdo. Só
isso já facilitaria muitíssimo a criação de sites com
acessibilidade”.
c. Não utilizar CAPTCHA (Completely Automated Public
Turing test to tell Computers and Humans Apart).
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 174](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-180-320.jpg)
![“CAPTCHA é um atentado à acessibilidade para um
deficiente visual”.
d. O conteúdo deve ser objetivo e os componentes não
textuais devem possuir um descritivo textual.
“Por exemplo, se for o caso de ler textos, que estes sejam
objetivos, sem muitas figuras, e caso existam, que sejam
descritas”.
e. Não inserir indicações de cor e desenhos.
“... a utilização de cores é outra coisa que nos atrapalha
muito, porque alguns sites utilizam cores para se
identificar determinados pontos dentro dele, mas pra nós
isso atrapalha. O que para as outras pessoas ajuda, para
nós dificulta a identificação dos elementos”.
f. Quando o material for gravado (leitura de texto, vídeo),
disponibilizar um gerenciador integrado à ferramenta,
que seja possível acessá-lo diretamente, além de permitir
parar, avançar e voltar.
“... quando tiver uma voz gravada nos materiais, tem que
dar a possibilidade de pará-las; ter controle sobre o
áudio”.
g. As avaliações devem ter opções de múltipla escolha
simples. Não deve haver associações entre duplas
colunas.
“... eu desisti de fazer um teste porque ele tinha umas
alternativas de escolha muito complicadas. Associar um
lado com outro, uma coluna com a outra. Associar a da
direita com a esquerda. Então eu o abandonei...”.
h. Informar quando a página é atualizada/modificada e pôr
o foco na funcionalidade selecionada. Por exemplo, se o
usuário selecionar Fórum, a página deve ser atualizada e
o foco deve estar no Fórum, para evitar passar por todos
os links novamente, antes de chegar à funcionalidade
selecionada.
“... em portais de notícias, que possuem várias
manchetes na mesma página, você começa a ler uma
notícia, quando vê já está no meio de outra notícia que
não tem nada a ver com a anterior. Você começa a ler:
‘Hoje o presidente esteve na cidade...’ e em seguida já
vem o texto: ‘... a previsão do tempo é de sol e calor’”.
i. Descrever o link que está sendo acessado.
“É importante para quem não vê (DV) que haja uma
descrição do link que está sendo acessado. O flash diz
que aquele link não tem nome e apenas atribui a esse link
um número, ficando o DV sem saber do que se trata”.
A partir da análise da segunda fonte de dados
(documentação WCAG), foi identificado que a sua
documentação oficial da WCAG 2.0 [10] já estrutura os
dados de forma categórica e conceitual. Desta forma, o
processo de interpretação focou em selecionar os princípios
e recomendações relacionadas às questões de pesquisa deste
trabalho, a saber:
a. Perceptível: A informação e os componentes da interface
do usuário têm de ser apresentados aos usuários de forma
que eles possam perceber.
a1. Alternativas em Texto: Fornecer alternativas em texto
para qualquer conteúdo não textual.
a2. Mídias com base no tempo: Fornecer alternativas para
multimídia baseada no tempo.
b.Operável: Os componentes de interface de usuário e a
navegação devem ser operáveis.
b1. Acessível por Teclado: Fazer com que toda a
funcionalidade fique disponível a partir do teclado.
b2. Tempo Suficiente: Fornecer tempo suficiente aos
utilizadores para lerem e utilizarem o conteúdo.
c. Compreensível: A informação e a operação da interface
de usuário devem ser compreensíveis.
c1. Legível: Tornar o conteúdo de texto legível e
compreensível.
c2. Previsível: Fazer com que as páginas Web surjam e
funcionem de forma previsível.
d.Robusto: O conteúdo tem de ser robusto o suficiente para
poder ser interpretado de forma concisa por diversos
agentes do usuário, incluindo tecnologias assistivas.
e. Compatível: Maximizar a compatibilidade com atuais e
futuros agentes de utilizador, incluindo tecnologias de
apoio.
A partir desta primeira interpretação, um segundo processo
interpretativo foi executado com o objetivo de selecionar as
recomendações de acessibilidade mais importantes, sob a
ótica dos usuários deficientes visuais. As recomendações
selecionadas foram: a1 (Alternativas em Texto), a2 (Mídias
com base no tempo), b1 (Acessível por Teclado), b4
(Navegável), c1 (Legível) e c2 (Previsível).
Tanto estas recomendações de acessibilidade da WAI,
como também as sugestões de acessibilidade identificadas
nas entrevistas com os usuários, foram utilizadas para a
formulação da teoria (diretrizes de acessibilidade aplicadas
neste trabalho) e consideradas nas fases seguintes do
processo de design da interação centrado no usuário.
Fase 2 - Brainstorm
A fase de brainstorm consistiu em uma sessão de 60
minutos, na qual foram exploradas soluções a serem
incorporadas à fase de prototipação. Utilizou-se a técnica de
brainstorm de modo simples e prático, tendo as seguintes
atividades:
a. Exposição das questões de pesquisa.
b.Exposição dos resultados da fase de pesquisa.
c. Apresentação de ideias para elaboração do protótipo.
Algumas da ideias suscitadas no brainstorm foram:
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 175](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-181-320.jpg)

![Figura 5. Tela de Login.
(1) Imagem do logotipo do Amadeus, com o seguinte
descritivo textual: “Imagem, no topo da tela, com o nome
projetoAmadeus, o logotipo do Amadeus e a versão em que
o sistema se encontra - Alpha”
(2) Barra de acessibilidade com cinco botões distintos e
com seus respectivos equivalentes textuais. Abaixo, seguem
as funcionalidades de cada um, da esquerda para a direita:
• Botão que descreve como o sistema está estruturado, por
exemplo: “A tela está dividida em dois frames: O
primeiro com a imagem do logotipo do Amadeus e com
os botões de acessibilidade e o segundo possui os campos
de login”.
• Botão que ativa o modo acessibilidade para deficientes
auditivos, o qual traduz o texto selecionado para a
Linguagem Brasileira de Sinais (LIBRAS).
• Botão para diminuir o tamanho da letra da tela atual.
• Botão que serve para deixar a letra da tela atual no
tamanho normal.
• Botão para aumentar o tamanho da letra da tela atual.
(3) Campos de entrada de dados, identificados pelo leitor de
tela, para fazer o login no sistema.
(4) Botão, devidamente identificado pelo leitor de tela, com
o descritivo: “Botão Entrar para fazer login no sistema”.
(5) Botão, devidamente identificado pelo leitor de tela, com
o descritivo: “Botão Google para fazer login no sistema,
utilizando a sua conta do Google[5]”.
(6) Link, devidamente identificado pelo leitor de tela, com o
descritivo: “Link Esqueceu a Senha que direciona para a
página de identificação do usuário, onde o sistema irá
enviar uma nova senha por email”.
(7) Link, devidamente identificado pelo leitor de tela, com o
descritivo: “Link Nova Conta que direciona para a página
de cadastro do usuário”.
Figura 6. Tela dos Cursos.
(1) Primeiro item a ser lido pela ferramenta assistiva, assim
que a tela for carregada. Esta área informa ao usuário que
ele está logado e os botões têm as respectivas descrições:
“Botão Perfil que, ao ser selecionado, direciona para uma
tela onde é possível modificar o seu perfil” e “Botão Sair
para fazer o logout no sistema”.
(2) Campo de busca no início da tela para que os usuários,
com e sem deficiência, possam pesquisar o conteúdo de seu
interesse e acessá-lo rapidamente.
(3) Área onde estão listados os cursos, separados por
categorias relacionadas ao aluno. Os links dos cursos têm
seus descritivos textuais, indicando para onde o usuário será
levado. Na categoria Cursos Disponíveis, o botão Inscrição
está ao lado do link para facilitar o acesso, evitando que o
usuário tenha que procurar esta opção para se inscrever no
curso desejado.
Figura 7. Perfil Aluno - Tela do Curso Selecionado.
(1) Menu lateral com todas as opções disponíveis pelo
curso. Cada link tem o descritivo textual que explica o
objetivo da funcionalidade e indica seu direcionamento. Na
Figura 7, a descrição da opção selecionada é “Menu Dados
do Curso, opção que indica o Nome do Curso, Professores,
Objetivos, Programa, Limite de Vagas e datas importantes”.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 177](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-183-320.jpg)

![Figura 10. Perfil Aluno - Tela Módulo do Curso - Avaliação.
(1) Avaliação relacionada ao módulo selecionado, com um
botão e seu equivalente textual para finalizá-la. Possui
perguntas acessíveis com respostas abertas ou de múltipla
escolha. Uma sugestão, relatada pelos deficientes visuais
nas entrevistas, é não inserir perguntas que tenham
relacionamentos de dois lados, pois dificulta a leitura da
ferramenta e consequentemente a localização dos
elementos.
As recomendações da WAI relacionadas ao protótipo do
presente trabalho são detalhadas a seguir:
• Alternativas em Texto: Para cada componente das telas
do protótipo (botão, imagem, link, frame, caixa de texto e
menu) é proposta uma descrição textual, a fim de que os
deficientes visuais possam acessá-los com a ferramenta
assistiva.
• Mídias com Base no Tempo: A ideia é que sejam
fornecidas legendas para a totalidade do áudio pré-
gravado existente em um conteúdo com mídia
sincronizada, com o objetivo de permitir que o usuário
possa gerenciar os áudios, evitando que, por exemplo, o
áudio de uma aula sobreponha o áudio da ferramenta
assistiva.
• Acessível por Teclado: Todo componente tem uma tecla
de atalho para que possa ser acessado via teclado, sendo
também ordenados adequadamente para que o deficiente
visual consiga “desenhar” as telas em sua mente da
mesma forma que as pessoas sem deficiência as
enxergam.
• Navegável: Foi feita uma separação de forma, função e
conteúdo, de maneira a estruturar as páginas e facilitar o
acesso de todos (pessoas com e sem deficiência).
• Legível: A informação é perceptível, ou seja, a proposta é
que o conteúdo seja objetivo o suficiente, que tenha
explicações para palavras incomuns e abreviaturas,
tornando-o de fácil compreensão.
• Previsível: Os mecanismos de navegação são repetidos
em várias páginas Web, tornando a navegação previsível
pela experiência do usuário. Os componentes de entrada
de dados estão disponíveis via teclado, com informações
do que é necessário preencher e os componentes que têm
a mesma funcionalidade são identificados de forma
consistente.
Fase 4 - Avaliação
A avaliação foi feita com alguns entrevistados logo após a
elaboração do protótipo. O processo foi descrever cada tela
do protótipo, com todos os detalhes das funcionalidades,
botões, links, menu, imagens, bem como a interação entre
os componentes e a sequência das telas, ouvindo os seus
comentários a todo momento.
Os usuários validadores do protótipo destacaram a
navegabilidade da interface, considerando-a simples,
objetiva e de fácil interação, com descritivos textuais para
todas as funcionalidades disponíveis. Apontaram como
ponto de melhoria a ênfase aos componentes acessíveis via
teclado, já que, em algumas ferramentas, links do menu, por
exemplo, só expandem com o click do mouse. Além desse,
outros aspectos analisados:
a. Incluir, na barra de acessibilidade, um botão de contraste
do background com a cor da fonte e outro botão para
ativar o modo monocromático, com o objetivo de tornar o
Amadeus acessível também para os usuários que
possuem deficiências visuais específicas (Protanopia:
deficiência com vermelho, Deuteranopia: deficiência com
a cor verde, Tritanopia: deficiência com a cor azul,
acromia: sem cores [3]). A partir de tal necessidade, as
telas do protótipo foram atualizadas para contemplar a
nova barra de acessibilidade (Figura 11).
Figura 11. Barra de acessibilidade com os novos botões.
b.Retirar a opção de “Buscar Curso” da Tela dos Cursos
(Figura 6), porque já existe uma busca no frame acima e,
deixando as duas, pode confundir o usuário DV, além de
tornar cansativo, pois o leitor de tela passará por este
componente cada vez que for selecionada a tela dos
cursos.
c. Colocar uma opção de aumentar e diminuir o volume
através do teclado, além dos botões disponíveis. Esta
melhoria é referente à Figura 9 e vai além do que pode
ser exibido na prototipação. Desta forma, fica como
sugestão para a futura implementação do protótipo.
CONCLUSÃO E PERSPECTIVAS FUTURAS
O objetivo principal deste estudo foi alinhar as necessidades
dos usuários deficientes visuais com as WCAG, propondo
interfaces acessíveis para o uso de um LMS. Usando como
estudo de caso a plataforma Amadeus, novas telas foram
prototipadas, considerando as recomendações de
acessibilidade identificadas. As telas apresentadas, e suas
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 179](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-185-320.jpg)

![Medindo Emoções em Reuniões no Second Life
Cleyton Slavieroi
Jivago
Medeirosi
Karen
Figueiredoi
Willian
Jefferson
Freitas da
Silvai
Cintia
Ramalho
Caetano da
Silva
Ana Cristina
Bicharra
Garcia
Instituto de Computação – Universidade Federal Fluminense – Niterói, RJ - Brasil
{cslaviero, jmedeiros, kfigueiredo, wsilva, ccaetano, bicharra}@ic.uff.br
RESUMO
Reuniões são capazes de alterar o estado emocional de
indivíduos, fato que pode influenciar no bom andamento
destas reuniões. A dificuldade de percepção e interpretação
das emoções dos participantes de uma reunião é um dos
fatores que podem prejudicar o trabalho colaborativo à
distância em ambientes virtuais como o Second Life.
Focando neste problema, este trabalho apresenta um
método para medir as emoções de um grupo de
participantes de uma reunião no ambiente virtual Second
Life. Além da descrição do processo de elaboração da
aplicação, este artigo também apresenta uma avaliação
preliminar da aplicação dois ambientes distintos de trabalho
colaborativo no Second Life.
Palavras-chave
Ambientes virtuais, Second Life, emoções, ambientes
colaborativos.
ACM Classification Keywords
H.5 [Information Interfaces and Presentation (e.g., HCI)]:
H5.3 Group and Organization Interfaces – collaborative
computing, computer-supported cooperative work,
synchronous interaction.
INTRODUÇÃO
Muitas empresas e grupos de pesquisa gerenciam projetos
que envolvem pessoas e equipes de trabalho distribuídas
geograficamente. Um mecanismo que dá suporte ao
trabalho colaborativo a distância é a realização de reuniões
virtuais. Nas últimas décadas, várias pesquisas vêm sendo
desenvolvidas com intuito de permitir a prática de reuniões
à distância, incluindo a execução de reuniões em ambientes
virtuais em 3D [4].
Ambientes virtuais são espaços criados por computador
para representar mundos virtuais nos quais os seus
integrantes podem interagir entre si e com objetos virtuais
em tempo real através de entidades controladas, i.e.
avatares[13]. O Second Life (SL) [11] é um ambiente
virtual que permite a criação de salas de reunião virtuais
onde os avatares podem se encontrar e discutir [4].
Apesar de no SL o senso de co-presença ser simulado
através da presença dos avatares no mesmo espaço virtual, a
manifestação da emoção dos usuários é limitada pela
execução de gestos programados para os avatares. A
dificuldade de percepção e interpretação das emoções dos
participantes de uma reunião é um dos fatores que podem
prejudicar a construção da propriedade coletiva (do inglês,
common ground), dificultando o trabalho colaborativo à
distância [6].
Além dos gestos predefinidos para os avatares limitarem a
manifestação emotiva do usuário, um gesto executado
durante uma reunião virtual pode não ser percebido pelos
outros participantes. E ainda que este gesto seja percebido
por todos os participantes, outra questão importante surge:
como registrar todos os gestos realizados em uma reunião e
transformá-los em uma informação que representa o estado
emocional do grupo reunido?
Segundo Olson e Olson [6], o estado emocional de um
grupo pode influenciar diretamente no seu desempenho ao
longo de uma reunião e na qualidade do trabalho produzido.
Avaliar este estado emocional pode auxiliar na condução da
reunião pelo mediador e, até mesmo, condicionar a
interrupção da mesma. Visando solucionar estes problemas,
o objetivo deste trabalho é elaborar um método para a
medição de emoções de um grupo de usuários no ambiente
virtual SL, analisando seu uso em reuniões realizadas neste
ambiente.
A partir desta seção, o restante deste artigo está organizado
da seguinte forma: incialmente, o ambiente virtual Second
Life é brevemente apresentado e alguns trabalhos
relacionados são discutidos; em seguida, algumas teorias
emocionais que serviram de inspiração para a criação do
nosso método de medição são abordadas; mais a frente, o
método de medição proposto, as técnicas utilizadas para sua
concepção, detalhes do modelo da aplicação e da
implementação são apresentados; uma avaliação preliminar
da utilização do método desenvolvido é apresentada logo
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA.
Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 181](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-187-320.jpg)
![depois e por fim, as conclusões e trabalhos futuros são
traçados.
AMBIENTES VIRTUAIS E SECOND LIFE
Como descrito na seção anterior, o Second Life é um
ambiente virtual. Ele foi criado pela Linden Labs,
localizada em São Francisco, Califórnia, em 2003 [13]. Este
ambiente permite a imersão dos usuários em um nível mais
elevado, comparado aos outros tipos de interação via
Internet, como conversas utilizando mensageiros
instantâneos, redes sociais e comunidades virtuais baseadas
somente em texto.
Diferente dos outros ambientes virtuais em 3D, que são, em
sua maioria, ambientes distintos do mundo real, o SL é
considerado um metaverso, pois visa reproduzir
virtualmente características do mundo real, ou da “primeira
vida” (do inglês, first life) [13]. Ainda assim, o SL
possui limitações se comparado a um ambiente real, como
restrições do próprio ambiente [3]. Uma limitação
importante é a dificuldade de trazer a sensação de realidade
ao ambiente [2], sendo esta pesquisada por nosso trabalho,
no âmbito da captura e medição de emoções.
Embora existam limitações, uma forma de contorná-las é
criando ferramentas [2] ou utilizando as ferramentas
disponíveis no próprio ambiente [13]. O SL possibilita a
criação de objetos virtuais das mais variadas formas, desde
as mais simples até as mais complexas, através das formas
primitivas que disponibiliza. Além disso, utilizando uma
linguagem de programação própria, a Linden Script
Language (LSL) [11], os usuários podem desenvolver
objetos interativos.
A possibilidade de elaborar interações entre objetos e
usuário em um mundo virtual permite superar algumas
limitações, proporcionando maior imersão dos usuários no
ambiente virtual. Na seção a seguir, abordamos alguns
trabalhos na área de ambientes virtuais colaborativos que
poderiam se beneficiar da proposta apresentada por este
trabalho.
Trabalhos Relacionados
Nesta seção abordamos algumas pesquisas que vêm sendo
desenvolvidas na última década com a finalidade de
melhorar a sensação de imersão em ambientes virtuais,
incluindo o SL.
Na área de trabalhos voltados à imersão do usuário em um
ambiente virtual, temos o trabalho de DiPaola e Collins [2],
por exemplo, tentam proporcionar maior imersão por meio
da criação de personagens que possuem expressões faciais e
que movimentam os lábios de acordo com o som emitido
pelo participante representado por esse personagem em um
ambiente virtual 3D chamado OnLive Traveler, que permite
o uso de voz para comunicação. Estas expressões faciais
são selecionadas pelo usuário, e sofrem decaimento, da
mesma forma que as emoções aplicadas neste trabalho.
Apesar os autores não especificam se as taxas são fixas ou
variáveis entre as emoções, como comentado por Picard [9],
fato este que prejudica uma representação mais fiel do
estado emocional dos usuários no ambiente proposto.
Além da procura por maior imersão dos usuários, pesquisas
vêm buscando utilizar o potencial de ambientes virtuais
para criar ambientes colaborativos virtuais, voltados
primariamente para troca de informações, em específico no
SL. Um exemplo de implementação desse tipo de ambiente
é o Time2Play [8], um jogo colaborativo educacional. O
objetivo deste é permitir que crianças criem e encenem
histórias no SL, expressando assim sua criatividade e
imaginação. Outro exemplo é o trabalho de Lucia et al. [4],
que investiga a utilização do SL no auxílio ao trabalho
colaborativo a distância, e propõe um método para
gerenciar reuniões, chamado de SLMeeting.
No que diz respeito a elementos ou objetos auxiliares
dentro de ambientes virtuais colaborativos, temos como
exemplo o Social Proxy [12], um objeto que é anexado a
tela do utilizados. O Social Proxy auxilia a visualização da
presença dos usuários em uma reunião, exibindo inclusive
quem está falando (ou digitando um texto) no momento.
Esta característica permite que a reunião possua uma
sequência bem definida, fato que é dificultado em uma
reunião virtual.
FUNDAMENTAÇÃO TEÓRICA
Conjecturando a importância das emoções, vários
pesquisadores do campo da psicologia desenvolveram
teorias que modelam a geração de emoções em humanos.
Um dos modelos mais importantes é a teoria das emoções
OCC [7]. Este modelo é especialmente difundido na área da
computação devido a sua facilidade de implementação [1].
O modelo mapeia uma lista de 22 emoções principais e
define as emoções como uma reação a um evento, que é
desencadeada por uma avaliação subjetiva do evento de
acordo com os objetivos do agente, normas e crenças.
Para descrever a composição de uma emoção, o modelo
OCC utiliza uma série de atributos, como: (i) tipo, nome da
emoção que está sendo experimentada; (ii) valência, denota
o tipo de reação (positiva ou negativa); (iii) intensidade, a
intensidade da emoção; (iv) time-stamp, o momento no qual
a emoção é criada ou atualizada. Baseado nesses atributos,
Picard [9] discute sobre a intensidade das emoções ao longo
do tempo. Para o autor, a partir do momento em que a
emoção é criada ela tende a diminuir ao longo do tempo e,
conseqüentemente, desaparecer. Emoções mais intensas
tendem a desaparecer mais rapidamente. Se nada acontece
ao agente durante certo tempo, ele se acalma retornando a
um estado neutro.
Os conceitos apresentados nesta seção serviram de base
para a elaboração do método de medição de emoções
apresentado na próxima seção deste trabalho.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 182](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-188-320.jpg)
![MEDINDO EMOÇÕES NO SECOND LIFE
Nesta seção todo processo para a elaboração da aplicação
do método de medição de emoções de um grupo de
participantes de uma reunião para o Second Life será
apresentado em detalhes, desde a sua concepção até a sua
implementação.
Reuniões
Todo o processo de modelagem e desenvolvimento do
componente foi feito através de reuniões no ambiente
Second Life. As reuniões foram realizadas, em sua
totalidade, em uma sala de reunião localizada na ilha
ADDLabs – UFF, com o objetivo de coordenar tarefas,
compartilhar informações, tomar decisões consistentes, e
estabelecer um consenso no grupo para a geração de um
produto final de qualidade. Permitindo assim, controle e
acompanhamento do processo de desenvolvimento através
do ambiente virtual.
A sala de reuniões era composta por um conjunto de
componentes para facilitar a colaboração do grupo, como
whiteboard, agenda de grupo, cronograma de tarefas,
modelo de argumentação, repositório de atas, social Proxy,
etc. Os componentes atuaram como forma de integrar a
equipe e facilitar a coordenação, comunicação e percepção.
A figura 1 mostra o grupo atuando em uma das reuniões.
Figura 1. Grupo atuando durante uma das reuniões
A proximidade com o objeto de estudo, realizando reuniões
dentro do ambiente, nos permitiu perceber as nuances da
utilização do mesmo, fato este que auxiliou na melhor
elaboração deste trabalho.
Foram realizadas seis reuniões com duração máxima de
uma hora. Antes de cada reunião era descrita uma agenda,
contendo tópicos que seriam abordados, a fim de facilitar o
gerenciamento da reunião e o grupo não se envolver em
atividades repetitivas. As agendas eram distribuídas antes
das reuniões a fim de garantir que todos os participantes
fossem informados sobre os tópicos a serem cobertos. Ao
final, era gerada uma ata de reunião, contendo decisões
tomadas, tarefas a serem realizadas por cada participante
além de um cronograma para continuação e andamento do
projeto. Toda a documentação do projeto foi armazenada no
GoogleDocs, de forma a facilitar o compartilhamento caso
o participante necessitasse de alguma informação e não
estivesse com o Second Life aberto.
O grupo atuou de forma distribuída e optou pela utilização
de comunicação via texto, que facilita o registro das
conversas para análises futuras. Uma limitação da utilização
da comunicação via texto é o intervalo de tempo entre o
envio e recebimento de uma mensagem, devido a repetições
de mensagens postadas.
Nas reuniões, foram discutidos aspectos do projeto, como a
elaboração de questionários para a criação do modelo de
usuário, forma de interação dos usuários com a proposta,
modelagens dos objetos EmotionSender e EmotionMeter,
implementação e métodos de avaliação dos resultados. As
próximas seções detalham cada um destes pontos.
O Modelo do Usuário
De forma a caracterizar e identificar os usuários que
utilizarão a aplicação proposta, um questionário1
foi
elaborado. O questionário, composto por doze perguntas,
foi criado para identificar características pessoais e detalhes
de uso do ambiente SL, além de informações que nos
auxiliaram posteriormente na definição de características da
aplicação. Treze usuários foram entrevistados no total.
Analisando as respostas obtidas, foi possível descobrir os
seguintes pontos:
(i) Os usuários que responderam o questionário são
adultos de 21 a 35 anos, e conhecem o SL, em sua
maioria, há pouco tempo (entre um e seis meses);
(ii) 46% dos usuários utilizam pelo menos uma vez por
semana esse ambiente virtual, principalmente para
reuniões;
(iii) Os usuários concordam que a utilização de objetos
criados para auxiliar reuniões, como o Social Proxy
[12], facilitam a realização das mesmas; e
(iv) 77% dos usuários entrevistados concordam que o SL
não tem meios eficazes de transmitir emoções sentidas
por participantes em uma reunião.
Aos entrevistados também foi perguntado que emoções
sentiam quando participavam de uma reunião. As emoções
utilizadas como opções no questionário foram selecionadas
a partir da lista de emoções descrita por Ortony et al. [7].
Seis emoções foram reveladas como as mais sentidas pelos
entrevistados durante uma reunião: admiração, reprovação,
contentamento, descontentamento, satisfação e insatisfação.
Essas são as emoções utilizadas em nossa aplicação.
Por fim, questões de interface e usabilidade foram
investigadas, sendo obtido que os usuários sentem-se mais
1
Questionário e modelo de usuário disponíveis em:
http://www.ic.uff.br/~kfigueiredo/emotionsSL/modeloUsua
rio.pdf.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 183](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-189-320.jpg)
![confortáveis quando eles próprios informam a emoção, ao
invés de serem alertados para informar à emoção que estão
sentindo. Além disso, uma informação importante foi sobre
a leitura do resultado da emoção do grupo pelo usuário. A
grande maioria dos entrevistados (98%) concorda com uma
transição de cores, em ordem decrescente de emoção, de
verde para amarelo e amarelo para vermelho, para informar
o que chamamos de “temperatura” da reunião. Esta e outras
questões sobre o funcionamento da aplicação desenvolvida
são melhor abordadas nas próximas seções.
Técnicas de construção e avaliação
Além do resultado final desse trabalho resultar em uma
nova aplicação para o ambiente SL, o SL também foi
escolhido como ambiente para o desenvolvimento do
trabalho. Assim, foram realizadas seis reuniões dentro do
SL em uma sala de reuniões virtual criada especificamente
para este propósito. Objetos virtuais de apoio a reuniões no
SL também foram utilizados, como um repositório de atas,
uma agenda, um acompanhamento de tarefas, um quadro
branco e o Social Proxy [12].
Para a construção da aplicação do trabalho algumas técnicas
foram adotadas. A primeira delas foi o modelo de tarefas
GOMS (Goals, Operators, Methods, and Selection Rules),
um método que representa a estrutura cognitiva do usuário
em termos de objetivos, operadores, métodos e regras de
seleção [5]. O GOMS foi utilizado como ferramenta para
documentar as interações entre os avatares e os objetos que
compõem a aplicação sob a perspectiva do usuário.
Outras técnicas de construção adotadas foram o desenho do
Modelo de Navegação e Storyboard dos objetos, que
descrevem respectivamente transições entre estados da
interface de acordo com a interação do usuário, e detalhes
de como a interface será organizada.
Para a avaliação das interfaces, foi utilizada uma técnica
denominada Avaliação Heurística. Nesta técnica, um
avaliador externo realiza uma análise sobre diferentes
interações, buscando por problemas de interface [12]. Um
grupo composto por três usuários de ambientes de reuniões
no SL serviu como avaliador externo desse trabalho, sendo
esta avaliação executada após a terceira reunião de
construção do trabalho, ponto no qual já havíamos
desenvolvido um protótipo da aplicação. Os resultados da
Avaliação Heurística foram considerados para a finalização
da aplicação.
O Modelo da Aplicação
Idealizando o desenvolvimento do método de medição de
emoções dos participantes de uma reunião no SL, o modelo
da aplicação foi concebido de forma a constituir de dois
objetos virtuais: o primeiro objeto utilizado pelos
participantes para informar às emoções que estão sentindo e
o segundo objeto, um objeto principal que recebe as
emoções dos participantes e exibe o que chamamos de
Emoção Total (ET) do grupo. Tais objetos são nomeados
EmotionSender (ES) e EmotionMeter (EM),
respectivamente.
Para medir as emoções durante uma reunião é necessário
utilizar uma instância do objeto EM, que deve estar
localizado de maneira que todos os participantes possam
visualizar o valor da ET, e n instâncias do objeto ES, sendo
n o número de participantes da reunião, para que cada
avatar possa interagir com um e somente um ES.
O ES dispõe de seis opções de emoções que podem ser
escolhidas: aprovação, reprovação, contentamento,
descontentamento, satisfação e insatisfação. Estas emoções
fazem parte das emoções principais do modelo OCC e
foram escolhidas após análise dos resultados obtidos pelo
questionário do modelo do usuário. Cada uma das emoções
possui um valor base (VB) que é multiplicado pelo peso da
emoção (p), resultando no valor final da emoção (Tabela 1).
Emoção Valência Valor
Base
(VB)
Peso
(p)
Tempo de
Expiração
Aprova-
ção
+ 0.2 1 25 minutos
Reprova-
ção
- 0.2 1 25 minutos
Conten-
tamento
+ 0.2 2 10 minutos
Desconten
-tamento
- 0.2 2 10 minutos
Satisfação + 0.2 5 5 minutos
Insatis-
fação
- 0.2 5 5 minutos
Tabela 1. Constituição das emoções
Os valores utilizados como peso para as emoções são
baseados no trabalho de Poel et al. [10]. Ao enviar uma
emoção pelo ES, o valor da emoção pode incrementar ou
decrementar o valor da ET de acordo com a valência da
emoção. A Figura 1 apresenta o modelo da aplicação
proposta.
Figura 1. Modelo da aplicação
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 184](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-190-320.jpg)
![Figura 2. Storyboard do objeto EmotionSender
As emoções também possuem um tempo de expiração
associado que passa a contar a partir do seu time-stamp,
neste caso, o momento em que o participante envia a
emoção pelo ES. O tempo de expiração de cada emoção foi
definido de forma inversamente proporcional ao peso da
emoção, seguindo a idéia de Picard [9] de que emoções
mais intensas tendem a desaparecer mais rapidamente.
Logo, quando o tempo de expiração é atingido, o valor da
emoção é retirado ou acrescentado (de acordo com o oposto
da valência da emoção) do valor da ET. A Tabela 1 mostra
todos os valores associados a cada emoção.
Além do valor da emoção, o valor da representatividade do
participante perante o total de participantes da reunião é
considerado no cálculo da ET. O valor final incrementado
ou decrementado da ET é dado através da fórmula:
O valor da ET é representado como uma porcentagem, e ao
iniciar a reunião, o EM é iniciado com o valor de ET em
100% Ao longo da reunião, conforme os participantes
enviam as emoções, este valor varia, nunca ultrapassando o
limite superior, 100%, ou inferior, 0%. De acordo com o
valor da ET, o EM exibe uma cor diferente (Tabela 2),
como mais uma forma dos participantes identificarem a ET
da reunião. Este padrão cromático foi escolhido de acordo
com os resultados apresentados na seção sobre o modelo de
usuário.
A próxima seção apresenta com mais detalhes a interface
dos objetos ES e EM e como a interação entre os avatares e
os objetos é dada.
Os Objetos da Aplicação
O EmotionSender é o objeto utilizado pelos participantes
para informar as emoções que estão sentindo durante a
reunião. Ao interagir com o ES, além de poder selecionar
uma emoção para ser enviada, o usuário também pode
consultar a ajuda de utilização do objeto como mostra o seu
storyboard (Figura 2).
Valor
da ET
Cor Significado
0-24% Vermelha Mau sinal - os participantes
não estão gostando da reunião
25-49% Amarela Sinal de alerta - alguma coisa
está incomodando os
participantes
50-
100%
Verde Bom sinal - o grupo está
apreciando a reunião
Tabela 2. Padrão cromático do EmotionMeter
O EmotionMeter é o objeto principal com o qual os
participantes da reunião poderão visualizar a “temperatura”
da mesma, i.e., o valor da ET do grupo. Por esta razão, a
forma de um termômetro foi escolhida para representar este
objeto. O EM possui dois estados principais: ligado e
desligado. Quando desligado, o usuário pode ligar o objeto
e consultar a ajuda de utilização do objeto. O objeto
desligado não fica habilitado a receber emoções dos
EmotionSender’s presentes. Ao ligar o EM, o usuário é
solicitado a informar o número de participantes da reunião e
a partir desse momento o EM passa a exibir a ET e a
receber as emoções dos ES. Enquanto o EM está ligado, o
usuário tem as opções de reiniciar o objeto, desligar e
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 185](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-191-320.jpg)
![Figura 3. Captura de tela da execução de um dos testes no ambiente de reunião (EmotionSender’s na mesa, e EmotionMeter na
parede do ambiente de reunião)
consultar a ajuda. Ao reiniciar o EM, o valor da ET retorna
a 100% e o usuário é solicitado a confirmar o número de
participantes da reunião.
Devido a limitações de espaço, não apresentaremos neste
trabalho os storyboards do EM, o GOMS e modelos de
navegação dos objetos.
Implementação dos Objetos
Esta seção descreve alguns pontos importantes da
implementação dos objetos EM e ES, que foi feita
utilizando a linguagem LSL (para a criação de scripts no
ambiente SL).
A troca de mensagens entre objetos e avatares é um dos
pontos mais importantes no que diz respeito a
implementações em LSL, sendo a função llSay uma das
mais utilizadas para esse fim. Quando uma mensagem é
enviada utilizando esta função, ela pode ser ouvida por
avatares e objetos em um raio de até 20 metros de distância
a partir do ponto em que foi emitida. Nesta função são
passados como parâmetros o canal pelo qual se deseja
enviar a mensagem e a mensagem a ser enviada, essa tendo
até 1024 bytes. Para que um objeto receba as mensagens de
determinado canal, devemos programá-lo para escutar o
canal pretendido, essa definição é feita utilizando a função
llListen [11].
Na implementação dos objetos EM e ES foi fundamental
descriminar os tipos de mensagens trocadas pelos objetos e
agrupar cada tipo de mensagem em um canal diferente. A
Tabela 3 ilustra o cenário implementado, onde diferentes
mensagens trafegam por diferentes canais. Para a escolha
de canais, foi necessário observar como os mesmos
funcionam neste ambiente.
O SL disponibiliza 2.147.483.647 canais para comunicação
entre canais negativos e positivos. A utilização destes
canais é feita segundo a regra: canais com numeração
menor que zero são utilizados para comunicação somente
entre objetos; canais acima de zero são utilizados para
comunicação privada (tanto entre objetos quanto entre
objetos e avatares); e o canal zero é utilizado para
comunicação pública (broadcast).
Canal Objeto
Emissor
Descrição de uso
777 EmotionMeter Canal utilizado pelo EM
para informar o seu estado
(ex: ligado ou desligado)
para os ES
778 EmotionSender Canal definido para o envio
de emoções pelos ES
779 EmotionMeter Por esse canal, o EM retorna
para o ES o valor
relacionado a emoção
enviada que realmente foi
utilizado (somado ou
subtraído) na ET
800 EmotionSender Quando o tempo de
expiração de uma emoção
enviada é atingido, o valor
anteriormente enviado pelo
canal 779 pelo EM é
retornado a ele pelo ES para
que a ET seja atualizada
801 e
802
EmotionMeter Comunicação entre as partes
do próprio objeto para a
troca de cores.
Tabela 3. Troca de mensagens entre os objetos por diferentes
canais
Para a implementação, foram necessários utilizar canais
com numeração positiva, haja visto que estes objetos
poderiam trocar mensagens com os avatares. A numeração
alta foi utilizada para garantir que não houvesse outros
usuários (ou objetos) utilizando o mesmo canal no
momento de comunicação.
Entretanto, o SL não permite que canais sejam utilizados
exclusivamente por um usuário ou um objeto ou grupo de
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 186](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-192-320.jpg)







![tomou por base os estudos de Padovani e Moura (2008). A
seguir são apresentadas as imagens das infografias
selecionadas (fig. 13 e fig. 14) e, também, as respectivas
análises.
Figura 13. Infográfico sobre a gripe H1N1.
Fonte: site G1, 2009.
Figura 14. Infográfico sobre a gripe A H1N1.
Fonte: jornal ZH, 2009.
O tema dos infográficos em estudo trata da gripe A H1N1,
as telas das duas infografias (fig. 13 e fig. 14) são
compostas com textos, ilustrações, títulos, linhas, barras
coloridas, fundo e pictogramas. Conforme Lupton e Phillips
(2008), muitos destes elementos e fenômenos visuais como
ponto, linha e plano, até escala, cor, hierarquia e camadas,
entre outros, convergem no design de diagramas
[infografias], onde no “reino dos gráficos de informação, a
estética destes elementos, permanece importante”,
adquirindo significados específicos dependendo da forma
como são articulados e em função de suas marcas gráficas e
relações visuais (LUPTON E PHILLIPS, 2008, p. 199).
Sobre a interatividade dos infográficos digitais
Quanto ao tipo de interatividade apresentada, os
infográficos (fig. 13 e fig. 14), são classificáveis na
categoria instrução, porque permitem a interação do usuário
por meio de botões.
O infográfico do site G1 (fig. 13), além dos botões,
apresenta também abas superiores que, tecnicamente,
desempenham as mesmas funções que os botões, porém
oferecem uma visão geral do sistema, permitindo que o
usuário mude de seção de forma mais rápida.
Nenhum dos infográficos estudados (fig. 13 e fig. 14)
oferecem possibilidades interativas dos tipos identificados
como manipulação ou como exploração (fig. 15).
Níveis de interatividade
Infográficos Instrução Manipulação Exploração
G1 (Fig. 13) X – –
ZH (Fig. 14) X – –
Figura 15. Tabela de níveis interatividade.
Fonte: Tabela dos autores.
Assim, também, não proporcionam ao usuário uma
experiência aprofundada de imersão, com possibilidades de
modificação ou personalização da interface. Além disso,
não propiciam, ainda, experiências com a interatividade que
é possibilitada nos ambientes web 3D.
Aspectos de navegação dos infográficos digitais
Considerou-se que os modos de navegação se dividem em
um número maior de categorias, com distinções sutis.
Portanto, desenvolveu-se uma investigação, na qual os
endereços eletrônico-digitais dos infográficos, foram
visitados e os objetos foram estudados diversas vezes. Nas
visitas e nos estudos, procurou-se as possíveis coincidências
entre os caminhos de navegação dos infográficos,
considerando os parâmetros de navegação propostos por
Padovani e Moura (2008).
De modo geral, o infográfico do G1 (fig. 13) não pode ser
classificado como End-of-branch, porque o usuário não
possui sinalização de links visitados.
Caso o usuário tenha um critério definido e queira, por
exemplo, verificar a primeira e a terceira aba do
infográfico, ficando satisfeito com as informações
adquiridas, a navegação no infográfico do G1 (fig. 13) pode
ser classificada como End-of-likely places, porque o usuário
definiu o sistema de busca e visitou apenas alguns nós da
rede ou sistema. O infográfico do G1 (fig. 13) permite
também os outros tipos subsequentes de navegação, exceto
o Map-node-map, porque o infográfico não apresenta um
mapa de navegação, como acontece comumente em um site.
No infográfico do jornal Zero Hora (fig. 14) também não há
sinalização de links visitados, portanto, não possibilita o
tipo de navegação End-of-branch. Contudo, possibilita a
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 194](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-200-320.jpg)



![Observações Etnográficas na Avaliação da Usabilidade de
Dispositivos Móveis de Coleta de Dados Estatísticos
Patricia Tavares
Departamento de Informática Aplicada
da Universidade Federal do Estado do
Rio de Janeiro (UNIRIO) e IBGE
patricia.tavares@uniriotec.br
Luiz Agner
Instituto Brasileiro de Geografia e
Estatística (IBGE) e UniverCidade
luizagner@gmail.com
Simone Bacellar Leal Ferreira
Departamento de Informática Aplicada
da Universidade Federal do Estado do
Rio de Janeiro (UNIRIO)
simone@uniriotec.br
RESUMO
O presente artigo apresenta o método, resultados e
conclusões preliminares de observações de campo
inspiradas em técnicas etnográficas. Foi analisada a
usabilidade do aplicativo desenvolvido para os PDAs
(Personal Digital Assistants) da Pesquisa Nacional por
Amostra de Domicílios Contínua do IBGE. A técnica foi
aplicada com a participação de entrevistadores que utilizam
PDAs, dispositivos móveis para coleta de dados durante as
pesquisas domiciliares do Instituto. As conclusões obtidas a
partir das “observações etnográficas” revelaram dados
qualitativos inusitados sobre a usabilidade. Os autores
reuniram relatos sobre o emprego do PDA no ambiente de
campo, apontando seus principais problemas de uso.
Palavras-chave
Usabilidade, PDA, metodologia, etnografia, design,
estatística.
ABSTRACT
This article presents the methodology, results and findings
of field observations where we analyzed the usability of the
software developed for PDAs of the IBGE National
Household Sample Continuous. Ethnography inspired field
observations were applied with the participation of users
who use mobile devices to collect data for statistical
research. The conclusions from field observation
qualitative data revealed to be surprising or unusual. To
register difficulty of use, the authors gathered reports of
interviewers on the use of PDA in the field environment,
pointing out its major problems.
Keywords
Usability, PDA, methodology, ethnography, design, statistics.
INTRODUÇÃO
Com o avanço da tecnologia da informação, as pessoas e as
organizações necessitam cada vez mais de sistemas
desenvolvidos com qualidade. Como é por intermédio das
interfaces que as pessoas se comunicam com os sistemas
para executar suas tarefas, elas precisam ser cada vez mais
projetadas com foco na usabilidade [6].
Existem diferentes métodos de avaliação de usabilidade: há
aqueles sem a presença de usuários - os “métodos de
inspeção” ou “métodos analíticos ou prognósticos”; e há
aqueles que envolvem usuários, chamados de “método de
observação” ou “testes com os usuários”. Estes podem ser
realizados em seu contexto de uso, no campo, ou em
ambientes monitorados, como os laboratórios de
usabilidade [4].
O método proposto neste trabalho representa o mix de
quatro abordagens diversificadas de avaliação: a observação
em contexto de uso (aqui referida também pela expressão
“observação etnográfica” – mas deixando claro que não se
trata do método tradicional da etnografia, tal como é
concebida e aplicada pelas ciências sociais), os testes de
usabilidade com emprego de laboratório portátil, as
entrevistas semi-estruturadas, e a inspeção heurística.
Na primeira fase do método, o usuário foi observado em
seu contexto primordial de uso, ou seja, utilizando o PDA
(Personal Digital Assistants) em visitas de campo, ao
entrevistar cidadãos em seus domicílios. A segunda fase
consistiu em uma observação feita em ambiente semi-
controlado, onde o usuário foi entrevistado e observado, em
local de trabalho, realizando tarefas que simulam situações
verdadeiras que ocorrem, com freqüência, nas suas
atividades de campo.
O método proposto aqui foi desenvolvido e aplicado para
avaliação de usabilidade de um software criado para o PDA
a ser utilizado pelos entrevistadores da Pesquisa Nacional
por Amostra de Domicílios Contínua (PNAD Contínua) do
Instituto Brasileiro de Geografia e Estatística (IBGE) [12].
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 198](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-204-320.jpg)
![Neste artigo, será dada ênfase especial à parte inicial do
método que trata da aplicação de observações etnográficas,
de caráter exploratório, e seus resultados. A segunda fase
do método já foi explorada em outros textos de
comunicação científica [12].
A TECNOLOGIA EM CONTEXTO DE COLETA DE
DADOS
Segundo Greene [5], a introdução de uma tecnologia pode
transformar o contexto de uma entrevista para coleta de
dados estatísticos e pesquisas domiciliares, contribuindo
para a sensação de que este é um evento importante para o
informante.
Em alguns casos, a curiosidade sobre a tecnologia pode
chamar mais pessoas para observar ou participar das
entrevistas. Às vezes isso ajuda a “quebrar o gelo”, ficando
mais fácil falar com outros membros de uma família ou da
comunidade. Em algumas raras situações, a tecnologia
poderá inspirar medo ou ansiedade [5].
Os métodos de coleta de dados assistida por computadores
são conhecidos pelos termos CADC (Computer-Assisted
Data Collection), ou pelo termo europeu CADAC, CASIC
(Computer-Assisted Survey Information Collection) e CAI
(Computer-Assisted Interviewing); os métodos tradicionais
de papel e lápis são muitas vezes denotados por PAPI
(Paper-And-Pencil Interviewing).
A característica principal das entrevistas apoiadas por
computador é que as perguntas são orientadas na ordem
correta, seguindo um algoritmo disponibilizado em um
programa interativo na tela do computador.
O software tem a capacidade de configurar a ordem e o tipo
de questões baseando-se nas respostas anteriores, ou na
informação que já dispõe sobre o entrevistado. As respostas
são inseridas diretamente neste computador por um
entrevistador ou pelo próprio entrevistado [7].
Como alternativa aos questionários em papel, a CADC é
bem aceita pelos entrevistados e pelos entrevistadores e a
qualidade dos dados melhora, especialmente quando os
questionários complexos são utilizados.
Em geral, os entrevistados reagem positivamente ao uso do
computador durante uma entrevista: eles atribuem um
maior grau de profissionalismo à pesquisa. A interação
social com o entrevistador é descrita como confortável [7].
A pesquisa que representa o objeto de estudo deste trabalho
– a PNAD Contínua – representa mais uma iniciativa do
Instituto Brasileiro de Geografia e Estatística no sentido de
integrar a tecnologia móvel para apoiar o processo de
entrevista e de coleta de dados sobre as condições de vida
da população brasileira - através do desenvolvimento e da
aplicação de um questionário eletrônico (figura 1), como já
ocorreu nos Censos 2007 e 2010.
A PESQUISA PNAD CONTÍNUA
A PNAD Contínua é uma nova pesquisa do IBGE, que
pretende permitir uma investigação contínua sobre trabalho
e rendimento da população. Ela é o resultado da fusão de
duas pesquisas do Instituto, a Pesquisa Mensal de
Empregos e a Pesquisa Nacional por Amostra de
Domicílios [8].
O IBGE começou a testar a metodologia e o sistema, a
partir de outubro de 2009, nos estados do Pará,
Pernambuco, Rio de Janeiro, São Paulo, Rio Grande do Sul
e no Distrito Federal, prosseguindo com o teste, no ano de
2010, no Rio de Janeiro. Em 2011, a pesquisa será
oficialmente lançada em todo o País [9].
A PNAD Contínua é realizada a partir de uma amostra de
aproximadamente 179.000 domicílios e tem como núcleo
básico questões sobre trabalho e rendimento. Além disso,
vai investigar temas adicionais, como: educação de jovens e
adultos, migração, educação profissional, trabalho infantil,
fecundidade, mobilidade social, nupcialidade, saúde,
segurança alimentar, tecnologia da informação e
comunicação, transferências de renda e uso do tempo [8].
Para a sua coleta de dados, foram desenvolvidos sistemas
para PDA e sistemas de gerenciamento dos dados. Este
estudo de usabilidade analisou a facilidade de uso do
aplicativo desenvolvido para o dispositivo móvel com o
objetivo de gerar recomendações para torná-lo mais
eficiente e adequado, aprimorando a qualidade e a
satisfação na coleta de dados.
Figura 1 - Detalhes da interface do protótipo da PNAD
Contínua para dispositivo móvel, versão 1.0.9.
O método de avaliação de usabilidade aplicado no presente
trabalho, batizado por nós de entrevistas baseadas em
cenários e tarefas, procurou preservar as características
essenciais de um método científico, para emprestar
credibilidade às suas conclusões e à apresentação dos seus
resultados. Este método foi desenvolvido para atender às
condições e às peculiaridades do contexto do IBGE e já
havia sido experimentado anteriormente na avaliação da
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 199](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-205-320.jpg)
![usabilidade de um aplicativo para o Censo Demográfico
2010, tendo sido apresentado e discutido em comunicações
científicas anteriores [12].
A pesquisa, de caráter qualitativo, teve seis etapas: (a)
pesquisa bibliográfica e documental; (b) observações
etnográficas; (c) seleção da amostra de participantes; (d)
entrevistas baseadas em cenários e tarefas; (e) análise dos
resultados; (f) comunicação dos resultados.
Neste paper, serão apresentados os detalhes e alguns
resultados qualitativos reunidos durante a etapa de
“observações etnográficas”. Deixamos claro, entretanto,
que este termo proposto não deve ser confundido com a
aplicação tradicional do método etnográfico, tal como é
compreendido por outras disciplinas, como explicaremos a
seguir.
TÉCNICAS ETNOGRÁFICAS EM IHC
Segundo Cooper [3], etnografia é um termo tomado
emprestado da Antropologia que significa um estudo
imersivo e sistemático de culturas humanas. Segundo Burke
e Kirk [1], a etnografia não é um método, é mais
propriamente uma categoria de pesquisas em Interação
Humano-Computador.
Tendo sido adotada na Antropologia e na Sociologia, a
etnografia se baseia na observação de interações humanas
em um dado ambiente ou atividade social. Pode ser descrita
como a observação de pessoas em seu contexto cultural.
Uma cultura é formada por determinados valores, práticas,
relações e identificações. Deste modo, um ambiente de
trabalho (como um escritório ou uma fábrica) pode ser
descrito como uma cultura, pois é caracterizado por
padrões, práticas de negócios (formais ou informais), e por
relações entre colegas de trabalho e com os gerentes.
De acordo com os autores acima citados, há uma série de
razões pelas quais a etnografia passou a ser importante para
o projeto de interface. Essas razões são as seguintes:
1 - o estudo etnográfico é um meio poderoso de identificar
as necessidades do usuário e enxergar o sistema pelo olhar
do usuário.
2 - descobre a verdadeira natureza do trabalho realizado: é
muito comum os usuários desempenharem suas tarefas de
modo diferente daquilo que foi prescrito. No caso de uma
coleta de dados assistida por computador, por exemplo, nós
descobrimos que o estudo etnográfico poderá ser útil ao
evidenciar se os usuários enunciam as perguntas da
entrevista empregando linguagem informal ou popular, de
modo diverso do que é proposto no questionário eletrônico
oficial. Ou, ainda, será possível observar se desenvolvem
confiança no dispositivo, ou se freqüentemente procuram
realizar um bypass no seu funcionamento normal, com o
intuito de evitar lentidão, travamentos ou perda de
informações.
3 – outra vantagem do estudo etnográfico é que o
pesquisador obtém um alto grau de compreensão do usuário
e pode desempenhar o seu papel em sessões de projeto
participativo.
4 - a natureza aberta (não enviesada) da etnografia habilita
o registro de revelações surpreendentes sobre como o
sistema é utilizado no campo.
Como nos estudos sociológicos, os etnógrafos precisam
estar imersos na cultura do usuário para melhor entender o
que se passa em torno dele. Assim, os etnógrafos devem
olhar, participar e perguntar sobre as atividades do seu dia-
a-dia. Sob o ponto de vista do projeto, deve-se começar a
raciocinar como um usuário.
Se o objetivo da etnografia social é compreender como o
indivíduo ou grupo interage dentro de sua cultura, na
etnografia para o projeto de sistemas, por outro lado, o
objetivo é verificar como o sistema é realmente utilizado.
Visa a identificar problemas na maneira como é usado,
assim como os efeitos do sistema na cultura específica do
local de trabalho, para descobrir possibilidades de
desenvolvimento, dentro daquela atividade ou local.
Os métodos etnográficos podem descobrir fatos inusitados e
valiosos que jamais seriam identificados por métodos in
house. A maior parte dos dados do estudo etnográfico é
elicitado através de observação pessoal, entrevistas ou
gravações em áudio e vídeo. Seus resultados são
informações qualitativas como declarações, impressões,
opiniões e descrições do ambiente ou local.
Segundo Burke e Kirk [1], há termos empregados em IHC
que são praticamente sinônimos de etnografia como:
1 - estudos de campo: termo alternativamente utilizado no
sentido de etnografia;
2 - investigação contextual (contextual inquiry): método
ligeiramente mais específico, focado no modo de dirigir
perguntas ao usuário;
3 - estudo observacional: significa simplesmente olhar o
usuário em seu contexto de trabalho, sem dirigir-lhe
quaisquer perguntas;
4 - observação participante: focada em realizar as
atividades cotidianas de trabalho, lado a lado com o
usuário.
Para Cooper [3], estudos contextuais desenvolvidos no
processo do design de interação devem trazer o espírito da
pesquisa social etnográfica e aplicá-lo em um nível micro.
Em vez de tentar compreender comportamentos e rituais
sociais de uma cultura inteira, seu objetivo deve ser
compreender comportamentos e rituais de grupos de
pessoas que interagem com produtos específicos.
Hugh Beyer e Karen Holtzblatt (apud [3]) foram os
pioneiros na aplicação de uma técnica de “entrevistas
etnográficas”, a que eles denominaram contextual inquiry
(investigação contextual). Esta técnica se tornou
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 200](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-206-320.jpg)
![rapidamente uma referência na indústria de software. O seu
método foi baseado no modelo mestre-aprendiz, ou seja, o
entrevistador observava e fazia perguntas como se fosse um
principiante e o usuário, o seu mestre.
Os dois autores citados enumeraram quatro princípios
básicos que notabilizam o seu método etnográfico:
1 - Contexto: em vez de entrevistar usuários em uma sala
branca e asséptica, a observação e a interação devem se dar
no seu ambiente comum de trabalho, fornecendo o contexto
apropriado para o produto.
2 - Parceria: a entrevista deve ocorrer de modo a ser uma
exploração colaborativa com o usuário, alternando-se entre
a observação do trabalho e a discussão sobre a sua estrutura
e detalhes.
3-Interpretação: a maior parte do trabalho do pesquisador
será ler nas entrelinhas o que acontece a partir dos dados
reunidos sobre o comportamento dos usuários, o que eles
declaram e como se relacionam com o seu ambiente.
4-Foco: o designer deve sutilmente direcionar a entrevista
para captar dados relevantes ao projeto do software.
Cooper et al. [3] enumeram os seguintes melhoramentos
emprestados por sua equipe à técnica original da
investigação contextual de Beyer e Holtzblatt, visando a
maior eficiência na sua prática projetual:
- Encurtamento: a investigação contextual propõe
entrevistas de dia inteiro, mas Cooper considera suficiente
realizar entrevistas de campo com não mais que uma hora
de duração, com cerca de seis usuários bem-selecionados;
- Equipes enxutas: apesar de Beyer e Holtzblatt proporem
uma equipe grande, Cooper et al. sugerem ser mais eficaz
realizar observações, seqüencialmente, com uma equipe de
trabalho enxuta formada por duas ou três pessoas. Todos os
observadores devem interagir com os usuários além de
analisar e compilar os dados;
- Identificação de objetivos: a identificação e a priorização
dos objetivos dos usuários devem ser realizadas antes de
relacionadas as tarefas específicas;
- Pesquisar além do contexto corporativo: a “entrevista
etnográfica” pode buscar informações e ser aplicada
também fora do contexto corporativo.
Cooper et al. explicam que as suas “entrevistas
etnográficas” podem ser agrupadas de modo a refletir
diferentes fases cronológicas, com foco mais abrangente e
amplo, no início, passando a abordar funções e tarefas
específicas nas últimas etapas. Os stakeholders podem ser
acionados para agendar entrevistados adequados a cada fase
do ciclo de entrevistas.
Para Cooper, as regras básicas das “entrevistas
etnográficas” são: entrevistar no local onde a interação
acontece; evitar perguntas fixas; focar em objetivos
primeiro, só depois em tarefas; evitar transformar o usuário
em designer de interface; evitar discussões sobre
tecnologias; encorajar a contação de histórias; solicitar a
demonstração dos artefatos pelo usuário; não formular
perguntas que geram vieses nas respostas.
Após cada “entrevista etnográfica”, a equipe de projetistas
deve se reunir, comparar e discutir as observações,
verificando se questões levantadas pelas entrevistas
anteriores foram respondidas. As fotos e os vídeos devem
ser revisados e postados em um local público, como um
mural. Será útil utilizar esses dados na preparação da
estratégia a ser adotada durante as próximas observações.
ACOMPANHAMENTO DE TRABALHO DE CAMPO
Os autores agendaram acompanhamentos com equipes em
trabalhos de campo da PNAD Contínua, onde o dispositivo
móvel de coleta de dados pode ser observado em seu
contexto real de uso. O objetivo foi reconhecer os
problemas e compreender as dificuldades e as vantagens da
coleta de dados assistida pelo PDA e como o dispositivo
impacta o comportamento do entrevistador e do informante.
Para compreender melhor como o entrevistador da PNAD
Contínua realiza seu trabalho, os autores acompanharam
três equipes do IBGE em entrevistas domiciliares reais da
pesquisa.
Em primeiro lugar, participaram de uma visita de campo no
bairro do Leblon. Em seguida, acompanharam uma equipe
de trabalho do IBGE em diversos bairros no subúrbio
carioca (Encantado, Piedade, Bonsucesso e Higienópolis).
Em outra ocasião, os autores realizaram visita a uma
agência de coleta. Depois disso, foi empreendida visita de
campo a Tanguá (figura 2), no interior do Estado do Rio de
Janeiro, uma área com características rurais.
Figura 2 - Registro de observações etnográficas:
entrevistador aborda um domicílio selecionado em Tanguá,
setor com características rurais no Estado do Rio de Janeiro.
As nossas observações etnográficas realizadas durante o
acompanhamento dessas equipes no campo foram
registradas em imagens, entrevistas em áudio e vídeo, e
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 201](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-207-320.jpg)
![anotações, apresentando a visão do usuário sobre a
interação com o dispositivo móvel no campo.
Como conclusão mais evidente dos acompanhamentos em
contexto de uso, percebeu-se a importância da usabilidade
na construção de aplicativos para os PDAs. Tais
equipamentos possuem limitações físicas, como telas e
teclados reduzidos. A navegação intuitiva e a identificação
eficiente de conteúdos textuais são necessidades absolutas
em dispositivos móveis em situação de pesquisa.
Em geral, usuários em ambientes fixos concentram-se
melhor enquanto que, em ambientes móveis, tendem a se
distrair em função de atividades que acontecem no
ambiente [10].
Os autores do artigo puderam verificar que, como são
utilizados em ambientes externos, os PDAs precisam
suportar condições ambientais adversas (calor, frio,
umidade, seca, luz natural e artificial), dependendo do local
de uso. Concordamos com Simões et al. [11] que o público-
alvo é um desafio, pois o trabalho de campo é realizado
com milhares de pessoas de variados perfis e localizações
geográficas.
A mobilidade impõe limites físicos, visuais e cognitivos ao
usuário [2]. Somam-se a estes fatores a dificuldade de
acesso a domicílios (áreas de alto risco, distantes ou rurais,
em condomínios classe média alta), onde cada vez mais o
informante tem restrições de receber o entrevistador. Para
registrar tais dificuldades, os autores reuniram relatos dos
entrevistadores sobre o uso do dispositivo móvel no
ambiente externo, apontando seus problemas.
O contraste de cores da tela do PDA com a luz solar foi o
problema mais citado nestes relatos: os pesquisadores
fotografaram o dispositivo sob a incidência da luz do sol e
puderam comprovar a gravidade desse problema, que
impede a leitura do questionário (figura 3).
Figura 3 - O dispositivo da PNAD Contínua sob a
incidência da luz solar: legibilidade prejudicada.
RELATÓRIOS DE OBSERVAÇÕES
Nos três textos a seguir, apresentamos partes selecionadas
dos relatórios elaborados pelos autores a partir das
observações etnográficas relacionadas à fase de testes da
pesquisa PNAD Contínua. Os textos representam sínteses
gerais das observações dos pesquisadores; todos os nomes
de indivíduos citados foram alterados para preservação de
privacidade.
Relatório de Trabalho de Campo no Leblon
Numa ensolarada tarde de outono, fomos acompanhar o
trabalho de campo de um dos entrevistadores da pesquisa
PNAD Contínua, no Leblon, um bairro nobre da zona sul
do Rio de Janeiro.
Estávamos em campo eu, Manuela, que trabalha junto à
Diretoria de Informática e integra a da equipe de
desenvolvimento do aplicativo do PDA, Roberto, um
supervisor da pesquisa, responsável pela área, e Reinaldo,
o entrevistador destacado para acompanharmos, que iria,
nesse dia, trabalhar numa rua do alto Leblon.
Esta área apresenta a característica de possuir muitos
edifícios residenciais de famílias de classe média alta que,
não raro, moram em grandes apartamentos ou em
coberturas de luxo.
Após cerca de dez tentativas infrutíferas de abrir domicílios
para aplicar o questionário da PNAD Contínua, finalmente
conseguimos entrar em uma residência a ser pesquisada. O
supervisor Reinaldo ficou nos aguardando na portaria e
subimos pelo elevador até uma das coberturas, onde fomos
recebidos por dona Marlene, que estava em casa
acompanhada da empregada. Reinaldo apresentou-me e a
Manuela como supervisores e perguntou se poderíamos
acompanhar a entrevista, no que obtivemos a anuência da
dona da casa, embora não sem demonstrar certa surpresa
quanto ao número de pessoas a entrar em sua casa.
Ao entrarmos, dona Marlene nos encaminhou para uma
ampla varanda, decorada com vasos de plantas e muito
bom gosto, onde havia dois sofás, cadeiras e uma mesa de
centro. Reinaldo sentou-se no local indicado pela
entrevistada, mas logo foi forçado a reacomodar-se devido
à luminosidade solar que incidia sobre o seu PDA,
impedindo a visibilidade de sua operação.
A entrevista iniciou-se às 11h25min e terminou por volta
das 12h25min. Durante a observação da entrevista e do uso
do dispositivo de mão, eu e Manuela pudemos registrar por
escrito diversos detalhes da interação com o informante.
A maior parte das perguntas dirigidas à entrevistada foi
enunciada de modo informal. Observamos que o
entrevistador (considerado pela chefia um dos seus
melhores funcionários) adaptou, à sua maneira, as
perguntas que a pesquisa apresentava na tela do PDA,
empregando linguagem bastante coloquial. Tal estratégia
contribuiu para descontrair a entrevista, aproximando-a de
uma conversação comum.
A entrevistada passou a conversar em tom informal com o
entrevistador, dando mais detalhes do que o que estava
sendo estritamente perguntado. Isso gerou a necessidade de
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 202](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-208-320.jpg)


![aparentando ter uns quarenta anos. Mais tarde, revelou ser
lavrador.
Ubiratan buscou uma sombra na varanda, sentando-se na
sua mureta, tendo sido acompanhado pelo dono da casa.
Após solicitar e beber um copo d’água, ele ligou o seu
PDA, começou a usá-lo silenciosamente; o informante
estava com paciência e, ao mesmo tempo, mostrava
curiosidade, esperando pelas perguntas. A entrevista
começou por volta de 12:15h.
Ubiratan foi empregando palavras simples e assim
conseguiu ganhar a confiança do informante para obter os
dados que precisava.
O informante ficou um pouco envergonhado ao falar o
quanto ganhava por mês. Disse que era lavrador, mas que
muitas vezes não ganhava nada porque perdia toda a
lavoura. Ele respondeu com educação a todas as
perguntas, mas não compreendeu aquela que indagava se
ele gostaria de trabalhar mais horas.
Ubiratan gastou um tempo explicando o propósito desta
pergunta para o homem, mas ele não conseguiu entender.
Gláucio também tentou explicar, mas ele e a esposa
continuaram com dúvidas. Como iria alguém querer
trabalhar mais se já trabalhava tanto?
Na hora de responder ao questionário relativo à sua
esposa, o lavrador a chamou para ajudar. Ela disse que
voltou a estudar à noite e que ia de bicicleta para a escola.
Era empregada doméstica; ganhava cerca de R$ 350,00
por mês. Ubiratan não perguntou quem era o responsável
pelo domicílio, por isto, não sabemos se ele apontou o
lavrador ou a esposa. Enquanto ocorria a entrevista, eu e
Carlos íamos registrando nossas observações por escrito.
Percebemos que as pessoas eram simples, mas educadas e
não cometiam muitos erros de linguagem. Um segundo
homem de meia idade que não se identificou e a filha do
casal, de cerca de uns dez anos, uniram-se ao grupo da
varanda, demonstrando curiosidade. No quintal da casa,
circulavam galinhas e patos e o galo cantava. Pareceu-nos
que a família consumia quase tudo o que plantava.
A entrevista durou cerca de 45 minutos. Nos despedimos,
tiramos fotos e fomos embora. Respondendo a uma
indagação de Carlos, Ubiratan disse no carro que as
últimas alterações realizadas no PDA, sugeridas pelos
estudos de usabilidade, melhoraram a interação e que o
novo teclado virtual havia ficado bem melhor.
PARA EFEITO DE CONCLUSÃO
O presente artigo apresentou a parte exploratória do método
de observações envolvendo usuários, para avaliação de
usabilidade de um dispositivo móvel de coleta de dados de
entrevistas domiciliares, com ênfase em técnicas de
observações etnográficas. Ele foi desenvolvido para ser
aplicado junto aos entrevistadores que utilizaram PDAs
durante a versão experimental da Pesquisa Nacional por
Amostra de Domicílios Contínua (PNAD Contínua).
O método de avaliação apresentou essencialmente duas
etapas: a primeira consistiu em acompanhar os usuários do
PDA em seu contexto de uso no campo (“observações
etnográficas”), e a segunda envolveu gravações e registros
sistemáticos de tarefas realizadas enquanto os usuários
interagiam com o PDA em um laboratório de usabilidade
portátil.
A segunda etapa do método foi discutida em outras
comunicações científicas [12], ficando o presente texto
reservado especificamente à apresentação de detalhes e
resultados qualitativos das observações etnográficas do
trabalho do usuário no campo.
O impacto desse tipo de entrevista apoiada por computador
na qualidade dos dados tem sido avaliado sistematicamente
por institutos de pesquisas de outros países. Sua principal
característica é que as perguntas são orientadas pelo sistema
na ordem correta, seguindo um algoritmo disponibilizado
em um programa interativo apresentado na tela do
computador. As respostas são inseridas diretamente, neste
computador, com dados digitados pelo entrevistador ou
pelo entrevistado.
Como foi visto, a etapa exploratória do trabalho incluiu
procedimentos de observação em campo inspiradas nas
técnicas da pesquisa etnográfica incorporada à IHC. Tendo
sido adotada na Antropologia e na Sociologia, o estudo
etnográfico se baseia na observação de interações humanas
em um dado ambiente de trabalho ou em uma atividade
social.
A nossa experiência demonstrou que a observação
etnográfica, tal como proposta, pode ser considerada muito
importante para o projeto de interface, pois este tipo de
estudo habilita o projetista a enxergar o sistema pelo olhar
do usuário, revelando a natureza real e não idealizada do
trabalho.
Uma série de conclusões foi obtida dos resultados dessas
observações, muitas das quais revelaram dados
surpreendentes ou inusitados. A mobilidade impõe limites
físicos, visuais e cognitivos ao usuário. Para registrar tais
dificuldades, os autores reuniram relatos de entrevistadores
sobre o uso do PDA no ambiente externo, apontando seus
principais problemas.
O contraste de cores da tela do dispositivo com a luz solar
foi um dos problemas mais citados nestes relatos: os
pesquisadores puderam conferir, na prática, a gravidade
deste evento que impacta seriamente a legibilidade do texto
das perguntas do questionário.
Somou-se a esses fatores a dificuldade de acesso a
domicílios que podem estar em áreas de risco, rurais, ou
distantes. No caso de condomínios classe média alta, cada
vez mais o informante impõe restrições de diversas ordens
para receber o entrevistador.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 205](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-211-320.jpg)
![Nas observações etnográficas que realizamos ficou também
evidente que o entrevistador - não raramente - realiza suas
tarefas de modo diverso ao que lhe foi prescrito no
treinamento. Por exemplo, utiliza linguagem coloquial e
popular para formular as perguntas, em vez de lê-las
formalmente, e inverte a ordem das questões propostas pelo
software de questionário eletrônico, com o objetivo de
reduzir a duração da entrevista, ou torná-la menos
entediante e mais natural para o entrevistado.
Evidências reunidas nos estudos de campo embasaram e
reforçaram conclusões obtidas nos testes com o emprego de
laboratório de usabilidade portátil, em ambiente semi-
controlado, paralelamente realizados. Isto nos permite
afirmar que as duas técnicas têm grande potencial quando
são aplicadas de modo complementar.
Na fase de comunicação dos resultados, as conclusões do
estudo, assim como as recomendações técnicas para a
solução de problemas de usabilidade, foram repassadas para
a equipe de desenvolvimento do software visando
implementações e correções técnicas.
Além de artigos científicos, as conclusões do presente
estudo foram apresentadas em seminário para outras
equipes internas, visando a disseminar e institucionalizar o
emprego da metodologia de avaliação de usabilidade em
dispositivos móveis, com o objetivo de contribuir para
tornar mais eficientes e seguros os processos de coleta de
dados estatísticos.
REFERÊNCIAS
1. Burke, J.; Kirk, A. Choosing Human-Computer
Interaction (HCI) Appropriate Research Methods –
Ethnographic Methods [online]. Disponível em:
http://otal.umd.edu/hci-rm/ethno.html Acesso em:
14/06/2010.
2. Burzagli, L., Billi, M., Palchetti, E., Catarci, T.,
Santucci, G., Bertini, E. Accessibility and Usability
Evaluation of MAIS Designer: A New Design Tool for
Mobile Services. Universal Access in HCI, Part II, HCII
2007, LNCS 4555, pp. 275–284, 2007.
3. Cooper, A.; Reimann, R.; Cronin, D. About Face 3: The
Essentials of Interaction Design. Indianapolis, IN; Wiley
Publishing, Inc., 2007.
4. Dias, C. Usabilidade na Web: criando portais mais
acessíveis. 2ªEd., R.J, Alta Books, 2007.
5. Greene, P.D. Handheld computers as tools for writing
and managing field data. Field Methods, 13(2):181-197.
2001. Disponível em: http://fmx.sagepub.com/content/
13/2/181. Acesso em: 02 de setembro de 2010.
6. Leal Ferreira, S.B., Nunes, R. e-Usabilidade, Rio de
Janeiro, LTC, 2007.
7. Leeuw, E.D.; Hox, J.J.; Snijkers, G. The effect of
computer-assisted interviewing on data quality. A
review. Pp. 173-198 in B. Blyth (ed.) Market Research
and Information Technology. ESOMAR Monogaph.
Amsterdam: Esomar. 1998. Disponível em:
http://igitur-archive.library.uu.nl/dissertations/2006-
1024-200101/c3.pdf. Acesso em: 02 de setembro de
2010.
8. IBGE - Instituto Brasileiro de Geografia e Estatística.
Quinto Fórum do Sistema Integrado de Pesquisas
Domiciliares por Amostragem. Disponível em:
http://www.ibge.gov.br/home/estatistica/indicadores/si
pd/quinto_forum/PNAD_Continua_Questionario.pdf.
Acesso em: 15/12/2008.
9. Leitão, M. Brasil terá um retrato da nova dinâmica do
trabalho. Disponível em: http://oglobo.globo.com
/economia/miriam/posts/2009/08/05/brasil-tera-um-
retrato-da-nova-dinamica-do-trabalho-211361.asp.
Acesso em: 29/03/2010.
10.Loureiro, A. A. F. et al. Comunicação Sem Fio e
Computação Móvel: Tecnologias, Desafios e
Oportunidades. Minicurso apresentado no Congresso da
Sociedade Brasileira de Computação. Campinas, SP.
Ago. 2003. Disponível em: http://homepages.dcc.
ufmg.br/~loureiro/cm/docs/jai03.pdf. Acesso em:
11/06/2008.
11.Simões, et al. Experiência: Coleta de dados por
computadores de mão para censos de proporções
continentais. Concurso Inovação na Gestão Pública
Federal. Disponível em: http://inovacao.enap.gov.br/
index.php?option=com_docmantask=doc_viewgid=
277. Acesso em: 11/06/2009.
12.Tavares, P.; Agner, L.; Leal Ferreira, S. B. Avaliação de
Usabilidade de Dispositivos Móveis de Coleta de Dados
Domiciliares Através de Entrevistas Baseadas em
Cenários e Tarefas. IHC 2010 – IX Simpósio Sobre
Fatores Humanos em Sistemas Computacionais.
October 5-8, 2010, Belo Horizonte, MG, Brasil.
NOTAS
Os autores agradecem aos apoios das equipes da Unidade Estadual do IBGE do Rio de Janeiro, da CODES (Diretoria de
Informática) e da Diretoria Executiva do IBGE, sem os quais esta pesquisa não teria sido possível. As opiniões emitidas neste
artigo são de exclusiva e inteira responsabilidade dos autores, não exprimindo, necessariamente, o ponto de vista do IBGE.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 206](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-212-320.jpg)
![Metodologia Projetual no Ensino de Design Digital Interativo
Paula Rigo Tramujas – Universidade Positivo /
EMBAP
Luciane Hilú – PUCPR / Universidade Positivo
RESUMO
Este presente artigo tem por objetivo apontar algumas
teorias de metodologia utilizadas para o ensino de design
em universidades, discutindo sua aplicabilidade ao universo
do design digital interativo e traçando um comparativo com
a metodologia usada na prática em uma empresa de design
americana – IDEO. Tendo este aporte teórico-comparativo
questionar-se pela possibilidade de incorporação desta no
âmbito de ensino de universitário design.
Palavras-chave do autor
Metodologia, design, ensino, universidade.
Palavras-chave de Classificação ACM
D.2.2 Methodologies: D.2.10 Design
INTRODUÇÃO
Para evidenciar a ligação íntima entre o processo de
desenvolvimento de produtos de design com o tema
metodologia, e discutir sobre os parâmetros metodológicos
necessários de serem cobertos no ensino projetual de design
digital, busca-se neste texto trazer a tona alguns conceitos
essenciais que evocam esta ligação e que podem
proporcionar o vislumbre de um caminho para a construção
do ensino neste âmbito. Com isto objetiva-se delinear
concepções específicas de metodologia para aplicação no
ensino de design digital.
Historicamente, a cada evolução do processo de
desenvolvimento de um produto, verifica-se que o design,
independente da natureza do produto que gera, como
qualquer área do conhecimento científico, sempre
demandou aporte a teorias capazes de embasar sua
produção, seus métodos de projetação e possibilitar
familiaridade com as situações de contextualização nas
quais é utilizado. Sendo assim, a aproximação da
metodologia com o design é resultado da necessidade
constante de se estabelecer um método específico para esta
área, a partir da análise dos já existentes, que possa dar
conta do desenvolvimento de um projeto específico.
Vários autores defendem a existência uma prática projetual
de design permeada por uma metodologia sinequanon, onde
as idéias são pesadas juntamente com os requisitos e
restrições inerentes ao produto a ser executado e ao
problema a ser solucionado, e são geradas e selecionadas
alternativas de solução, de forma crítica.
Desta forma, ter um projeto e uma metodologia de trabalho
bem desenvolvidos e estruturados se tornou um requisito
fundamental para o design alcançar seus objetivos. O
produto final de design se torna, pois, o resultado lógico de
um projeto que envolve métodos que visam atender à
proposta de resolver da melhor maneira todos os
componentes de um dado problema.
Porém, questiona-se se as metodologias desenvolvidas e
utilizadas como base teórica para ensino nas universidades
de design, já discutidas e sedimentadas na academia, são
passíveis de dar conta das necessidades atuais de
desenvolvimento de produtos nesta área, que envolve
atualmente outros níveis de problemática e de construção,
como o caso do design digital, que envolve desde produtos
de natureza estática quanto em movimento, incorporando
por muitas vezes o elemento interação, que traz toda
especificidade ao pensar “fazer design” atual.
“Y es que la tecnologia está permitiendo poner en
marcha planteamientos educativos que intentan
romper con las barreras establecidas por las
instituciones dedicadas e instruir a los futuros
diseñadores, en general demasiado rígidas y no
adaptadas a la realidad de los nuevos medios” [5]
ENSINO DE METODOLOGIA NOS CURSOS DE DESIGN
No âmbito universitário, tanto professor quanto o aluno
precisam utilizar algum tipo de metodologia para a solução
de seus problemas: ao professor cabe o ensino de uma
metodologia para ajudar a nortear este aluno que, para
aprender e evoluir, precisa de um caminho; ao aluno cabe a
aplicação de um método transmitido por meio do professor
em situações onde seja requisitada uma solução de
problema, que se utiliza de uma metodologia de ensino
parametrizada e aprovada pela universidade.
Especificamente na área do Design, onde as soluções de
problemas se concentram na atividade projetual, o aluno, ao
formar-se na universidade e entrar no mercado de trabalho,
de posse do conhecimento de tais metodologias poderá ou
não aplicar aquela ensinada pelo professor para atuar em
sua área de conhecimento. Com o tempo se utilizará de um
método próprio, que deverá ser influenciado pelas
referências que teve ao longo do aprendizado e experiência
no ensino superior.
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA.
Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
1
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 207](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-213-320.jpg)
![Neste sentido é imprescindível a discussão de quais
metodologias ou quais elementos metodológicos deverão
ser apresentados a este aluno durante sua permanência na
Universidade a fim de formar-lhe um arcabouço
teórico/prático e uma formação basilar de consistência para
o desenvolvimento futuro de suas particularidades no seu
próprio processo de desenvolvimento projetual.
Discussões acerca desta temática são comuns e recorrentes
ao longo da história do ensino de design, desde a Escola de
Ulm. A adoção, a partir destas discussões, de métodos
específicos na área de design é, pois, uma prática já
estabelecida. A própria história do “fazer design” ao longo
do último século, aliada à complexidade crescente de
fatores envolvidos nos projetos desta natureza passou a não
permitir mais que seu desenvolvimento se fundamentasse
apenas na intuição ou na experiência adquirida,
principalmente com o crescente desenvolvimento de nichos
de design específicos e particularizados, como o design
gráfico, o de produto e afins.
Consolidou-se, pois, um consenso geral de que, no ato
criativo de qualquer produto de design, a aplicação de
processos metodológicos é essencial para a produção de
resultados coerentes com as necessidades e expectativas
aventadas, especialmente na busca de soluções de
problemas determinados.
Estendendo as concepções de aplicação de metodologia
como item relevante na solução de problemas buscando um
alto nível criativo, verifica-se que a tendência para a
objetivação das atividades criativas se alimenta do anseio
do uso de uma metodologia que possa automaticamente
conduzir a resultados originais e perfeitos, servindo de base
primordial, mas não de verdade absoluta. Nota-se desta
forma que a criação denota em si o gérmen do saber fazer,
que é compreendido também por meio de métodos
aplicados que devem ser repassados para os estudantes na
academia como forma de estímulo à criatividade e
inovação.
Aliando estes aspectos, firmando a necessidade do ensino
da aplicação de métodos no projeto de design, a fim de
dotar os alunos de capacidade de produzir produtos que
atendam às expectativas e necessidades, e que o façam de
uma forma a criá-los originais e criativos, as discussões
teóricas que tiveram lugar ao longo do século XX sobre
design e ensino de design levaram ao estabelecimento de
“caminhos projetuais” mais ou menos similares entre si,
compostos freqüentemente por etapas lineares também
similares e concordantes:
“design é transformar objetivos em objetos. Isso
implica um processo de trabalho que, seja curto ou
longo, se desenvolve com começo, meio e fim:
abrange as etapas de Levantamento / Estudos /
Anteprojeto / Projeto executivo. Quando não é
assim, quando é instantâneo, não é design [...]. O
processo de desenvolvimento do projeto define,
portanto, a própria natureza do design.” [1]
Segundo a concepção geral de produção de design e sua
decorrente aplicação ao ensino, pode-se verificar, pois a
possibilidade de organizar o processo projetual em três
macro etapas, derivadas da observância da proposta
seqüencial de Começo, Meio e Fim de um projeto,
refletidas nos termos gerais: Problema, Projeto e
Realização.
Inúmeras discussões acadêmicas sobre a construção de
teorias metodológicas baseadas nestes três termos tiveram
lugar. O diferencial entre elas se encontra basicamente nas
suas subdivisões ou processos que comportam, sendo que
cada teórico aponta um número de ações e natureza das
mesmas variadas em cada uma destas etapas, segundo o
foco do produto ou da filosofia projetual utilizada.
Amplamente discutidas, estas etapas são valiosas para o
desenvolvimento de produtos de natureza já estabelecida e
de domínio do âmbito do design e devem ser repassadas no
ensino do design na academia. A questão é se, dentro destas
etapas, as suas subdivisões, ou seus enfoques internos,
explicitadas nas teorias particulares, são suficientes para dar
conta da demanda de soluções digitais interativas.
Alerta-se que a cada dia surgem novas demandas de
produção de design em produtos digitais interativos
complexos, que acabam por demandar também
procedimentos de trabalho, pesquisa e desenvolvimento de
design que devem atender necessidades específicas
projetuais e que solicitam do designer um incremento nos
procedimentos das etapas citadas.
Nesta perspectiva busca-se compreender estas
especificidades projetuais e, por meio de um mapeamento
das teorias já existentes e aplicadas no universo de design,
apontar um possível caminho de construção metodológica
que dê conta desta nova ordem.
CAMINHOS METODOLÓGICOS
Apontada a necessidade do ensino metodológico projetual
nos curso de design e a necessidade de se buscar uma
adequação à demanda de design digital atual, deve-se
esclarecer quais teorias tem sido utilizadas e como podemos
atualizá-las para as necessidades de solucionamento de
problemáticas atuais voltadas ao âmbito digital.
A priori faz-se necessário mapear o âmbito da metodologia
em termos mais gerais e amplos, a fim de verificar qual
linha mais se adéqua ao ensino de projetos de design e,
posteriormente, levantar alguns teóricos desta mesma que
podem ser utilizados como parâmetros para mapeamento e
construção de uma metodologia mais voltada para a
atualidade.
Algumas teorias já estabelecidas podem ser citadas como
exemplos para aplicação em disciplinas de metodologia do
design nas universidades. A primeira linha versa sobre as
derivadas do método cartesiano, desenvolvido por René
Descartes (1637), e que se apóia sucintamente na idéia de
que o todo pode ser dividido em partes para uma melhor
2
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 208](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-214-320.jpg)

![certas configurações basilares. O método é passível de
modificações ao longo do processo, caso outros valores
objetivos sejam encontrados que o melhorem, mas se apóia
em pontos importantes sedimentados a serem observados. A
constante evolução e adequação verificada advêm, muitas
vezes não só do objeto de design específico a ser projetado,
ou da situação de projeto encontrada, mas da criatividade
do designer, que aplica sua própria personalidade à sua
maneira de projetar.
Esta conformação metodológica é a atualmente mais
comumentemente ensinada nas escolas de design,
direcionadas ou adequadas mais ou menos segundo a
natureza do produto a ser desenvolvido, seja ele gráfico ou
de produto.
DESIGN DE INTERAÇÃO/CENTRADO NO USUÁRIO
Porém, o universo digital trouxe novas demandas
projetuais, os produtos pedindo por um pensamento
projetual que desse conta das disparidades de percepção
próprias do meio, necessitando de uma nova forma de
pensar o design e sua metodologia. O enfoque desta nova
postura é por um design mais interativo e interdisciplinar.
As metodologias sedimentadas na academia que
compartilham uma maneira lógica e seqüencial de se
projetar um produto, baseadas em um método lógico e
racional, se demonstram não adequadas ao universo
projetual atual interativo e interdisciplinar, não podendo ser
simplistas como não o é qualquer processo relacionado com
o comportamento humano. Esta constatação foi levantada já
antes do advento do design digital, por meados da década
de 1970, quando se verificou que os métodos racionais de
design proporcionavam segurança, reduzindo margens de
erros, mas reduziam também as possibilidades de soluções
em consonância com a necessidade cultural e simbólica do
usuário, além de estarem distantes de uma prática real de
projeto. O discurso de uma metodologia única se esvaiu
com esta constatação, o que permitiu que todas as formas
de projetar fossem tidas como válidas, cada qual aplicável a
um universo de projeto em particular [7].
Porém, se a racionalidade dos métodos no inicio do século
XX foram inadequados às novas necessidades de projeto de
design digital interativo, de alguma maneira se encontra
uma volta à ela mesma, porém de uma outra forma por
meio da inclusão forte do usuário no processo de
desenvolvimento.
Apesar de já existir nas primeiras discussões sobre
metodologia de design a preocupação com o usuário,
verifica-se que atualmente, a produção de design, tem
voltado seu foco para este elemento central, com uma
ênfase maior, explicitando esta ser necessária à produção de
produtos que possam efetivamente ser adequados e usáveis
em todas as suas possibilidades.
Coelho [1], citando Gui Bonsiepe, afirma que um designer
cria formas para atender às necessidades do homem. E que
para atender tais necessidades é preciso estabelecer formas
de conhecer este homem e seu entorno. Por outro lado, o
design de interação, que busca desenvolver produtos
interativos que sejam utilizáveis, ou seja, fáceis de
aprender, eficazes no uso, que proporcionem ao usuário
uma experiência agradável [8] apregoa um conhecimento
amplo do homem-usuário e o do seu entorno.
Enriquecendo a proposta de uma metodologia mais
adequada ao design interativo, Preece, Rogers e Sharp [8]
defendem que o processo de design de interação pode ser
dividido em quatro etapas essenciais e básicas: 1)
identificação das necessidades e estabelecimento de
requisitos, que pode ser compreendida como espelho da
macro fase “Problema” dos teóricos consagrados do século
XX; 2) desenvolvimento de designs alternativos que
preencham estes requisitos, que pode ser incorporada na
macro etapa do “projeto”, 3) construção de versões
interativas dos designs de maneira que possam ser
comunicados a analisados, também incorporada na macro
etapa de “projeto” e 4) avaliação do que está sendo
construído durante o processo. Esta última poderia ser
incorporada em um ou outro autor na etapa de “realização”,
porém, sua característica de empregabilidade não linear ou
seqüencial, a coloca como um termo extra sem
comparativos ou paralelos nas metodologias sedimentadas
do século XX.
Além das etapas básicas, segundo as autoras citadas, o
design de interação deve preencher três características
básicas: 1) os usuários devem estar envolvidos no
desenvolvimento do projeto; 2) a usabilidade específica e as
metas decorrentes da experiência do usuário devem ser
identificadas, claramente documentadas e acordadas no
início do projeto; 3) a iteração em todas as quatro atividades
é inevitável.
Traçando um paralelo das concepções do design de
interação neste aspecto com as metodologias apontadas,
verifica-se um fraco foco nestes três itens, o que claramente
expõe a fragilidade do ensino das mesmas para o aluno de
design digital.
Verifica-se, pois, uma lacuna teórica na construção de
metodologias claramente identificadas no meio acadêmico
que possam ser ensinadas para o estudante de design digital.
Com esta carência acadêmica, busca-se encontrar
manancial em outra área, especificamente a mercadológica,
verificando quais empresas tem tido sucesso no
desenvolvimento de produtos de design com estas
características e se estas possuem uma metodologia clara de
projeto.
Dentre as diversas experiências de empresas que optam por
adotar o design de interação sob a formatação apontada e
que tem uma metodologia claramente definida, pode-se
citar a IDEO, cuja marca particular sempre foi a inovação
em produtos de design e o design centrado no usuário,
filosofia que coloca o usuário no centro de todo o processo
d desenvolvimento de um produto, ou seja, os objetivos do
produto, seu contexto de uso e todos os aspectos das tarefas
4
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 210](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-216-320.jpg)
![que o produto irá suportar são derivados a partir da
perspectiva do usuário.
METODOLOGIAS MERCADOLÓGICAS DE DESIGN –
IDEO
“solo o equilíbrio entre las emociones y la
racionalidad de la ciencia, entre un hacer prático y
un saber bien afirmado, puede realmente
ayudarnos”.[7]
Com esta frase, Edward Schrincker abre a perspectiva para
a proposta de trazer para o ensino da metodologia de
design, conhecimentos tirados de prática in loco.
Com esta abertura, ao verificar a práxis do projeto de
design no mercado de trabalho, podem-se encontrar
metodologias que trazem em si a criatividade própria e
particular, que, confrontadas e aliadas às metodologias já
sedimentadas de teóricos da área, podem servir de espelho
para a evolução de uma teoria metodológica passível de ser
aplicada no ensino do projeto do design em suas
configurações atuais.
Cabe relembrar que as teorias sedimentadas da área de
design foram também espelhadas em teorias de outra
ordem, e, com a análise crítica efetuada pelos teóricos,
puderam se conformar e adequar-se à produção de design.
A mescla das teorias ou de etapas trazidas de outra ordem
então é possível, desde que resulte em maior ganho para o
projeto naquela determinada etapa do processo.
Diante deste cenário e da complexidade dos atuais projetos
de design, busca-se responder a questão de como
instrumentalizar o aluno e desenvolver nele habilidades que
lhe permitam atuar de maneira adequada em projetos de
design no mercado de trabalho? Como criar um ambiente
mobilizador e gerador de conhecimentos, transformando as
aulas de projeto em um laboratório de ideias? Os alunos
precisam de fundamentação teórica para então “fazer
design” [6].
Ao observar grandes escritórios ou empresas de design
mundiais, verifica-se a grande aceitabilidade e relevância
que a empresa IDEO tem no mercado, justamente por sua
maneira peculiar de resolver problemas, utilizando para tal
o design.
A IDEO é uma consultoria de design e inovação localizada
em Palo Alto (EUA) com escritórios na Inglaterra,
Alemanha e China. É uma das referências mundiais em
inovação e design, voltada a desenvolvimento de produtos,
serviços e experiências digitais, sendo que a sua própria
estrutura organizacional esta permeada por um alto grau de
inovação.
Seu foco consiste em poder inovar em todas as propostas de
solução de problemas por meio do design, advindo do
reconhecimento da inovação como ponto central das
estratégias e iniciativas corporativas. Verificou uma grande
sede das empresas do mercado por conhecimento,
especialização, metodologias e práticas de atuação em torno
da inovação e, com base nesta premissa, discutiu e
desenvolveu uma metodologia que possibilitasse o
incremento da inovação para atender às necessidades das
empresas. Esta foi elaborada por meio da sua própria
experiência direta e imediata, adquirida por meio da
aplicação prática e cases de sucesso sendo extremamente
bem desenvolvida e continuamente aprimorada, o que faz
com esteja sempre em consonância com as necessidades
vigentes. Seu pensamento reside na idéia de que o seu
sucesso não advém somente do que se faz, mas como se faz.
Suas conquistas no âmbito do design são, freqüente e
amplamente, associadas a metodologias e ferramentas
específicas desenvolvidas e aplicadas em seus escritórios,
se tornando tão sedimentadas internamente que passaram a
serem passíveis de utilização em outros contextos. Neste
plano, a empresa passou a prestar consultoria para áreas e
empresas além do design, explicitando os métodos de
trabalho para atingir objetivos inovadores e adequados ao
cenário atual.
“Há pouco tempo, conforme a fama da IDEO ia se
espalhando cada vez mais rápida e intensamente, a
empresa recebeu clientes implorando por
conselhos, não apenas para um ou dois produtos,
mas no modo de inovar. A IDEO respondeu a
altura. Boa notícia para os leitores. Isso significa
que a metodologia não funciona apenas para a
IDEO – pode ser aplicada em outras
organizações.” [2]
Tendo por base estas assertivas, buscam-se na metodologia
desenvolvida pela IDEO, alguns métodos ou ferramentas
que possam ser incluídos no ensino acadêmico do design, a
fim de construir um profissional mais próximo às
tendências e necessidades reais de mercado.
“Vagamente descrita, essa metodologia tem cinco
etapas básicas:
1.Compreender o mercado, o cliente, a tecnologia
e as limitações identificadas do problema. [...]
2.Observar pessoas reais em situações de vida real
para descobrir o que modifica o comportamento: o
que as confunde, do que gostam, o que detestam,
onde tem necessidades latentes não atendidas pelos
produtos e serviços atuais. {...}
3.Visualizar conceitos novos para o mundo e para
os clientes que os usarão. [...]
4.Avaliar e aprimorar os protótipos numa série de
interações rápidas [...] nenhuma idéias é tão boa
que não possa ser aperfeiçoada [...]. Obtemos as
opiniões de nossa equipe interna, da equipe do
cliente, de pessoas bem informadas não
diretamente envolvidas no projeto e de pessoas
que constituem o mercado-alvo.[...]
5.Implementar o novo conceito para
comercialização. [...]”
5
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 211](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-217-320.jpg)
![Temos demonstrado que essa metodologia
ilusoriamente simples funciona para tudo, desde a
criação de simples brinquedos infantis até o
lançamento de empresas de comércio eletrônico.”
[2]
Ou seja, se baseia nas seguintes premissas: Observação,
Brainstorming, Prototipação Rápida, Refinamento e
Implementação.
Análise da metodologia IDEO
Traçando um paralelo entre as premissas colocadas pelo
IDEO considerando-as como sendo processos que podem
ser incluídos em macro etapas, verifica-se que a
metodologia desenvolvida pela empresa compartilha das
fases primordiais verificadas nas teorias acadêmicas de
design, abarcando as três fases básicas: – PROBLEMA –
PROJETO – REALIZAÇÃO, o que reafirma a validade de
se pensar neste três termos em projeto de design de
qualquer natureza (Ver Tabela 3 no final do documento).
No detalhamento dos processos internos a cada etapa ou
premissa (Ver Tabela 4 no final do documento)., verifica-se
um grande foco na compreensão do usuário e de seu
entorno, ou seja, a filosofia do projeto é sempre do design
centrado no usuário. Isto faz com que, nesta metodologia,
exista um debruçar maior sobre o mapeamento deste
usuário, mais do que o normalmente sugerido nas
metodologias acadêmicas sedimentadas. Usualmente a
metodologia da empresa comporta inicialmente uma fase
inicial de análise preliminar do problema, identificando o
usuário, seus objetivos, as tarefas e o ambiente. Segue-se a
esta análise uma pesquisa de campo para mapear existentes
similares ao produto a ser desenvolvido no mercado. Este
mapeamento avança em testes que envolvem não só a
utilização do produto, mas entrevistas a usuários ou
envolvidos de alguma forma com aquele determinado
produto entendendo melhor o problema apresentado.
Após a delimitação do problema, as especificações do
projeto são estruturadas para elaboração de propostas na
fase de prototipação inicial, que serão apresentadas e
testadas, verificando seus aspectos mais relevantes para a
combinação das melhores soluções e montagem do
protótipo. As propostas são geradas por meio de técnicas de
criatividade, especificamente a de brainstorming.
Na apresentação do protótipo, este é testado, sendo feita
uma avaliação de usabilidade para então a versão final ser
apresentada ao cliente totalmente conceituada dentro da
análise inicial do problema. A fase de prototipação pode
envolver três níveis de prototipagem, de baixa, média ou
alta fidelidade, o que permite avaliações constantes no
desenvolver do processo de design, também no tocante à
aceitabilidade pelo usuário e alcance das expectativas
quanto à experiência do usuário.
O usuário é envolvido em todas as etapas, sendo
constantemente requisitado para contribuir no
desenvolvimento do projeto.
Após o aceite pelo cliente, o projeto é enfim implementado
para comercialização.
ANALISE COMPARATIVA DAS METODOLOGIAS
Ao se confrontar a metodologia da empresa IDEO com as
dos teóricos levantados neste texto, observam-se algumas
confluências e outras lacunas em cada uma das três etapas
básicas descritas a seguir.
Problema
Apesar da etapa do problema da IDEO incorporar um
grande esforço na compreensão do usuário, do contexto e
dos similares, ainda carece de uma determinação mais clara
da definição do problema a ser resolvido em si. Esta etapa
possui um paralelo na etapa semântica do Maser, que
reponde à questão “o quê”, à Análise da situação do
Gugelot e à coleta e análise de dados de Bruno Munari
(identificada não como etapa de Problema, mas de Projeto).
Porém, falta a discussão ou incorporação de
questionamentos observados nos procedimentos específicos
da etapa pragmática do Maser, que responde à questão
“por quê” (finalidades e objetivos gerais do projeto), e da
Colocação do problema e Definição do problema e
objetivos do Gugelot. Da metodologia de Bruno Munari
verifica-se a falta da definição do problema e de seus
componentes. Quase toda a fase 1 do Gui Bonsiepe não está
detalhada nesta etapa da IDEO, somente a análise de
soluções existentes.
Projeto
Ao se traçar um paralelo da fase de Projeto da IDEO com a
dos teóricos analisados neste texto, verificamos uma maior
similaridade entre os procedimentos. Observa-se uma
lacuna na definição do aspecto sintático do Maser, que
reponde à questão “como”, que envolve basicamente o
planejamento do projeto (tempo, equipe de trabalho, verba,
etc). Somente figura o desenvolvimento das alternativas e
avaliação e escolha das mesmas, embora Maser não
explicite de que maneira isto acontece. De Gugelot percebe-
se uma equivalência, excetuada pela prototipação rápida da
IDEO, inexistente na metodologia do teórico. Bruno
Munari compartilha da metodologia da IDEO com o
procedimento de Criatividade + Idéias, paralelamente ao
brainstorming da empresa, mas apregoa a definição dos
materiais e tecnologias que não aparece na metodologia da
IDEO. Aparece em sua metodologia algo similar à
prototipagem e refinamento, nos procedimentos de
experimentação, modelo e verificação, paralelamente à da
empresa IDEO, porém na sua etapa final, de Realização. O
modelo de Gui Bonsiepe, por seu lado, se assemelha
bastante ao modelo da IDEO, embora tenha mais
detalhamento dos processos.
Realização/implementação
Apesar se ser considerada uma empresa que trabalha nos
aspectos de metas de usabilidade e de experiência de
usuário, não aparece na fase final de
realização/implementação da IDEO aspectos relacionado à
6
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 212](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-218-320.jpg)

![de Orientação Gráfica Organizacional, 2010.
(http://www.logo.ufsc.br/observacao.pdf) 2005.
8._________________. Os estudos das linguagens como
apoio aos processos metodológicos do design. In:
COELHO, Luiz Antonio Luzio (org). Design Método. c.1
Rio de Janeiro; Teresópolis: PUC-Rio; Novas Idéias, 2006.
p. 17 a 38.
TABELAS
Metodologias
Teóricos
Problema Projeto Realização
Bruno
Munari
[4] *
- Problema;
- Definição do
problema;
- Componentes do
problema;
- Coleta de
dados;
- Análise de
dados;
- Criatividade
+ idéia;
- Materiais e
tecnologia;
-Experimentação;
- Modelo;
- Verificação;
- Finalização;
- Solução.
Gui
Bonsiepe
- FASE 1 -
estruturação do
problema
Descobrimento de
uma necessidade;
Valorização de
uma necessidade;
Formulação geral
de um problema;
Formulações
particulares do
problema;
Fragmentação do
problema;
Hierarquização
dos problemas
parciais;
Análise das
soluções
existentes.
- FASE 2 -
Desenvolvim
ento do
Projeto
Desenvolvim
ento das
alternativas;
Verificação e
seleção das
alternativas;
Detalhament
o e
otimização
da solução
adotada;
Construção e
prova do
protótipo;
Fabricação
em série.
- FASE 3 -
Realização do
Projeto
Tabela 1. Quadro comparativo das Metodologias – Bruno
Munari X Gui Bonsiepe
Metodologias
Teóricos
Problema Projeto Realização
Siegfried
Maser
1- Análise:
1.1 - Aspecto
pragmático (por
quê?):
1.2 - Finalidades;
1.3 - Objetivos
gerais do projeto
em si, inclusive
restrições.
2- Aspecto
semântico (o
quê?):
2.1 - Descrição do
problema e
contexto;
2.2 -
Levantamento;
2.3 - Análise.
1- Aspecto
sintático
(como?):
2 -
Planejamento
do caminho do
processo
(macro-
estrutura);
4 -
Planejamento
do tempo;
5 - Constituição
do grupo/forma
de trabalho;
6 -
Financiamento
do projeto;
7 - Definição do
problema;
8 -
Desenvolviment
o das
alternativas;
9 - Avaliação
das
alternativas/esco
lha.
1 - Realização
do projeto
2 -
Implantação
Hans
Gugelot
- Colocação do
problema
- Análise da
situação
- Geração de
alternativas
- Planificação
da produção
- Avaliação e
seleção
- Definição do
problema e
objetivos
Tabela 2. Quadro comparativo das Metodologias – Siegfried
Maser X Hans Gugelot
8
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 214](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-220-320.jpg)
![Metodologia
Teóricos
Problema Projeto Realização
IDEO
1.Compreender o
mercado, o
cliente, a
tecnologia e as
limitações
identificadas do
problema. [...]
2.Observar
pessoas reais em
situações de vida
real para descobrir
o que modifica o
comportamento: o
que as confunde,
do que gostam, o
que detestam,
onde tem
necessidades
latentes não
atendidas pelos
produtos e
serviços atuais.
{...}
3.Visualizar
conceitos
novos para o
mundo e para
os clientes
que os
usarão. [...]
4.Avaliar e
aprimorar os
protótipos
numa série de
interações
rápidas [...]
nenhuma
idéias é tão
boa que não
possa ser
aperfeiçoada
[...]. Obtemos
as opiniões
de nossa
equipe
interna, da
equipe do
cliente, de
pessoas bem
informadas
não
diretamente
envolvidas
no projeto e
de pessoas
que
constituem o
mercado-
alvo.[...]
5.Implementar o
novo conceito
para
comercialização.
[...]”
Tabela 3. Quadro da Metodologia utilizada pela IDEO –
conceito.
Metodologia Detalhamento
Problema
1. Observação
Utiliza os seguintes processos ou técnicas:
- Shadowing
- Observação do público alvo em todas as ações que
realizam em sua interação produtos ou serviços.
- Mapeamento do comportamento
- Registro fotográfico do público alvo usando o
produto ou serviço, mapeando ações relevantes.
- Jornada do consumidor
- Traçado de todas as interações que o público alvo
tem com o produto ou serviço
- Câmera Journals
- Solicitar ao público alvo que façam diários visuais
de suas atividades ou impressões relacionadas ao
produto.
- Entrevistas
- Descobrir, por meio de entrevistas, tudo o que o
público alvo sabe ou não sabe sobre o serviço
oferecido e sua relação com o mesmo avaliando sua
experiência com o mesmo.
- Contação de histórias
- Pedir para que o público alvo conte histórias
particulares sobre suas experiências como
consumidor.
- Grupos não focais
- Entrevistar ou buscar informações com pessoas
diversas do público alvo
Projeto
2. Brainstorming
Um processo intenso de sessão de geração de idéias
baseada na análise de dados obtida na etapa anterior.
3. Prototipação rápida
Realizar protótipos de trabalho a fim de visualizar
possíveis soluções e agilizar as decisões de design e
inovação.
4. Refinamento
Restringir as escolhas a poucas possibilidades,
utilizando, entre outras, as seguintes técnicas:
aplicação de brainstorming de seleção, prototipação
focada e engajamento do cliente.
Realização
5. Implementação
Efetiva implementação final do produto para
comercialização no mercado
Tabela 4. Quadro da Metodologia utilizada pela IDEO –
detalhamento.
9
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 215](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-221-320.jpg)


![Figure 1. Tesco Automated store at Northampton
“The most profound revolutions are not the ones trumpeted
by pundits, but those that sneak in when we are not
looking”. What Mark Weiser formulated over ten years ago
accurately describes the current atmosphere surrounding the
field of pervasive computing. While personal gadgetry in
the form of Smartphone’s and Internet fridges continues to
bedazzle the press, industry has quietly begun setting its
sights on the enormous business potential that technologies
such as wireless sensors, RFID tags, and positioning
systems have to offer. Analysts call it the real-time
economy or now-economy where more and more entities in
the economic process, such as goods, factories, and
vehicles, are being enhanced with comprehensive methods
of monitoring and information extraction. Ultimately, the
whole lifecycle of products, beginning with the “birth” of
their components and ending with their complete
consumption (or recycling), can be witnessed (and, to some
extent, even controlled) in real time. Two important
technologies form the core of these new economic
processes and applications: the ability to track real-world
entities, and the introspection capabilities of smart objects.
Tracking objects in real-time allows for more efficient
business processes, while objects that can monitor their
own status via embedded sensors allow for a range of
innovative business models.
STORE SHOWCASES
At [4] it is possible to observe that sales are dependent on
the space but we are interested in whether increases in
space produce linear, increasing or diminishing returns. To
test this they examined if variations in retail space
(measured in square inches) produced variations in sales
(measured in sales of SKUs). Sections of twenty
independent fashion and department stores in the UK were
used. These stores did not normally stock watches. This
environment ensured that there was no immediate effect
from competitor brands. The sections used varied in size
from 1,600 to 2,890 square feet of retail space. Display
showcases ranging from 144 square inches to 7,012 square
inches were allocated to sections. As the size of the
showcase increased, there was a corresponding increase in
SKUs from 6 to 289. Allocation was random subject to a
constraint; not all store sections could accommodate the
largest cabinets, so these went to bigger sections. Because
of this constraint, it is possible that section size affected the
sales figures for large cabinets. Data were collected by sales
staff, who conducted stock checks of individual SKU’s over
a four week period.
Figure 2. Scatter plot of space level and G-Shock unit
sales
Increase in showcase size generated an increase in product
sales. The Pearson correlation coefficient between the two
variables was 0.88 (p = 0.00). The scatter plot in Figure2
shows that the relationship between space and sales appears
to be curvilinear with accelerating gains from increased
display space, though this assessment rests on relatively
few cases. In the second investigation they examined
whether window and in-store displays in the same store
produced more sales gain than equivalent window and in
store displays in different stores. The sample for this
Investigation consisted of 66 stores of the H. Samuel retail
chain. The selection of this retailer gave geo-demographic
representation across the UK population (H. Samuel have
428 stores with a presence in every major town in the
United Kingdom). The chain accounts for 10 per cent of
watch sales in the UK. The 66 stores were assigned
randomly to one of three treatments groups, as shown in
Table 1. Each display contained the same 42 G-shock lines
with the brand name clearly displayed on a placard. The
way in which products were presented (e.g. solus window)
was held constant in each display treatment. Other factors
such as pricing, stocking and display of other products
remained constant over the period of the experiments.
Inventory management obviously benefits from accurate,
real-time information on the location and condition of
goods, equipment, and manpower. If a company does not
know the location and condition of its stock, and how long
it has been in the warehouse, significant costs are incurred.
Missed profits, oversized inventories, and the devaluation
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 218](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-224-320.jpg)

![Figure 4. Visual Inspection System.
Recently, researchers in human-computer interaction have
been exploring interactive tabletops for use by individuals
and groups, as part of multi-display environments, and for
fun and entertainment. A key challenge of surface
computing is that traditional input using the keyboard,
mouse, and mouse-based widgets is no longer preferable;
instead, interactive surfaces are typically controlled via
multi-touch freehand gestures. Whereas input devices
inherently constrain human motion for meaningful human-
computer dialogue, surface gestures are versatile and highly
varied—almost anything one can do with one’s hands could
be a potential gesture. To date, most surface gestures have
been defined by system designers, who personally employ
them or teach them to user-testers .Despite skillful design,
this results in somewhat arbitrary gesture sets whose
members may be chosen out of concern for reliable
recognition. Although this criterion is important for early
prototypes, it is not useful for determining which gestures
match those that would be chosen by users. It is therefore
timely to consider the types of surface gestures people
make without regard for recognition or technical concerns.
What kinds of gestures do non-technical users make? In
users’ minds, what are the important characteristics of such
gestures? Does number of fingers matter like it does in
many designer-defined gesture sets? How consistently are
gestures employed by different users for the same
commands? Although designers may organize their gestures
in a principled, logical fashion, user behavior is rarely so
systematic. As McNeill writes in his laborious study of
human discursive gesture, “Indeed, the important thing
about gestures is that they are not fixed. They are free and
reveal the idiosyncratic imagery of thought”.
All those gestures and human activities when using the
surfaces are tracked using vision based solutions, namely as
blob recognition and tracking for associating an id and a
movement to each finger and therefore it is possible to use
this information to analyze which gesture was done
comparing it to predetermined gestures.
Figure 5. Microsoft Surface Configuration
Figure 6. User Gestures for Input
Figure 7. User interacting with Project natal
SYSTEM OVERVIEW
Setup
The configuration of the 3S(Smart-Store Showcase) system
used in the present study is described in Figure 1. The
system consists of a big store showcase, whose surface is
composed of glass, transparent for the camera. A camera
that captures the images from the customers. The captured
images are processed by a computer running the Image
Processing Core(IPC). Usually, to get better results, it is
necessary to calibrate and make some adjustments on some
parameters, like camera focus, parameters, in addition to
software adjustments, like equalize and balance light. From
captured images, software detects interesting characteristics
for further analysis of customer behaviour. The IPC was
implemented using the C++ language and the Open Source
Computer Vision Library (OpenCV []).
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 220](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-226-320.jpg)
![.
Figure 8. Setup of the Smart Store Showcase.
Customer Recognition
Using Haar-Like Features Classifier from the OpenCV it is
possible to detect the presence and the position of a face on
the image, according to the classification formulas below.
(1)
Recognition of Faces Features
Interesting Face Features to be recognized are eyes, mouth
and nose. Those help on the geometry analysis to find
position and rotation of the customers face[15][18]. Those
characteristics are also found using Haar-like features and
classifiers.
Geometrical Analysis
Geometrical analysis consists of finding the values of
angles between the lines in the triangle formed from lines
leaving from the center of the eyes, passing by the center of
the mouth and the center of the nose. Equation (2)
calculates the tangent of the angle between two lines.
(2)
where,
(3)
Figure 7. Degrees of Freedom of Human Head.
Figure 9. Degrees of Freedom of Human Head.
Figure 10. Geometry of Human Face
Analyzing this information according to figure 11 it is
possible to determine the behavior of the customer to the
showcase, meaning that the customer can be, for example,
looking to a product, not looking at all, or even somehow
looking at an avoidance manner to it(figure 12).
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 221](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-227-320.jpg)
![Figure 11. Customer Patterns when looking to the Showcase
Figure 12. Real-data patterns analysis
The final step of the image processing core is to use a K-
Nearest Neighbor[17] algorithm to associate an id to each
customer to be able to check for how long it keeps looking
to the showcase, and also get a detailed report associating
customer to product.
Figure 13. K-Nearest Neighbour algorithm applied to find the
most probable face according to last position.
Application
TUIO Protocol
The TUIO Protocol [7] is a simple protocol designed to
meet the requirements of table-top tangible user interfaces.
We have adapted the TUIO messages to this type of
application. The 3S is considered as a host that becomes
available to clients, running on a computer attached to it.
With this information the management software is able to
generate a log and a daily spreadsheet relating products
shown on the showcase and the customers’ behavior during
the day.
CONCLUSION
We have characterized and implemented a system for
automating the capture of customers’ behavior when
looking to a store showcase and also, a system to analyze
this data to optimize sales on stores. Our system aims to
incorporate consolidate Vision methods to the field of smart
stores. With this information the store owner would be able
to organize its showcase with a more careful planning. And
also, to see the direct relation between products advertised
on the showcase and products bought. The proposed
solution opens a wide variety of opportunities for future
work, ranging from adapting it to stereo vision, better
tracking algorithms, and Human Factors of this Human
Computer Interface. The new directions of the project are to
develop a system to correlate the elapsed time between
looking and buying, to augment the number of cameras, and
products. Incorporate gaze tracking for measuring attention.
Interaction South America 2010 Curitiba, Brazil - December 2-4
IxDA Curitiba - www.ixdacuritiba.com.br 222](https://image.slidesharecdn.com/anaisixdsa10-230531183004-ac13e684/85/Artigos-Interaction-South-America-2010-228-320.jpg)

