SlideShare uma empresa Scribd logo
1 de 102
Baixar para ler offline
http://publicationslist.org/junio
José Fernando Rodrigues Júnior
Universidade de São Paulo
Instituto de Ciências Matemáticas e de Computação
- 2012 -
Análise Visual de Dados:
conceitos, técnicas e
sistemas
Roteiro
 Introdução
 Alguns Conceitos
 Esquemas visuais mais usados
 Interação, Sistematização e Processamento
 Observações Conclusivas
Questões a serem
respondidas
• O que é Visualização de Informações?
• Por que seu uso?
• Princípios
• Técnicas mais usuais
• Exemplos de sistematização
• Estado da arte
• Como obter mais informações sobre o assunto?
O que é?
• A prática de se beneficiar das capacidades
cognitivas visuais para se expressar conhecimento
de maneira mais rápida e intuitiva.
• Também denominada Infovis
• Exemplo: a invasão francesa da Rússia
O problema
Dados
Humano
Objetivo: discernimento
Transferência de
dados
 Evolução do Hardware
• Dobro do processamento a cada 18 meses (Moore’s Law)
• Dobro de tecnologia gráfica a cada 12 meses
• Tendência observada já há 50 anos
Fatos
 Crescimento da produção/fluxo de dados
• Apenas em 2010, estimativa de 5 zetabytes (270 B)
• O armazenamento de novas informações tem crescido à
taxa de mais de 30 % ao ano
 Evolução do Hardware
• Dobro do processamento a cada 18 meses (Moore’s Law)
• Dobro de tecnologia gráfica a cada 12 meses
• Tendência observada já há 50 anos
• Pelo menos mais 10 anos
Fatos
 Crescimento da produção/fluxo de dados
• Apenas em 2010, estimativa de 5 zetabytes (270 B)
• O armazenamento de novas informações tem crescido à
taxa de mais de 30 % ao ano
“O propósito da computação é compreensão, e não
números.”
Richard Hamming (Turing Award, 1968)
http://publicationslist.org/junio
• Em contraste, habilidades humanas básicas não
mudam ao longo do tempo
• Bancos de dados com uma quantidade de
dados muito maior do que é possível para o
ser humano aproveitar
 Não evolução do ser humano
 Conseqüência
As técnicas de Visualização de
Informações reduzem este problema.
Fatos
Exibição de dados –
diferentes abordagens
• Computação gráfica: como
renderizar?
• Visualização científica: como
reproduzir graficamente?
• Visualização de informações: como
definir um design que personifique
meus dados?
Exibição de dados –
diferentes abordagens
• Computação gráfica: como
renderizar?
• Visualização científica: como
reproduzir graficamente?
• Visualização de informações: como
definir um design que personifique
meus dados?
Tabela Balancete
Trimestre Faturamento
1 70
2 20
3 5
4 5
Ciência Analítica
• Objetivos:
– Avaliar
– Prever
– Identificar alternativas
– Suporte à decisão
• Artefatos de racionalização, hierárquicos:
– Elementares: dados individuais, suposições, evidências...
– Padrões analíticos: correlação, tendência, classificação,
relacionamento, exceções, agrupamentos, estrutura, ...
– Artefatos de ordem superior: inferência lógica (se então, por
exemplo), casualidade temporal, modelos de regressão (padrões
funcionais), ...
– Complexos: hipóteses e cenários (explicações)
Ciência Analítica
Artefatos
Elementares
Ex.: dados e
suposições
Padrões
Analíticos
Ex.: tendência,
classificação,
relacionamento,
agrupamentos,...
Artefatos de
Ordem
Superior
Ex.: inferência
lógica (se
então, se e
somente se),
modelos de
regressão
Hipóteses
E
Cenários
(previsão,
avaliação,
explicação)
Ciência Analítica
Artefatos
Elementares
Ex.: dados e
suposições
Padrões
Analíticos
Ex.: tendência,
classificação,
relacionamento,
agrupamentos,...
Artefatos de
Ordem
Superior
Ex.: inferência
lógica (se
então, se e
somente se),
modelos de
regressão
Hipóteses
E
Cenários
(previsão,
avaliação,
explicação)
Principal abrangência da visualização
Ciência Analítica
Artefatos
Elementares
Ex.: dados e
suposições
Padrões
Analíticos
Ex.: tendência,
classificação,
relacionamento,
agrupamentos,...
Artefatos de
Ordem
Superior
Ex.: inferência
lógica (se
então, se e
somente se),
modelos de
regressão
Hipóteses
E
Cenários
(previsão,
avaliação,
explicação)
Principal abrangência da visualização
Mineração de dados e raciocínio suportado por visualização
Ciência Analítica
Artefatos
Elementares
Ex.: dados e
suposições
Padrões
Analíticos
Ex.: tendência,
classificação,
relacionamento,
agrupamentos,...
Artefatos de
Ordem
Superior
Ex.: inferência
lógica (se
então, se e
somente se),
modelos de
regressão
Hipóteses
E
Cenários
(previsão,
avaliação,
explicação)
Principal abrangência da visualização
Mineração de dados e raciocínio suportado por visualização
Profundo conhecimento de domínio
Ciência Analítica
• Objetivos:
– Avaliar
– Prever
– Identificar alternativas
– Suporte à decisão
• Artefatos de racionalização:
– Elementares: dados individuais, suposições, evidências...
– Padrões analíticos: correlação, tendência, classificação,
relacionamento, exceções, agrupamentos, estrutura, ...
– Artefatos de ordem superior: inferência lógica (se então, por
exemplo), casualidade temporal, modelos de regressão (padrões
funcionais), ...
– Complexos: hipóteses e cenários (explicações)
Outros recursos:
• Descartes R. 1637. Discourse on Method;
• Jones M. 1995. The Thinker’s Toolkit: 14 Powerful
Techniques for Problem Solving. Three Rivers Press;
• Heuer R. 1999. Psychology of Intelligence Analysis.
U.S. Government Printing Office;
• Adams JL. 2001. Conceptual Blockbusting: A Guide
to Better Ideas. Fourth edition, Perseus Publishing.
Roteiro
 Introdução
 Alguns Conceitos
 Esquemas Visuais mais Usados
 Interação, Sistematização e Processamento
 Observações Conclusivas
Princípio da
Visualização
Dados
Humano
Transferência de
dados
Princípio da
Visualização
• Os olhos têm acesso privilegiado ao cérebro
• Mais de 50 % do cérebro é dedicado à visão
Recursos – pré-atenção
• Mecanismo da visão, duas fases
– 1ª. Fase: pré-atenção instantânea e em paralelo
– 2ª. Fase: varredura demorada e seqüencial
Quantos números “4” há na cena?
Recursos – pré-atenção
 Cor
PB
PD
PE
PA
PI
PJ
PL
PK
PC
PB
PD
PE
PA
PI
PJ
PL
PK
PC
PE
PI
PL
DIR
ESQ
ESQ
PD
PA
DIR
ESQ
PB
PJ
PK
PC
ESQ
DIR
ESQ
DIR
IDEOL.PART.
Estímulos pré-atentivos
4 canais
Recursos – pré-atenção
Estímulos pré-atentivos
4 canais
 Posição
PB
PD
PE
PA
PI
PJ
PL
PK
PC
PA
PB
PD
PE
PC
PI
PJ
PL
PK
PE
PI
PL
DIR
ESQ
ESQ
PD
PA
DIR
ESQ
PB
PJ
PK
PC
ESQ
DIR
ESQ
DIR
IDEOL.PART.
Recursos – pré-atenção
 Forma
PB
PD
PE
PA
PI
PJ
PL
PK
PC
PB
PD
PI
PJ
PA
PC
PL
PEPK
PE
PI
PL
DIR
ESQ
ESQ
PD
PA
DIR
ESQ
PB
PJ
PK
PC
ESQ
DIR
ESQ
DIR
IDEOL.PART.
Estímulos pré-atentivos
4 canais
Recursos – pré-atenção
 Tempo
(animação
cor,
posição
e/ou forma) PE
PA
PI
PK
PE
PI
PL
DIR
ESQ
ESQ
PD
PA
DIR
ESQ
PB
PJ
PK
PC
ESQ
DIR
ESQ
DIR
IDEOL.PART.
Estímulos pré-atentivos
4 canais
PE
PA
PI
PK
Recursos – pré-atenção
Estímulos pré-atentivos
Recursos – pré-atenção
• Posição: 1D, 2D e 3D;
• Forma: ponto, linha, área, volume, orientação,
comprimento, colinearidade, tamanho,
curvatura;
• Cor: matiz, saturação, brilho, textura;
• Tempo (animação): movimento e intermitência.
Estímulos pré-atentivos
Recursos – pré-atenção
• Posição: 1D, 2D e 3D;
• Forma: ponto, linha, área, volume, orientação,
comprimento, colinearidade, tamanho,
curvatura;
• Cor: matiz, saturação, brilho, textura;
• Tempo (animação): movimento e intermitência.
Mas o que isso tem a ver com computação?
Auxílio computacional:
• escalabilidade de dados (via SGBDs) e
de processamento
• interação: redefinição em tempo real da
apresentação de dados
• dimensão temporal
• algorítmico: combinação com mineração
de dados
Estímulos pré-atentivos
Recursos – pré-atenção
• Mecanismo da visão, duas fases
– 1ª. Fase: pré-atenção instantânea e em paralelo
– 2ª. Fase: varredura demorada e sequencial
Procedimento geral da visualização (Visualization
Mantra):
Visão geral (1ª. fase)
Zoom & filtragem (Interação)
Detalhes sob demanda (2ª. Fase)
http://publicationslist.org/junio
Recursos – pré-atenção
Qual o estado com maior nível salarial?
Qual a relação entre salário e educação?
Comportamentos incomuns (outliers)?
http://publicationslist.org/junio
Recursos – pré-atenção
Salário annual Per Capita (U$)
Níveleducacional(%comcursosuperior)
Recursos:
pré-atenção  percepção  raciocíonio
Recursos:
pré-atenção  percepção  raciocíonio
Pré-atenção:
• Posição
• Forma
• Cor
• Tempo
Percepção
(padrões visuais):
• Correspondência
• Diferenciação
• Conectividade
• Arranjo
• Significado
• Variação
Interpretação
(padrões analíticos):
• Correlação
• Tendência
• Classificação
• Relacionamento
• Sumarização
• Exceções
• Agrupamentos
• Estrutura
• Leitura, ...
Observação Raciocínio
Recursos:
pré-atenção  percepção  raciocíonio
Pré-atenção:
• Posição
• Forma
• Cor
• Tempo
Observação Raciocínio
Projeto/
Sistematização
/Utilização
Percepção
(padrões visuais):
• Correspondência
• Diferenciação
• Conectividade
• Arranjo
• Significado
• Variação
Etapa natural
com pouca
carga
cognitiva
Conhecimento de
domínio
Interpretação
(padrões analíticos):
• Correlação
• Tendência
• Classificação
• Relacionamento
• Sumarização
• Exceções
• Agrupamentos
• Estrutura
• Leitura, ...
Geração de
conclusões
com base no
domínio dos
dados
Recursos:
pré-atenção  percepção  raciocíonio
Canal:
Posição ●
Forma ●
Cor ●
Tempo ●
Padrões visuais:
● Correspondência
● Diferenciação
● Conectividade
● Arranjo
● Significado
● Variação
Recursos:
pré-atenção  percepção  raciocíonio
Demonstração
Mundo: Renda X Emissão de Carbono
PROJEÇÃO ANIMADA
Dados de IDH
• Ano
• Nome do país
• Tamanho da população
• Grupo de renda
• Renda per capita (U$)
• Emissão de CO2 (ton/pessoa)
Software: Gapminder
(spreadsheet do Google Docs)
Análise Geral
Percepções
• Posição: correspondência, arranjo
• Forma: correspondência, diferenciação,
conectividade, significado
• Cor: correspondência
• Animação
Interpretações:
• Correlação
• Tendência
• Classificação
• Exceções
• Agrupamentos
• Estrutura
• Leitura
Demonstração
Mundo: Fertilidade X PopulaçãoPROJEÇÃO ANIMADA
Dados de IDH
• Ano
• Nome do país
• Filhos por mulher
• Tamanho da População
• Renda per capita
• Grupo de renda
Software: Gapminder
(spreadsheet do Google Docs)
http://publicationslist.org/junio
1. Mais Recursos
– Processamento perceptivo paralelo
– Percepção ao invés de cognição
– Expansão das memórias de curto e longo prazo do usuário
2. Busca Reduzida
– Informações agrupadas reduzem a varredura sequencial
– Leitura espacial instantânea
3. Melhor Reconhecimento de Padrões
– Reconhecer ao invés de relembrar
– Abstração e agregação
– Exposição estrutural
– Valor, relacionamento, tendência
Como a visualização
pode ajudar?
http://publicationslist.org/junio
Como a visualização
pode ajudar?
4. Inferência Perceptiva
– Alguns problemas se tornam óbvios
– O raciocínio é amplificado com pistas visuais
5. Monitoramento Perceptivo
– Alterações visuais saltam aos olhos
6. Mídia Manipulável
– Interação
Demonstração
Mundo: Distribuição de renda
Demonstração
Mundo: Distribuição de renda
Linhas Gerais de
Aplicação
Tarefas
Exploração analítica Descobrir hipótese
Apresentação confirmatória Verificar hipótese
Suporte à decisão Avaliar, prever, identificar
alternativas
Apresentação simples Apresentar o que você já
sabe
Linhas Gerais de
Aplicação
Tipos de dados
Multi-dimensional (tabular) Bancos de dados relacionais
Redes e árvores (grafos) Redes sociais, redes de
recomendação, redes de
computadores, localização
geográfica
Textos e documentos Repositórios de texto (artigos,
notícias, wikis)
Espacial-temporal
(1D, 2D, 3D e 4D)
Simulação e reprodução de
fenômenos científicos
http://publicationslist.org/junio
Projeto e
desenvolvimento
http://publicationslist.org/junio
Sistematização
Dados
“crus”
Dados
estruturados
Design
Visual
Visualização
Transformações
do Dados
Mapeamento
Visual
Transformações
Visuais
Dados
Formato
Visual
Processamento
Pré-visualização
Técnicas
de
Visualização
Técnicas
de Interação
Visual
Sistema de Visualização
 Introdução
 Alguns Conceitos
 Esquemas Visuais mais Usados
 Interação, Sistematização e Processamento
 Observações Conclusivas
Roteiro
Esquemas visuais
mais usados
• Projeções geométricas
• Técnicas iconográficas
• Técnicas hierárquicas
• Técnicas orientadas a pixels
Classificação que segue à organização visual
Projeção geométrica
Coordenadas Paralelas
X0
X0: 5
X1
X1: 1
X2
X2: 10 X3
X3: 7
Atributo 0 Atributo 1 Atributo 2 Atributo 3
10
0
Projeção geométrica
Coordenadas Paralelas
COORDENADAS PARALELAS
Dados de veículos
• Milhas Por Galão
• # Cilindros (CYLINDERS)
• Autonomia (DISPLACEMENT)
• Potência (HORSEPOWER)
• Peso (WEIGHT)
• Aceleração (ACCELERATION)
• Ano (YEAR)
• Origem (AMER., EUROP.,
JAP.)
Software: VisTree
Análise Geral
Percepções
• Posição: correspondência, arranjo
• Forma: conectividade
• Cor: diferenciação
Interpretações:
• Correlação
• Tendência
• Sumarização
• Classificação
• Exceções
Base de Dados
• Matriz de Scatter Plots
– Projeção dos atributos combinados
– Correlação
Projeção geométrica
Matriz de Scatter PlotsMATRIZ DE SCATTER PLOTS
Dados de veículos
• Milhas Por Galão
• # Cilindros (CYLINDERS)
• Autonomia (DISPLACEMENT)
• Potência (HORSEPOWER)
• Peso (WEIGHT)
• Aceleração (ACCELERATION)
• Ano (YEAR)
• Origem (AMER., EUROP.,
JAP.)
Software: VisTree
Análise Geral
Percepções
• Posição: correspondência, arranjo
Interpretações:
• Correlação
• Tendência
• Exceções
http://publicationslist.org/junio
Projeção geométrica
Table Lens
TABLE LENS
Dados de filmes
• Rank de arrecadação (RANK)
• Lançamento (RELEASE DATE)
• Arrecadação (CUMULATIVE GROSS)
• Distribuidora (DISTRIBUTOR)
• Título (TITLE)
Software: Table Lens
Análise Geral
Percepções
• Posição: correspondência,
arranjo
• Forma: correspondência,
significado
• Cor: diferenciação
Interpretações:
• Correlação
• Tendência
• Classificação
• Exceções
• Leitura
http://publicationslist.org/junio
•Peso: 5
•Peso: 10
•MPG: 1
•Potência: 5
•Aceleração: 2
Técnicas Iconográficas
Star Glyphs
http://publicationslist.org/junio
#DECILINDROS
MILHAS POR GALÃO (MPG)
Técnicas Hierárquicas
Sobreposição Dimensional
POTÊNCIA
#DECILINDROS
MPG
PESO
http://publicationslist.org/junio
Técnicas Hierárquicas
Treemaps
http://publicationslist.org/junio
Técnicas Orientadas a Pixels
Padrões de Arranjo
• Design
• Arranjo dos pixels: apresentação depende da ordem
• Mapeamento de cores por valor de atributo
http://publicationslist.org/junio
Técnicas Orientadas a Pixels
Padrões de Arranjo
• Design
• Arranjo dos pixels: apresentação depende da
ordem
• Mapeamento de Cores por valor de atributo
• Um atributo (dimensão) por janela
Técnicas Orientadas a Pixels
Matriz de correlações
Técnicas Orientadas a Pixels
Matriz de correlações
Esquemas visuais
mais usados
• Projeções geométricas
• Técnicas iconográficas
• Técnicas hierárquicas
• Técnicas orientadas a pixels
 Introdução
 Alguns Conceitos
 Esquemas Visuais mais Usados
 Interação, Sistematização e Processamento
 Observações Conclusivas
Roteiro
http://publicationslist.org/junio
Interação e
Sistematização
• Interação: alteração dos parâmetros de posição, de forma e de
cor
• Principais:
– Filtragem interativa: alteração de cor (brushing) e de forma
(contorno de seleção)
– Transformação Espacial/Zoom: alteração de forma (escala) e
de posição (rotação e translação)
– Distorção: alteração de posição (diferentes perspectivas)
• Sistematização com expansão do espaço de exibição:
– Visões interligadas (linked-views)
– Múltiplos espaços de visualização
– Visualização em multi-resolução
O analista pode “sentir” melhor a cena de
análise, aumentando as possibilidades
de interpretação visual.
Análise Geral
Percepções
• Posição: correspondência, arranjo
• Forma: conectividade
• Cor: diferenciação
Interpretações:
• Correlação
• Tendência
• Sumarização
• Classificação
• Exceções
INTERAÇÃO VIA FILTRAGEM
INTERATIVA E LINK & BRUSH
SISTEMATIZAÇÃO POR VISÕES
INTERLIGADAS (linked-views)
Dados de veículos
• Milhas Por Galão
• # Cilindros (CYLINDERS)
• Autonomia (DISPLACEMENT)
• Potência (HORSEPOWER)
• Peso (WEIGHT)
• Aceleração (ACCELERATION)
• Ano (YEAR)
• Origem (AMER., EUROP., JAP.)
Software: VisTree
Ciência Analítica Visual
INTERAÇÃO VIA
TRANSFORMAÇÃO ESPACIAL
Dados de cidades
• Nome (CIDADE)
• Estado (UF)
• Latitude
• Longitude
Software: FastMapDB
Análise Geral
Percepções
• Posição: correspondência,
significado
• Cor: correspondência
Interpretações:
• Classificação
• Estrutura
• Agrupamentos
• Leitura
Ciência Analítica Visual
INTERAÇÃO VIA DISTORÇÃO
Dados de filmes
• Ano de produção
• Distribuidora (DISTRIBUTOR)
• Título (TITLE)
• Gênero
Software: TimeWall
Análise Geral
Percepções
• Posição: correspondência
• Forma: diferenciação,
significado
• Cor: correspondência
Interpretações:
• Tendência
• Classificação
• Exceções
• Agrupamentos
• Leitura
Interação - Distorção espacial
StarTree
http://publicationslist.org/junio
Processamento: pré-
processamento e
suporte estatístico
• Redução de dimensionalidade:
n-dimensional  k-dimensional, onde n < k
• Agregação: por exemplo, sumarização estatística
• Seleção: por exemplo, amostragem
• Segmentação: por exemplo, particionamento
hierárquico
REDUÇÃO DE DIMENSIONALIDADE
E INTERAÇÃO POR TRANSFORMAÇÃO
ESPACIAL
Dados de exames de câncer (biopsia)
• Identificador (ID)
• 9 exames laboratoriais
• Classificador (CLASS)
Software: FastMapDB
Análise Geral
Percepções
• Posição: correspondência, arranjo
• Cor: correspondência
Interpretações:
• Classificação
• Estrutura
• Exceções
• Agrupamentos
Ciência Analítica Visual
AGREGAÇÃO ESTATÍSTICA
Dados de veículos
•Dados de veículos
• Milhas Por Galão
• # Cilindros (CYLINDERS)
• Autonomia (DISPLACEMENT)
• Potência (HORSEPOWER)
• Peso (WEIGHT)
• Aceleração (ACCELERATION)
• Ano (YEAR)
• Origem (AMER., EUROP., JAP.)
Software: VisTree
Análise Geral
Percepções
• Posição: correspondência,
diferenciação, arranjo
• Forma: correspondência,
diferenciação, conectividade
• Cor: correspondência, diferenciação
Interpretações:
• Sumarização
• Correlação
• Relacionamento
• Tendência
• Classificação
• Exceções
• Agrupamentos
Ciência Analítica Visual
Autores
Autor AutorId
Autor1 1
Autor2 2
Autor3 3
Autor4 4
Autor5 5
Autoria
ArtigoId AutorId
A 1
A 2
B 1
B 4
C 2
C 5
D 3
D 4
Artigos
Artigo ArtigoId
Artigo1 A
Artigo2 B
Artigo3 C
Ciência Analítica Visual
Autores
Autor AutorId
Autor1 1
Autor2 2
Autor3 3
Autor4 4
Autor5 5
Autoria
ArtigoId AutorId
A 1
A 2
B 1
B 4
C 2
C 5
D 3
D 4
Artigos
Artigo ArtigoId
Artigo1 A
Artigo2 B
Artigo3 C
Ciência Analítica Visual
SISTEMATIZAÇÃO POR MULTI-
RESOLUÇÃO COM
SEGMENTAÇÃO HIERÁRQUICA
Dados de comunicação eletrônica
• Companhias
• Departamentos
• Pessoas
Software: GMine
Análise Geral
Percepções
• Posição: arranjo
• Forma: conectividade,
diferenciação
• Cor: diferenciação
Interpretações:
• Relacionamento
• Tendência
• Classificação
• Exceções
• Estrutura
• Agrupamentos
BoxPlot – Visão geral da
distribuição de variáveis
BoxPlot – Visão geral da
distribuição de variáveis
 Introdução
 Alguns Conceitos
 Esquemas Visuais mais Usados
 Interação, Sistematização e Processamento
 Observações Conclusivas
Roteiro
Comparação com
Mineração de Dados
• Extração não trivial de informações
implícitas, potencialmente úteis e
previamente desconhecidas
• Caracteristicamente algorítmica
Visualização de Informações
+
Algoritmos de Mineração de Dados
Algoritmos de
Mineração de Dados
Visualização
de
Informações
Objetivo + –
Mensurável + –
Flexível – +
Interativo – +
Comparação com
Mineração de Dados
Visualização de Informações
+
Algoritmos de Mineração de Dados
Algoritmos de
Mineração de Dados
Visualização
de
Informações
Objetivo + –
Mensurável + –
Flexível – +
Interativo – +
Mineração Visual de Dados: utilização
de Visualização de Informações para
monitorar, guiar ou se beneficiar de
algoritmos de Mineração de Dados.
Comparação com
Mineração de Dados
Exemplo: monitoramento visual do algoritmo k-
medoid para detecção de clusters.
Mineração de Dados
Algoritmo k-medoid:
1. Selecione os elementos que serão os centros dos
agrupamentos
2. Verifique todos os pontos do conjunto e atribua a cada ponto
o agrupamento referente ao centro mais próximo
3. Recalcule os centros dos agrupamentos de acordo com os
agrupamentos definidos
4. Enquanto os centros trocarem de posição, vá para o passo 2
Minimizar
Estado da Arte
A Ciência Analítica Visual [2]
Estado da Arte
A Ciência Analítica Visual [2]
Tecnologias de dados:
● armazenamento
● disponibilização
● gerenciamento.
Formatos de dados
versáteis, orientados à
análise.
Procedimentos
sistemáticos de
análise:
● avaliação
● planejamento
● tomada de decisão.
Design de
técnicas de
visualização
e interação.
Disponibilização
e difusão.
Estado da Arte
A Ciência Analítica Visual [2]
Tecnologias de dados:
● armazenamento
● disponibilização
● gerenciamento.
Formatos de dados
versáteis, orientados à
análise.
Procedimentos
sistemáticos de
análise:
● avaliação
● planejamento
● tomada de decisão.
Design de
técnicas de
visualização
e interação.
Disponibilização
e difusão.
Formalização do fato de que a
ciência de InfoVis engloba uma
série de disciplinas, todas inter-
relacionadas.
Avaliação de técnicas de
análise visual de dados
• Tema amplo
• Critérios:
– Funcionalidade – as funcionalidades esperadas são oferecidas?
– Efetividade – a técnica agrega valor? Novas descobertas nos dados?
– Eficiência – a técnica promove melhor desempenho?
– Usabilidade – qual é a dificuldade em se usar o sistema? Há clareza?
– Utilidade – é possível se beneficiar da técnica?
• Metodologias:
– Avaliação analítica: baseada em modelos e em testes estruturados;
– Avaliação empírica: quantitativa ou qualitativa
Avaliação de técnicas de
análise visual de dados
• Tema amplo
• Critérios:
– Funcionalidade – as funcionalidades esperadas são oferecidas?
– Efetividade – a técnica agrega valor? Novas descobertas nos dados?
– Eficiência – a técnica promove melhor desempenho?
– Usabilidade – qual é a dificuldade em se usar o sistema? Há clareza?
– Utilidade – é possível se beneficiar da técnica?
• Metodologias:
– Avaliação analítica: baseada em modelos e em testes estruturados;
– Avaliação empírica: quantitativa ou qualitativa
• Há subjetividade semelhante ao que se observa em HCI
(Human-Computer Interaction);
• Devido ao contexto analítico, nem sempre as técnicas de HCI
podem ser aplicadas sem adaptação;
• Da mesma forma, há metodologias bastante satisfatórias,
mas com alto custo de aplicação.
Avaliação de técnicas de
análise visual de dados
• DECIDE1: um arcabouço para avaliação de sistemas
1. Determine os objetivos: o quê se quer avaliar?
2. Enumere questões relevantes sobre os objetivos;
3. Escolha a metodologia de avaliação: slide anterior;
4. Identifique os fatores práticos: usuários, equipamento, dados, ...
5. Gerencie as questões éticas;
6. Avalie, interprete e apresente os resultados.
1 J. Preece, Y. Rogers, and H. Sharp, Interaction Design. John Wiley & Sons, Inc., 2002
http://publicationslist.org/junio
Disseminação
• SAP: incorporou (da Inxight) as técnicas StarTree, TableLens
e TimeWall em seus produtos
• TIBCO (Spotfire): comercializa técnicas como Coordenadas
Paralelas, Scatter Plots e TreeMaps
• Advanced Visual Systems (AVS): abrange soluções para a
indústria e para a academia
• Outras empresas: Advizor Solutions, Compudigm, Dimension
5, Infommersion, Macrofocus, Purple Insight, ...
• Listagem completa: http://kisd.de/~marian/infovis/
Linhas de
Desenvolvimento
1. Paradigmas de Interação
Orientados ao usuário E.g.: perspective view
Orientados a sistema E.g.: linked views
2. Suporte da Ciência da Computação
Componentes E.g.: Graph-Tree
Aperfeiçoamentos E.g.: Keim’s color space
Linhas de
Desenvolvimento
3. Novos Designs
E.g.: Gapminder
E.g.: Table Lens
4. Suporte Teórico
Espaços de Design E.g.: design orientado à percepção
Estudo do sistema
perceptivo
E.g.: princípios de manipulação direta
5. Suporte de Desenvolvimento
Componentes E.g.: OpenGL
Toolkits E.g.: IVTK http://ivtk.sourceforge.net/
3. Novos Designs
E.g.: Gapminder
E.g.: Table Lens
4. Suporte Teórico
Espaços de Design E.g.: design orientado à percepção
Estudo do sistema
perceptivo
E.g.: princípios de manipulação direta
5. Suporte de Desenvolvimento
Componentes E.g.: OpenGL
Toolkits E.g.: IVTK http://ivtk.sourceforge.net/
Linhas de
Desenvolvimento
3. Novos Designs
E.g.: Gapminder
E.g.: Table Lens
4. Suporte Teórico
Espaços de Design E.g.: design orientado à percepção
Estudo do sistema
perceptivo
E.g.: princípios de manipulação direta
5. Suporte de Desenvolvimento
Componentes E.g.: OpenGL
Toolkits E.g.: IVTK http://ivtk.sourceforge.net/
Linhas de
Desenvolvimento
Ainda há muito o que se fazer em:
 visualização de dados relacionais
 escalabilidade de dados
 uso combinado com mineração de dados
visualização 3D interativa
 utilização da dimensão temporal (animação)
Discussão
• A visualização pode resolver todos os meus problemas
de análise de dados?
R.: Não. Análise de dados é um processo elaborado que
requer profundo conhecimento de domínio, objetivos
claros e trabalho intenso.
• Posso trabalhar sem visualização, então?
R.: Não. Apesar de seus limites, a visualização provê
benefícios bastante favoráveis, e não há substituto
para estes benefícios.
Discussão
• A visualização pode resolver todos os meus problemas
de análise de dados?
R.: Não. Análise de dados é um processo elaborado que
requer profundo conhecimento de domínio, objetivos claros
e trabalho intenso.
• Posso trabalhar sem visualização, então?
R.: Não. Apesar de seus limites, a visualização provê
benefícios bastante favoráveis, e não há substituto
para estes benefícios.
Discussão
• A visualização pode resolver todos os meus problemas
de análise de dados?
R.: Não. Análise de dados é um processo elaborado que
requer profundo conhecimento de domínio, objetivos claros
e trabalho intenso.
• Posso trabalhar sem visualização, então?
R.: Não. Apesar de seus limites, a visualização provê
benefícios bastante favoráveis, e não há substituto para
tais benefícios.
Livros Básicos
Visualização de
Informações
Robert SPENCE. “Information Visualization”, ACM
Press, 2001
Stuart K. Card, Jock D. MacKinlay, Ben
Shneiderman, Mackinlay Card (eds.). “Readings
in Information Visualization: Using Vision to
Think”, Morgan Kaufmann Series in Interactive
Technologies, Academic Press, 1999. ISBN 1-
55860-533-9
Colin WARE. “Information Visualization:
Perception for Design”, Morgan Kaufmann
Interactive Technologies Series, January 2000.
ISBN 1-55860-511-8
K. Cios et. al. - “Data Mining: A Knowledge
Discovery Approach”, Springer, 2007
Jiawei Han, Micheline Kamber. “Data Mining:
Concepts and Techniques”, Morgan Kaufmann,
2006
Pang-Ning Tan, Michael Steinbach, Vipin Kumar.
“Introduction to Data Mining”, Addison
Wesley, 2005
Livros Básicos
Mineração de Dados
Fontes de InfoVis
• http://www.wikivis.org/
• Revistas
– IEEE “Transactions on Visualization and Computer
Graphics”
– Palgrave “Information Visualization”
• Conferências
– IEEE Symposium on Information Visualization (InfoVis)
– IEEE Conference on Visualization (Vis)
– Joint Eurographics IEEE TVCG Symposium on
Visualization (EuroVis)
– International Conference on Visualisation (IV)
– International Symposium on Smart Graphics (SG)
Profissionais em InfoVis
• Em ordem alfabética:
– Agma Traina – ICMC-USP
– Carla M. D. S. Freitas - UFRGS
– Fernando Paulovich – ICMC-USP
– Luciana P. Nedel - UFRGS
– Maria Cristina F. de Oliveira – ICMC-USP
– Rosane Minghin – ICMC-USP
Outras áreas de
visualização
• Visualização Científica
• Visualização de Software
• Visualização Geográfica
• Visualização de Redes
• Ciência Analítica
• Realidade Virtual
• Realidade Aumentada
• Sonificação (som)
• Háptica (tato)
Prof. Dr.
José Fernando Rodrigues Júnior
http://www.icmc.usp.br/~junio
junio@icmc.usp.br
Principais áreas (maioria das publicações):
- Análise Visual de Dados
- Recuperação de dados baseada em
conteúdo
Áreas Secundárias (já publicado):
- Mineração de grafos
- Estruturas de dados para indexação
- Processamento de imagens
- E-learning
Fim.
Análise Visual de Dados:
conceitos, técnicas e
sistemas
Referências
• [1] “How Much Information?”
Lyman P and HR Varian, 2003. Disponível em
http://www.sims.berkeley.edu/how-much-info.
• [2] “Illuminating the Path: The Research and
Development Agenda for Visual Analytics”
James J. Thomas and Kristin A. Cook, editors.
IEEE Press, 2005. Disponível em
http://nvac.pnl.gov/agenda.stm.

Mais conteúdo relacionado

Destaque (8)

Tópico 4 regressão linear simples 02
Tópico 4   regressão linear simples 02Tópico 4   regressão linear simples 02
Tópico 4 regressão linear simples 02
 
06 tópico 5 - heterocedasticidade
06   tópico 5 - heterocedasticidade06   tópico 5 - heterocedasticidade
06 tópico 5 - heterocedasticidade
 
02 tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA
02   tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA02   tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA
02 tópico 1 - regressão linear simples 01 - Econometria - Graduação - UFPA
 
05 tópico 4 - multicolinearidade
05   tópico 4 - multicolinearidade05   tópico 4 - multicolinearidade
05 tópico 4 - multicolinearidade
 
Econometria 1
Econometria 1Econometria 1
Econometria 1
 
Análise multivarida e correlacões no Genes
Análise multivarida e correlacões no GenesAnálise multivarida e correlacões no Genes
Análise multivarida e correlacões no Genes
 
Regressão - aula 03/04
Regressão - aula 03/04Regressão - aula 03/04
Regressão - aula 03/04
 
Regressão - aula 04/04
Regressão - aula 04/04Regressão - aula 04/04
Regressão - aula 04/04
 

Semelhante a Infovis tutorial

Introdução à Visualização de Dados (2015)
Introdução à Visualização de Dados (2015)Introdução à Visualização de Dados (2015)
Introdução à Visualização de Dados (2015)Helder da Rocha
 
Aula introducao-redes-neurais
Aula introducao-redes-neuraisAula introducao-redes-neurais
Aula introducao-redes-neuraisLeo Laurett
 
Procedimentos qualitativos na investigação MID II
Procedimentos qualitativos na investigação MID IIProcedimentos qualitativos na investigação MID II
Procedimentos qualitativos na investigação MID IIMaria Alves
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Alexandre Duarte
 
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...Dalton Martins
 
Modelagem de sistemas - Pensamento sistêmico
Modelagem de sistemas - Pensamento sistêmicoModelagem de sistemas - Pensamento sistêmico
Modelagem de sistemas - Pensamento sistêmicoBruno Oliveira
 
analise-de-sistemas-aula-01-bcc-noturno-ema908915a.pptx
analise-de-sistemas-aula-01-bcc-noturno-ema908915a.pptxanalise-de-sistemas-aula-01-bcc-noturno-ema908915a.pptx
analise-de-sistemas-aula-01-bcc-noturno-ema908915a.pptxMoysesOliveira3
 
Uma introdução à mineração de informações
Uma introdução à mineração de informaçõesUma introdução à mineração de informações
Uma introdução à mineração de informaçõesFabrício Barth
 
Aula 3 - Modelo multifacetado de uso da informacao
Aula 3 - Modelo multifacetado de uso da informacaoAula 3 - Modelo multifacetado de uso da informacao
Aula 3 - Modelo multifacetado de uso da informacaoLeticia Strehl
 
Análise de Tutoriais e Sites educacionais em competência em informação
Análise de Tutoriais e Sites educacionais em competência em informaçãoAnálise de Tutoriais e Sites educacionais em competência em informação
Análise de Tutoriais e Sites educacionais em competência em informaçãoElisabeth Dudziak
 
Sociologia da Informação 7.pptx
Sociologia da Informação 7.pptxSociologia da Informação 7.pptx
Sociologia da Informação 7.pptxssuser3ca214
 
Findability: elementos essenciais para a recuperação da informação em ambient...
Findability: elementos essenciais para a recuperação da informação em ambient...Findability: elementos essenciais para a recuperação da informação em ambient...
Findability: elementos essenciais para a recuperação da informação em ambient...Index3i
 

Semelhante a Infovis tutorial (20)

Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Introdução à Visualização de Dados (2015)
Introdução à Visualização de Dados (2015)Introdução à Visualização de Dados (2015)
Introdução à Visualização de Dados (2015)
 
Aula introducao-redes-neurais
Aula introducao-redes-neuraisAula introducao-redes-neurais
Aula introducao-redes-neurais
 
Procedimentos qualitativos na investigação MID II
Procedimentos qualitativos na investigação MID IIProcedimentos qualitativos na investigação MID II
Procedimentos qualitativos na investigação MID II
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01
 
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
 
Aula 1 final
Aula 1 finalAula 1 final
Aula 1 final
 
Mineração
MineraçãoMineração
Mineração
 
Modelagem de sistemas - Pensamento sistêmico
Modelagem de sistemas - Pensamento sistêmicoModelagem de sistemas - Pensamento sistêmico
Modelagem de sistemas - Pensamento sistêmico
 
Trabalhadores Do Conhecimento
Trabalhadores Do ConhecimentoTrabalhadores Do Conhecimento
Trabalhadores Do Conhecimento
 
analise-de-sistemas-aula-01-bcc-noturno-ema908915a.pptx
analise-de-sistemas-aula-01-bcc-noturno-ema908915a.pptxanalise-de-sistemas-aula-01-bcc-noturno-ema908915a.pptx
analise-de-sistemas-aula-01-bcc-noturno-ema908915a.pptx
 
Uma introdução à mineração de informações
Uma introdução à mineração de informaçõesUma introdução à mineração de informações
Uma introdução à mineração de informações
 
Aula 3 - Modelo multifacetado de uso da informacao
Aula 3 - Modelo multifacetado de uso da informacaoAula 3 - Modelo multifacetado de uso da informacao
Aula 3 - Modelo multifacetado de uso da informacao
 
Analise e Projeto de Sistemas
Analise e Projeto de SistemasAnalise e Projeto de Sistemas
Analise e Projeto de Sistemas
 
Tgs unidade 1
Tgs unidade 1Tgs unidade 1
Tgs unidade 1
 
Análise de Tutoriais e Sites educacionais em competência em informação
Análise de Tutoriais e Sites educacionais em competência em informaçãoAnálise de Tutoriais e Sites educacionais em competência em informação
Análise de Tutoriais e Sites educacionais em competência em informação
 
Sociologia da Informação 7.pptx
Sociologia da Informação 7.pptxSociologia da Informação 7.pptx
Sociologia da Informação 7.pptx
 
Findability: elementos essenciais para a recuperação da informação em ambient...
Findability: elementos essenciais para a recuperação da informação em ambient...Findability: elementos essenciais para a recuperação da informação em ambient...
Findability: elementos essenciais para a recuperação da informação em ambient...
 
Inteligencia artificial
Inteligencia artificialInteligencia artificial
Inteligencia artificial
 

Mais de Universidade de São Paulo

Introdução às ferramentas de Business Intelligence do ecossistema Hadoop
Introdução às ferramentas de Business Intelligence do ecossistema HadoopIntrodução às ferramentas de Business Intelligence do ecossistema Hadoop
Introdução às ferramentas de Business Intelligence do ecossistema HadoopUniversidade de São Paulo
 
On the Support of a Similarity-Enabled Relational Database Management System ...
On the Support of a Similarity-Enabled Relational Database Management System ...On the Support of a Similarity-Enabled Relational Database Management System ...
On the Support of a Similarity-Enabled Relational Database Management System ...Universidade de São Paulo
 
Effective and Unsupervised Fractal-based Feature Selection for Very Large Dat...
Effective and Unsupervised Fractal-based Feature Selection for Very Large Dat...Effective and Unsupervised Fractal-based Feature Selection for Very Large Dat...
Effective and Unsupervised Fractal-based Feature Selection for Very Large Dat...Universidade de São Paulo
 
Fire Detection on Unconstrained Videos Using Color-Aware Spatial Modeling and...
Fire Detection on Unconstrained Videos Using Color-Aware Spatial Modeling and...Fire Detection on Unconstrained Videos Using Color-Aware Spatial Modeling and...
Fire Detection on Unconstrained Videos Using Color-Aware Spatial Modeling and...Universidade de São Paulo
 
Unveiling smoke in social images with the SmokeBlock approach
Unveiling smoke in social images with the SmokeBlock approachUnveiling smoke in social images with the SmokeBlock approach
Unveiling smoke in social images with the SmokeBlock approachUniversidade de São Paulo
 
Vertex Centric Asynchronous Belief Propagation Algorithm for Large-Scale Graphs
Vertex Centric Asynchronous Belief Propagation Algorithm for Large-Scale GraphsVertex Centric Asynchronous Belief Propagation Algorithm for Large-Scale Graphs
Vertex Centric Asynchronous Belief Propagation Algorithm for Large-Scale GraphsUniversidade de São Paulo
 
Fast Billion-scale Graph Computation Using a Bimodal Block Processing Model
Fast Billion-scale Graph Computation Using a Bimodal Block Processing ModelFast Billion-scale Graph Computation Using a Bimodal Block Processing Model
Fast Billion-scale Graph Computation Using a Bimodal Block Processing ModelUniversidade de São Paulo
 
StructMatrix: large-scale visualization of graphs by means of structure detec...
StructMatrix: large-scale visualization of graphs by means of structure detec...StructMatrix: large-scale visualization of graphs by means of structure detec...
StructMatrix: large-scale visualization of graphs by means of structure detec...Universidade de São Paulo
 
Techniques for effective and efficient fire detection from social media images
Techniques for effective and efficient fire detection from social media imagesTechniques for effective and efficient fire detection from social media images
Techniques for effective and efficient fire detection from social media imagesUniversidade de São Paulo
 
Multimodal graph-based analysis over the DBLP repository: critical discoverie...
Multimodal graph-based analysis over the DBLP repository: critical discoverie...Multimodal graph-based analysis over the DBLP repository: critical discoverie...
Multimodal graph-based analysis over the DBLP repository: critical discoverie...Universidade de São Paulo
 
Supervised-Learning Link Recommendation in the DBLP co-authoring network
Supervised-Learning Link Recommendation in the DBLP co-authoring networkSupervised-Learning Link Recommendation in the DBLP co-authoring network
Supervised-Learning Link Recommendation in the DBLP co-authoring networkUniversidade de São Paulo
 
Reviewing Data Visualization: an Analytical Taxonomical Study
Reviewing Data Visualization: an Analytical Taxonomical StudyReviewing Data Visualization: an Analytical Taxonomical Study
Reviewing Data Visualization: an Analytical Taxonomical StudyUniversidade de São Paulo
 
Complexidade de Algoritmos, Notação assintótica, Algoritmos polinomiais e in...
Complexidade de Algoritmos, Notação assintótica, Algoritmos polinomiais e in...Complexidade de Algoritmos, Notação assintótica, Algoritmos polinomiais e in...
Complexidade de Algoritmos, Notação assintótica, Algoritmos polinomiais e in...Universidade de São Paulo
 
Visualization tree multiple linked analytical decisions
Visualization tree multiple linked analytical decisionsVisualization tree multiple linked analytical decisions
Visualization tree multiple linked analytical decisionsUniversidade de São Paulo
 

Mais de Universidade de São Paulo (20)

A gentle introduction to Deep Learning
A gentle introduction to Deep LearningA gentle introduction to Deep Learning
A gentle introduction to Deep Learning
 
Computação: carreira e mercado de trabalho
Computação: carreira e mercado de trabalhoComputação: carreira e mercado de trabalho
Computação: carreira e mercado de trabalho
 
Introdução às ferramentas de Business Intelligence do ecossistema Hadoop
Introdução às ferramentas de Business Intelligence do ecossistema HadoopIntrodução às ferramentas de Business Intelligence do ecossistema Hadoop
Introdução às ferramentas de Business Intelligence do ecossistema Hadoop
 
On the Support of a Similarity-Enabled Relational Database Management System ...
On the Support of a Similarity-Enabled Relational Database Management System ...On the Support of a Similarity-Enabled Relational Database Management System ...
On the Support of a Similarity-Enabled Relational Database Management System ...
 
Effective and Unsupervised Fractal-based Feature Selection for Very Large Dat...
Effective and Unsupervised Fractal-based Feature Selection for Very Large Dat...Effective and Unsupervised Fractal-based Feature Selection for Very Large Dat...
Effective and Unsupervised Fractal-based Feature Selection for Very Large Dat...
 
Fire Detection on Unconstrained Videos Using Color-Aware Spatial Modeling and...
Fire Detection on Unconstrained Videos Using Color-Aware Spatial Modeling and...Fire Detection on Unconstrained Videos Using Color-Aware Spatial Modeling and...
Fire Detection on Unconstrained Videos Using Color-Aware Spatial Modeling and...
 
Unveiling smoke in social images with the SmokeBlock approach
Unveiling smoke in social images with the SmokeBlock approachUnveiling smoke in social images with the SmokeBlock approach
Unveiling smoke in social images with the SmokeBlock approach
 
Vertex Centric Asynchronous Belief Propagation Algorithm for Large-Scale Graphs
Vertex Centric Asynchronous Belief Propagation Algorithm for Large-Scale GraphsVertex Centric Asynchronous Belief Propagation Algorithm for Large-Scale Graphs
Vertex Centric Asynchronous Belief Propagation Algorithm for Large-Scale Graphs
 
Fast Billion-scale Graph Computation Using a Bimodal Block Processing Model
Fast Billion-scale Graph Computation Using a Bimodal Block Processing ModelFast Billion-scale Graph Computation Using a Bimodal Block Processing Model
Fast Billion-scale Graph Computation Using a Bimodal Block Processing Model
 
An introduction to MongoDB
An introduction to MongoDBAn introduction to MongoDB
An introduction to MongoDB
 
StructMatrix: large-scale visualization of graphs by means of structure detec...
StructMatrix: large-scale visualization of graphs by means of structure detec...StructMatrix: large-scale visualization of graphs by means of structure detec...
StructMatrix: large-scale visualization of graphs by means of structure detec...
 
Apresentacao vldb
Apresentacao vldbApresentacao vldb
Apresentacao vldb
 
Techniques for effective and efficient fire detection from social media images
Techniques for effective and efficient fire detection from social media imagesTechniques for effective and efficient fire detection from social media images
Techniques for effective and efficient fire detection from social media images
 
Multimodal graph-based analysis over the DBLP repository: critical discoverie...
Multimodal graph-based analysis over the DBLP repository: critical discoverie...Multimodal graph-based analysis over the DBLP repository: critical discoverie...
Multimodal graph-based analysis over the DBLP repository: critical discoverie...
 
Supervised-Learning Link Recommendation in the DBLP co-authoring network
Supervised-Learning Link Recommendation in the DBLP co-authoring networkSupervised-Learning Link Recommendation in the DBLP co-authoring network
Supervised-Learning Link Recommendation in the DBLP co-authoring network
 
Graph-based Relational Data Visualization
Graph-based RelationalData VisualizationGraph-based RelationalData Visualization
Graph-based Relational Data Visualization
 
Reviewing Data Visualization: an Analytical Taxonomical Study
Reviewing Data Visualization: an Analytical Taxonomical StudyReviewing Data Visualization: an Analytical Taxonomical Study
Reviewing Data Visualization: an Analytical Taxonomical Study
 
Complexidade de Algoritmos, Notação assintótica, Algoritmos polinomiais e in...
Complexidade de Algoritmos, Notação assintótica, Algoritmos polinomiais e in...Complexidade de Algoritmos, Notação assintótica, Algoritmos polinomiais e in...
Complexidade de Algoritmos, Notação assintótica, Algoritmos polinomiais e in...
 
Dawarehouse e OLAP
Dawarehouse e OLAPDawarehouse e OLAP
Dawarehouse e OLAP
 
Visualization tree multiple linked analytical decisions
Visualization tree multiple linked analytical decisionsVisualization tree multiple linked analytical decisions
Visualization tree multiple linked analytical decisions
 

Infovis tutorial

  • 1. http://publicationslist.org/junio José Fernando Rodrigues Júnior Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação - 2012 - Análise Visual de Dados: conceitos, técnicas e sistemas
  • 2. Roteiro  Introdução  Alguns Conceitos  Esquemas visuais mais usados  Interação, Sistematização e Processamento  Observações Conclusivas
  • 3. Questões a serem respondidas • O que é Visualização de Informações? • Por que seu uso? • Princípios • Técnicas mais usuais • Exemplos de sistematização • Estado da arte • Como obter mais informações sobre o assunto?
  • 4. O que é? • A prática de se beneficiar das capacidades cognitivas visuais para se expressar conhecimento de maneira mais rápida e intuitiva. • Também denominada Infovis • Exemplo: a invasão francesa da Rússia
  • 6.  Evolução do Hardware • Dobro do processamento a cada 18 meses (Moore’s Law) • Dobro de tecnologia gráfica a cada 12 meses • Tendência observada já há 50 anos Fatos  Crescimento da produção/fluxo de dados • Apenas em 2010, estimativa de 5 zetabytes (270 B) • O armazenamento de novas informações tem crescido à taxa de mais de 30 % ao ano
  • 7.  Evolução do Hardware • Dobro do processamento a cada 18 meses (Moore’s Law) • Dobro de tecnologia gráfica a cada 12 meses • Tendência observada já há 50 anos • Pelo menos mais 10 anos Fatos  Crescimento da produção/fluxo de dados • Apenas em 2010, estimativa de 5 zetabytes (270 B) • O armazenamento de novas informações tem crescido à taxa de mais de 30 % ao ano “O propósito da computação é compreensão, e não números.” Richard Hamming (Turing Award, 1968)
  • 8. http://publicationslist.org/junio • Em contraste, habilidades humanas básicas não mudam ao longo do tempo • Bancos de dados com uma quantidade de dados muito maior do que é possível para o ser humano aproveitar  Não evolução do ser humano  Conseqüência As técnicas de Visualização de Informações reduzem este problema. Fatos
  • 9. Exibição de dados – diferentes abordagens • Computação gráfica: como renderizar? • Visualização científica: como reproduzir graficamente? • Visualização de informações: como definir um design que personifique meus dados?
  • 10. Exibição de dados – diferentes abordagens • Computação gráfica: como renderizar? • Visualização científica: como reproduzir graficamente? • Visualização de informações: como definir um design que personifique meus dados? Tabela Balancete Trimestre Faturamento 1 70 2 20 3 5 4 5
  • 11. Ciência Analítica • Objetivos: – Avaliar – Prever – Identificar alternativas – Suporte à decisão • Artefatos de racionalização, hierárquicos: – Elementares: dados individuais, suposições, evidências... – Padrões analíticos: correlação, tendência, classificação, relacionamento, exceções, agrupamentos, estrutura, ... – Artefatos de ordem superior: inferência lógica (se então, por exemplo), casualidade temporal, modelos de regressão (padrões funcionais), ... – Complexos: hipóteses e cenários (explicações)
  • 12. Ciência Analítica Artefatos Elementares Ex.: dados e suposições Padrões Analíticos Ex.: tendência, classificação, relacionamento, agrupamentos,... Artefatos de Ordem Superior Ex.: inferência lógica (se então, se e somente se), modelos de regressão Hipóteses E Cenários (previsão, avaliação, explicação)
  • 13. Ciência Analítica Artefatos Elementares Ex.: dados e suposições Padrões Analíticos Ex.: tendência, classificação, relacionamento, agrupamentos,... Artefatos de Ordem Superior Ex.: inferência lógica (se então, se e somente se), modelos de regressão Hipóteses E Cenários (previsão, avaliação, explicação) Principal abrangência da visualização
  • 14. Ciência Analítica Artefatos Elementares Ex.: dados e suposições Padrões Analíticos Ex.: tendência, classificação, relacionamento, agrupamentos,... Artefatos de Ordem Superior Ex.: inferência lógica (se então, se e somente se), modelos de regressão Hipóteses E Cenários (previsão, avaliação, explicação) Principal abrangência da visualização Mineração de dados e raciocínio suportado por visualização
  • 15. Ciência Analítica Artefatos Elementares Ex.: dados e suposições Padrões Analíticos Ex.: tendência, classificação, relacionamento, agrupamentos,... Artefatos de Ordem Superior Ex.: inferência lógica (se então, se e somente se), modelos de regressão Hipóteses E Cenários (previsão, avaliação, explicação) Principal abrangência da visualização Mineração de dados e raciocínio suportado por visualização Profundo conhecimento de domínio
  • 16. Ciência Analítica • Objetivos: – Avaliar – Prever – Identificar alternativas – Suporte à decisão • Artefatos de racionalização: – Elementares: dados individuais, suposições, evidências... – Padrões analíticos: correlação, tendência, classificação, relacionamento, exceções, agrupamentos, estrutura, ... – Artefatos de ordem superior: inferência lógica (se então, por exemplo), casualidade temporal, modelos de regressão (padrões funcionais), ... – Complexos: hipóteses e cenários (explicações) Outros recursos: • Descartes R. 1637. Discourse on Method; • Jones M. 1995. The Thinker’s Toolkit: 14 Powerful Techniques for Problem Solving. Three Rivers Press; • Heuer R. 1999. Psychology of Intelligence Analysis. U.S. Government Printing Office; • Adams JL. 2001. Conceptual Blockbusting: A Guide to Better Ideas. Fourth edition, Perseus Publishing.
  • 17. Roteiro  Introdução  Alguns Conceitos  Esquemas Visuais mais Usados  Interação, Sistematização e Processamento  Observações Conclusivas
  • 19. Princípio da Visualização • Os olhos têm acesso privilegiado ao cérebro • Mais de 50 % do cérebro é dedicado à visão
  • 20. Recursos – pré-atenção • Mecanismo da visão, duas fases – 1ª. Fase: pré-atenção instantânea e em paralelo – 2ª. Fase: varredura demorada e seqüencial Quantos números “4” há na cena?
  • 21. Recursos – pré-atenção  Cor PB PD PE PA PI PJ PL PK PC PB PD PE PA PI PJ PL PK PC PE PI PL DIR ESQ ESQ PD PA DIR ESQ PB PJ PK PC ESQ DIR ESQ DIR IDEOL.PART. Estímulos pré-atentivos 4 canais
  • 22. Recursos – pré-atenção Estímulos pré-atentivos 4 canais  Posição PB PD PE PA PI PJ PL PK PC PA PB PD PE PC PI PJ PL PK PE PI PL DIR ESQ ESQ PD PA DIR ESQ PB PJ PK PC ESQ DIR ESQ DIR IDEOL.PART.
  • 23. Recursos – pré-atenção  Forma PB PD PE PA PI PJ PL PK PC PB PD PI PJ PA PC PL PEPK PE PI PL DIR ESQ ESQ PD PA DIR ESQ PB PJ PK PC ESQ DIR ESQ DIR IDEOL.PART. Estímulos pré-atentivos 4 canais
  • 24. Recursos – pré-atenção  Tempo (animação cor, posição e/ou forma) PE PA PI PK PE PI PL DIR ESQ ESQ PD PA DIR ESQ PB PJ PK PC ESQ DIR ESQ DIR IDEOL.PART. Estímulos pré-atentivos 4 canais PE PA PI PK
  • 26. Recursos – pré-atenção • Posição: 1D, 2D e 3D; • Forma: ponto, linha, área, volume, orientação, comprimento, colinearidade, tamanho, curvatura; • Cor: matiz, saturação, brilho, textura; • Tempo (animação): movimento e intermitência. Estímulos pré-atentivos
  • 27. Recursos – pré-atenção • Posição: 1D, 2D e 3D; • Forma: ponto, linha, área, volume, orientação, comprimento, colinearidade, tamanho, curvatura; • Cor: matiz, saturação, brilho, textura; • Tempo (animação): movimento e intermitência. Mas o que isso tem a ver com computação? Auxílio computacional: • escalabilidade de dados (via SGBDs) e de processamento • interação: redefinição em tempo real da apresentação de dados • dimensão temporal • algorítmico: combinação com mineração de dados Estímulos pré-atentivos
  • 28. Recursos – pré-atenção • Mecanismo da visão, duas fases – 1ª. Fase: pré-atenção instantânea e em paralelo – 2ª. Fase: varredura demorada e sequencial Procedimento geral da visualização (Visualization Mantra): Visão geral (1ª. fase) Zoom & filtragem (Interação) Detalhes sob demanda (2ª. Fase)
  • 29. http://publicationslist.org/junio Recursos – pré-atenção Qual o estado com maior nível salarial? Qual a relação entre salário e educação? Comportamentos incomuns (outliers)?
  • 30. http://publicationslist.org/junio Recursos – pré-atenção Salário annual Per Capita (U$) Níveleducacional(%comcursosuperior)
  • 32. Recursos: pré-atenção  percepção  raciocíonio Pré-atenção: • Posição • Forma • Cor • Tempo Percepção (padrões visuais): • Correspondência • Diferenciação • Conectividade • Arranjo • Significado • Variação Interpretação (padrões analíticos): • Correlação • Tendência • Classificação • Relacionamento • Sumarização • Exceções • Agrupamentos • Estrutura • Leitura, ... Observação Raciocínio
  • 33. Recursos: pré-atenção  percepção  raciocíonio Pré-atenção: • Posição • Forma • Cor • Tempo Observação Raciocínio Projeto/ Sistematização /Utilização Percepção (padrões visuais): • Correspondência • Diferenciação • Conectividade • Arranjo • Significado • Variação Etapa natural com pouca carga cognitiva Conhecimento de domínio Interpretação (padrões analíticos): • Correlação • Tendência • Classificação • Relacionamento • Sumarização • Exceções • Agrupamentos • Estrutura • Leitura, ... Geração de conclusões com base no domínio dos dados
  • 34. Recursos: pré-atenção  percepção  raciocíonio Canal: Posição ● Forma ● Cor ● Tempo ● Padrões visuais: ● Correspondência ● Diferenciação ● Conectividade ● Arranjo ● Significado ● Variação
  • 36. Demonstração Mundo: Renda X Emissão de Carbono PROJEÇÃO ANIMADA Dados de IDH • Ano • Nome do país • Tamanho da população • Grupo de renda • Renda per capita (U$) • Emissão de CO2 (ton/pessoa) Software: Gapminder (spreadsheet do Google Docs) Análise Geral Percepções • Posição: correspondência, arranjo • Forma: correspondência, diferenciação, conectividade, significado • Cor: correspondência • Animação Interpretações: • Correlação • Tendência • Classificação • Exceções • Agrupamentos • Estrutura • Leitura
  • 37. Demonstração Mundo: Fertilidade X PopulaçãoPROJEÇÃO ANIMADA Dados de IDH • Ano • Nome do país • Filhos por mulher • Tamanho da População • Renda per capita • Grupo de renda Software: Gapminder (spreadsheet do Google Docs)
  • 38. http://publicationslist.org/junio 1. Mais Recursos – Processamento perceptivo paralelo – Percepção ao invés de cognição – Expansão das memórias de curto e longo prazo do usuário 2. Busca Reduzida – Informações agrupadas reduzem a varredura sequencial – Leitura espacial instantânea 3. Melhor Reconhecimento de Padrões – Reconhecer ao invés de relembrar – Abstração e agregação – Exposição estrutural – Valor, relacionamento, tendência Como a visualização pode ajudar?
  • 39. http://publicationslist.org/junio Como a visualização pode ajudar? 4. Inferência Perceptiva – Alguns problemas se tornam óbvios – O raciocínio é amplificado com pistas visuais 5. Monitoramento Perceptivo – Alterações visuais saltam aos olhos 6. Mídia Manipulável – Interação
  • 42. Linhas Gerais de Aplicação Tarefas Exploração analítica Descobrir hipótese Apresentação confirmatória Verificar hipótese Suporte à decisão Avaliar, prever, identificar alternativas Apresentação simples Apresentar o que você já sabe
  • 43. Linhas Gerais de Aplicação Tipos de dados Multi-dimensional (tabular) Bancos de dados relacionais Redes e árvores (grafos) Redes sociais, redes de recomendação, redes de computadores, localização geográfica Textos e documentos Repositórios de texto (artigos, notícias, wikis) Espacial-temporal (1D, 2D, 3D e 4D) Simulação e reprodução de fenômenos científicos
  • 46.  Introdução  Alguns Conceitos  Esquemas Visuais mais Usados  Interação, Sistematização e Processamento  Observações Conclusivas Roteiro
  • 47. Esquemas visuais mais usados • Projeções geométricas • Técnicas iconográficas • Técnicas hierárquicas • Técnicas orientadas a pixels Classificação que segue à organização visual
  • 48. Projeção geométrica Coordenadas Paralelas X0 X0: 5 X1 X1: 1 X2 X2: 10 X3 X3: 7 Atributo 0 Atributo 1 Atributo 2 Atributo 3 10 0
  • 49. Projeção geométrica Coordenadas Paralelas COORDENADAS PARALELAS Dados de veículos • Milhas Por Galão • # Cilindros (CYLINDERS) • Autonomia (DISPLACEMENT) • Potência (HORSEPOWER) • Peso (WEIGHT) • Aceleração (ACCELERATION) • Ano (YEAR) • Origem (AMER., EUROP., JAP.) Software: VisTree Análise Geral Percepções • Posição: correspondência, arranjo • Forma: conectividade • Cor: diferenciação Interpretações: • Correlação • Tendência • Sumarização • Classificação • Exceções Base de Dados
  • 50. • Matriz de Scatter Plots – Projeção dos atributos combinados – Correlação Projeção geométrica Matriz de Scatter PlotsMATRIZ DE SCATTER PLOTS Dados de veículos • Milhas Por Galão • # Cilindros (CYLINDERS) • Autonomia (DISPLACEMENT) • Potência (HORSEPOWER) • Peso (WEIGHT) • Aceleração (ACCELERATION) • Ano (YEAR) • Origem (AMER., EUROP., JAP.) Software: VisTree Análise Geral Percepções • Posição: correspondência, arranjo Interpretações: • Correlação • Tendência • Exceções
  • 51. http://publicationslist.org/junio Projeção geométrica Table Lens TABLE LENS Dados de filmes • Rank de arrecadação (RANK) • Lançamento (RELEASE DATE) • Arrecadação (CUMULATIVE GROSS) • Distribuidora (DISTRIBUTOR) • Título (TITLE) Software: Table Lens Análise Geral Percepções • Posição: correspondência, arranjo • Forma: correspondência, significado • Cor: diferenciação Interpretações: • Correlação • Tendência • Classificação • Exceções • Leitura
  • 52. http://publicationslist.org/junio •Peso: 5 •Peso: 10 •MPG: 1 •Potência: 5 •Aceleração: 2 Técnicas Iconográficas Star Glyphs
  • 53. http://publicationslist.org/junio #DECILINDROS MILHAS POR GALÃO (MPG) Técnicas Hierárquicas Sobreposição Dimensional POTÊNCIA #DECILINDROS MPG PESO
  • 55. http://publicationslist.org/junio Técnicas Orientadas a Pixels Padrões de Arranjo • Design • Arranjo dos pixels: apresentação depende da ordem • Mapeamento de cores por valor de atributo
  • 56. http://publicationslist.org/junio Técnicas Orientadas a Pixels Padrões de Arranjo • Design • Arranjo dos pixels: apresentação depende da ordem • Mapeamento de Cores por valor de atributo • Um atributo (dimensão) por janela
  • 57. Técnicas Orientadas a Pixels Matriz de correlações
  • 58. Técnicas Orientadas a Pixels Matriz de correlações
  • 59. Esquemas visuais mais usados • Projeções geométricas • Técnicas iconográficas • Técnicas hierárquicas • Técnicas orientadas a pixels
  • 60.  Introdução  Alguns Conceitos  Esquemas Visuais mais Usados  Interação, Sistematização e Processamento  Observações Conclusivas Roteiro
  • 61. http://publicationslist.org/junio Interação e Sistematização • Interação: alteração dos parâmetros de posição, de forma e de cor • Principais: – Filtragem interativa: alteração de cor (brushing) e de forma (contorno de seleção) – Transformação Espacial/Zoom: alteração de forma (escala) e de posição (rotação e translação) – Distorção: alteração de posição (diferentes perspectivas) • Sistematização com expansão do espaço de exibição: – Visões interligadas (linked-views) – Múltiplos espaços de visualização – Visualização em multi-resolução O analista pode “sentir” melhor a cena de análise, aumentando as possibilidades de interpretação visual.
  • 62. Análise Geral Percepções • Posição: correspondência, arranjo • Forma: conectividade • Cor: diferenciação Interpretações: • Correlação • Tendência • Sumarização • Classificação • Exceções INTERAÇÃO VIA FILTRAGEM INTERATIVA E LINK & BRUSH SISTEMATIZAÇÃO POR VISÕES INTERLIGADAS (linked-views) Dados de veículos • Milhas Por Galão • # Cilindros (CYLINDERS) • Autonomia (DISPLACEMENT) • Potência (HORSEPOWER) • Peso (WEIGHT) • Aceleração (ACCELERATION) • Ano (YEAR) • Origem (AMER., EUROP., JAP.) Software: VisTree
  • 63. Ciência Analítica Visual INTERAÇÃO VIA TRANSFORMAÇÃO ESPACIAL Dados de cidades • Nome (CIDADE) • Estado (UF) • Latitude • Longitude Software: FastMapDB Análise Geral Percepções • Posição: correspondência, significado • Cor: correspondência Interpretações: • Classificação • Estrutura • Agrupamentos • Leitura
  • 64. Ciência Analítica Visual INTERAÇÃO VIA DISTORÇÃO Dados de filmes • Ano de produção • Distribuidora (DISTRIBUTOR) • Título (TITLE) • Gênero Software: TimeWall Análise Geral Percepções • Posição: correspondência • Forma: diferenciação, significado • Cor: correspondência Interpretações: • Tendência • Classificação • Exceções • Agrupamentos • Leitura
  • 65. Interação - Distorção espacial StarTree
  • 66.
  • 67. http://publicationslist.org/junio Processamento: pré- processamento e suporte estatístico • Redução de dimensionalidade: n-dimensional  k-dimensional, onde n < k • Agregação: por exemplo, sumarização estatística • Seleção: por exemplo, amostragem • Segmentação: por exemplo, particionamento hierárquico
  • 68. REDUÇÃO DE DIMENSIONALIDADE E INTERAÇÃO POR TRANSFORMAÇÃO ESPACIAL Dados de exames de câncer (biopsia) • Identificador (ID) • 9 exames laboratoriais • Classificador (CLASS) Software: FastMapDB Análise Geral Percepções • Posição: correspondência, arranjo • Cor: correspondência Interpretações: • Classificação • Estrutura • Exceções • Agrupamentos
  • 69. Ciência Analítica Visual AGREGAÇÃO ESTATÍSTICA Dados de veículos •Dados de veículos • Milhas Por Galão • # Cilindros (CYLINDERS) • Autonomia (DISPLACEMENT) • Potência (HORSEPOWER) • Peso (WEIGHT) • Aceleração (ACCELERATION) • Ano (YEAR) • Origem (AMER., EUROP., JAP.) Software: VisTree Análise Geral Percepções • Posição: correspondência, diferenciação, arranjo • Forma: correspondência, diferenciação, conectividade • Cor: correspondência, diferenciação Interpretações: • Sumarização • Correlação • Relacionamento • Tendência • Classificação • Exceções • Agrupamentos
  • 70. Ciência Analítica Visual Autores Autor AutorId Autor1 1 Autor2 2 Autor3 3 Autor4 4 Autor5 5 Autoria ArtigoId AutorId A 1 A 2 B 1 B 4 C 2 C 5 D 3 D 4 Artigos Artigo ArtigoId Artigo1 A Artigo2 B Artigo3 C
  • 71. Ciência Analítica Visual Autores Autor AutorId Autor1 1 Autor2 2 Autor3 3 Autor4 4 Autor5 5 Autoria ArtigoId AutorId A 1 A 2 B 1 B 4 C 2 C 5 D 3 D 4 Artigos Artigo ArtigoId Artigo1 A Artigo2 B Artigo3 C
  • 72. Ciência Analítica Visual SISTEMATIZAÇÃO POR MULTI- RESOLUÇÃO COM SEGMENTAÇÃO HIERÁRQUICA Dados de comunicação eletrônica • Companhias • Departamentos • Pessoas Software: GMine Análise Geral Percepções • Posição: arranjo • Forma: conectividade, diferenciação • Cor: diferenciação Interpretações: • Relacionamento • Tendência • Classificação • Exceções • Estrutura • Agrupamentos
  • 73. BoxPlot – Visão geral da distribuição de variáveis
  • 74. BoxPlot – Visão geral da distribuição de variáveis
  • 75.  Introdução  Alguns Conceitos  Esquemas Visuais mais Usados  Interação, Sistematização e Processamento  Observações Conclusivas Roteiro
  • 76. Comparação com Mineração de Dados • Extração não trivial de informações implícitas, potencialmente úteis e previamente desconhecidas • Caracteristicamente algorítmica
  • 77. Visualização de Informações + Algoritmos de Mineração de Dados Algoritmos de Mineração de Dados Visualização de Informações Objetivo + – Mensurável + – Flexível – + Interativo – + Comparação com Mineração de Dados
  • 78. Visualização de Informações + Algoritmos de Mineração de Dados Algoritmos de Mineração de Dados Visualização de Informações Objetivo + – Mensurável + – Flexível – + Interativo – + Mineração Visual de Dados: utilização de Visualização de Informações para monitorar, guiar ou se beneficiar de algoritmos de Mineração de Dados. Comparação com Mineração de Dados
  • 79. Exemplo: monitoramento visual do algoritmo k- medoid para detecção de clusters. Mineração de Dados
  • 80. Algoritmo k-medoid: 1. Selecione os elementos que serão os centros dos agrupamentos 2. Verifique todos os pontos do conjunto e atribua a cada ponto o agrupamento referente ao centro mais próximo 3. Recalcule os centros dos agrupamentos de acordo com os agrupamentos definidos 4. Enquanto os centros trocarem de posição, vá para o passo 2 Minimizar
  • 81.
  • 82. Estado da Arte A Ciência Analítica Visual [2]
  • 83. Estado da Arte A Ciência Analítica Visual [2] Tecnologias de dados: ● armazenamento ● disponibilização ● gerenciamento. Formatos de dados versáteis, orientados à análise. Procedimentos sistemáticos de análise: ● avaliação ● planejamento ● tomada de decisão. Design de técnicas de visualização e interação. Disponibilização e difusão.
  • 84. Estado da Arte A Ciência Analítica Visual [2] Tecnologias de dados: ● armazenamento ● disponibilização ● gerenciamento. Formatos de dados versáteis, orientados à análise. Procedimentos sistemáticos de análise: ● avaliação ● planejamento ● tomada de decisão. Design de técnicas de visualização e interação. Disponibilização e difusão. Formalização do fato de que a ciência de InfoVis engloba uma série de disciplinas, todas inter- relacionadas.
  • 85. Avaliação de técnicas de análise visual de dados • Tema amplo • Critérios: – Funcionalidade – as funcionalidades esperadas são oferecidas? – Efetividade – a técnica agrega valor? Novas descobertas nos dados? – Eficiência – a técnica promove melhor desempenho? – Usabilidade – qual é a dificuldade em se usar o sistema? Há clareza? – Utilidade – é possível se beneficiar da técnica? • Metodologias: – Avaliação analítica: baseada em modelos e em testes estruturados; – Avaliação empírica: quantitativa ou qualitativa
  • 86. Avaliação de técnicas de análise visual de dados • Tema amplo • Critérios: – Funcionalidade – as funcionalidades esperadas são oferecidas? – Efetividade – a técnica agrega valor? Novas descobertas nos dados? – Eficiência – a técnica promove melhor desempenho? – Usabilidade – qual é a dificuldade em se usar o sistema? Há clareza? – Utilidade – é possível se beneficiar da técnica? • Metodologias: – Avaliação analítica: baseada em modelos e em testes estruturados; – Avaliação empírica: quantitativa ou qualitativa • Há subjetividade semelhante ao que se observa em HCI (Human-Computer Interaction); • Devido ao contexto analítico, nem sempre as técnicas de HCI podem ser aplicadas sem adaptação; • Da mesma forma, há metodologias bastante satisfatórias, mas com alto custo de aplicação.
  • 87. Avaliação de técnicas de análise visual de dados • DECIDE1: um arcabouço para avaliação de sistemas 1. Determine os objetivos: o quê se quer avaliar? 2. Enumere questões relevantes sobre os objetivos; 3. Escolha a metodologia de avaliação: slide anterior; 4. Identifique os fatores práticos: usuários, equipamento, dados, ... 5. Gerencie as questões éticas; 6. Avalie, interprete e apresente os resultados. 1 J. Preece, Y. Rogers, and H. Sharp, Interaction Design. John Wiley & Sons, Inc., 2002
  • 88. http://publicationslist.org/junio Disseminação • SAP: incorporou (da Inxight) as técnicas StarTree, TableLens e TimeWall em seus produtos • TIBCO (Spotfire): comercializa técnicas como Coordenadas Paralelas, Scatter Plots e TreeMaps • Advanced Visual Systems (AVS): abrange soluções para a indústria e para a academia • Outras empresas: Advizor Solutions, Compudigm, Dimension 5, Infommersion, Macrofocus, Purple Insight, ... • Listagem completa: http://kisd.de/~marian/infovis/
  • 89. Linhas de Desenvolvimento 1. Paradigmas de Interação Orientados ao usuário E.g.: perspective view Orientados a sistema E.g.: linked views 2. Suporte da Ciência da Computação Componentes E.g.: Graph-Tree Aperfeiçoamentos E.g.: Keim’s color space
  • 90. Linhas de Desenvolvimento 3. Novos Designs E.g.: Gapminder E.g.: Table Lens 4. Suporte Teórico Espaços de Design E.g.: design orientado à percepção Estudo do sistema perceptivo E.g.: princípios de manipulação direta 5. Suporte de Desenvolvimento Componentes E.g.: OpenGL Toolkits E.g.: IVTK http://ivtk.sourceforge.net/
  • 91. 3. Novos Designs E.g.: Gapminder E.g.: Table Lens 4. Suporte Teórico Espaços de Design E.g.: design orientado à percepção Estudo do sistema perceptivo E.g.: princípios de manipulação direta 5. Suporte de Desenvolvimento Componentes E.g.: OpenGL Toolkits E.g.: IVTK http://ivtk.sourceforge.net/ Linhas de Desenvolvimento
  • 92. 3. Novos Designs E.g.: Gapminder E.g.: Table Lens 4. Suporte Teórico Espaços de Design E.g.: design orientado à percepção Estudo do sistema perceptivo E.g.: princípios de manipulação direta 5. Suporte de Desenvolvimento Componentes E.g.: OpenGL Toolkits E.g.: IVTK http://ivtk.sourceforge.net/ Linhas de Desenvolvimento Ainda há muito o que se fazer em:  visualização de dados relacionais  escalabilidade de dados  uso combinado com mineração de dados visualização 3D interativa  utilização da dimensão temporal (animação)
  • 93. Discussão • A visualização pode resolver todos os meus problemas de análise de dados? R.: Não. Análise de dados é um processo elaborado que requer profundo conhecimento de domínio, objetivos claros e trabalho intenso. • Posso trabalhar sem visualização, então? R.: Não. Apesar de seus limites, a visualização provê benefícios bastante favoráveis, e não há substituto para estes benefícios.
  • 94. Discussão • A visualização pode resolver todos os meus problemas de análise de dados? R.: Não. Análise de dados é um processo elaborado que requer profundo conhecimento de domínio, objetivos claros e trabalho intenso. • Posso trabalhar sem visualização, então? R.: Não. Apesar de seus limites, a visualização provê benefícios bastante favoráveis, e não há substituto para estes benefícios.
  • 95. Discussão • A visualização pode resolver todos os meus problemas de análise de dados? R.: Não. Análise de dados é um processo elaborado que requer profundo conhecimento de domínio, objetivos claros e trabalho intenso. • Posso trabalhar sem visualização, então? R.: Não. Apesar de seus limites, a visualização provê benefícios bastante favoráveis, e não há substituto para tais benefícios.
  • 96. Livros Básicos Visualização de Informações Robert SPENCE. “Information Visualization”, ACM Press, 2001 Stuart K. Card, Jock D. MacKinlay, Ben Shneiderman, Mackinlay Card (eds.). “Readings in Information Visualization: Using Vision to Think”, Morgan Kaufmann Series in Interactive Technologies, Academic Press, 1999. ISBN 1- 55860-533-9 Colin WARE. “Information Visualization: Perception for Design”, Morgan Kaufmann Interactive Technologies Series, January 2000. ISBN 1-55860-511-8
  • 97. K. Cios et. al. - “Data Mining: A Knowledge Discovery Approach”, Springer, 2007 Jiawei Han, Micheline Kamber. “Data Mining: Concepts and Techniques”, Morgan Kaufmann, 2006 Pang-Ning Tan, Michael Steinbach, Vipin Kumar. “Introduction to Data Mining”, Addison Wesley, 2005 Livros Básicos Mineração de Dados
  • 98. Fontes de InfoVis • http://www.wikivis.org/ • Revistas – IEEE “Transactions on Visualization and Computer Graphics” – Palgrave “Information Visualization” • Conferências – IEEE Symposium on Information Visualization (InfoVis) – IEEE Conference on Visualization (Vis) – Joint Eurographics IEEE TVCG Symposium on Visualization (EuroVis) – International Conference on Visualisation (IV) – International Symposium on Smart Graphics (SG)
  • 99. Profissionais em InfoVis • Em ordem alfabética: – Agma Traina – ICMC-USP – Carla M. D. S. Freitas - UFRGS – Fernando Paulovich – ICMC-USP – Luciana P. Nedel - UFRGS – Maria Cristina F. de Oliveira – ICMC-USP – Rosane Minghin – ICMC-USP
  • 100. Outras áreas de visualização • Visualização Científica • Visualização de Software • Visualização Geográfica • Visualização de Redes • Ciência Analítica • Realidade Virtual • Realidade Aumentada • Sonificação (som) • Háptica (tato)
  • 101. Prof. Dr. José Fernando Rodrigues Júnior http://www.icmc.usp.br/~junio junio@icmc.usp.br Principais áreas (maioria das publicações): - Análise Visual de Dados - Recuperação de dados baseada em conteúdo Áreas Secundárias (já publicado): - Mineração de grafos - Estruturas de dados para indexação - Processamento de imagens - E-learning Fim. Análise Visual de Dados: conceitos, técnicas e sistemas
  • 102. Referências • [1] “How Much Information?” Lyman P and HR Varian, 2003. Disponível em http://www.sims.berkeley.edu/how-much-info. • [2] “Illuminating the Path: The Research and Development Agenda for Visual Analytics” James J. Thomas and Kristin A. Cook, editors. IEEE Press, 2005. Disponível em http://nvac.pnl.gov/agenda.stm.