O documento discute como compreender e refinar dados para uso otimizado. Ele descreve a importância de compreender totalmente os dados, incluindo seu tipo, características e impacto. Também discute características comuns de dados como geográficos, temporais e qualitativos. Além disso, destaca etapas para limpar dados e torná-los coerentes, como garantir valores e datas consistentes, e para enriquecer dados, como dividir campos e adicionar novas informações como latitude e longitude.
3. COMPREENDER OS DADOS
Os dados de que dispõe
podem dizer-lhe muito
acerca daquilo que está a
observar.
4. COMPREENDER OS DADOS
Para que os dados «falem», tente compreendê-los na
íntegra.
Pergunte a si mesmo:
● Que tipo de informação é?
● Quais são as suas principais características?
● Que impacto têm na situação?
5. COMPREENDER OS DADOS
É importante:
● entender a natureza dos dados
● aprender a analisá-los com
algumas ações simples
7. DADOS GEOGRÁFICOS
Os dados que está a utilizar para os
seus projetos podem conter
informações geográficas.
Por exemplo, qual é a extensão de
um fenómeno num determinado
território.
8. DADOS GEOGRÁFICOS
○ A que território dizem respeito? Nacional, regional,
provincial ou municipal?
○ Qual é a ligação entre este território e o projeto que
selecionou ou o que está a estudar?
○ Que informações adicionais poderá obter ao analisar
as informações geográficas dos seus dados?
9. SÉRIES HISTÓRICAS
Os dados podem permitir a análise da
tendência de um fenómeno ao longo
do tempo e a medição de variações
(por ex., de um mês para outro ou de
um ano para outro).
10. SÉRIES HISTÓRICAS: EXEMPLOS
A recolha diferenciada de
resíduos aumentou, diminuiu
ou permaneceu estável?
O número de turistas num
território é constante ano
após ano ou tem havido
alterações?
Os fenómenos em
análise estão a crescer
ou a diminuir (por ex.,
mês após mês)?
11. DADOS QUALITATIVOS
Estes são os dados que
definem a qualidade
intrínseca e as
características de um ou
mais itens.
12. Por isso, pergunte a si mesmo:
Quais são as características dos
dados que recolheu ou está a
recolher?
Quais lhe interessam mais?
14. LIMPAR OS DADOS
Antes de analisar os dados, é necessário
realizar determinados passos para os tornar
coerentes e tirar máximo proveito das suas
características.
Há também métodos específicos para o
efeito.
Vejamos…
15. LIMPAR OS DADOS
A limpeza dos dados é fundamental para assegurar
que as linhas e colunas estão bem estruturadas
e que os valores introduzidos são coerentes.
Analisar os dados sem os limpar poderá levar a
erros graves ou a problemas incontroláveis.
Há algumas ferramentas que ajudam a limpar os
dados, como a OpenRefine (http://openrefine.org)
16. LIMPAR OS DADOS
1
Certifique-se de que os valores são
introduzidos da mesma forma.
Por exemplo, se o valor «Ambiente»
aparecer também como «ambiente» e
«AMBIENTE», haverá erros. Os valores
tem de ser todos escritos da mesma
forma.
17. LIMPAR OS DADOS
2
Verifique as datas (se disponíveis): as datas
também devem ser escritas num formato
homogéneo.
Verificar-se-ão erros se algumas datas forem
introduzidas num formato numérico (por ex.,
01/03/2015) e outras num formato alfanumérico
(por ex., 10 de março de 2015). As datas devem
estar num formato único: altere utilizando a
opção Formatar células.
18. LIMPAR OS DADOS
3
Verifique a numeração.
Certifique-se de que os números são representados
corretamente.
Verifique o sistema de numeração utilizando as
definições da folha de trabalho.
20. DIVIDIR
Os dados devem ser granulares, como se fossem átomos.
Por exemplo, se os seus dados tiverem a coluna Locais e houver um valor como:
«Cologno Monzese, província de Milão (Lombardia)», talvez seja melhor dividir a
coluna em três colunas (Município + Província + Região). Assim, poderá analisar por
município, província e região.
21. ADICIONAR
Não é certo que o seu conjunto de dados
lhe forneça todas as informações
necessárias. Em determinados casos,
poderá ter de enriquecê-lo, adicionando
novas colunas com informações
específicas.
Já poderá tê-lo feito parcialmente ao seguir
as instruções anteriores, mas podem existir
outras formas de enriquecer um conjunto
de dados…
22. GEOCODIFICAÇÃO
Latitude Longitude
Utilizando o mesmo exemplo, depois de ter
dividido a coluna Locais em três colunas
(Município, Província, Região), poderá ser útil
introduzir a latitude e a longitude, e criar um
mapa.
Para o efeito, insira duas novas colunas (Latitude
e Longitude) e trace as coordenadas geográficas
do local de referência.
LongitudeLatitude
23. GEOCODIFICAÇÃO
Pode encontrar as coordenadas em linha.
Há várias ferramentas na Internet: basta procurar!
Certifique-se sempre de que os dados podem ser reutilizados (com o
OpenStreetMap é possível, mas com o GoogleMaps há restrições).