SlideShare uma empresa Scribd logo
1 de 75
Baixar para ler offline
Juan José Rodríguez
Orientadora: Nádia Puchalski
1/68
Clusterização e Visualização Espaço-Temporal de
dados georreferenciados adaptando o algoritmo
Marker Clusterer – Um caso de uso em Curitiba
1/68
Sumário
2/68
1. Introdução
2. Fundamentação Teórica
3. Materiais e Métodos
4. Implementações
5. Resultados e Conclusões
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Motivação: O que acontece nas cidades?
3/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
consumo dos recursos e de
energia do mundo, e geram
80% dos gases-estufa
responsáveis ​​pelo efeito estufa
(Signori, 2008).
75%
2%
ocupando apenas 2%
do território mundial
(Signori, 2008).
50%
vive em cidades e a
expectativa é de que, até
2050, essa proporção
chegue a 70% (WHO, 2014)
Motivação: O que acontece nas cidades?
4/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
As tecnologias geoespaciais, são o coração fundamental das cidades
inteligentes, sendo essencial entender a variável "Onde" para tomar
decisões informadas. Moura (2012)
5/68
Motivação: Dados da IPPUC
Autoria Propia (2016)
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
5/68
Trabalhos relatos:
Um modelo de Representação
baseado em Conceitos de
Crescimento Urbano Associados
e Alvarás e Primitivas em Banco
de dados Espacial
Análise do banco de alvarás
da Prefeitura de Curitiba e
sua influência nos
restaurantes de Curitiba.
Kono (2016)
Cunha (2016)
1. Falta de normalização de dados,
2. Duplicação de dados,
3. Falta de categorização apropriada
dos tipos de alvarás,
4. Qualidade de dados e finalmente,
5. Sobreposição de pontos que dificulta
a visualização de informação em
mapas.
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Projeto BigSea - Europe – Brazil
Collaboration of BIG Data Scientific
Research through Cloud-Centric
Applications
INTRODUÇÃO
6/68
SIG
Bibliografia
● Conceitos
● Tipos de dados
● Arquiteturas
● Relacionamentos
● Aplicações
Cid.Inteligentes
● Conceitos
● Necessidades
● Características
● Arquiteturas
● Aplicações
DESAFIOS E TRABALHOS RELACIONADOS
Resultado
Clusterização
● Conceitos
● Algoritmos
● Aplicações
● Comparações
Dados Abertos
● Conceitos
● Dados de Curitiba
● Análise preliminar
● Aplicações
CLUSTERIZAÇÃO E VISUALIZAÇÃO
Visualização
● Conceitos
● Bibliotecas
● Aplicações
● Algoritmo Bidimensional de Clusterização.
● Qualidade de dados.
● Sistema Web/Mobile
● Código fonte disponível em Github.
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Analisar e adaptar o algoritmo Marker Clusterer que
permita resolver problemas de sobreposição de pontos,
clusterização e visualização comparativa entre diversos
tipos de alvarás usando dados históricos e
georreferenciados. Em particular, usaremos dados abertos
de alvarás de comércio para os bairros: Centro, Batel e
Tatuquara das últimas 3 décadas.
OBJETIVO GERAL
7/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Entender as diversas questões bibliográficas (i) sistemas de informação
geográfica, (ii) cidades inteligentes, (iii) dados abertos, (iv) algoritmos de
clusterização e visualização.
Gerar uma fonte de dados atualizada e recategorizada de Alvarás de
Curitiba.
Adaptar o algoritmo Marker Clusterer que permita realizar clusterização e
visualização espaço-temporal considerando diversos tipos de alvarás.
Gerar um protótipo accesível e compatível com entornos Web e Mobile.
Realizar uma avaliação preliminar
8/68
OBJETIVOS ESPECÍFICOS
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
AplicaçõesArquiteturaRelacionamentos E.Tipos de dados
Sistemas de informação geográfica (SIG), são sistemas de informações
baseado em computador que permite a captura, modelagem,
manipulação, recuperação, análise e apresentação de dados
georreferenciados (Worboys, 1995).
2.1 Sistemas de Informação Geográfica (SIG)
● Vetorial
● Matricial
● Topológicas
● Métricas
● Direcionais
● Apresentação
● Processamento
● Dados
● TaxiVis
● SIG/SAM
9/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Sistemas de
Informação
Geográfica
(SIG)
Adaptado de Li e
Torres (2014).
10/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
AplicaçõesArquiteturaOGCÁreas
11/68
2.2 Cidades Inteligentes
Cidadãos, Governança,
Negócios, Planejamento,
Construções, Mobilidade,
Tecnologia da Informação,
Energía
Uma cidade inteligente é aquela cidade que utiliza tecnologias inteligentes para
integrar suas infraestruturas e serviços, a qual se esforça em aproveitar estas
tecnologias para melhorar a eficiência, a eficácia, a transparência e a
sustentabilidade. (Alawadhi, 2012).
Tecnologias abertas:
GML, KML, WFS, WMS,
WCS, CSW
● Aplicação
● Negócio
● Dados
● Detecção
● Singapure Online
● OneMap
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Percivall, OGC (2015).
12/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Percivall, OGC (2015).
13/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
14/68
2.4 Visualização de Dados
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
A visualização significa construir uma imagem visual na mente humana. E isto é mais
do que uma representação gráfica de dados ou conceitos. (Card,1999).
Id Estudante Endereço
001 Kathy
Magdalena
Rua Arthur Carlos
Peralta 1686
002 Kiara
Rodriguez
Rua Bartolomé de
las casas 163
003 Jorge Lucar Rua Visconde de
Guarapuaba 42
004 Marcos Rester Rua 28 de Julho
3421
Dados Informação
Autoria Propia (2016)
15/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Autoria Propia (2016)
16/68
2.5 Clusterização e Visualização de Dados
Clusterização é o processo de realizar agrupamento de
objetos que apresentam semelhanças.
Marker
Cluster
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
17/68
K-Means ( K-Médias)
● Algoritmo usado com contextos de
Data Mining não supervisada.
● Classificação de informação de acordo
com os próprios dados.
● Input: número de clusters
(parâmetro K) a ser utilizados.
Clusters dos pontos de ônibus usando K-means, com
K=4. Neves (2016).
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
2.5 Clusterização e Visualização de Dados
18/68
DBScan (Density Based Spatial Clustering of Applications with Noise)
● Clusterização baseado na intensidade de
markers. Se existir um marker distante, é
considerado ruído (noise).
● Input: Total de Pontos, proximidade e
minpts (densidade).
● O algoritmo pode ser utilizado para
agrupar objetos de um banco de dados
em subtipos que expressem algo, por
exemplo, ao obter imagens satelitais da
terra (Ester, 1996), como rios, estradas,
etc.
Clusterização baseado em densidade de markers usando
DBSCAN. Adaptado de (Ester, 1996).
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
2.5 Clusterização e Visualização de Dados
19/68
Marker Clusterer
Clusterização de dados georreferenciados de forma iterativa baseados nas
distâncias euclidianas entre Markers, Clusters e nível do zoom sobre o
mapa. Para o cálculo da distância euclidiana se usa a fórmula haversin que
considera a latitude, longitude, raio da terra e nível do zoom.
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Autoria Propia (2016)
2.5 Clusterização e Visualização de Dados
20/68
Comparativa
Critério/Algoritmo K-Means DBSCAN Marker
Clusterer
É necessário conocer número de clusters prévios? Sim Não Não
Precisa de um # mínimo de Markers para Clusterizar? Não Sim Não
Permite clusterização em múltiples formas? Não Sim Sim
Por padrão, permite realizar clusterização de dados
Georreferenciados?
Não Não Sim
Possui integração com Mapas Web-Mobile? Não Não Sim
Autoria Propia (2016)
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
2.5 Clusterização e Visualização de Dados
21/68
1 2
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Processo do Marker Clusterer
22/68
Nro Cluster Markers
1 A, B e D
2 C e E
3 F, G, J e I
4 H
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Processo do Marker Clusterer
23/68
Cálculo da Distância
Euclidiana
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
24/68
Bibliotecas
HeatMap
Leaflet JS para OSM Marker Cluster para Google
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Autoria Propia (2016)
2.5 Clusterização e Visualização de Dados
25/68
Comparativa entre Bibliotecas
Autoria própria(2016).
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
2.5 Clusterização e Visualização de Dados
26/68
1. O algoritmo agrupa sem diferenciar os tipos de dados.
2. O algoritmo agrupa sem considerar límites geográficos.
3. O processo de desagregação é realizado usando zoom sobre o mapa,
e em muitos casos, esse processo de desagregação implica em
gasto de tempo e de interações desnecessárias com o servidor de
aplicações para exibir os zooms intermediários.
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
2.5 Clusterização e Visualização de Dados
Desafios de Marker Clusterer
27/68
4. Se queremos usar o algoritmo em outro sistema de mapas como
Open Street Map ou Bing, será necessário a criação da
biblioteca que possua compatibilidade com estes sistemas de
mapas.
5. Forte dependência com o Google Maps, caso haja uma mudança
nas políticas do Google Maps, a aplicação web deve executar as
atualizações necessárias para manter o funcionamento.
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
2.5 Clusterização e Visualização de Dados
Desafios de Marker Clusterer
28/68
A liberação de dados de alvarás concedidos a localidade do bairro do Tatuquara,
Batel e centro de Curitiba entre os anos de 1980 a 2015 (PMC,2015) e (IPPUC, 2016).
PMC (2016)
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
2.6 Dados Abertos: Curitiba
29/68
Desafios: Existência de duplicidade de latitude e longitude gerando sobreposição de pontos,existe tipificação de
alvarás que não estão associados corretamente gerando assim registros semelhantes que poderiam ser agrupadas em
uma categoria específica e existem ainda alguns problemas como maiúsculas e minúsculas.
Alvarás de
Restaurantes.
Kono (2016)
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
2.6 Dados Abertos: Curitiba
30/68
Tipos e estilos de
restaurantes definidas pelo
SEBRAE (2014).
Cunha (2016)
Existe uma melhor distribuição e agrupamento de categorias, porém ainda existem problemas de
dados não associados corretamente, qualidade de dados e sobreposição de pontos.
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
2.6 Dados Abertos: Curitiba
SIG
Cid.Inteligentes
Dados Abertos
Visualização e
clusterização
- Complexidade de uso dos SIG (Haklay, 2008).
- Revisões históricas (NGB, 2015).
- Grande volume de dados (Jacobs, 2009).
- Serviços e aplicações móveis ao
desenvolvimento urbano sustentável.
(Pentikousis,2011).
- Falta de qualidade, normalização, duplicação,
atualização e recategorização de dados
(Kono, Cunha, 2016).
- Sobreposição de pontos (Kono, 2016).
- Clusterização de dados que permita comparação
entre os tipos de dados.
31/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
3/10
1/5
2/5
1/5
3.1 Desafios que serão abordados
7/25
32/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
3.2 Método proposto
Autoria própria(2016).
4.1 Processo de Padronização de Dados
33/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Script que padroniza e recategoriza Alvarás de Restaurantes conforme o SEBRAE.
Autoria Própria (2016)
Alvarás de
Curitiba
Out. 2016
Dados
Padronizados
Out. 2016
Script de
Padronização
Out. 2016
34/68
Script que padroniza e recategoriza Alvarás de Restaurantes conforme o SEBRAE.
Autoria Própria (2016)
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
4.1 Processo de Padronização de Dados
35/68
Script que padroniza e recategoriza Alvarás de Restaurantes conforme o SEBRAE.
Autoria Própria (2016)
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
4.1 Processo de Padronização de Dados
36/68
Atualização e recategorização de Alvarás de Restaurantes conforme o SEBRAE.
Autoria Própria (2016)
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Análise preliminar dos dados
37/68
(A) Crescimento por ano,
(B) Distribuição geográfica,
(C) Alta concentração.
Autoria própria(2016).
Centro
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
38/68
Centro
Cinco tipos de negócios que cresceram mais nas últimas décadas.
Autoria própria(2016).
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
39/68
(A) Crescimento por ano,
(B) Distribuição
geográfica,
(C) Alta concentração.
Autoria própria(2016).
Batel
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
40/68
Cinco tipos de negócios que cresceram mais nas últimas décadas.
Autoria própria(2016).
Batel
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
41/68
(A) Crescimento por ano,
(B) Distribuição geográfica,
(C) Alta concentração.
Autoria própria(2016).
Tatuquara
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
42/68
Cinco tipos de negócios que cresceram mais nas últimas décadas.
Autoria própria(2016).
Tatuquara
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
43/68
1. Problemas de Geocodificação: mesmo utilizando o endereço, o processo de
geocodificação não foi eficiente para 10% dos dados.
2. Problemas com Padrões: Diversos formatos que variam de UTF8 a Latin. geolocalização
usando latitude / longitude (49.343750 -25.564539) ou UTM (666418.3496092
7171543.905212).
3. Diferentes sistemas de coordenadas: IPPUC usa o formato de dados DATUM SAD69, e á
integração com Google Maps, OpenStreetMaps requer um sistema diferente de
coordenadas (SIRGAS2000).
4. Composição de objetos geométricos: IPPUC trabalha com segmentos de linha para ruas
(nó inicial e nó georreferenciado final para cada bloco), mas o Google trabalha com um
objeto de linha para uma única rua.
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Dificultades identificadas e abordadas
44/68
5. Inconsistências nos dados: A análise prévia dos dados, se identificou que dos 2337
markers, 25 estabelecimentos apresentam inconsistência nos dados, devido a que
segundo a latitude e longitude, não pertencem ao bairro que foram declarados no
banco de dados.
6. Outros desafios: Podemos mencionar outros desafios tais como: (i) diferentes
granularidades dentro das fontes: fontes governamentais apresentaram maior
precisão sobre fontes não oficiais (Google Maps, OSM); e (ii) diferentes tipos e
formatos de dados. Alguns são CSV, XLS, JSON e Shapefile. Dependendo da técnica ou
processo de integração, esses dados ainda devem ser convertidos para SQL para a
definição e inserção de dados.
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Dificultades identificadas e abordadas
45/68
Marker Clusterer
Tradicional
Entrada Saída
Processamento
Lista de Markers
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
4.2 Adaptações ao Algoritmo: Processo Atual
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Marker Clusterer
Bidimensional
MyMaps
Lista de Markers
Visualização baseada no
Tipo de Negócio
E
P
S E
P
S
Etapa 1 Etapa 2
Estrutura bidimensional que
armazena os markers de acordo ao
Tipo de Negócio
Banco de
Dados
46/68
4.2 Novo Processo Proposto
47/68
4.2.1 Criação do Markers - MyMaps
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
4.2 Adaptações ao Algoritmo
48/68
Data: Marker
distance ← 40000 //// Distância referencial para clusterização
clusterToAdd ← null
pos ← marker.position
switch marker.BusinessType
case 'TipoA' : j ← 0
case 'TipoB' : j ← 1
case 'TipoC' : j ← 2
default: j ← 0
end
for i ← 0 to i ← NumberOfClusters , cluster ← clusters(i)(j) do
center ← cluster.center
if (center) then
d ← distanceBetweenPoints(center, pos)
if ( d <distance) then
distance ← d clusterToAdd ← cluster
end
end
end
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Nova condição que identifica o tipo de
negócio antes do processo de
clusterização.
Cálculo da distância euclideana
considerando o array bidimensional
(i)(j) do marker e centro do cluster.
4.2 Adaptações ao Algoritmo
4.2.2 Criação da nova estrutura MK Bidimensional
49/68
if (clusterToAdd andclusterToAdd.isMarkerInClusterBounds(marker)) then
clusterToAdd.add(marker)
else
cluster ← new Cluster
cluster.addMarker(marker)
clusters.pushNewCluster(cluster, j)
end
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Adiciona o marker ao cluster mais
próximo considerando o array
bidimensional (i)(j)
4.2 Adaptações ao Algoritmo
4.2.2 Criação da nova estrutura MK Bidimensional
50/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
4.2 Resultado do Novo Algoritmo
Autoria própria (2016).
Marker Clusterer Bidimensional
51/68
1. Pouca experiência em uso de algoritmos de clusterização e
visualização.
2. O algoritmo apresentou mais de 1360 linhas de códigos e
processos entrelazados, que dificultou a implementação na
visualização em Google Maps.
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Dificultades identificadas e abordadas
52/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Filtro temporal
Filtro
espacial
Filtro tipo
de negócio
4.3 Interface proposta
53/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
4.3 Interface proposta
54/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
4.3 Interface proposta
Charts and heatmap visualization. Autoria Própria (2016).
54/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
4.3 Interface proposta
55/68
Mapa dos
Negócios
Mapa de
Pontos de ônibus
Código disponível em
github
juanjoserodriguez.me/map/b
usiness
juanjoserodriguez.me/map/bus github.com/jrodriguezv10
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
4.3 Demo funcional disponível de:
56/68
4.3 Compatibilidade
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
57/68
Problemas com qualidade de dados. Autoria própria (2016).
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Dificultades identificadas
58/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Hardware:
● Macbook Pro com sistema operacional OS X O Captain 10GB
1333 MHz DDR3
Software
● SGBD PostgreSQL 9.6.1
● Servidor MAMP V. 3.5.2
● Google Chrome V 52 &
● HTML5, CSS3, Javascript, Google Maps API V3, e finalmente,
Biblioteca Marker Cluster V3.
4.4 Software e Hardware utilizados
59/68
● Processo de avaliação composto por: um termo de
consentimento estabelecido (Anexo 1), questionário inicial
com três perguntas (Anexo 2), e um questionário final com
seis perguntas (Anexo 3).
● As respostas podiam ter os valores entre 1 e 5, sendo
que 1 era a nota mais baixa e 5 a mais alta.
● 27 voluntários do curso de engenharia da computação da
UTFPR e 2337 registros no protótipo de alvarás.
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
4.5 Avaliação preliminar com usuários
60/68
5 Avaliação Preliminar com Usuários
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Antes de implementar a solução Após de implementar a solução
61/68
5 Avaliação Preliminar com Usuários
69,3%
80,8%
92,3%
84,6%
65,4%
Resultados:
Questionário final com as avaliações antes e após de usar a nova solução. Autoria própria(2016)
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
Entender as diversas questões bibliográficas (i) sistemas de informação
geográfica, (ii) cidades inteligentes, (iii) dados abertos, (iv) algoritmos de
clusterização e visualização.
Gerar uma fonte de dados atualizada e recategorizada de Alvarás de
Curitiba.
Adaptar o algoritmo Marker Clusterer que permita realizar clusterização e
visualização espaço-temporal considerando diversos tipos de alvarás.
Gerar um protótipo accesível e compatível com entornos Web e Mobile.
Realizar uma avaliação preliminar
62/68
OBJETIVOS ESPECÍFICOS ATINGIDOS
Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
63/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
DESAFIOS ESPECÍFICOS ATINGIDOS
SIG
Cid.Inteligentes
Dados Abertos
Visualização e
clusterização
- Complexidade de uso dos SIG (Haklay, 2008).
- Revisões históricas (NGB, 2015).
- Grande volume de dados (Jacobs, 2009).
- Serviços e aplicações móveis ao
desenvolvimento urbano sustentável.
(Pentikousis,2011).
- Falta de qualidade, normalização, duplicação,
atualização e recategorização de dados
(Kono, Cunha, 2016).
- Sobreposição de pontos (Kono, 2016).
- Clusterização de dados que permita comparação
entre os tipos de dados.
7/25
Conclusões
1. A Fonte de Dados ainda apresentou diversos problemas em relação a qualidade
de dados, recategorização, normalização entre outros.
2. Marker Clusterer apresentou um processo mais prático, adaptável e
implementável ao contexto de clusterização dos alvarás de Curitiba em relação à
outros algoritmos e bibliotecas analisadas.
3. O Processo de avaliação da solução e aceitação da solução apresentou resultados
alentadores tendo que 84,6% que consideraram o protótipo como uma solução
útil.
64/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
65/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Seminário 3 | 26 de Outubro de 2016
1. Trabalho submetido titulado: Minha cidade inteligente na Competição de Vídeos
sobre Cidades Inteligentes no XXXIII Simpósio Brasileiro de Telecomunicações
2015. O trabalho ganhou o prêmio de primeiro lugar da competição. Link:
http://www.sbrt.org.br/sbrt2015/premiacao-competicao-de-video/.
2. Artigo publicado: “Urban Mobility Challenges - An exploratory analysis of public
transportation data in Curitiba” na Revista de Informática Aplicada da
Universidade Federal do ABC, Brasil.
3. Artigo aceito:: "Uma proposta para apresentar a Computação/Banco de Dados
no Ensino Médio para o Público Feminino". O trabalho foi destacado como um dos
melhores 5 artigos da seção aplicações e experiências no XII Escola Regional de
Banco de Dados 2016, e pode ser verificado no Anexo 1. Link:
http://cross.dc.uel.br/erbd2016/programacao/#ST3.
Resultados e reconhecimentos obtidos :
66/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
DESAFIOS PENDENTES / TRABALHOS FUTUROS
SIG
Cid.Inteligentes
Dados Abertos
Visualização e
clusterização
Crowdsourcing e validação de dados, Informação em tempo real,
Segurança de dados, Localização em interiores, Integração de
dados, etc.
18 desafios pendentes
Infraestruturas para cidades inteligentes, aumentar eficiência
energética, pessoas como produtoras de informação, etc.
Qualidade de dados
Clusterização considerando delimitação geográfica, optimização
do processo de desagrupamento, dependência de Google Maps.
Sinceros agradecimentos:
1. À Deus, minha esposa, filha e minha querida família,
2. CNPQ, Capes, MRE,
3. À Profa. Nádia Puchalski,
4. Aos Profs. da Dainf,
5. A todos que direta ou indiretamente contribuíram e
contribuem para que este sonho de fazer um mestrado
fora do meu país seja uma realidade.
67/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Seminário 3 | 26 de Outubro de 2016
Google confidential | Do not distribute
Juan José Rodríguez
Orientadora: Nádia Puchalski
68/68
Muchas Gracias!
Clusterização e Visualização Espaço-Temporal de
dados georreferenciados adaptando o algoritmo
Marker Clusterer – Um caso de uso em Curitiba

Mais conteúdo relacionado

Destaque

An Approach to Digital Marketing
An Approach to Digital MarketingAn Approach to Digital Marketing
An Approach to Digital MarketingSuresh Parmachand
 
Gafas de Realidade Virtual
Gafas de Realidade VirtualGafas de Realidade Virtual
Gafas de Realidade Virtualprieto4
 
Consejos principales para Android UI Cómo alcanzar la magia en los tablets
Consejos principales para Android UI Cómo alcanzar la magia en los tabletsConsejos principales para Android UI Cómo alcanzar la magia en los tablets
Consejos principales para Android UI Cómo alcanzar la magia en los tabletsMotorola Mobility - MOTODEV
 
The second mile principle
The second mile principleThe second mile principle
The second mile principleVan Nagac
 
USPTO patent application 13,573,002 The Heart Beacon Cycle Time Space Meter, ...
USPTO patent application 13,573,002 The Heart Beacon Cycle Time Space Meter, ...USPTO patent application 13,573,002 The Heart Beacon Cycle Time Space Meter, ...
USPTO patent application 13,573,002 The Heart Beacon Cycle Time Space Meter, ...Steven McGee
 
Acertijos en entrevistas de trabajo
Acertijos en entrevistas de trabajoAcertijos en entrevistas de trabajo
Acertijos en entrevistas de trabajoHerles Incalla
 
De hemorroides tratamiento
De hemorroides tratamientoDe hemorroides tratamiento
De hemorroides tratamientoeshacersea
 

Destaque (14)

Final RWU Career Guide
Final RWU Career GuideFinal RWU Career Guide
Final RWU Career Guide
 
An Approach to Digital Marketing
An Approach to Digital MarketingAn Approach to Digital Marketing
An Approach to Digital Marketing
 
Gafas de Realidade Virtual
Gafas de Realidade VirtualGafas de Realidade Virtual
Gafas de Realidade Virtual
 
Lo2 pitch
Lo2 pitchLo2 pitch
Lo2 pitch
 
Tic´s google +
Tic´s google +Tic´s google +
Tic´s google +
 
Consejos principales para Android UI Cómo alcanzar la magia en los tablets
Consejos principales para Android UI Cómo alcanzar la magia en los tabletsConsejos principales para Android UI Cómo alcanzar la magia en los tablets
Consejos principales para Android UI Cómo alcanzar la magia en los tablets
 
google aps
google apsgoogle aps
google aps
 
Living on the future with google glass 2015
Living on the future with google glass   2015Living on the future with google glass   2015
Living on the future with google glass 2015
 
FusionCharts Clockworks
FusionCharts ClockworksFusionCharts Clockworks
FusionCharts Clockworks
 
The second mile principle
The second mile principleThe second mile principle
The second mile principle
 
USPTO patent application 13,573,002 The Heart Beacon Cycle Time Space Meter, ...
USPTO patent application 13,573,002 The Heart Beacon Cycle Time Space Meter, ...USPTO patent application 13,573,002 The Heart Beacon Cycle Time Space Meter, ...
USPTO patent application 13,573,002 The Heart Beacon Cycle Time Space Meter, ...
 
Acertijos en entrevistas de trabajo
Acertijos en entrevistas de trabajoAcertijos en entrevistas de trabajo
Acertijos en entrevistas de trabajo
 
Realidad aumentada en el ambito universitario
Realidad aumentada en el ambito universitarioRealidad aumentada en el ambito universitario
Realidad aumentada en el ambito universitario
 
De hemorroides tratamiento
De hemorroides tratamientoDe hemorroides tratamiento
De hemorroides tratamiento
 

Semelhante a Clusterização e Visualização de Dados Georreferenciados

Uma Ferramenta Computacional para geração de Modelos Digitais de Terrenos com...
Uma Ferramenta Computacional para geração de Modelos Digitais de Terrenos com...Uma Ferramenta Computacional para geração de Modelos Digitais de Terrenos com...
Uma Ferramenta Computacional para geração de Modelos Digitais de Terrenos com...pqd
 
Prefeitura Livre: Tecnologias Geoespaciais
Prefeitura Livre: Tecnologias GeoespaciaisPrefeitura Livre: Tecnologias Geoespaciais
Prefeitura Livre: Tecnologias GeoespaciaisHelton Uchoa
 
Informática Aplicada ao Planejamento Territorial - Introdução
Informática Aplicada ao Planejamento Territorial - IntroduçãoInformática Aplicada ao Planejamento Territorial - Introdução
Informática Aplicada ao Planejamento Territorial - IntroduçãoVitor Vieira Vasconcelos
 
Comparação de Rastos GPS para Sistemas de Partilha de Carros - CISTI2010
Comparação de Rastos GPS para Sistemas de Partilha de Carros - CISTI2010Comparação de Rastos GPS para Sistemas de Partilha de Carros - CISTI2010
Comparação de Rastos GPS para Sistemas de Partilha de Carros - CISTI2010paulojbras
 
2005 roberto rosa
2005 roberto rosa2005 roberto rosa
2005 roberto rosadanilabgis
 
SIG_II.docx
SIG_II.docxSIG_II.docx
SIG_II.docxegasjest
 
Informática Aplicada ao Planejamento Territorial - Apresentação
Informática Aplicada ao Planejamento Territorial - ApresentaçãoInformática Aplicada ao Planejamento Territorial - Apresentação
Informática Aplicada ao Planejamento Territorial - ApresentaçãoVitor Vieira Vasconcelos
 
2018 - Desenvolvimento de ferramentas de produção cartográfica no Qgis
2018 - Desenvolvimento de ferramentas de produção cartográfica no Qgis2018 - Desenvolvimento de ferramentas de produção cartográfica no Qgis
2018 - Desenvolvimento de ferramentas de produção cartográfica no QgisGeorge Porto Ferreira
 
Arc gis102 divisao_de_linha_por_comprimento
Arc gis102 divisao_de_linha_por_comprimentoArc gis102 divisao_de_linha_por_comprimento
Arc gis102 divisao_de_linha_por_comprimentoDanielle Corrêa
 
Apresentação li segunda feira
Apresentação li segunda feiraApresentação li segunda feira
Apresentação li segunda feiracesar do amaral
 
ANÁLISE DE PONTOS DE PROPAGAÇÃO DE INFORMAÇÃO EM REDES SOCIAIS
ANÁLISE DE PONTOS DE PROPAGAÇÃO DE INFORMAÇÃO EM REDES SOCIAIS ANÁLISE DE PONTOS DE PROPAGAÇÃO DE INFORMAÇÃO EM REDES SOCIAIS
ANÁLISE DE PONTOS DE PROPAGAÇÃO DE INFORMAÇÃO EM REDES SOCIAIS JoãoMiguel De Oliveira Francisco
 
PROCC UFS.br :: Apresentação Disciplina PGPS - Planejamento e Gerencia de Pro...
PROCC UFS.br :: Apresentação Disciplina PGPS - Planejamento e Gerencia de Pro...PROCC UFS.br :: Apresentação Disciplina PGPS - Planejamento e Gerencia de Pro...
PROCC UFS.br :: Apresentação Disciplina PGPS - Planejamento e Gerencia de Pro...Rogerio P C do Nascimento
 
Five Minute Speech - Academic Interests, Current Works and Experiences.
Five Minute Speech - Academic Interests, Current Works and Experiences.Five Minute Speech - Academic Interests, Current Works and Experiences.
Five Minute Speech - Academic Interests, Current Works and Experiences.Michel Alves
 
O uso do PostgreSQL e PostGIS no cadastro geocodificado de acidentes de trânsito
O uso do PostgreSQL e PostGIS no cadastro geocodificado de acidentes de trânsitoO uso do PostgreSQL e PostGIS no cadastro geocodificado de acidentes de trânsito
O uso do PostgreSQL e PostGIS no cadastro geocodificado de acidentes de trânsitoGeorge Silva
 
OpenStreetMap (OSM): O conceito da Web 2.0 aplicado a Geomática
OpenStreetMap (OSM): O conceito da Web 2.0 aplicado a GeomáticaOpenStreetMap (OSM): O conceito da Web 2.0 aplicado a Geomática
OpenStreetMap (OSM): O conceito da Web 2.0 aplicado a GeomáticaHelton Uchoa
 

Semelhante a Clusterização e Visualização de Dados Georreferenciados (20)

Geoprocess in smart cities concepts
Geoprocess in smart cities conceptsGeoprocess in smart cities concepts
Geoprocess in smart cities concepts
 
Uma Ferramenta Computacional para geração de Modelos Digitais de Terrenos com...
Uma Ferramenta Computacional para geração de Modelos Digitais de Terrenos com...Uma Ferramenta Computacional para geração de Modelos Digitais de Terrenos com...
Uma Ferramenta Computacional para geração de Modelos Digitais de Terrenos com...
 
Prefeitura Livre: Tecnologias Geoespaciais
Prefeitura Livre: Tecnologias GeoespaciaisPrefeitura Livre: Tecnologias Geoespaciais
Prefeitura Livre: Tecnologias Geoespaciais
 
Informática Aplicada ao Planejamento Territorial - Introdução
Informática Aplicada ao Planejamento Territorial - IntroduçãoInformática Aplicada ao Planejamento Territorial - Introdução
Informática Aplicada ao Planejamento Territorial - Introdução
 
Apresent trab grafos
Apresent trab grafosApresent trab grafos
Apresent trab grafos
 
Comparação de Rastos GPS para Sistemas de Partilha de Carros - CISTI2010
Comparação de Rastos GPS para Sistemas de Partilha de Carros - CISTI2010Comparação de Rastos GPS para Sistemas de Partilha de Carros - CISTI2010
Comparação de Rastos GPS para Sistemas de Partilha de Carros - CISTI2010
 
2005 roberto rosa
2005 roberto rosa2005 roberto rosa
2005 roberto rosa
 
SIG_II.docx
SIG_II.docxSIG_II.docx
SIG_II.docx
 
Informática Aplicada ao Planejamento Territorial - Apresentação
Informática Aplicada ao Planejamento Territorial - ApresentaçãoInformática Aplicada ao Planejamento Territorial - Apresentação
Informática Aplicada ao Planejamento Territorial - Apresentação
 
2018 - Desenvolvimento de ferramentas de produção cartográfica no Qgis
2018 - Desenvolvimento de ferramentas de produção cartográfica no Qgis2018 - Desenvolvimento de ferramentas de produção cartográfica no Qgis
2018 - Desenvolvimento de ferramentas de produção cartográfica no Qgis
 
Geotrans piloto-bh
Geotrans piloto-bhGeotrans piloto-bh
Geotrans piloto-bh
 
Arc gis102 divisao_de_linha_por_comprimento
Arc gis102 divisao_de_linha_por_comprimentoArc gis102 divisao_de_linha_por_comprimento
Arc gis102 divisao_de_linha_por_comprimento
 
Geoprocessamento02 2006
Geoprocessamento02 2006Geoprocessamento02 2006
Geoprocessamento02 2006
 
Geoprocessamento Corporativo
Geoprocessamento CorporativoGeoprocessamento Corporativo
Geoprocessamento Corporativo
 
Apresentação li segunda feira
Apresentação li segunda feiraApresentação li segunda feira
Apresentação li segunda feira
 
ANÁLISE DE PONTOS DE PROPAGAÇÃO DE INFORMAÇÃO EM REDES SOCIAIS
ANÁLISE DE PONTOS DE PROPAGAÇÃO DE INFORMAÇÃO EM REDES SOCIAIS ANÁLISE DE PONTOS DE PROPAGAÇÃO DE INFORMAÇÃO EM REDES SOCIAIS
ANÁLISE DE PONTOS DE PROPAGAÇÃO DE INFORMAÇÃO EM REDES SOCIAIS
 
PROCC UFS.br :: Apresentação Disciplina PGPS - Planejamento e Gerencia de Pro...
PROCC UFS.br :: Apresentação Disciplina PGPS - Planejamento e Gerencia de Pro...PROCC UFS.br :: Apresentação Disciplina PGPS - Planejamento e Gerencia de Pro...
PROCC UFS.br :: Apresentação Disciplina PGPS - Planejamento e Gerencia de Pro...
 
Five Minute Speech - Academic Interests, Current Works and Experiences.
Five Minute Speech - Academic Interests, Current Works and Experiences.Five Minute Speech - Academic Interests, Current Works and Experiences.
Five Minute Speech - Academic Interests, Current Works and Experiences.
 
O uso do PostgreSQL e PostGIS no cadastro geocodificado de acidentes de trânsito
O uso do PostgreSQL e PostGIS no cadastro geocodificado de acidentes de trânsitoO uso do PostgreSQL e PostGIS no cadastro geocodificado de acidentes de trânsito
O uso do PostgreSQL e PostGIS no cadastro geocodificado de acidentes de trânsito
 
OpenStreetMap (OSM): O conceito da Web 2.0 aplicado a Geomática
OpenStreetMap (OSM): O conceito da Web 2.0 aplicado a GeomáticaOpenStreetMap (OSM): O conceito da Web 2.0 aplicado a Geomática
OpenStreetMap (OSM): O conceito da Web 2.0 aplicado a Geomática
 

Mais de Juan José Rodriguez MsC.

Programas y Herramientas de Google para emprendedores
Programas y Herramientas de Google para emprendedoresProgramas y Herramientas de Google para emprendedores
Programas y Herramientas de Google para emprendedoresJuan José Rodriguez MsC.
 
Programas de Google DevRel LatAm South Region
Programas de Google DevRel LatAm South RegionProgramas de Google DevRel LatAm South Region
Programas de Google DevRel LatAm South RegionJuan José Rodriguez MsC.
 
La Realidad Aumentada como herramienta para mejorar los procesos educativos e...
La Realidad Aumentada como herramienta para mejorar los procesos educativos e...La Realidad Aumentada como herramienta para mejorar los procesos educativos e...
La Realidad Aumentada como herramienta para mejorar los procesos educativos e...Juan José Rodriguez MsC.
 
Utilización de tecnologías Cloud Computing para la innovación en Organizacion...
Utilización de tecnologías Cloud Computing para la innovación en Organizacion...Utilización de tecnologías Cloud Computing para la innovación en Organizacion...
Utilización de tecnologías Cloud Computing para la innovación en Organizacion...Juan José Rodriguez MsC.
 
Herramientas de comunicación y colaboración de Google Apps Edu Edition como p...
Herramientas de comunicación y colaboración de Google Apps Edu Edition como p...Herramientas de comunicación y colaboración de Google Apps Edu Edition como p...
Herramientas de comunicación y colaboración de Google Apps Edu Edition como p...Juan José Rodriguez MsC.
 
Code Passion 2012 - Ecosistema de tecnologías google - propuestas, iniciativa...
Code Passion 2012 - Ecosistema de tecnologías google - propuestas, iniciativa...Code Passion 2012 - Ecosistema de tecnologías google - propuestas, iniciativa...
Code Passion 2012 - Ecosistema de tecnologías google - propuestas, iniciativa...Juan José Rodriguez MsC.
 
Oportunidad para innovar con tecnología google - AgileOpenLima V
Oportunidad para innovar con tecnología google - AgileOpenLima VOportunidad para innovar con tecnología google - AgileOpenLima V
Oportunidad para innovar con tecnología google - AgileOpenLima VJuan José Rodriguez MsC.
 
Qué es un gtug y tecnologías google para desarrolladores - Academic Developer...
Qué es un gtug y tecnologías google para desarrolladores - Academic Developer...Qué es un gtug y tecnologías google para desarrolladores - Academic Developer...
Qué es un gtug y tecnologías google para desarrolladores - Academic Developer...Juan José Rodriguez MsC.
 
Programa Academic Developer Technology Groups en Perú
Programa Academic Developer Technology Groups en PerúPrograma Academic Developer Technology Groups en Perú
Programa Academic Developer Technology Groups en PerúJuan José Rodriguez MsC.
 

Mais de Juan José Rodriguez MsC. (14)

Programas y Herramientas de Google para emprendedores
Programas y Herramientas de Google para emprendedoresProgramas y Herramientas de Google para emprendedores
Programas y Herramientas de Google para emprendedores
 
Las nuevas funcionalidades de Google Apps
Las nuevas funcionalidades de Google AppsLas nuevas funcionalidades de Google Apps
Las nuevas funcionalidades de Google Apps
 
GDG DevFest Lighting Talks México
GDG DevFest Lighting Talks MéxicoGDG DevFest Lighting Talks México
GDG DevFest Lighting Talks México
 
Programas de Google DevRel LatAm South Region
Programas de Google DevRel LatAm South RegionProgramas de Google DevRel LatAm South Region
Programas de Google DevRel LatAm South Region
 
La Realidad Aumentada como herramienta para mejorar los procesos educativos e...
La Realidad Aumentada como herramienta para mejorar los procesos educativos e...La Realidad Aumentada como herramienta para mejorar los procesos educativos e...
La Realidad Aumentada como herramienta para mejorar los procesos educativos e...
 
Utilización de tecnologías Cloud Computing para la innovación en Organizacion...
Utilización de tecnologías Cloud Computing para la innovación en Organizacion...Utilización de tecnologías Cloud Computing para la innovación en Organizacion...
Utilización de tecnologías Cloud Computing para la innovación en Organizacion...
 
Herramientas de comunicación y colaboración de Google Apps Edu Edition como p...
Herramientas de comunicación y colaboración de Google Apps Edu Edition como p...Herramientas de comunicación y colaboración de Google Apps Edu Edition como p...
Herramientas de comunicación y colaboración de Google Apps Edu Edition como p...
 
Code Passion 2012 - Ecosistema de tecnologías google - propuestas, iniciativa...
Code Passion 2012 - Ecosistema de tecnologías google - propuestas, iniciativa...Code Passion 2012 - Ecosistema de tecnologías google - propuestas, iniciativa...
Code Passion 2012 - Ecosistema de tecnologías google - propuestas, iniciativa...
 
Herramientas Google para docentes y alumnos
Herramientas Google para docentes y alumnosHerramientas Google para docentes y alumnos
Herramientas Google para docentes y alumnos
 
Taller de Google Apps - Eduticinnova 2011
Taller de Google Apps - Eduticinnova 2011Taller de Google Apps - Eduticinnova 2011
Taller de Google Apps - Eduticinnova 2011
 
Oportunidad para innovar con tecnología google - AgileOpenLima V
Oportunidad para innovar con tecnología google - AgileOpenLima VOportunidad para innovar con tecnología google - AgileOpenLima V
Oportunidad para innovar con tecnología google - AgileOpenLima V
 
Qué es un gtug y tecnologías google para desarrolladores - Academic Developer...
Qué es un gtug y tecnologías google para desarrolladores - Academic Developer...Qué es un gtug y tecnologías google para desarrolladores - Academic Developer...
Qué es un gtug y tecnologías google para desarrolladores - Academic Developer...
 
Programa Academic Developer Technology Groups en Perú
Programa Academic Developer Technology Groups en PerúPrograma Academic Developer Technology Groups en Perú
Programa Academic Developer Technology Groups en Perú
 
Virtual educa 2011
Virtual educa 2011Virtual educa 2011
Virtual educa 2011
 

Clusterização e Visualização de Dados Georreferenciados

  • 1. Juan José Rodríguez Orientadora: Nádia Puchalski 1/68 Clusterização e Visualização Espaço-Temporal de dados georreferenciados adaptando o algoritmo Marker Clusterer – Um caso de uso em Curitiba 1/68
  • 2. Sumário 2/68 1. Introdução 2. Fundamentação Teórica 3. Materiais e Métodos 4. Implementações 5. Resultados e Conclusões Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 3.
  • 4. Motivação: O que acontece nas cidades? 3/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 consumo dos recursos e de energia do mundo, e geram 80% dos gases-estufa responsáveis ​​pelo efeito estufa (Signori, 2008). 75% 2% ocupando apenas 2% do território mundial (Signori, 2008). 50% vive em cidades e a expectativa é de que, até 2050, essa proporção chegue a 70% (WHO, 2014)
  • 5. Motivação: O que acontece nas cidades? 4/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 As tecnologias geoespaciais, são o coração fundamental das cidades inteligentes, sendo essencial entender a variável "Onde" para tomar decisões informadas. Moura (2012)
  • 6. 5/68 Motivação: Dados da IPPUC Autoria Propia (2016) Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 7. 5/68 Trabalhos relatos: Um modelo de Representação baseado em Conceitos de Crescimento Urbano Associados e Alvarás e Primitivas em Banco de dados Espacial Análise do banco de alvarás da Prefeitura de Curitiba e sua influência nos restaurantes de Curitiba. Kono (2016) Cunha (2016) 1. Falta de normalização de dados, 2. Duplicação de dados, 3. Falta de categorização apropriada dos tipos de alvarás, 4. Qualidade de dados e finalmente, 5. Sobreposição de pontos que dificulta a visualização de informação em mapas. Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Projeto BigSea - Europe – Brazil Collaboration of BIG Data Scientific Research through Cloud-Centric Applications
  • 8. INTRODUÇÃO 6/68 SIG Bibliografia ● Conceitos ● Tipos de dados ● Arquiteturas ● Relacionamentos ● Aplicações Cid.Inteligentes ● Conceitos ● Necessidades ● Características ● Arquiteturas ● Aplicações DESAFIOS E TRABALHOS RELACIONADOS Resultado Clusterização ● Conceitos ● Algoritmos ● Aplicações ● Comparações Dados Abertos ● Conceitos ● Dados de Curitiba ● Análise preliminar ● Aplicações CLUSTERIZAÇÃO E VISUALIZAÇÃO Visualização ● Conceitos ● Bibliotecas ● Aplicações ● Algoritmo Bidimensional de Clusterização. ● Qualidade de dados. ● Sistema Web/Mobile ● Código fonte disponível em Github. Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 9. Analisar e adaptar o algoritmo Marker Clusterer que permita resolver problemas de sobreposição de pontos, clusterização e visualização comparativa entre diversos tipos de alvarás usando dados históricos e georreferenciados. Em particular, usaremos dados abertos de alvarás de comércio para os bairros: Centro, Batel e Tatuquara das últimas 3 décadas. OBJETIVO GERAL 7/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 10. Entender as diversas questões bibliográficas (i) sistemas de informação geográfica, (ii) cidades inteligentes, (iii) dados abertos, (iv) algoritmos de clusterização e visualização. Gerar uma fonte de dados atualizada e recategorizada de Alvarás de Curitiba. Adaptar o algoritmo Marker Clusterer que permita realizar clusterização e visualização espaço-temporal considerando diversos tipos de alvarás. Gerar um protótipo accesível e compatível com entornos Web e Mobile. Realizar uma avaliação preliminar 8/68 OBJETIVOS ESPECÍFICOS Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 11.
  • 12. AplicaçõesArquiteturaRelacionamentos E.Tipos de dados Sistemas de informação geográfica (SIG), são sistemas de informações baseado em computador que permite a captura, modelagem, manipulação, recuperação, análise e apresentação de dados georreferenciados (Worboys, 1995). 2.1 Sistemas de Informação Geográfica (SIG) ● Vetorial ● Matricial ● Topológicas ● Métricas ● Direcionais ● Apresentação ● Processamento ● Dados ● TaxiVis ● SIG/SAM 9/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 13. Sistemas de Informação Geográfica (SIG) Adaptado de Li e Torres (2014). 10/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 14. AplicaçõesArquiteturaOGCÁreas 11/68 2.2 Cidades Inteligentes Cidadãos, Governança, Negócios, Planejamento, Construções, Mobilidade, Tecnologia da Informação, Energía Uma cidade inteligente é aquela cidade que utiliza tecnologias inteligentes para integrar suas infraestruturas e serviços, a qual se esforça em aproveitar estas tecnologias para melhorar a eficiência, a eficácia, a transparência e a sustentabilidade. (Alawadhi, 2012). Tecnologias abertas: GML, KML, WFS, WMS, WCS, CSW ● Aplicação ● Negócio ● Dados ● Detecção ● Singapure Online ● OneMap Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 15. Percivall, OGC (2015). 12/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 16. Percivall, OGC (2015). 13/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 17. 14/68 2.4 Visualização de Dados Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 A visualização significa construir uma imagem visual na mente humana. E isto é mais do que uma representação gráfica de dados ou conceitos. (Card,1999). Id Estudante Endereço 001 Kathy Magdalena Rua Arthur Carlos Peralta 1686 002 Kiara Rodriguez Rua Bartolomé de las casas 163 003 Jorge Lucar Rua Visconde de Guarapuaba 42 004 Marcos Rester Rua 28 de Julho 3421 Dados Informação Autoria Propia (2016)
  • 18. 15/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Autoria Propia (2016)
  • 19. 16/68 2.5 Clusterização e Visualização de Dados Clusterização é o processo de realizar agrupamento de objetos que apresentam semelhanças. Marker Cluster Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 20. 17/68 K-Means ( K-Médias) ● Algoritmo usado com contextos de Data Mining não supervisada. ● Classificação de informação de acordo com os próprios dados. ● Input: número de clusters (parâmetro K) a ser utilizados. Clusters dos pontos de ônibus usando K-means, com K=4. Neves (2016). Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 2.5 Clusterização e Visualização de Dados
  • 21. 18/68 DBScan (Density Based Spatial Clustering of Applications with Noise) ● Clusterização baseado na intensidade de markers. Se existir um marker distante, é considerado ruído (noise). ● Input: Total de Pontos, proximidade e minpts (densidade). ● O algoritmo pode ser utilizado para agrupar objetos de um banco de dados em subtipos que expressem algo, por exemplo, ao obter imagens satelitais da terra (Ester, 1996), como rios, estradas, etc. Clusterização baseado em densidade de markers usando DBSCAN. Adaptado de (Ester, 1996). Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 2.5 Clusterização e Visualização de Dados
  • 22. 19/68 Marker Clusterer Clusterização de dados georreferenciados de forma iterativa baseados nas distâncias euclidianas entre Markers, Clusters e nível do zoom sobre o mapa. Para o cálculo da distância euclidiana se usa a fórmula haversin que considera a latitude, longitude, raio da terra e nível do zoom. Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Autoria Propia (2016) 2.5 Clusterização e Visualização de Dados
  • 23. 20/68 Comparativa Critério/Algoritmo K-Means DBSCAN Marker Clusterer É necessário conocer número de clusters prévios? Sim Não Não Precisa de um # mínimo de Markers para Clusterizar? Não Sim Não Permite clusterização em múltiples formas? Não Sim Sim Por padrão, permite realizar clusterização de dados Georreferenciados? Não Não Sim Possui integração com Mapas Web-Mobile? Não Não Sim Autoria Propia (2016) Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 2.5 Clusterização e Visualização de Dados
  • 24. 21/68 1 2 Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Processo do Marker Clusterer
  • 25. 22/68 Nro Cluster Markers 1 A, B e D 2 C e E 3 F, G, J e I 4 H Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Processo do Marker Clusterer
  • 26. 23/68 Cálculo da Distância Euclidiana Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 27. 24/68 Bibliotecas HeatMap Leaflet JS para OSM Marker Cluster para Google Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Autoria Propia (2016) 2.5 Clusterização e Visualização de Dados
  • 28. 25/68 Comparativa entre Bibliotecas Autoria própria(2016). Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 2.5 Clusterização e Visualização de Dados
  • 29. 26/68 1. O algoritmo agrupa sem diferenciar os tipos de dados. 2. O algoritmo agrupa sem considerar límites geográficos. 3. O processo de desagregação é realizado usando zoom sobre o mapa, e em muitos casos, esse processo de desagregação implica em gasto de tempo e de interações desnecessárias com o servidor de aplicações para exibir os zooms intermediários. Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 2.5 Clusterização e Visualização de Dados Desafios de Marker Clusterer
  • 30. 27/68 4. Se queremos usar o algoritmo em outro sistema de mapas como Open Street Map ou Bing, será necessário a criação da biblioteca que possua compatibilidade com estes sistemas de mapas. 5. Forte dependência com o Google Maps, caso haja uma mudança nas políticas do Google Maps, a aplicação web deve executar as atualizações necessárias para manter o funcionamento. Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 2.5 Clusterização e Visualização de Dados Desafios de Marker Clusterer
  • 31. 28/68 A liberação de dados de alvarás concedidos a localidade do bairro do Tatuquara, Batel e centro de Curitiba entre os anos de 1980 a 2015 (PMC,2015) e (IPPUC, 2016). PMC (2016) Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 2.6 Dados Abertos: Curitiba
  • 32. 29/68 Desafios: Existência de duplicidade de latitude e longitude gerando sobreposição de pontos,existe tipificação de alvarás que não estão associados corretamente gerando assim registros semelhantes que poderiam ser agrupadas em uma categoria específica e existem ainda alguns problemas como maiúsculas e minúsculas. Alvarás de Restaurantes. Kono (2016) Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 2.6 Dados Abertos: Curitiba
  • 33. 30/68 Tipos e estilos de restaurantes definidas pelo SEBRAE (2014). Cunha (2016) Existe uma melhor distribuição e agrupamento de categorias, porém ainda existem problemas de dados não associados corretamente, qualidade de dados e sobreposição de pontos. Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 2.6 Dados Abertos: Curitiba
  • 34.
  • 35. SIG Cid.Inteligentes Dados Abertos Visualização e clusterização - Complexidade de uso dos SIG (Haklay, 2008). - Revisões históricas (NGB, 2015). - Grande volume de dados (Jacobs, 2009). - Serviços e aplicações móveis ao desenvolvimento urbano sustentável. (Pentikousis,2011). - Falta de qualidade, normalização, duplicação, atualização e recategorização de dados (Kono, Cunha, 2016). - Sobreposição de pontos (Kono, 2016). - Clusterização de dados que permita comparação entre os tipos de dados. 31/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 3/10 1/5 2/5 1/5 3.1 Desafios que serão abordados 7/25
  • 36. 32/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 3.2 Método proposto Autoria própria(2016).
  • 37.
  • 38. 4.1 Processo de Padronização de Dados 33/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Script que padroniza e recategoriza Alvarás de Restaurantes conforme o SEBRAE. Autoria Própria (2016) Alvarás de Curitiba Out. 2016 Dados Padronizados Out. 2016 Script de Padronização Out. 2016
  • 39. 34/68 Script que padroniza e recategoriza Alvarás de Restaurantes conforme o SEBRAE. Autoria Própria (2016) Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 4.1 Processo de Padronização de Dados
  • 40. 35/68 Script que padroniza e recategoriza Alvarás de Restaurantes conforme o SEBRAE. Autoria Própria (2016) Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 4.1 Processo de Padronização de Dados
  • 41. 36/68 Atualização e recategorização de Alvarás de Restaurantes conforme o SEBRAE. Autoria Própria (2016) Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Análise preliminar dos dados
  • 42. 37/68 (A) Crescimento por ano, (B) Distribuição geográfica, (C) Alta concentração. Autoria própria(2016). Centro Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 43. 38/68 Centro Cinco tipos de negócios que cresceram mais nas últimas décadas. Autoria própria(2016). Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 44. 39/68 (A) Crescimento por ano, (B) Distribuição geográfica, (C) Alta concentração. Autoria própria(2016). Batel Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 45. 40/68 Cinco tipos de negócios que cresceram mais nas últimas décadas. Autoria própria(2016). Batel Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 46. 41/68 (A) Crescimento por ano, (B) Distribuição geográfica, (C) Alta concentração. Autoria própria(2016). Tatuquara Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 47. 42/68 Cinco tipos de negócios que cresceram mais nas últimas décadas. Autoria própria(2016). Tatuquara Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 48. 43/68 1. Problemas de Geocodificação: mesmo utilizando o endereço, o processo de geocodificação não foi eficiente para 10% dos dados. 2. Problemas com Padrões: Diversos formatos que variam de UTF8 a Latin. geolocalização usando latitude / longitude (49.343750 -25.564539) ou UTM (666418.3496092 7171543.905212). 3. Diferentes sistemas de coordenadas: IPPUC usa o formato de dados DATUM SAD69, e á integração com Google Maps, OpenStreetMaps requer um sistema diferente de coordenadas (SIRGAS2000). 4. Composição de objetos geométricos: IPPUC trabalha com segmentos de linha para ruas (nó inicial e nó georreferenciado final para cada bloco), mas o Google trabalha com um objeto de linha para uma única rua. Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Dificultades identificadas e abordadas
  • 49. 44/68 5. Inconsistências nos dados: A análise prévia dos dados, se identificou que dos 2337 markers, 25 estabelecimentos apresentam inconsistência nos dados, devido a que segundo a latitude e longitude, não pertencem ao bairro que foram declarados no banco de dados. 6. Outros desafios: Podemos mencionar outros desafios tais como: (i) diferentes granularidades dentro das fontes: fontes governamentais apresentaram maior precisão sobre fontes não oficiais (Google Maps, OSM); e (ii) diferentes tipos e formatos de dados. Alguns são CSV, XLS, JSON e Shapefile. Dependendo da técnica ou processo de integração, esses dados ainda devem ser convertidos para SQL para a definição e inserção de dados. Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Dificultades identificadas e abordadas
  • 50. 45/68 Marker Clusterer Tradicional Entrada Saída Processamento Lista de Markers Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 4.2 Adaptações ao Algoritmo: Processo Atual
  • 51. Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Marker Clusterer Bidimensional MyMaps Lista de Markers Visualização baseada no Tipo de Negócio E P S E P S Etapa 1 Etapa 2 Estrutura bidimensional que armazena os markers de acordo ao Tipo de Negócio Banco de Dados 46/68 4.2 Novo Processo Proposto
  • 52. 47/68 4.2.1 Criação do Markers - MyMaps Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 4.2 Adaptações ao Algoritmo
  • 53. 48/68 Data: Marker distance ← 40000 //// Distância referencial para clusterização clusterToAdd ← null pos ← marker.position switch marker.BusinessType case 'TipoA' : j ← 0 case 'TipoB' : j ← 1 case 'TipoC' : j ← 2 default: j ← 0 end for i ← 0 to i ← NumberOfClusters , cluster ← clusters(i)(j) do center ← cluster.center if (center) then d ← distanceBetweenPoints(center, pos) if ( d <distance) then distance ← d clusterToAdd ← cluster end end end Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Nova condição que identifica o tipo de negócio antes do processo de clusterização. Cálculo da distância euclideana considerando o array bidimensional (i)(j) do marker e centro do cluster. 4.2 Adaptações ao Algoritmo 4.2.2 Criação da nova estrutura MK Bidimensional
  • 54. 49/68 if (clusterToAdd andclusterToAdd.isMarkerInClusterBounds(marker)) then clusterToAdd.add(marker) else cluster ← new Cluster cluster.addMarker(marker) clusters.pushNewCluster(cluster, j) end Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Adiciona o marker ao cluster mais próximo considerando o array bidimensional (i)(j) 4.2 Adaptações ao Algoritmo 4.2.2 Criação da nova estrutura MK Bidimensional
  • 55. 50/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 4.2 Resultado do Novo Algoritmo Autoria própria (2016). Marker Clusterer Bidimensional
  • 56. 51/68 1. Pouca experiência em uso de algoritmos de clusterização e visualização. 2. O algoritmo apresentou mais de 1360 linhas de códigos e processos entrelazados, que dificultou a implementação na visualização em Google Maps. Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Dificultades identificadas e abordadas
  • 57. 52/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Filtro temporal Filtro espacial Filtro tipo de negócio 4.3 Interface proposta
  • 58. 53/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 4.3 Interface proposta
  • 59. 54/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 4.3 Interface proposta Charts and heatmap visualization. Autoria Própria (2016).
  • 60. 54/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 4.3 Interface proposta
  • 61. 55/68 Mapa dos Negócios Mapa de Pontos de ônibus Código disponível em github juanjoserodriguez.me/map/b usiness juanjoserodriguez.me/map/bus github.com/jrodriguezv10 Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 4.3 Demo funcional disponível de:
  • 62. 56/68 4.3 Compatibilidade Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 63. 57/68 Problemas com qualidade de dados. Autoria própria (2016). Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Dificultades identificadas
  • 64. 58/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Hardware: ● Macbook Pro com sistema operacional OS X O Captain 10GB 1333 MHz DDR3 Software ● SGBD PostgreSQL 9.6.1 ● Servidor MAMP V. 3.5.2 ● Google Chrome V 52 & ● HTML5, CSS3, Javascript, Google Maps API V3, e finalmente, Biblioteca Marker Cluster V3. 4.4 Software e Hardware utilizados
  • 65. 59/68 ● Processo de avaliação composto por: um termo de consentimento estabelecido (Anexo 1), questionário inicial com três perguntas (Anexo 2), e um questionário final com seis perguntas (Anexo 3). ● As respostas podiam ter os valores entre 1 e 5, sendo que 1 era a nota mais baixa e 5 a mais alta. ● 27 voluntários do curso de engenharia da computação da UTFPR e 2337 registros no protótipo de alvarás. Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 4.5 Avaliação preliminar com usuários
  • 66. 60/68 5 Avaliação Preliminar com Usuários Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 Antes de implementar a solução Após de implementar a solução
  • 67. 61/68 5 Avaliação Preliminar com Usuários 69,3% 80,8% 92,3% 84,6% 65,4% Resultados: Questionário final com as avaliações antes e após de usar a nova solução. Autoria própria(2016) Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 68.
  • 69. Entender as diversas questões bibliográficas (i) sistemas de informação geográfica, (ii) cidades inteligentes, (iii) dados abertos, (iv) algoritmos de clusterização e visualização. Gerar uma fonte de dados atualizada e recategorizada de Alvarás de Curitiba. Adaptar o algoritmo Marker Clusterer que permita realizar clusterização e visualização espaço-temporal considerando diversos tipos de alvarás. Gerar um protótipo accesível e compatível com entornos Web e Mobile. Realizar uma avaliação preliminar 62/68 OBJETIVOS ESPECÍFICOS ATINGIDOS Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 70. 63/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 DESAFIOS ESPECÍFICOS ATINGIDOS SIG Cid.Inteligentes Dados Abertos Visualização e clusterização - Complexidade de uso dos SIG (Haklay, 2008). - Revisões históricas (NGB, 2015). - Grande volume de dados (Jacobs, 2009). - Serviços e aplicações móveis ao desenvolvimento urbano sustentável. (Pentikousis,2011). - Falta de qualidade, normalização, duplicação, atualização e recategorização de dados (Kono, Cunha, 2016). - Sobreposição de pontos (Kono, 2016). - Clusterização de dados que permita comparação entre os tipos de dados. 7/25
  • 71. Conclusões 1. A Fonte de Dados ainda apresentou diversos problemas em relação a qualidade de dados, recategorização, normalização entre outros. 2. Marker Clusterer apresentou um processo mais prático, adaptável e implementável ao contexto de clusterização dos alvarás de Curitiba em relação à outros algoritmos e bibliotecas analisadas. 3. O Processo de avaliação da solução e aceitação da solução apresentou resultados alentadores tendo que 84,6% que consideraram o protótipo como uma solução útil. 64/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016
  • 72. 65/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Seminário 3 | 26 de Outubro de 2016 1. Trabalho submetido titulado: Minha cidade inteligente na Competição de Vídeos sobre Cidades Inteligentes no XXXIII Simpósio Brasileiro de Telecomunicações 2015. O trabalho ganhou o prêmio de primeiro lugar da competição. Link: http://www.sbrt.org.br/sbrt2015/premiacao-competicao-de-video/. 2. Artigo publicado: “Urban Mobility Challenges - An exploratory analysis of public transportation data in Curitiba” na Revista de Informática Aplicada da Universidade Federal do ABC, Brasil. 3. Artigo aceito:: "Uma proposta para apresentar a Computação/Banco de Dados no Ensino Médio para o Público Feminino". O trabalho foi destacado como um dos melhores 5 artigos da seção aplicações e experiências no XII Escola Regional de Banco de Dados 2016, e pode ser verificado no Anexo 1. Link: http://cross.dc.uel.br/erbd2016/programacao/#ST3. Resultados e reconhecimentos obtidos :
  • 73. 66/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Dissertação | 16 de Dezembro de 2016 DESAFIOS PENDENTES / TRABALHOS FUTUROS SIG Cid.Inteligentes Dados Abertos Visualização e clusterização Crowdsourcing e validação de dados, Informação em tempo real, Segurança de dados, Localização em interiores, Integração de dados, etc. 18 desafios pendentes Infraestruturas para cidades inteligentes, aumentar eficiência energética, pessoas como produtoras de informação, etc. Qualidade de dados Clusterização considerando delimitação geográfica, optimização do processo de desagrupamento, dependência de Google Maps.
  • 74. Sinceros agradecimentos: 1. À Deus, minha esposa, filha e minha querida família, 2. CNPQ, Capes, MRE, 3. À Profa. Nádia Puchalski, 4. Aos Profs. da Dainf, 5. A todos que direta ou indiretamente contribuíram e contribuem para que este sonho de fazer um mestrado fora do meu país seja uma realidade. 67/68Juan José Rodríguez (UTFPR) | Mestrado em Computação Aplicada - Seminário 3 | 26 de Outubro de 2016
  • 75. Google confidential | Do not distribute Juan José Rodríguez Orientadora: Nádia Puchalski 68/68 Muchas Gracias! Clusterização e Visualização Espaço-Temporal de dados georreferenciados adaptando o algoritmo Marker Clusterer – Um caso de uso em Curitiba