O roli danych geograficznych ich źródłach, potencjale oraz metodach analitycznych wykorzystujących informacje przestrzenne.
5 spotkanie Data Science Warsaw MeetUp. Warszawa, 12 maja 2015
Geolokalizacja i analizy przestrzenne: trzy wymiary a ile pracy dla analityka!
1. #1Copyright by DataWise
Geolokalizacja i analizy przestrzenne:
trzy wymiary a ile pracy dla analityka!
O roli danych geograficznych ich źródłach, potencjale oraz metodach
analitycznych wykorzystujących informacje przestrzenne.
5 spotkanie Data Science Warsaw MeetUp. Warszawa, 12 maja 2015
2. #2Copyright by DataWise
Od 2000 roku zajmuję się analizą danych zastanych i
znalezionych w biznesie (CRMy, systemy transakcyjne
itp.)
Do 2008 w korporacji (Claritas, Acxiom)
Od 2008 współtworzę DataWise, firmę która integruje,
tworzy i analizuje dane na potrzeby aktywności
marketingowych i sprzedażowych
Od początku ważnym wątkiem analiz był geomarketing i
analiza przestrzenna
O mnie
3. #3Copyright by DataWise
„Geographic data is one of the most common types of data
available, and with today’s location-based applications and
sensors, it’s more important than ever.”
Myśl przewodnia
Źródło: https://www.tableau.com/solutions/mapping-software
6. #6Copyright by DataWise
Położenie w (czaso)przestrzeni -
podstawowa właściwość
zarówno ludzi jak i rzeczy
Przestrzeń i informacja o
położeniu:
Często determinuje możliwość
interakcji / relacji (dystans)
Jest potrzebna do kontroli i
poczucia bezpieczeństwa
Umożliwia podejmowanie wielu
decyzji i zarządzanie procesami
Wpływa na koszty
podejmowanych działań (koszt
dotarcia, ryzyko fizycznych
inwestycje)
Lokalizacja to podstawa
7. #7Copyright by DataWise
Proste do zapisu i strukturyzacji dane
Zajmują relatywnie mało miejsca
Większość operacji to dość prosta, choć niekiedy
czasochłonna, arytmetyka i geometria
Coraz więcej danych i źródeł danych
Coraz więcej metod i oprogramowania, w tym pakietów
open-source
Coraz większe zapotrzebowanie!
Co jest ważne dla nas?
10. #10Copyright by DataWise
Czy można się schować?
lon/lat: 20.802935 52.218758
0
Typ Str. wiekowaFirmy
26
domów
Ulica
6200 zł
Zarobki
+
11. #11Copyright by DataWise
Gdzie bardziej potrzeba szkoły?
Wilanów
Kabaty
Poleczki
Wołoska
Stosunek liczby dzieci do lat 14 do
liczby emerytów
Liczba spółek (z o.o. i S.A)
Mapy wykorzystują o podział kraju na ponad 180 tys. mikroobszarów)
12. #12Copyright by DataWise
Wyniki 2 tury wyborów prezydenckich 2010 w oparciu o dane z
pojedynczych komisji (ponad 20 tys.)
Dlaczego frekwencja w wyborach się liczy?
Źródło: PKW, DataWise
14. #14Copyright by DataWise
Dużo pracy dla data scientist
Źródło: http://www.wired.co.uk/news/archive/2012-08/14/location-prediction/
15. #15Copyright by DataWise
Fizyczna lokalizacja
(klienta, placówki,
urządzenia)
Mapy obiektów
geograficznych, ulic
itp.
Podziały
geograficzne
Dane
socjodemograficzne
i konsumenckie
Teren,
infrastruktura,
geografia
Punkty Points of
Interest (POI),
placówki itp.
Dane tradycyjne – dane statyczne
16. #16Copyright by DataWise
Główny Urząd Statystyczny
http://stat.gov.pl/bdl/app/strona.html?p_name=indeks
http://geo.stat.gov.pl/
Centralny Ośrodek Dokumentacji Geodezyjnej i
Kartograficznej (http://www.codgik.gov.pl/)
Portal Moje Państwo:
(https://mojepanstwo.pl/api/technical_info)
Geoportal (http://geoportal.gov.pl/)
Open Street Map
Publiczne źródła danych w Polsce
17. #17Copyright by DataWise
Serwisy geolokalizujące (Bing, DataWise, Google,
Targeo)
Producenci map: HERE (d. Navteq), Imagis
Producenci danych komercyjnych (DataWise, GFK)
Dane o ruchu/korkach z nawigacji samochodowej
Dane POI
Dane dot. cen nieruchomości
Dane dot. infrastruktury
?
Komercyjne źródła danych w Polsce
18. #18Copyright by DataWise
Geotagging , Geohash (Flickr, Twitter)
Serwisy społecznościowe
Indoor location
Geofeeds
Check-ins
Geolokalizacja via przeglądarka
Internet rzeczy
Nowe dane! Kto je zdobędzie?
21. #21Copyright by DataWise
Elementy analizy geograficznej wchodzą w kanon funkcji
software’u BI/analitycznego
Tableau – ważny element propozycji od początku
Duże systemy BI gonią Tableau
IBM Modeller – algorytmy do analizy czasoprzestrzennej w
nowej wersji
R – dedykowane biblioteki
Wizualizacja na mapie - przewaga