SlideShare uma empresa Scribd logo
1 de 24
Baixar para ler offline
#1Copyright by DataWise
Geolokalizacja i analizy przestrzenne:
trzy wymiary a ile pracy dla analityka!
O roli danych geograficznych ich źródłach, potencjale oraz metodach
analitycznych wykorzystujących informacje przestrzenne.
5 spotkanie Data Science Warsaw MeetUp. Warszawa, 12 maja 2015
#2Copyright by DataWise
 Od 2000 roku zajmuję się analizą danych zastanych i
znalezionych w biznesie (CRMy, systemy transakcyjne
itp.)
 Do 2008 w korporacji (Claritas, Acxiom)
 Od 2008 współtworzę DataWise, firmę która integruje,
tworzy i analizuje dane na potrzeby aktywności
marketingowych i sprzedażowych
 Od początku ważnym wątkiem analiz był geomarketing i
analiza przestrzenna
O mnie
#3Copyright by DataWise
„Geographic data is one of the most common types of data
available, and with today’s location-based applications and
sensors, it’s more important than ever.”
Myśl przewodnia
Źródło: https://www.tableau.com/solutions/mapping-software
#4Copyright by DataWise
Lokalizacja – trzy proste wymiary
x=21°
y=52°
z=100 m.n.p.m.
x
y
z
#5Copyright by DataWise
… no może cztery
Źródło: http://www.flightradar24.com
t1 t2
#6Copyright by DataWise
 Położenie w (czaso)przestrzeni -
podstawowa właściwość
zarówno ludzi jak i rzeczy
 Przestrzeń i informacja o
położeniu:
 Często determinuje możliwość
interakcji / relacji (dystans)
 Jest potrzebna do kontroli i
poczucia bezpieczeństwa
 Umożliwia podejmowanie wielu
decyzji i zarządzanie procesami
 Wpływa na koszty
podejmowanych działań (koszt
dotarcia, ryzyko fizycznych
inwestycje)
Lokalizacja to podstawa
#7Copyright by DataWise
 Proste do zapisu i strukturyzacji dane
 Zajmują relatywnie mało miejsca
 Większość operacji to dość prosta, choć niekiedy
czasochłonna, arytmetyka i geometria
 Coraz więcej danych i źródeł danych
 Coraz więcej metod i oprogramowania, w tym pakietów
open-source
 Coraz większe zapotrzebowanie!
Co jest ważne dla nas?
#8Copyright by DataWise
Komu to potrzebne?
#9Copyright by DataWise
Augmented reality
Źródło: http://ngm.nationalgeographic.com/img/big-idea/augmented/augmented.jpg
#10Copyright by DataWise
Czy można się schować?
lon/lat: 20.802935 52.218758
0
Typ Str. wiekowaFirmy
 26
domów
Ulica
6200 zł
Zarobki
+
#11Copyright by DataWise
Gdzie bardziej potrzeba szkoły?
Wilanów
Kabaty
Poleczki
Wołoska
Stosunek liczby dzieci do lat 14 do
liczby emerytów
Liczba spółek (z o.o. i S.A)
Mapy wykorzystują o podział kraju na ponad 180 tys. mikroobszarów)
#12Copyright by DataWise
Wyniki 2 tury wyborów prezydenckich 2010 w oparciu o dane z
pojedynczych komisji (ponad 20 tys.)
Dlaczego frekwencja w wyborach się liczy?
Źródło: PKW, DataWise
#13Copyright by DataWise
Smartfon z GPS – nowa rzeczywistość
Źródło: https://blog.gnip.com/blake-shaw-foursquare/
#14Copyright by DataWise
Dużo pracy dla data scientist
Źródło: http://www.wired.co.uk/news/archive/2012-08/14/location-prediction/
#15Copyright by DataWise
Fizyczna lokalizacja
(klienta, placówki,
urządzenia)
Mapy obiektów
geograficznych, ulic
itp.
Podziały
geograficzne
Dane
socjodemograficzne
i konsumenckie
Teren,
infrastruktura,
geografia
Punkty Points of
Interest (POI),
placówki itp.
Dane tradycyjne – dane statyczne
#16Copyright by DataWise
 Główny Urząd Statystyczny
 http://stat.gov.pl/bdl/app/strona.html?p_name=indeks
 http://geo.stat.gov.pl/
 Centralny Ośrodek Dokumentacji Geodezyjnej i
Kartograficznej (http://www.codgik.gov.pl/)
 Portal Moje Państwo:
(https://mojepanstwo.pl/api/technical_info)
 Geoportal (http://geoportal.gov.pl/)
 Open Street Map
Publiczne źródła danych w Polsce
#17Copyright by DataWise
 Serwisy geolokalizujące (Bing, DataWise, Google,
Targeo)
 Producenci map: HERE (d. Navteq), Imagis
 Producenci danych komercyjnych (DataWise, GFK)
 Dane o ruchu/korkach z nawigacji samochodowej
 Dane POI
 Dane dot. cen nieruchomości
 Dane dot. infrastruktury
 ?
Komercyjne źródła danych w Polsce
#18Copyright by DataWise
 Geotagging , Geohash (Flickr, Twitter)
 Serwisy społecznościowe
 Indoor location
 Geofeeds
 Check-ins
 Geolokalizacja via przeglądarka
 Internet rzeczy
Nowe dane! Kto je zdobędzie?
#19Copyright by DataWise
Healthmap.org
#20Copyright by DataWise
wheredoyougo.net
#21Copyright by DataWise
 Elementy analizy geograficznej wchodzą w kanon funkcji
software’u BI/analitycznego
 Tableau – ważny element propozycji od początku
 Duże systemy BI gonią Tableau
 IBM Modeller – algorytmy do analizy czasoprzestrzennej w
nowej wersji
 R – dedykowane biblioteki
Wizualizacja na mapie - przewaga
#22Copyright by DataWise
Narzędzie BigData tam zmierzają
Źródło: http://spatialhadoop.cs.umn.edu/xvisualization.html
#23Copyright by DataWise
 OpenSource GIS
 qGIS
 Grass GIS
 Quantum GIS
 Biblioteki javascript (np. Leaflet)
 Statystyka czasoprzestrzenna
 R – 136 pakietów mających w nazwie lub opisie słowo „spatial”
 IBM Modeller v.23+
 …?
 Komercyjne pakiet GIS
 Esri ArcView
 MapInfo Pro
Narzędzia
#24Copyright by DataWise
Marek Turlejski
m.turlejski@datawise.pl
+48 501 099 698

Mais conteúdo relacionado

Semelhante a Geolokalizacja i analizy przestrzenne: trzy wymiary a ile pracy dla analityka!

Location, movent, time, context. / Lokalizacja, ruch, czas, kontekst.
Location, movent, time, context. / Lokalizacja, ruch, czas, kontekst.Location, movent, time, context. / Lokalizacja, ruch, czas, kontekst.
Location, movent, time, context. / Lokalizacja, ruch, czas, kontekst.Marek Turlejski
 
Data science warsaw inaugural meetup
Data science warsaw   inaugural meetupData science warsaw   inaugural meetup
Data science warsaw inaugural meetupData Science Warsaw
 
Digital HR, Candidates and Employees Experience - Digital University 20-01-2017
Digital HR, Candidates and Employees Experience - Digital University 20-01-2017Digital HR, Candidates and Employees Experience - Digital University 20-01-2017
Digital HR, Candidates and Employees Experience - Digital University 20-01-2017Marcin Sienczyk
 
Digital Analytics of the Future (Digital Analytics w przyszłości) - Blueffect...
Digital Analytics of the Future (Digital Analytics w przyszłości) - Blueffect...Digital Analytics of the Future (Digital Analytics w przyszłości) - Blueffect...
Digital Analytics of the Future (Digital Analytics w przyszłości) - Blueffect...Bluerank
 
3 lata otwierania danych w Gdańsku
3 lata otwierania danych w Gdańsku3 lata otwierania danych w Gdańsku
3 lata otwierania danych w GdańskuTomasz Nadolny
 
Data science warsaw inaugural meetup
Data science warsaw   inaugural meetupData science warsaw   inaugural meetup
Data science warsaw inaugural meetupAgnieszka Zdebiak
 
Artur Senk, OKE Poland, Big Data na zakupach
Artur Senk, OKE Poland, Big Data na zakupachArtur Senk, OKE Poland, Big Data na zakupach
Artur Senk, OKE Poland, Big Data na zakupach3camp
 
Wpływ "customer journey" na obsługę klienta bankowego – postaw na „user exper...
Wpływ "customer journey" na obsługę klienta bankowego – postaw na „user exper...Wpływ "customer journey" na obsługę klienta bankowego – postaw na „user exper...
Wpływ "customer journey" na obsługę klienta bankowego – postaw na „user exper...ITMAGINATION
 
5 kroków do zmiany spojrzenia na e-biznes | Mateusz Muryjas @ LubBiznes
5 kroków do zmiany spojrzenia na e-biznes | Mateusz Muryjas @ LubBiznes5 kroków do zmiany spojrzenia na e-biznes | Mateusz Muryjas @ LubBiznes
5 kroków do zmiany spojrzenia na e-biznes | Mateusz Muryjas @ LubBiznesMateusz Muryjas
 
Dominik Mikiewicz / Cartomatic / Narzędzia w partycypacji społecznej
Dominik Mikiewicz / Cartomatic / Narzędzia w partycypacji społecznejDominik Mikiewicz / Cartomatic / Narzędzia w partycypacji społecznej
Dominik Mikiewicz / Cartomatic / Narzędzia w partycypacji społecznejmiastadwazero
 
Dlaczego Big Data narobi nam problemów? - Mateusz Muryjas @ GeekTrends #1
Dlaczego Big Data narobi nam problemów? - Mateusz Muryjas @ GeekTrends #1Dlaczego Big Data narobi nam problemów? - Mateusz Muryjas @ GeekTrends #1
Dlaczego Big Data narobi nam problemów? - Mateusz Muryjas @ GeekTrends #1Mateusz Muryjas
 
Budowanie skutecznej strategii e-marketingowej | Mateusz Muryjas @ Igrzyska P...
Budowanie skutecznej strategii e-marketingowej | Mateusz Muryjas @ Igrzyska P...Budowanie skutecznej strategii e-marketingowej | Mateusz Muryjas @ Igrzyska P...
Budowanie skutecznej strategii e-marketingowej | Mateusz Muryjas @ Igrzyska P...Mateusz Muryjas
 
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...TUATARA
 
Big Data w Polsce i za granicą (Big Data in Poland and worldwide)
Big Data w Polsce i za granicą (Big Data in Poland and worldwide)Big Data w Polsce i za granicą (Big Data in Poland and worldwide)
Big Data w Polsce i za granicą (Big Data in Poland and worldwide)Aleksandra Wozniak
 
Duże liczby w wielkim świecie, czyli (r)ewolucja IT w biznesie | Mateusz Mury...
Duże liczby w wielkim świecie, czyli (r)ewolucja IT w biznesie | Mateusz Mury...Duże liczby w wielkim świecie, czyli (r)ewolucja IT w biznesie | Mateusz Mury...
Duże liczby w wielkim świecie, czyli (r)ewolucja IT w biznesie | Mateusz Mury...Mateusz Muryjas
 
Cyfrowa transformacja. Fakty i Mity
Cyfrowa transformacja. Fakty i MityCyfrowa transformacja. Fakty i Mity
Cyfrowa transformacja. Fakty i MityMichal Kreczmar
 
What kind of Data Scientist do you need?
What kind of Data Scientist do you need?What kind of Data Scientist do you need?
What kind of Data Scientist do you need?Agnieszka Zdebiak
 
II Kongres eHandlu: Wojciech Chochołowicz, Gino Rossi i Jarosław Królewski, H...
II Kongres eHandlu: Wojciech Chochołowicz, Gino Rossi i Jarosław Królewski, H...II Kongres eHandlu: Wojciech Chochołowicz, Gino Rossi i Jarosław Królewski, H...
II Kongres eHandlu: Wojciech Chochołowicz, Gino Rossi i Jarosław Królewski, H...ecommerce poland expo
 

Semelhante a Geolokalizacja i analizy przestrzenne: trzy wymiary a ile pracy dla analityka! (20)

Location, movent, time, context. / Lokalizacja, ruch, czas, kontekst.
Location, movent, time, context. / Lokalizacja, ruch, czas, kontekst.Location, movent, time, context. / Lokalizacja, ruch, czas, kontekst.
Location, movent, time, context. / Lokalizacja, ruch, czas, kontekst.
 
Data science warsaw inaugural meetup
Data science warsaw   inaugural meetupData science warsaw   inaugural meetup
Data science warsaw inaugural meetup
 
Digital HR, Candidates and Employees Experience - Digital University 20-01-2017
Digital HR, Candidates and Employees Experience - Digital University 20-01-2017Digital HR, Candidates and Employees Experience - Digital University 20-01-2017
Digital HR, Candidates and Employees Experience - Digital University 20-01-2017
 
Digital Analytics of the Future (Digital Analytics w przyszłości) - Blueffect...
Digital Analytics of the Future (Digital Analytics w przyszłości) - Blueffect...Digital Analytics of the Future (Digital Analytics w przyszłości) - Blueffect...
Digital Analytics of the Future (Digital Analytics w przyszłości) - Blueffect...
 
3 lata otwierania danych w Gdańsku
3 lata otwierania danych w Gdańsku3 lata otwierania danych w Gdańsku
3 lata otwierania danych w Gdańsku
 
Data science warsaw inaugural meetup
Data science warsaw   inaugural meetupData science warsaw   inaugural meetup
Data science warsaw inaugural meetup
 
Artur Senk, OKE Poland, Big Data na zakupach
Artur Senk, OKE Poland, Big Data na zakupachArtur Senk, OKE Poland, Big Data na zakupach
Artur Senk, OKE Poland, Big Data na zakupach
 
Wpływ "customer journey" na obsługę klienta bankowego – postaw na „user exper...
Wpływ "customer journey" na obsługę klienta bankowego – postaw na „user exper...Wpływ "customer journey" na obsługę klienta bankowego – postaw na „user exper...
Wpływ "customer journey" na obsługę klienta bankowego – postaw na „user exper...
 
5 kroków do zmiany spojrzenia na e-biznes | Mateusz Muryjas @ LubBiznes
5 kroków do zmiany spojrzenia na e-biznes | Mateusz Muryjas @ LubBiznes5 kroków do zmiany spojrzenia na e-biznes | Mateusz Muryjas @ LubBiznes
5 kroków do zmiany spojrzenia na e-biznes | Mateusz Muryjas @ LubBiznes
 
Dominik Mikiewicz / Cartomatic / Narzędzia w partycypacji społecznej
Dominik Mikiewicz / Cartomatic / Narzędzia w partycypacji społecznejDominik Mikiewicz / Cartomatic / Narzędzia w partycypacji społecznej
Dominik Mikiewicz / Cartomatic / Narzędzia w partycypacji społecznej
 
Dlaczego Big Data narobi nam problemów? - Mateusz Muryjas @ GeekTrends #1
Dlaczego Big Data narobi nam problemów? - Mateusz Muryjas @ GeekTrends #1Dlaczego Big Data narobi nam problemów? - Mateusz Muryjas @ GeekTrends #1
Dlaczego Big Data narobi nam problemów? - Mateusz Muryjas @ GeekTrends #1
 
Budowanie skutecznej strategii e-marketingowej | Mateusz Muryjas @ Igrzyska P...
Budowanie skutecznej strategii e-marketingowej | Mateusz Muryjas @ Igrzyska P...Budowanie skutecznej strategii e-marketingowej | Mateusz Muryjas @ Igrzyska P...
Budowanie skutecznej strategii e-marketingowej | Mateusz Muryjas @ Igrzyska P...
 
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
 
Michał Korzycki @ SFI
Michał Korzycki @ SFIMichał Korzycki @ SFI
Michał Korzycki @ SFI
 
Big Data w Polsce i za granicą (Big Data in Poland and worldwide)
Big Data w Polsce i za granicą (Big Data in Poland and worldwide)Big Data w Polsce i za granicą (Big Data in Poland and worldwide)
Big Data w Polsce i za granicą (Big Data in Poland and worldwide)
 
Duże liczby w wielkim świecie, czyli (r)ewolucja IT w biznesie | Mateusz Mury...
Duże liczby w wielkim świecie, czyli (r)ewolucja IT w biznesie | Mateusz Mury...Duże liczby w wielkim świecie, czyli (r)ewolucja IT w biznesie | Mateusz Mury...
Duże liczby w wielkim świecie, czyli (r)ewolucja IT w biznesie | Mateusz Mury...
 
Cyfrowa transformacja. Fakty i Mity
Cyfrowa transformacja. Fakty i MityCyfrowa transformacja. Fakty i Mity
Cyfrowa transformacja. Fakty i Mity
 
Big Data w rekrutacji
Big Data w rekrutacjiBig Data w rekrutacji
Big Data w rekrutacji
 
What kind of Data Scientist do you need?
What kind of Data Scientist do you need?What kind of Data Scientist do you need?
What kind of Data Scientist do you need?
 
II Kongres eHandlu: Wojciech Chochołowicz, Gino Rossi i Jarosław Królewski, H...
II Kongres eHandlu: Wojciech Chochołowicz, Gino Rossi i Jarosław Królewski, H...II Kongres eHandlu: Wojciech Chochołowicz, Gino Rossi i Jarosław Królewski, H...
II Kongres eHandlu: Wojciech Chochołowicz, Gino Rossi i Jarosław Królewski, H...
 

Mais de Data Science Warsaw

Wizualne budowanie aplikacji na Sparku przy pomocy narzędzia Seahorse
Wizualne budowanie aplikacji na Sparku przy pomocy narzędzia SeahorseWizualne budowanie aplikacji na Sparku przy pomocy narzędzia Seahorse
Wizualne budowanie aplikacji na Sparku przy pomocy narzędzia SeahorseData Science Warsaw
 
Neptune - narzędzie do monitorowania i zarządzania eksperymentami Machine Lea...
Neptune - narzędzie do monitorowania i zarządzania eksperymentami Machine Lea...Neptune - narzędzie do monitorowania i zarządzania eksperymentami Machine Lea...
Neptune - narzędzie do monitorowania i zarządzania eksperymentami Machine Lea...Data Science Warsaw
 
CRISP-DM Agile Approach to Data Mining Projects
CRISP-DM Agile Approach to Data Mining ProjectsCRISP-DM Agile Approach to Data Mining Projects
CRISP-DM Agile Approach to Data Mining ProjectsData Science Warsaw
 
Online content popularity prediction
Online content popularity predictionOnline content popularity prediction
Online content popularity predictionData Science Warsaw
 
Rozwiązywanie problemów optymalizacyjnych
Rozwiązywanie problemów optymalizacyjnychRozwiązywanie problemów optymalizacyjnych
Rozwiązywanie problemów optymalizacyjnychData Science Warsaw
 
Big Data, Wearable, sztuczna inteligencja i ekonomia współpracy
Big  Data, Wearable, sztuczna inteligencja i ekonomia współpracyBig  Data, Wearable, sztuczna inteligencja i ekonomia współpracy
Big Data, Wearable, sztuczna inteligencja i ekonomia współpracyData Science Warsaw
 
Oracle Big Data Discovery - ludzka twarz Hadoop'a
Oracle Big Data Discovery - ludzka twarz Hadoop'aOracle Big Data Discovery - ludzka twarz Hadoop'a
Oracle Big Data Discovery - ludzka twarz Hadoop'aData Science Warsaw
 
Data Exchange - the missing link in the big data value chain
Data Exchange - the missing link in the big data value chainData Exchange - the missing link in the big data value chain
Data Exchange - the missing link in the big data value chainData Science Warsaw
 
Metody logiczne w analizie danych
Metody logiczne w analizie danych Metody logiczne w analizie danych
Metody logiczne w analizie danych Data Science Warsaw
 
Małe dane, duży wpływ - Dominik Batorski ICM
Małe dane, duży wpływ - Dominik Batorski ICMMałe dane, duży wpływ - Dominik Batorski ICM
Małe dane, duży wpływ - Dominik Batorski ICMData Science Warsaw
 

Mais de Data Science Warsaw (20)

Wizualne budowanie aplikacji na Sparku przy pomocy narzędzia Seahorse
Wizualne budowanie aplikacji na Sparku przy pomocy narzędzia SeahorseWizualne budowanie aplikacji na Sparku przy pomocy narzędzia Seahorse
Wizualne budowanie aplikacji na Sparku przy pomocy narzędzia Seahorse
 
Neptune - narzędzie do monitorowania i zarządzania eksperymentami Machine Lea...
Neptune - narzędzie do monitorowania i zarządzania eksperymentami Machine Lea...Neptune - narzędzie do monitorowania i zarządzania eksperymentami Machine Lea...
Neptune - narzędzie do monitorowania i zarządzania eksperymentami Machine Lea...
 
CRISP-DM Agile Approach to Data Mining Projects
CRISP-DM Agile Approach to Data Mining ProjectsCRISP-DM Agile Approach to Data Mining Projects
CRISP-DM Agile Approach to Data Mining Projects
 
Online content popularity prediction
Online content popularity predictionOnline content popularity prediction
Online content popularity prediction
 
Rozwiązywanie problemów optymalizacyjnych
Rozwiązywanie problemów optymalizacyjnychRozwiązywanie problemów optymalizacyjnych
Rozwiązywanie problemów optymalizacyjnych
 
Ile informacji jest w danych?
Ile informacji jest w danych?Ile informacji jest w danych?
Ile informacji jest w danych?
 
Analiza języka naturalnego
Analiza języka naturalnegoAnaliza języka naturalnego
Analiza języka naturalnego
 
Otwarte Miasta
Otwarte MiastaOtwarte Miasta
Otwarte Miasta
 
How to build your own google
How to build your own googleHow to build your own google
How to build your own google
 
To się w ram ie nie zmieści
To się w ram ie nie zmieściTo się w ram ie nie zmieści
To się w ram ie nie zmieści
 
Azure - Duże zbiory w chmurze
Azure - Duże zbiory w chmurzeAzure - Duże zbiory w chmurze
Azure - Duże zbiory w chmurze
 
Data Science Warsaw
Data Science WarsawData Science Warsaw
Data Science Warsaw
 
Data science w ubezpieczeniach
Data science w ubezpieczeniachData science w ubezpieczeniach
Data science w ubezpieczeniach
 
As simple as Apache Spark
As simple as Apache SparkAs simple as Apache Spark
As simple as Apache Spark
 
Big Data, Wearable, sztuczna inteligencja i ekonomia współpracy
Big  Data, Wearable, sztuczna inteligencja i ekonomia współpracyBig  Data, Wearable, sztuczna inteligencja i ekonomia współpracy
Big Data, Wearable, sztuczna inteligencja i ekonomia współpracy
 
Ask Data Anything
Ask Data AnythingAsk Data Anything
Ask Data Anything
 
Oracle Big Data Discovery - ludzka twarz Hadoop'a
Oracle Big Data Discovery - ludzka twarz Hadoop'aOracle Big Data Discovery - ludzka twarz Hadoop'a
Oracle Big Data Discovery - ludzka twarz Hadoop'a
 
Data Exchange - the missing link in the big data value chain
Data Exchange - the missing link in the big data value chainData Exchange - the missing link in the big data value chain
Data Exchange - the missing link in the big data value chain
 
Metody logiczne w analizie danych
Metody logiczne w analizie danych Metody logiczne w analizie danych
Metody logiczne w analizie danych
 
Małe dane, duży wpływ - Dominik Batorski ICM
Małe dane, duży wpływ - Dominik Batorski ICMMałe dane, duży wpływ - Dominik Batorski ICM
Małe dane, duży wpływ - Dominik Batorski ICM
 

Geolokalizacja i analizy przestrzenne: trzy wymiary a ile pracy dla analityka!

  • 1. #1Copyright by DataWise Geolokalizacja i analizy przestrzenne: trzy wymiary a ile pracy dla analityka! O roli danych geograficznych ich źródłach, potencjale oraz metodach analitycznych wykorzystujących informacje przestrzenne. 5 spotkanie Data Science Warsaw MeetUp. Warszawa, 12 maja 2015
  • 2. #2Copyright by DataWise  Od 2000 roku zajmuję się analizą danych zastanych i znalezionych w biznesie (CRMy, systemy transakcyjne itp.)  Do 2008 w korporacji (Claritas, Acxiom)  Od 2008 współtworzę DataWise, firmę która integruje, tworzy i analizuje dane na potrzeby aktywności marketingowych i sprzedażowych  Od początku ważnym wątkiem analiz był geomarketing i analiza przestrzenna O mnie
  • 3. #3Copyright by DataWise „Geographic data is one of the most common types of data available, and with today’s location-based applications and sensors, it’s more important than ever.” Myśl przewodnia Źródło: https://www.tableau.com/solutions/mapping-software
  • 4. #4Copyright by DataWise Lokalizacja – trzy proste wymiary x=21° y=52° z=100 m.n.p.m. x y z
  • 5. #5Copyright by DataWise … no może cztery Źródło: http://www.flightradar24.com t1 t2
  • 6. #6Copyright by DataWise  Położenie w (czaso)przestrzeni - podstawowa właściwość zarówno ludzi jak i rzeczy  Przestrzeń i informacja o położeniu:  Często determinuje możliwość interakcji / relacji (dystans)  Jest potrzebna do kontroli i poczucia bezpieczeństwa  Umożliwia podejmowanie wielu decyzji i zarządzanie procesami  Wpływa na koszty podejmowanych działań (koszt dotarcia, ryzyko fizycznych inwestycje) Lokalizacja to podstawa
  • 7. #7Copyright by DataWise  Proste do zapisu i strukturyzacji dane  Zajmują relatywnie mało miejsca  Większość operacji to dość prosta, choć niekiedy czasochłonna, arytmetyka i geometria  Coraz więcej danych i źródeł danych  Coraz więcej metod i oprogramowania, w tym pakietów open-source  Coraz większe zapotrzebowanie! Co jest ważne dla nas?
  • 9. #9Copyright by DataWise Augmented reality Źródło: http://ngm.nationalgeographic.com/img/big-idea/augmented/augmented.jpg
  • 10. #10Copyright by DataWise Czy można się schować? lon/lat: 20.802935 52.218758 0 Typ Str. wiekowaFirmy  26 domów Ulica 6200 zł Zarobki +
  • 11. #11Copyright by DataWise Gdzie bardziej potrzeba szkoły? Wilanów Kabaty Poleczki Wołoska Stosunek liczby dzieci do lat 14 do liczby emerytów Liczba spółek (z o.o. i S.A) Mapy wykorzystują o podział kraju na ponad 180 tys. mikroobszarów)
  • 12. #12Copyright by DataWise Wyniki 2 tury wyborów prezydenckich 2010 w oparciu o dane z pojedynczych komisji (ponad 20 tys.) Dlaczego frekwencja w wyborach się liczy? Źródło: PKW, DataWise
  • 13. #13Copyright by DataWise Smartfon z GPS – nowa rzeczywistość Źródło: https://blog.gnip.com/blake-shaw-foursquare/
  • 14. #14Copyright by DataWise Dużo pracy dla data scientist Źródło: http://www.wired.co.uk/news/archive/2012-08/14/location-prediction/
  • 15. #15Copyright by DataWise Fizyczna lokalizacja (klienta, placówki, urządzenia) Mapy obiektów geograficznych, ulic itp. Podziały geograficzne Dane socjodemograficzne i konsumenckie Teren, infrastruktura, geografia Punkty Points of Interest (POI), placówki itp. Dane tradycyjne – dane statyczne
  • 16. #16Copyright by DataWise  Główny Urząd Statystyczny  http://stat.gov.pl/bdl/app/strona.html?p_name=indeks  http://geo.stat.gov.pl/  Centralny Ośrodek Dokumentacji Geodezyjnej i Kartograficznej (http://www.codgik.gov.pl/)  Portal Moje Państwo: (https://mojepanstwo.pl/api/technical_info)  Geoportal (http://geoportal.gov.pl/)  Open Street Map Publiczne źródła danych w Polsce
  • 17. #17Copyright by DataWise  Serwisy geolokalizujące (Bing, DataWise, Google, Targeo)  Producenci map: HERE (d. Navteq), Imagis  Producenci danych komercyjnych (DataWise, GFK)  Dane o ruchu/korkach z nawigacji samochodowej  Dane POI  Dane dot. cen nieruchomości  Dane dot. infrastruktury  ? Komercyjne źródła danych w Polsce
  • 18. #18Copyright by DataWise  Geotagging , Geohash (Flickr, Twitter)  Serwisy społecznościowe  Indoor location  Geofeeds  Check-ins  Geolokalizacja via przeglądarka  Internet rzeczy Nowe dane! Kto je zdobędzie?
  • 21. #21Copyright by DataWise  Elementy analizy geograficznej wchodzą w kanon funkcji software’u BI/analitycznego  Tableau – ważny element propozycji od początku  Duże systemy BI gonią Tableau  IBM Modeller – algorytmy do analizy czasoprzestrzennej w nowej wersji  R – dedykowane biblioteki Wizualizacja na mapie - przewaga
  • 22. #22Copyright by DataWise Narzędzie BigData tam zmierzają Źródło: http://spatialhadoop.cs.umn.edu/xvisualization.html
  • 23. #23Copyright by DataWise  OpenSource GIS  qGIS  Grass GIS  Quantum GIS  Biblioteki javascript (np. Leaflet)  Statystyka czasoprzestrzenna  R – 136 pakietów mających w nazwie lub opisie słowo „spatial”  IBM Modeller v.23+  …?  Komercyjne pakiet GIS  Esri ArcView  MapInfo Pro Narzędzia
  • 24. #24Copyright by DataWise Marek Turlejski m.turlejski@datawise.pl +48 501 099 698