SlideShare a Scribd company logo
1 of 8
Big Data e Statistica Ufficiale:
i progetti internazionali

Carlo Vaccari
UNECE Task Team on Big Data
Università di Camerino - Istat
http://vaccaricarlo.wordpress.com

Big Data Analytics Conference 2013 - C. Vaccari
Big Data nella Statistica Ufficiale

Sfide dei Big Data alla statistica ufficiale:
i Big Data sono accessibili agli Istituti di Statistica (NSI) e a quali
condizioni?
quali garanzie esistono sulla tutela della riservatezza
nell'accesso ed elaborazione dei Big Data?
l'accesso ai Big Data spesso ha un costo, magari inferiore
rispetto ai dati statistici, ma a volte considerevole
qual è l'impatto sull'organizzazione di un NSI quando i Big Data
diventano una importante fonte di dati?
quale cambiamento di paradigma è necessario nell'IT degli NSI
per utilizzare i Big Data?
qual è l'impatto dell'uso dei Big Data (in combinazione o in
sostituzione di dati statistici) sui metodi statistici consolidati di
raccolta dei dati, l'elaborazione e la diffusione?
Big Data Analytics Conference 2013 - C. Vaccari
Le prime esperienze internazionali

Olanda: dati dai sensori del traffico per rilevare i movimenti delle
persone
Olanda: dati da Twitter per valutare con “sentiment analysis” il
clima di fiducia dei consumatori
Australia: dati da satellite per stimare la crescita dei raccolti e
l'utilizzo del suolo agricolo
Slovenia: migliorare le statistiche sulla popolazione e la mobilità
utilizzando dati dei cellulari
Nuova Zelanda: monitorare i movimenti della popolazione a
breve termine durante e dopo un disastro naturale
Eurostat: prezzi dal Web per migliorare l'indice dei prezzi
(progetto simile a Billion Prices Project, nato dal controllo dei
prezzi in Argentina)
...
Big Data Analytics Conference 2013 - C. Vaccari
L'inflazione argentina calcolata dai Big Data

Big Data Analytics Conference 2013 - C. Vaccari
le azioni di coordinamento
Primo documento dell'High Level Group:
What does BigData mean for official statistics?
2013: formazione di un gruppo di lavoro con tre organizzazioni
internazionali (UNECE, Eurostat, OECD) e dieci nazioni (Australia,
Canada, Italia, Mexico, Nuova Zelanda, Olanda, Polonia, Regno
Unito, Slovenia, Turchia) con il compito di individuare le priorità
per la cooperazione internazionale e di sviluppare una proposta di
progetto per un progetto su Big Data e statistica ufficiale
Perché la cooperazione internazionale?
Molti fenomeni internazionali per natura (es. traffico web)
Molti dati gestiti da operatori multinazionali (eg provider
telefonici)
Più potere contrattuale (es verso Google o provider)
Necessità di comparabilità internazionale (es prezzi)
Big Data Analytics Conference 2013 - C. Vaccari
il progetto proposto

Il progetto, in via di completamento, sarà proposto in novembre all'
High Level Group
Composto da tre work-package principali:
1 - come rispondere alle sfide: legislativa, privacy, costi,
management, metodologia, tecnologia
2 - sviluppare una sandbox, un ambiente condiviso per
dimostrare la fattibilità della produzione di statistiche ufficiali
partendo da Big Data, con la possibilità di replicare l'approccio in
diverse nazioni
3 - facilitare lo scambio di conoscenza, strumenti e metodi per la
produzione di statistiche partendo da Big Data, sviluppare un
sito di documentazione, demo, video, manuali, organizzare
workshop e corsi
Big Data Analytics Conference 2013 - C. Vaccari
la “sandbox”

Un ambiente (sandbox) con qualche applicazione pratica per
dimostrare che:
si possono manipolare Big Data in modo semplice ed efficiente
sulla piattaforma scelta
la piattaforma rispetta i vincoli tecnologici e di costo degli NSIs
i dati scelti possono garantire output statistici con determinati
criteri di qualità
i risultati sono comparabili con prodotti statistici standard
le nazioni partecipanti possono condividere metodi, tool, dataset
e
risultati
nel
quadro
della
Common Statistical Production Architecture

Big Data Analytics Conference 2013 - C. Vaccari
“sandbox” ad oggi

In via di definizione l'ambiente a vari livelli:
cluster e cloud: valutando piattaforme di cluster, ambienti cloud,
strumenti che integrano Hadoop e altri ambienti di base
strumenti di analisi: analisi statistica, ambienti integrati di
visualizzazione avanzata, suite di business intelligence, suite per
l'analisi di Big Data, tool di data mining, strumenti di ETL
(Extraction Transformation & Loading), generatori di report e di
grafici a partire da Big Data, …
dataset: dati di test (come il dump di Wikipedia, One million
songs,..), acquisti con carte di credito, social network, chiamate
da cellulari, transazioni sul web, tracce GPS, …
Obiettivo: creare un ambiente di test, ma in seguito generare
anche virtual machine pronte all'uso
Big Data Analytics Conference 2013 - C. Vaccari

More Related Content

What's hot

Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito
Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego SanvitoKnowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito
Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego SanvitoData Driven Innovation
 
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...Data Driven Innovation
 
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...Data Driven Innovation
 
Portabilità dei dati e benessere del consumatore di servizi cloud - Davide Mula
Portabilità dei dati e benessere del consumatore di servizi cloud - Davide MulaPortabilità dei dati e benessere del consumatore di servizi cloud - Davide Mula
Portabilità dei dati e benessere del consumatore di servizi cloud - Davide MulaData Driven Innovation
 
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...Data Driven Innovation
 
ProCivibus Kublai Award 2011
ProCivibus Kublai Award 2011ProCivibus Kublai Award 2011
ProCivibus Kublai Award 2011Marco Palazzo
 
I Big Data e la Statistica: un progetto internazionale
I Big Data e la Statistica: un progetto internazionaleI Big Data e la Statistica: un progetto internazionale
I Big Data e la Statistica: un progetto internazionaleCarlo Vaccari
 
Innovazione per la PA - Andrea D'Acunto
Innovazione per la PA - Andrea D'AcuntoInnovazione per la PA - Andrea D'Acunto
Innovazione per la PA - Andrea D'AcuntoData Driven Innovation
 
A. D'Eramo, SAS for SDMX: incettivare la pubblicazione ed il riuso dei dati d...
A. D'Eramo, SAS for SDMX: incettivare la pubblicazione ed il riuso dei dati d...A. D'Eramo, SAS for SDMX: incettivare la pubblicazione ed il riuso dei dati d...
A. D'Eramo, SAS for SDMX: incettivare la pubblicazione ed il riuso dei dati d...Istituto nazionale di statistica
 
Big Data and Data Science @ BNL - D. Morgagni & L. Dell'Anna
Big Data and Data Science @ BNL - D. Morgagni & L. Dell'AnnaBig Data and Data Science @ BNL - D. Morgagni & L. Dell'Anna
Big Data and Data Science @ BNL - D. Morgagni & L. Dell'AnnaData Driven Innovation
 
Smau Milano 2019 Marta Bonucci (FASI.biz)
Smau Milano 2019 Marta Bonucci (FASI.biz)Smau Milano 2019 Marta Bonucci (FASI.biz)
Smau Milano 2019 Marta Bonucci (FASI.biz)SMAU
 
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De FrancisciLa visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De FrancisciIstituto nazionale di statistica
 
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...Cultura Digitale
 
Open Data v0.3
Open Data v0.3Open Data v0.3
Open Data v0.3Luca Mauri
 

What's hot (20)

Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito
Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego SanvitoKnowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito
Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito
 
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
 
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
 
Portabilità dei dati e benessere del consumatore di servizi cloud - Davide Mula
Portabilità dei dati e benessere del consumatore di servizi cloud - Davide MulaPortabilità dei dati e benessere del consumatore di servizi cloud - Davide Mula
Portabilità dei dati e benessere del consumatore di servizi cloud - Davide Mula
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
Città Digitali
Città DigitaliCittà Digitali
Città Digitali
 
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...
 
ProCivibus Kublai Award 2011
ProCivibus Kublai Award 2011ProCivibus Kublai Award 2011
ProCivibus Kublai Award 2011
 
I Big Data e la Statistica: un progetto internazionale
I Big Data e la Statistica: un progetto internazionaleI Big Data e la Statistica: un progetto internazionale
I Big Data e la Statistica: un progetto internazionale
 
SmartData per i Beni Culturali
SmartData per i Beni CulturaliSmartData per i Beni Culturali
SmartData per i Beni Culturali
 
FANTIN BIG DATA (1)
FANTIN BIG DATA (1)FANTIN BIG DATA (1)
FANTIN BIG DATA (1)
 
Innovazione per la PA - Andrea D'Acunto
Innovazione per la PA - Andrea D'AcuntoInnovazione per la PA - Andrea D'Acunto
Innovazione per la PA - Andrea D'Acunto
 
Data Governance at work
Data Governance at workData Governance at work
Data Governance at work
 
A. D'Eramo, SAS for SDMX: incettivare la pubblicazione ed il riuso dei dati d...
A. D'Eramo, SAS for SDMX: incettivare la pubblicazione ed il riuso dei dati d...A. D'Eramo, SAS for SDMX: incettivare la pubblicazione ed il riuso dei dati d...
A. D'Eramo, SAS for SDMX: incettivare la pubblicazione ed il riuso dei dati d...
 
Big Data and Data Science @ BNL - D. Morgagni & L. Dell'Anna
Big Data and Data Science @ BNL - D. Morgagni & L. Dell'AnnaBig Data and Data Science @ BNL - D. Morgagni & L. Dell'Anna
Big Data and Data Science @ BNL - D. Morgagni & L. Dell'Anna
 
Smau Milano 2019 Marta Bonucci (FASI.biz)
Smau Milano 2019 Marta Bonucci (FASI.biz)Smau Milano 2019 Marta Bonucci (FASI.biz)
Smau Milano 2019 Marta Bonucci (FASI.biz)
 
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De FrancisciLa visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
 
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
Open Data v0.3
Open Data v0.3Open Data v0.3
Open Data v0.3
 

Viewers also liked

Web2.0.2012 - lesson 8 - Google world
Web2.0.2012 - lesson 8 - Google worldWeb2.0.2012 - lesson 8 - Google world
Web2.0.2012 - lesson 8 - Google worldCarlo Vaccari
 
Web2.0 2012 - lesson 6 - web feed
Web2.0 2012 - lesson 6 - web feedWeb2.0 2012 - lesson 6 - web feed
Web2.0 2012 - lesson 6 - web feedCarlo Vaccari
 
Interoperability of data management for data dissemination
Interoperability of data management for data disseminationInteroperability of data management for data dissemination
Interoperability of data management for data disseminationCarlo Vaccari
 
Social networks , Job Searching and Research - 1
Social networks , Job Searching and Research - 1Social networks , Job Searching and Research - 1
Social networks , Job Searching and Research - 1Carlo Vaccari
 
Web2.0.2012 - lesson 9 - social networks
Web2.0.2012 - lesson 9 - social networksWeb2.0.2012 - lesson 9 - social networks
Web2.0.2012 - lesson 9 - social networksCarlo Vaccari
 
Web2.0 2012 - lesson 4 - twitter
Web2.0 2012 - lesson 4 - twitterWeb2.0 2012 - lesson 4 - twitter
Web2.0 2012 - lesson 4 - twitterCarlo Vaccari
 

Viewers also liked (8)

Web2.0.2012 - lesson 8 - Google world
Web2.0.2012 - lesson 8 - Google worldWeb2.0.2012 - lesson 8 - Google world
Web2.0.2012 - lesson 8 - Google world
 
Web2.0 2012 - lesson 6 - web feed
Web2.0 2012 - lesson 6 - web feedWeb2.0 2012 - lesson 6 - web feed
Web2.0 2012 - lesson 6 - web feed
 
Interoperability of data management for data dissemination
Interoperability of data management for data disseminationInteroperability of data management for data dissemination
Interoperability of data management for data dissemination
 
Social networks , Job Searching and Research - 1
Social networks , Job Searching and Research - 1Social networks , Job Searching and Research - 1
Social networks , Job Searching and Research - 1
 
Turismo: i siti web
Turismo: i siti webTurismo: i siti web
Turismo: i siti web
 
Web 2.0 2009 Istat
Web 2.0 2009 IstatWeb 2.0 2009 Istat
Web 2.0 2009 Istat
 
Web2.0.2012 - lesson 9 - social networks
Web2.0.2012 - lesson 9 - social networksWeb2.0.2012 - lesson 9 - social networks
Web2.0.2012 - lesson 9 - social networks
 
Web2.0 2012 - lesson 4 - twitter
Web2.0 2012 - lesson 4 - twitterWeb2.0 2012 - lesson 4 - twitter
Web2.0 2012 - lesson 4 - twitter
 

Similar to Big data analytics vaccari oct2013

Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaValerio Torriero
 
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...Data Driven Innovation
 
Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...Data Driven Innovation
 
Open Data 4 Startups
Open Data 4 StartupsOpen Data 4 Startups
Open Data 4 Startupsmzaglio
 
Daniela Fusco - L’uso dei Big Data a supporto della statistica - 23 maggio 20...
Daniela Fusco - L’uso dei Big Data a supporto della statistica - 23 maggio 20...Daniela Fusco - L’uso dei Big Data a supporto della statistica - 23 maggio 20...
Daniela Fusco - L’uso dei Big Data a supporto della statistica - 23 maggio 20...Istat Area SUD Eventi Territoriali
 
Data & analytics framework malerba
Data & analytics framework   malerbaData & analytics framework   malerba
Data & analytics framework malerbaRedazione InnovaPuglia
 
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...Free Your Talent
 
Analytics 3.0 - Breve storia della Data Analysis ad oggi
Analytics 3.0 - Breve storia della Data Analysis ad oggiAnalytics 3.0 - Breve storia della Data Analysis ad oggi
Analytics 3.0 - Breve storia della Data Analysis ad oggiFilippo Ragazzo
 
S. Piunno, Piattaforma Digitale Nazionale Dati - Sessione come l'accesso ai m...
S. Piunno, Piattaforma Digitale Nazionale Dati - Sessione come l'accesso ai m...S. Piunno, Piattaforma Digitale Nazionale Dati - Sessione come l'accesso ai m...
S. Piunno, Piattaforma Digitale Nazionale Dati - Sessione come l'accesso ai m...Istituto nazionale di statistica
 
Industria 4.0 soluzioni efficienti
Industria 4.0 soluzioni efficientiIndustria 4.0 soluzioni efficienti
Industria 4.0 soluzioni efficientiGemax Consulting
 
Una finestra sul futuro: il Web 3.0
Una finestra sul futuro: il Web 3.0Una finestra sul futuro: il Web 3.0
Una finestra sul futuro: il Web 3.0KEA s.r.l.
 
Smart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsSmart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsCSI Piemonte
 
Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support
 
Big Data & Data Mining
Big Data  & Data MiningBig Data  & Data Mining
Big Data & Data MiningAndrea Frison
 
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...OpenGeoDataItalia
 
Big Data per Madee 7 at Digital Accademia
Big Data per Madee 7 at Digital AccademiaBig Data per Madee 7 at Digital Accademia
Big Data per Madee 7 at Digital AccademiaGianluigi Cogo
 
Tecnologie inquiete ...
Tecnologie inquiete ...Tecnologie inquiete ...
Tecnologie inquiete ...Clay Casati
 
La produzione e la gestione degli Open Data
La produzione e la gestione degli Open DataLa produzione e la gestione degli Open Data
La produzione e la gestione degli Open DataGianluigi Cogo
 

Similar to Big data analytics vaccari oct2013 (20)

Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social Media
 
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
 
Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...
 
Open Data 4 Startups
Open Data 4 StartupsOpen Data 4 Startups
Open Data 4 Startups
 
Daniela Fusco - L’uso dei Big Data a supporto della statistica - 23 maggio 20...
Daniela Fusco - L’uso dei Big Data a supporto della statistica - 23 maggio 20...Daniela Fusco - L’uso dei Big Data a supporto della statistica - 23 maggio 20...
Daniela Fusco - L’uso dei Big Data a supporto della statistica - 23 maggio 20...
 
Data & analytics framework malerba
Data & analytics framework   malerbaData & analytics framework   malerba
Data & analytics framework malerba
 
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
 
Analytics 3.0 - Breve storia della Data Analysis ad oggi
Analytics 3.0 - Breve storia della Data Analysis ad oggiAnalytics 3.0 - Breve storia della Data Analysis ad oggi
Analytics 3.0 - Breve storia della Data Analysis ad oggi
 
S. Piunno, Piattaforma Digitale Nazionale Dati - Sessione come l'accesso ai m...
S. Piunno, Piattaforma Digitale Nazionale Dati - Sessione come l'accesso ai m...S. Piunno, Piattaforma Digitale Nazionale Dati - Sessione come l'accesso ai m...
S. Piunno, Piattaforma Digitale Nazionale Dati - Sessione come l'accesso ai m...
 
Industria 4.0 soluzioni efficienti
Industria 4.0 soluzioni efficientiIndustria 4.0 soluzioni efficienti
Industria 4.0 soluzioni efficienti
 
Una finestra sul futuro: il Web 3.0
Una finestra sul futuro: il Web 3.0Una finestra sul futuro: il Web 3.0
Una finestra sul futuro: il Web 3.0
 
Smart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsSmart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of Things
 
Clusit
ClusitClusit
Clusit
 
Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)
 
Big Data & Data Mining
Big Data  & Data MiningBig Data  & Data Mining
Big Data & Data Mining
 
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
 
_ABIlab-BigData-Finale
_ABIlab-BigData-Finale_ABIlab-BigData-Finale
_ABIlab-BigData-Finale
 
Big Data per Madee 7 at Digital Accademia
Big Data per Madee 7 at Digital AccademiaBig Data per Madee 7 at Digital Accademia
Big Data per Madee 7 at Digital Accademia
 
Tecnologie inquiete ...
Tecnologie inquiete ...Tecnologie inquiete ...
Tecnologie inquiete ...
 
La produzione e la gestione degli Open Data
La produzione e la gestione degli Open DataLa produzione e la gestione degli Open Data
La produzione e la gestione degli Open Data
 

More from Carlo Vaccari

HLG Big Data project and Sandbox
HLG Big Data project and SandboxHLG Big Data project and Sandbox
HLG Big Data project and SandboxCarlo Vaccari
 
Andrea Talamonti: CKAN a tool for Open Data
Andrea Talamonti: CKAN a tool for Open DataAndrea Talamonti: CKAN a tool for Open Data
Andrea Talamonti: CKAN a tool for Open DataCarlo Vaccari
 
Fabrizio Allegretto: Open Data & University
Fabrizio Allegretto: Open Data & UniversityFabrizio Allegretto: Open Data & University
Fabrizio Allegretto: Open Data & UniversityCarlo Vaccari
 
Yapo Juares Tanguy: RSS environment
Yapo Juares Tanguy: RSS environmentYapo Juares Tanguy: RSS environment
Yapo Juares Tanguy: RSS environmentCarlo Vaccari
 
Matteo Marchionne: Foaf e feed reader
Matteo Marchionne: Foaf e feed readerMatteo Marchionne: Foaf e feed reader
Matteo Marchionne: Foaf e feed readerCarlo Vaccari
 
Alex Haechler: China vs USA social networks
Alex Haechler: China vs USA social networksAlex Haechler: China vs USA social networks
Alex Haechler: China vs USA social networksCarlo Vaccari
 
Carlo Colicchio: Big Data for business
Carlo Colicchio: Big Data for businessCarlo Colicchio: Big Data for business
Carlo Colicchio: Big Data for businessCarlo Vaccari
 
Yves Studer: Big Data in practice
Yves Studer: Big Data in practiceYves Studer: Big Data in practice
Yves Studer: Big Data in practiceCarlo Vaccari
 
Klevis Mino: MongoDB
Klevis Mino: MongoDBKlevis Mino: MongoDB
Klevis Mino: MongoDBCarlo Vaccari
 
Rando Veizi: Data warehouse and Pentaho suite
Rando Veizi: Data warehouse and Pentaho suiteRando Veizi: Data warehouse and Pentaho suite
Rando Veizi: Data warehouse and Pentaho suiteCarlo Vaccari
 
Unkan Erol: Xing vs Linkedin
Unkan Erol: Xing vs LinkedinUnkan Erol: Xing vs Linkedin
Unkan Erol: Xing vs LinkedinCarlo Vaccari
 
Serena Carota: Open Data nella Regione Marche
Serena Carota: Open Data nella Regione MarcheSerena Carota: Open Data nella Regione Marche
Serena Carota: Open Data nella Regione MarcheCarlo Vaccari
 
Introduzione ai Social network
Introduzione ai Social network  Introduzione ai Social network
Introduzione ai Social network Carlo Vaccari
 
Social network ,ricerca di lavoro e ricerca scientifica
Social network ,ricerca di lavoro e ricerca scientificaSocial network ,ricerca di lavoro e ricerca scientifica
Social network ,ricerca di lavoro e ricerca scientificaCarlo Vaccari
 
Social network and job searching and SN for researchers
Social network and job searching and SN for researchersSocial network and job searching and SN for researchers
Social network and job searching and SN for researchersCarlo Vaccari
 
Sharing Advisory Board newsletter #8
Sharing Advisory Board newsletter #8Sharing Advisory Board newsletter #8
Sharing Advisory Board newsletter #8Carlo Vaccari
 
Seminario su Open data - UniCam 18.4.2013
Seminario su Open data - UniCam 18.4.2013Seminario su Open data - UniCam 18.4.2013
Seminario su Open data - UniCam 18.4.2013Carlo Vaccari
 
Turismo e social network
Turismo e social networkTurismo e social network
Turismo e social networkCarlo Vaccari
 
Concetta De Vivo: Open Data Day Marche 2013
Concetta De Vivo: Open Data Day Marche 2013Concetta De Vivo: Open Data Day Marche 2013
Concetta De Vivo: Open Data Day Marche 2013Carlo Vaccari
 

More from Carlo Vaccari (20)

HLG Big Data project and Sandbox
HLG Big Data project and SandboxHLG Big Data project and Sandbox
HLG Big Data project and Sandbox
 
Andrea Talamonti: CKAN a tool for Open Data
Andrea Talamonti: CKAN a tool for Open DataAndrea Talamonti: CKAN a tool for Open Data
Andrea Talamonti: CKAN a tool for Open Data
 
Fabrizio Allegretto: Open Data & University
Fabrizio Allegretto: Open Data & UniversityFabrizio Allegretto: Open Data & University
Fabrizio Allegretto: Open Data & University
 
Yapo Juares Tanguy: RSS environment
Yapo Juares Tanguy: RSS environmentYapo Juares Tanguy: RSS environment
Yapo Juares Tanguy: RSS environment
 
Matteo Marchionne: Foaf e feed reader
Matteo Marchionne: Foaf e feed readerMatteo Marchionne: Foaf e feed reader
Matteo Marchionne: Foaf e feed reader
 
Alex Haechler: China vs USA social networks
Alex Haechler: China vs USA social networksAlex Haechler: China vs USA social networks
Alex Haechler: China vs USA social networks
 
Carlo Colicchio: Big Data for business
Carlo Colicchio: Big Data for businessCarlo Colicchio: Big Data for business
Carlo Colicchio: Big Data for business
 
Yves Studer: Big Data in practice
Yves Studer: Big Data in practiceYves Studer: Big Data in practice
Yves Studer: Big Data in practice
 
Klevis Mino: MongoDB
Klevis Mino: MongoDBKlevis Mino: MongoDB
Klevis Mino: MongoDB
 
Rando Veizi: Data warehouse and Pentaho suite
Rando Veizi: Data warehouse and Pentaho suiteRando Veizi: Data warehouse and Pentaho suite
Rando Veizi: Data warehouse and Pentaho suite
 
Unkan Erol: Xing vs Linkedin
Unkan Erol: Xing vs LinkedinUnkan Erol: Xing vs Linkedin
Unkan Erol: Xing vs Linkedin
 
Serena Carota: Open Data nella Regione Marche
Serena Carota: Open Data nella Regione MarcheSerena Carota: Open Data nella Regione Marche
Serena Carota: Open Data nella Regione Marche
 
Introduzione ai Social network
Introduzione ai Social network  Introduzione ai Social network
Introduzione ai Social network
 
Start up innovative
Start up innovativeStart up innovative
Start up innovative
 
Social network ,ricerca di lavoro e ricerca scientifica
Social network ,ricerca di lavoro e ricerca scientificaSocial network ,ricerca di lavoro e ricerca scientifica
Social network ,ricerca di lavoro e ricerca scientifica
 
Social network and job searching and SN for researchers
Social network and job searching and SN for researchersSocial network and job searching and SN for researchers
Social network and job searching and SN for researchers
 
Sharing Advisory Board newsletter #8
Sharing Advisory Board newsletter #8Sharing Advisory Board newsletter #8
Sharing Advisory Board newsletter #8
 
Seminario su Open data - UniCam 18.4.2013
Seminario su Open data - UniCam 18.4.2013Seminario su Open data - UniCam 18.4.2013
Seminario su Open data - UniCam 18.4.2013
 
Turismo e social network
Turismo e social networkTurismo e social network
Turismo e social network
 
Concetta De Vivo: Open Data Day Marche 2013
Concetta De Vivo: Open Data Day Marche 2013Concetta De Vivo: Open Data Day Marche 2013
Concetta De Vivo: Open Data Day Marche 2013
 

Big data analytics vaccari oct2013

  • 1. Big Data e Statistica Ufficiale: i progetti internazionali Carlo Vaccari UNECE Task Team on Big Data Università di Camerino - Istat http://vaccaricarlo.wordpress.com Big Data Analytics Conference 2013 - C. Vaccari
  • 2. Big Data nella Statistica Ufficiale Sfide dei Big Data alla statistica ufficiale: i Big Data sono accessibili agli Istituti di Statistica (NSI) e a quali condizioni? quali garanzie esistono sulla tutela della riservatezza nell'accesso ed elaborazione dei Big Data? l'accesso ai Big Data spesso ha un costo, magari inferiore rispetto ai dati statistici, ma a volte considerevole qual è l'impatto sull'organizzazione di un NSI quando i Big Data diventano una importante fonte di dati? quale cambiamento di paradigma è necessario nell'IT degli NSI per utilizzare i Big Data? qual è l'impatto dell'uso dei Big Data (in combinazione o in sostituzione di dati statistici) sui metodi statistici consolidati di raccolta dei dati, l'elaborazione e la diffusione? Big Data Analytics Conference 2013 - C. Vaccari
  • 3. Le prime esperienze internazionali Olanda: dati dai sensori del traffico per rilevare i movimenti delle persone Olanda: dati da Twitter per valutare con “sentiment analysis” il clima di fiducia dei consumatori Australia: dati da satellite per stimare la crescita dei raccolti e l'utilizzo del suolo agricolo Slovenia: migliorare le statistiche sulla popolazione e la mobilità utilizzando dati dei cellulari Nuova Zelanda: monitorare i movimenti della popolazione a breve termine durante e dopo un disastro naturale Eurostat: prezzi dal Web per migliorare l'indice dei prezzi (progetto simile a Billion Prices Project, nato dal controllo dei prezzi in Argentina) ... Big Data Analytics Conference 2013 - C. Vaccari
  • 4. L'inflazione argentina calcolata dai Big Data Big Data Analytics Conference 2013 - C. Vaccari
  • 5. le azioni di coordinamento Primo documento dell'High Level Group: What does BigData mean for official statistics? 2013: formazione di un gruppo di lavoro con tre organizzazioni internazionali (UNECE, Eurostat, OECD) e dieci nazioni (Australia, Canada, Italia, Mexico, Nuova Zelanda, Olanda, Polonia, Regno Unito, Slovenia, Turchia) con il compito di individuare le priorità per la cooperazione internazionale e di sviluppare una proposta di progetto per un progetto su Big Data e statistica ufficiale Perché la cooperazione internazionale? Molti fenomeni internazionali per natura (es. traffico web) Molti dati gestiti da operatori multinazionali (eg provider telefonici) Più potere contrattuale (es verso Google o provider) Necessità di comparabilità internazionale (es prezzi) Big Data Analytics Conference 2013 - C. Vaccari
  • 6. il progetto proposto Il progetto, in via di completamento, sarà proposto in novembre all' High Level Group Composto da tre work-package principali: 1 - come rispondere alle sfide: legislativa, privacy, costi, management, metodologia, tecnologia 2 - sviluppare una sandbox, un ambiente condiviso per dimostrare la fattibilità della produzione di statistiche ufficiali partendo da Big Data, con la possibilità di replicare l'approccio in diverse nazioni 3 - facilitare lo scambio di conoscenza, strumenti e metodi per la produzione di statistiche partendo da Big Data, sviluppare un sito di documentazione, demo, video, manuali, organizzare workshop e corsi Big Data Analytics Conference 2013 - C. Vaccari
  • 7. la “sandbox” Un ambiente (sandbox) con qualche applicazione pratica per dimostrare che: si possono manipolare Big Data in modo semplice ed efficiente sulla piattaforma scelta la piattaforma rispetta i vincoli tecnologici e di costo degli NSIs i dati scelti possono garantire output statistici con determinati criteri di qualità i risultati sono comparabili con prodotti statistici standard le nazioni partecipanti possono condividere metodi, tool, dataset e risultati nel quadro della Common Statistical Production Architecture Big Data Analytics Conference 2013 - C. Vaccari
  • 8. “sandbox” ad oggi In via di definizione l'ambiente a vari livelli: cluster e cloud: valutando piattaforme di cluster, ambienti cloud, strumenti che integrano Hadoop e altri ambienti di base strumenti di analisi: analisi statistica, ambienti integrati di visualizzazione avanzata, suite di business intelligence, suite per l'analisi di Big Data, tool di data mining, strumenti di ETL (Extraction Transformation & Loading), generatori di report e di grafici a partire da Big Data, … dataset: dati di test (come il dump di Wikipedia, One million songs,..), acquisti con carte di credito, social network, chiamate da cellulari, transazioni sul web, tracce GPS, … Obiettivo: creare un ambiente di test, ma in seguito generare anche virtual machine pronte all'uso Big Data Analytics Conference 2013 - C. Vaccari