SlideShare uma empresa Scribd logo
1 de 41
Baixar para ler offline
Data Journalism
seconda giornata
Ovvero Perché Excel è un amico
Marco Montanari
@ingmmo, marco.montanari@gmail.com, sirmmo.blogspot.com



Sviluppatore, Appassionato di giochi, Nerd…




passione per i dati

“I am a journalist looking for coder friends.”




Jens Finnäs (HacksHackers Helsinki 2012)

“I am a coder with journalist friends.”


Marco Montanari 
Struttura della notizia



5W


Who is it about?



What happened?



When did it take place?



Where did it take place?



Why did it happen?
Thought Experiment


Volete scrivere un articolo su un confronto fra due politici basandovi su
alcune affermazioni fatte nel tempo.



Vi servono dati per corroborare la vostra tesi



Raccogliete le posizioni dei politici sulle affermazioni
Dati raccolti


Politico 1: «Certo, i matrimoni omosessuali sono un diritto civile»



Politico 2: «Mai due gay all’altare»



Politico 1: «Ognuno ha diritto di autodeterminazione, nella vita e nella
morte»



Politico 2: «Se Dio avesse voluto che ci uccidessimo, non l’avrebbe reso
peccato capitale»



Politico 1: «Renzi si sta comportando un po’ come Grillo»



Politico 2: «Spero che Renzi sia candidato: rappresenta aria nuova,
finalmente»
Dati raccolti


Politico 1: «Certo, i matrimoni omosessuali sono un diritto civile»



Politico 2: «Mai due gay all’altare»



Politico 1: «Ognuno ha diritto di autodeterminazione, nella vita e nella
morte»



Politico 2: «Se Dio avesse voluto che ci uccidessimo, non l’avrebbe reso
peccato capitale»



Politico 1: «Renzi si sta comportando un po’ come Grillo»



Politico 2: «Spero che Renzi sia candidato: rappresenta aria nuova,
finalmente»
Dati raccolti
Argomento
Matrimoni
omosessuali

Politico 1
Favorevole

Politico 2
Contrario

Eutanasia
Renzi

Contrario
Contrario

Favorevole
Favorevole

Ma le 5W?
Sono diventate tre colonne di argomento specifico!
E ora possiamo vedere le posizioni in modo preciso!
Struttura del dato



5W


Who is it about?



What happened?



When did it take place?



Where did it take place?



Why did it happen?
Dimensioni dei dati


Ogni «W» è una dimensione



Ogni dimensione mette in
correlazione un aspetto



Più aspetti implicano più
sfaccettature della storia

Chi

Dove

Cosa

Fatto

Perché

Quando
Dimensioni dei dati del Thought
Experiment
Matrimoni
omosessuali

Politico
1
Eutanasia

Matrimoni
omosessuali

Politico
2
Renzi

Eutanasia

Renzi
Fonti di dati


I dati possono trovarsi sul web in tanti formati


Tabellari




20%

xml json (shp)

Linked data




xls xlsx csv tsv ods dbf

Strutturati




75%

RDF

5

Altro…


HTML

50%
Fonti di dati


I dati possono trovarsi sul web in tanti formati


Tabellari




20%

xml json (shp)

Linked data




xls xlsx csv tsv ods dbf

Strutturati




75%

RDF

5

Altro…


HTML

50%
Demo
Dove si analizza un dataset
http://dati.istat.it/

http://dati.comune.bologna.it/dati
Excel - Importazione dati csv - 1

Importazione
da file
Excel - Importazione dati csv - 2
Testo delimitato
da virgole e altri
simboli
Excel - Importazione dati csv - 3
In questo caso il
testo è delimitato
da punti e virgola
Excel - Importazione dati csv - 4

ATTENZIONE!!! Alcuni dati
numerici potrebbero essere solo
sequenza di caratteri numerici
(iniziando con 0)

Per concludere
Ma a volte i dati sono sporchi...
OpenRefine


Scaricare da http://openrefine.org



Scompattare archivio



Eseguire la applicazione con il simbolo del diamante
OpenRefine – Pulizia dei dati - 1

Modalità di importazione dei dati:
File locale
Indirizzo web (del file o dei diversi file)
Dati da Google
OpenRefine – Pulizia dei dati - 2

Preview dell’importazione

Intestazione della colonna
Righe “inutili” con intestazioni
o descrizioni dei dati

Modalità di importazione
Non interpretare il contenuto
(codici numerici con “0” iniziali)
Abuso di virgolette (“)
OpenRefine – Pulizia dei dati - 3

Clustering degli elementi affini all’interno della
colonna per omogeneizzare i dati
OpenRefine – Pulizia dei dati - 3
Metodo di riconoscimento dell’affinità
Funzione di ricerca

Per unire i dati: selezionare le fusioni e “merge”
OpenRefine – Pulizia dei dati - 3

Trasformazione manuale dei dati
(per pulire la modalità “italiana” di scrittura dei numeri)
Trasformazioni “standard”
(eliminare spazi iniziali, finali, troppi spazi in mezzo)
OpenRefine – Pulizia dei dati - 3
Operazione di trasformazione
AIUTO!!!! (guida)
Dato originario

Anteprima della trasfromazione

Operazione: value.replace(".","").replace(",",".")
Uso del dato


Dati tabellari






Amati dai
manager

Non ideali per
una «storia»

Nemmeno ai
manager
piacciono i dati
«puri», ma
degli aggregati


Magari in forma
grafica
(Dashboard)
Pivoting


Tabella Pivot


Aggregazioni
semplici



Fattibile con
Excel e/o
Libreoffice
Cubi di dati



Datacube (Big Data?)


Aggregazioni complesse



Strumenti più specializzati (Excel le supporta)
Demo
Dove si prende la tabella e la si analizza attraverso aggregazioni
Pivoting in Excel - 1
Plugin Tabella Pivot
Pivoting in Excel - 2
Dove deve prendere I dati e
dove deve metterli?
Le impostazioni di default
vanno generalmente bene
Pivoting in Excel – Dimensioni - 1
A destra compare il Sistema di
gestione delle dimensioni del
dato
Pivoting in Excel – Dimensioni - 2

Genera

Ma “count”
rappresenta
solo la quantità
di progetti, non
l’ammontare
Pivoting in Excel – Dimensioni - 3

Il menu
accessibile
dalla freccina
consente di
modificare le
impostazioni
del singolo
campo,
portandoci a
selezionare
“somma” in
vece di “conta”
Pivoting in Excel – Dimensioni - 4
Aggiungendo una dimensione
nelle colonne, possiamo
analizzare gli incroci e
vedere le dinamiche

Totali per ogni aggregazione
Esplorazione dei dati con altri strumenti


Raw http://raw.densitydesign.org/



Datawrapper http://datawrapper.de/



Tableau http://www.tableausoftware.com/public/



Google Fusion Tables



Geojson.io
Scraping via browser


https://chrome.google.com/webstore/detail/tablecapture/iebpjdmgckacbodjpijphcplhebcmeop



https://chrome.google.com/webstore/detail/scraper/mbigbapnjcgaff
ohmbkdlecaccepngjd
Scraping via browser

Estrazione di dati tramite Table Capture
Scraping da codice
Si, è complesso, quindi…

… chiamate l’amico sviluppatore!!
That’s all Folks!
GRAZIE!
Per qualsiasi domanda:

@ingmmo
marco.montanari@gmail.com
sirmmo.blogspot.com, …
sirmmo
http://it.linkedin.com/in/montanarim/
https://www.facebook.com/marco.montanari
marco.montanari

Mais conteúdo relacionado

Semelhante a DataJournalism@RCS

Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...
Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...
Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...Dataninja
 
Software open source per l'uso di open data
Software open source per l'uso di open dataSoftware open source per l'uso di open data
Software open source per l'uso di open dataLibreItalia
 
Strumenti open source per il giornalismo: come usare gli open data
 Strumenti open source per il giornalismo: come usare gli open data  Strumenti open source per il giornalismo: come usare gli open data
Strumenti open source per il giornalismo: come usare gli open data Alfredo Parisi
 
Workshop a #ijf15 su open data e software libero
Workshop a #ijf15 su open data e software liberoWorkshop a #ijf15 su open data e software libero
Workshop a #ijf15 su open data e software liberosonia montegiove
 
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014Dataninja
 
Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012INPSDG
 
Il sistema informativo statistico sulla popolazione e le statistiche demograf...
Il sistema informativo statistico sulla popolazione e le statistiche demograf...Il sistema informativo statistico sulla popolazione e le statistiche demograf...
Il sistema informativo statistico sulla popolazione e le statistiche demograf...Vincenzo Patruno
 
Scraping - Corso per L'Avvenire
Scraping - Corso per L'AvvenireScraping - Corso per L'Avvenire
Scraping - Corso per L'AvvenireMarco Montanari
 
Sistemi Informativi Statistici
Sistemi Informativi StatisticiSistemi Informativi Statistici
Sistemi Informativi StatisticiVincenzo Patruno
 
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De FrancisciLa visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De FrancisciIstituto nazionale di statistica
 

Semelhante a DataJournalism@RCS (11)

Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...
Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...
Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...
 
Software open source per l'uso di open data
Software open source per l'uso di open dataSoftware open source per l'uso di open data
Software open source per l'uso di open data
 
Strumenti open source per il giornalismo: come usare gli open data
 Strumenti open source per il giornalismo: come usare gli open data  Strumenti open source per il giornalismo: come usare gli open data
Strumenti open source per il giornalismo: come usare gli open data
 
Workshop a #ijf15 su open data e software libero
Workshop a #ijf15 su open data e software liberoWorkshop a #ijf15 su open data e software libero
Workshop a #ijf15 su open data e software libero
 
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
 
Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012
 
Il sistema informativo statistico sulla popolazione e le statistiche demograf...
Il sistema informativo statistico sulla popolazione e le statistiche demograf...Il sistema informativo statistico sulla popolazione e le statistiche demograf...
Il sistema informativo statistico sulla popolazione e le statistiche demograf...
 
Scraping - Corso per L'Avvenire
Scraping - Corso per L'AvvenireScraping - Corso per L'Avvenire
Scraping - Corso per L'Avvenire
 
3.4 Comprendere i dati: raffinare
3.4 Comprendere i dati: raffinare3.4 Comprendere i dati: raffinare
3.4 Comprendere i dati: raffinare
 
Sistemi Informativi Statistici
Sistemi Informativi StatisticiSistemi Informativi Statistici
Sistemi Informativi Statistici
 
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De FrancisciLa visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
 

Mais de Marco Montanari

OpenStreetMap_LinuxDay2023.pptx
OpenStreetMap_LinuxDay2023.pptxOpenStreetMap_LinuxDay2023.pptx
OpenStreetMap_LinuxDay2023.pptxMarco Montanari
 
Ohm itwikicon tech - english
Ohm itwikicon tech - englishOhm itwikicon tech - english
Ohm itwikicon tech - englishMarco Montanari
 
ITWikiCon 2020 - OpenHistoryMap
ITWikiCon 2020 - OpenHistoryMapITWikiCon 2020 - OpenHistoryMap
ITWikiCon 2020 - OpenHistoryMapMarco Montanari
 
ITWikiCon - Edutainment e Wikipedia
ITWikiCon - Edutainment e WikipediaITWikiCon - Edutainment e Wikipedia
ITWikiCon - Edutainment e WikipediaMarco Montanari
 
MN-MAP Poster for Foss4G2018
MN-MAP Poster for Foss4G2018MN-MAP Poster for Foss4G2018
MN-MAP Poster for Foss4G2018Marco Montanari
 
GEOCONTEXT AND CHCONTEXT GEOGRAPHIC INFORMATION IN CULTURAL HERITAGE
GEOCONTEXT AND CHCONTEXT GEOGRAPHIC INFORMATION IN CULTURAL HERITAGEGEOCONTEXT AND CHCONTEXT GEOGRAPHIC INFORMATION IN CULTURAL HERITAGE
GEOCONTEXT AND CHCONTEXT GEOGRAPHIC INFORMATION IN CULTURAL HERITAGEMarco Montanari
 
Saas rad with django, django rest framework
Saas rad with django, django rest frameworkSaas rad with django, django rest framework
Saas rad with django, django rest frameworkMarco Montanari
 
Intro datajournalism - 14-15/06/2017
Intro datajournalism - 14-15/06/2017Intro datajournalism - 14-15/06/2017
Intro datajournalism - 14-15/06/2017Marco Montanari
 
Open Data e Trasparenza come punto di contatto fra cittadinanza e politica
Open Data e Trasparenza come punto di contatto fra cittadinanza e politicaOpen Data e Trasparenza come punto di contatto fra cittadinanza e politica
Open Data e Trasparenza come punto di contatto fra cittadinanza e politicaMarco Montanari
 

Mais de Marco Montanari (20)

OpenStreetMap_LinuxDay2023.pptx
OpenStreetMap_LinuxDay2023.pptxOpenStreetMap_LinuxDay2023.pptx
OpenStreetMap_LinuxDay2023.pptx
 
Ohm wikimania 2021
Ohm wikimania 2021Ohm wikimania 2021
Ohm wikimania 2021
 
Ohm itwikicon tech - english
Ohm itwikicon tech - englishOhm itwikicon tech - english
Ohm itwikicon tech - english
 
ITWikiCon 2020 - OpenHistoryMap
ITWikiCon 2020 - OpenHistoryMapITWikiCon 2020 - OpenHistoryMap
ITWikiCon 2020 - OpenHistoryMap
 
ITWikiCon - Edutainment e Wikipedia
ITWikiCon - Edutainment e WikipediaITWikiCon - Edutainment e Wikipedia
ITWikiCon - Edutainment e Wikipedia
 
Storia dell'informatica
Storia dell'informaticaStoria dell'informatica
Storia dell'informatica
 
Bononia 1115
Bononia 1115Bononia 1115
Bononia 1115
 
ChContext
ChContextChContext
ChContext
 
MN-MAP Poster for Foss4G2018
MN-MAP Poster for Foss4G2018MN-MAP Poster for Foss4G2018
MN-MAP Poster for Foss4G2018
 
GEOCONTEXT AND CHCONTEXT GEOGRAPHIC INFORMATION IN CULTURAL HERITAGE
GEOCONTEXT AND CHCONTEXT GEOGRAPHIC INFORMATION IN CULTURAL HERITAGEGEOCONTEXT AND CHCONTEXT GEOGRAPHIC INFORMATION IN CULTURAL HERITAGE
GEOCONTEXT AND CHCONTEXT GEOGRAPHIC INFORMATION IN CULTURAL HERITAGE
 
OHM at FOSS4G17
OHM at FOSS4G17OHM at FOSS4G17
OHM at FOSS4G17
 
Mn map poster
Mn map posterMn map poster
Mn map poster
 
Saas rad with django, django rest framework
Saas rad with django, django rest frameworkSaas rad with django, django rest framework
Saas rad with django, django rest framework
 
poster mn-auth
poster mn-authposter mn-auth
poster mn-auth
 
poster holodocker
poster holodockerposter holodocker
poster holodocker
 
Big data, big tourism
Big data, big tourismBig data, big tourism
Big data, big tourism
 
Intro datajournalism - 14-15/06/2017
Intro datajournalism - 14-15/06/2017Intro datajournalism - 14-15/06/2017
Intro datajournalism - 14-15/06/2017
 
OHM at Kainua17
OHM at Kainua17OHM at Kainua17
OHM at Kainua17
 
OHM Workshop
OHM WorkshopOHM Workshop
OHM Workshop
 
Open Data e Trasparenza come punto di contatto fra cittadinanza e politica
Open Data e Trasparenza come punto di contatto fra cittadinanza e politicaOpen Data e Trasparenza come punto di contatto fra cittadinanza e politica
Open Data e Trasparenza come punto di contatto fra cittadinanza e politica
 

Último

Aristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptxAristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptxtecongo2007
 
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxScienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxlorenzodemidio01
 
case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....giorgiadeascaniis59
 
discorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptxdiscorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptxtecongo2007
 
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxNicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxlorenzodemidio01
 
Quadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceoQuadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceoyanmeng831
 
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxLorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxlorenzodemidio01
 
Scrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibileScrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibileNicola Rabbi
 
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxLorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxlorenzodemidio01
 
Lorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxLorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxlorenzodemidio01
 
Tosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptxTosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptxlorenzodemidio01
 
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxLorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxlorenzodemidio01
 
descrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptxdescrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptxtecongo2007
 
LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................giorgiadeascaniis59
 
Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................giorgiadeascaniis59
 
Presentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione CivicaPresentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione CivicaSalvatore Cianciabella
 
Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.camillaorlando17
 
Descrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptxDescrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptxtecongo2007
 

Último (18)

Aristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptxAristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptx
 
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxScienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
 
case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....
 
discorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptxdiscorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptx
 
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxNicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
 
Quadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceoQuadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceo
 
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxLorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
 
Scrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibileScrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibile
 
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxLorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
 
Lorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxLorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptx
 
Tosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptxTosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptx
 
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxLorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
 
descrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptxdescrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptx
 
LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................
 
Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................
 
Presentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione CivicaPresentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione Civica
 
Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.
 
Descrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptxDescrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptx
 

DataJournalism@RCS

  • 1. Data Journalism seconda giornata Ovvero Perché Excel è un amico
  • 2. Marco Montanari @ingmmo, marco.montanari@gmail.com, sirmmo.blogspot.com  Sviluppatore, Appassionato di giochi, Nerd…   passione per i dati “I am a journalist looking for coder friends.”   Jens Finnäs (HacksHackers Helsinki 2012) “I am a coder with journalist friends.”  Marco Montanari 
  • 3. Struttura della notizia  5W  Who is it about?  What happened?  When did it take place?  Where did it take place?  Why did it happen?
  • 4. Thought Experiment  Volete scrivere un articolo su un confronto fra due politici basandovi su alcune affermazioni fatte nel tempo.  Vi servono dati per corroborare la vostra tesi  Raccogliete le posizioni dei politici sulle affermazioni
  • 5. Dati raccolti  Politico 1: «Certo, i matrimoni omosessuali sono un diritto civile»  Politico 2: «Mai due gay all’altare»  Politico 1: «Ognuno ha diritto di autodeterminazione, nella vita e nella morte»  Politico 2: «Se Dio avesse voluto che ci uccidessimo, non l’avrebbe reso peccato capitale»  Politico 1: «Renzi si sta comportando un po’ come Grillo»  Politico 2: «Spero che Renzi sia candidato: rappresenta aria nuova, finalmente»
  • 6. Dati raccolti  Politico 1: «Certo, i matrimoni omosessuali sono un diritto civile»  Politico 2: «Mai due gay all’altare»  Politico 1: «Ognuno ha diritto di autodeterminazione, nella vita e nella morte»  Politico 2: «Se Dio avesse voluto che ci uccidessimo, non l’avrebbe reso peccato capitale»  Politico 1: «Renzi si sta comportando un po’ come Grillo»  Politico 2: «Spero che Renzi sia candidato: rappresenta aria nuova, finalmente»
  • 7. Dati raccolti Argomento Matrimoni omosessuali Politico 1 Favorevole Politico 2 Contrario Eutanasia Renzi Contrario Contrario Favorevole Favorevole Ma le 5W? Sono diventate tre colonne di argomento specifico! E ora possiamo vedere le posizioni in modo preciso!
  • 8. Struttura del dato  5W  Who is it about?  What happened?  When did it take place?  Where did it take place?  Why did it happen?
  • 9. Dimensioni dei dati  Ogni «W» è una dimensione  Ogni dimensione mette in correlazione un aspetto  Più aspetti implicano più sfaccettature della storia Chi Dove Cosa Fatto Perché Quando
  • 10. Dimensioni dei dati del Thought Experiment Matrimoni omosessuali Politico 1 Eutanasia Matrimoni omosessuali Politico 2 Renzi Eutanasia Renzi
  • 11. Fonti di dati  I dati possono trovarsi sul web in tanti formati  Tabellari   20% xml json (shp) Linked data   xls xlsx csv tsv ods dbf Strutturati   75% RDF 5 Altro…  HTML 50%
  • 12. Fonti di dati  I dati possono trovarsi sul web in tanti formati  Tabellari   20% xml json (shp) Linked data   xls xlsx csv tsv ods dbf Strutturati   75% RDF 5 Altro…  HTML 50%
  • 13. Demo Dove si analizza un dataset http://dati.istat.it/ http://dati.comune.bologna.it/dati
  • 14. Excel - Importazione dati csv - 1 Importazione da file
  • 15. Excel - Importazione dati csv - 2 Testo delimitato da virgole e altri simboli
  • 16. Excel - Importazione dati csv - 3 In questo caso il testo è delimitato da punti e virgola
  • 17. Excel - Importazione dati csv - 4 ATTENZIONE!!! Alcuni dati numerici potrebbero essere solo sequenza di caratteri numerici (iniziando con 0) Per concludere
  • 18. Ma a volte i dati sono sporchi...
  • 19. OpenRefine  Scaricare da http://openrefine.org  Scompattare archivio  Eseguire la applicazione con il simbolo del diamante
  • 20. OpenRefine – Pulizia dei dati - 1 Modalità di importazione dei dati: File locale Indirizzo web (del file o dei diversi file) Dati da Google
  • 21. OpenRefine – Pulizia dei dati - 2 Preview dell’importazione Intestazione della colonna Righe “inutili” con intestazioni o descrizioni dei dati Modalità di importazione Non interpretare il contenuto (codici numerici con “0” iniziali) Abuso di virgolette (“)
  • 22. OpenRefine – Pulizia dei dati - 3 Clustering degli elementi affini all’interno della colonna per omogeneizzare i dati
  • 23. OpenRefine – Pulizia dei dati - 3 Metodo di riconoscimento dell’affinità Funzione di ricerca Per unire i dati: selezionare le fusioni e “merge”
  • 24. OpenRefine – Pulizia dei dati - 3 Trasformazione manuale dei dati (per pulire la modalità “italiana” di scrittura dei numeri) Trasformazioni “standard” (eliminare spazi iniziali, finali, troppi spazi in mezzo)
  • 25. OpenRefine – Pulizia dei dati - 3 Operazione di trasformazione AIUTO!!!! (guida) Dato originario Anteprima della trasfromazione Operazione: value.replace(".","").replace(",",".")
  • 26. Uso del dato  Dati tabellari    Amati dai manager Non ideali per una «storia» Nemmeno ai manager piacciono i dati «puri», ma degli aggregati  Magari in forma grafica (Dashboard)
  • 28. Cubi di dati  Datacube (Big Data?)  Aggregazioni complesse  Strumenti più specializzati (Excel le supporta)
  • 29. Demo Dove si prende la tabella e la si analizza attraverso aggregazioni
  • 30. Pivoting in Excel - 1 Plugin Tabella Pivot
  • 31. Pivoting in Excel - 2 Dove deve prendere I dati e dove deve metterli? Le impostazioni di default vanno generalmente bene
  • 32. Pivoting in Excel – Dimensioni - 1 A destra compare il Sistema di gestione delle dimensioni del dato
  • 33. Pivoting in Excel – Dimensioni - 2 Genera Ma “count” rappresenta solo la quantità di progetti, non l’ammontare
  • 34. Pivoting in Excel – Dimensioni - 3 Il menu accessibile dalla freccina consente di modificare le impostazioni del singolo campo, portandoci a selezionare “somma” in vece di “conta”
  • 35. Pivoting in Excel – Dimensioni - 4 Aggiungendo una dimensione nelle colonne, possiamo analizzare gli incroci e vedere le dinamiche Totali per ogni aggregazione
  • 36. Esplorazione dei dati con altri strumenti  Raw http://raw.densitydesign.org/  Datawrapper http://datawrapper.de/  Tableau http://www.tableausoftware.com/public/  Google Fusion Tables  Geojson.io
  • 38. Scraping via browser Estrazione di dati tramite Table Capture
  • 40. Si, è complesso, quindi… … chiamate l’amico sviluppatore!!
  • 41. That’s all Folks! GRAZIE! Per qualsiasi domanda: @ingmmo marco.montanari@gmail.com sirmmo.blogspot.com, … sirmmo http://it.linkedin.com/in/montanarim/ https://www.facebook.com/marco.montanari marco.montanari