Il progetto MAPPA, conclusosi a fine giugno 2013, ha visto lavorare assieme un team di archeologi, geologi, matematici. La finalità principale del progetto è stata quella di studiare strumenti di calcolo predittivo applicabili al potenziale archeologico di un’area urbana e di creare un prodotto funzionale alla tutela, alla ricerca e alla governance della città e del suo patrimonio sepolto.
La strategia del Progetto si è basata su due capisaldi:
- apertura dei prodotti della ricerca attraverso una politica open access, apertura dei dati della ricerca attraverso la realizzazione del primo archivio open data dell’archeologia italiana;
- realizzazione della carta di potenziale archeologico dell’area urbana di Pisa sviluppata attraverso un modello predittivo, con l’ambizione di diventare un modello replicabile per la tutela del patrimonio sepolto e per la ricerca archeologica.
Per fare Open Data siamo partiti dallo studio legale degli aspetti connessi all’apertura dei dati e dalla necessità di garantire chi produce i dati archeologici: questi derivano sempre e comunque da un’attività di ricerca (essendo dati non replicabili) e quindi ne deve essere rispettata la paternità intellettuale attraverso l’apposizione di DOI e l’uso di licenze appropriate (CC-BY; CC-BY-SA). Per quanto riguarda la carta di potenziale siamo partiti dalla disamina dei principali modelli predittivi conosciuti in letteratura, legati sia alla pianificazione territoriale, sia alla ricerca. I modelli predittivi attualmente si basano su modelli statistici e/o geostatistici. La nostra idea è stata quella di utilizzare un modello predittivo matematico. Un modello statistico evidenzia, infatti, la maggiore o minore probabilità dell’avverarsi di un determinato fenomeno, mentre un modello matematico cerca di ricostruire, formalizzandone le regole di base, le modalità del verificarsi o meno di un certo fenomeno. Nel nostro caso il calcolo del Potenziale archeologico di un’area urbana. Il modello realizzato dal Progetto MAPPA è basato su sull’algoritmo di PageRank adeguatamente modificato fino a trasformarlo nell’algoritmo MAPPA. Tutte le fasi del progetto sono state caratterizzate da una capillare azione di comunicazione sia scientifica, sia sociale. Accanto alla pubblicazione di tutti i prodotti scientifici in modo aperto attraverso politiche open access sia tradizionali, sia interattive, come il webGIS, e alla partecipazione a convegni nazionali e internazionali, è stata fatta una forte comunicazione via web tramite il nostro sito (www.mappaproject.org) e sui social network, promuovendo forme di racconto meno convenzionali come i video di Opening the Past e più tradizionale con la presenza a convegni e incontri non strettamente scientifici. Attualmente, il Laboratorio MAPPA porta avanti e sviluppa le tematiche del progetto indirizzandosi verso l’analisi computazionale automatizzata di grandi quantità di dati, i cosiddetti Big Data, e verso i Linked Open Data.
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
1. @MappaProject: un approccio computazionale
innovativo per l’archeologia italiana #opendata
#matematica
Gabriele Gattiglia
Seminario di Cultura Digitale, Pisa 6 novembre 2013
2. Geologi
Archeologi
Pisa, Italy
Matematici
Carta Predittiva del Potenziale
Archeologico
Carta Archeologica
Carta geomorfologica
Modello matematico
Open digital archaeological archive
Open Data
Collaborazione
Trasparenza
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
2 / 59
4. i beni culturali sono pubblici
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
4 / 59
5. la collettività paga
E deve conoscere i risultati
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
5 / 59
7. Nell’ultimo decennio sono stati prodotti una grande mole di
dati archeologici, spesso in formato digitale, che sono andati
ad aggiungersi alle sterminate documentazioni analogiche di
scavo prodotte negli ultimi 40 anni, spesso al solo scopo di
giacere inutilizzati negli archivi. Assistiamo al paradosso di
possedere potenti strumenti di calcolo informatico, ma pochi
dati da processare, di produrre con costi molto elevati nuovi
dati, per farne un uso limitato nel migliore dei casi a pochi o
pochissimi riutilizzi.
Ricicliamoli!
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
7 / 59
9. @MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
9 / 59
10. Viene utilizzato principalmente per indicare l'accesso libero e
senza restrizione degli articoli pubblicati in riviste accademiche;
inoltre, l'open access copre non soltanto articoli di riviste, ma
anche capitoli di libri e monografie, ed in generale ogni prodotto
della ricerca.
Esistono due strategie principali per garantire pubblicazioni ad
accesso aperto, con numerose sfumature:
• Viene definita «via verde» ("green road") la pratica dell'autoarchiviazione ("self-archiving"), da parte degli autori, di copie
dei loro articoli in archivi istituzionali o disciplinari, o ancora nei
loro siti personali.
• Viene definita «via d'oro» ("gold road") la pubblicazione di
riviste in cui gli articoli sono direttamente ed immediatamente
accessibili ad accesso aperto.
Fonte: http://it.wikipedia.org/wiki/Open_access
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
10 / 59
13. Open….source
web server
scripting
database server
motore webGIS
Fonte: Noti V.: Il webGIS del progetto MAPPA: architettura del sistema e sviluppi futuri
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
13 / 59
15. More info
Anichini F., Gattiglia G.: A qualcuno piace
‘webGIS’: indicazioni pratiche per un utilizzo
archeologico consapevole
Kansa E.: Open access in archaeology
Noti V.: Il webGIS del progetto MAPPA:
architettura del sistema e sviluppi futuri
Video
ll webGIS del progetto MAPPA
15 di 59
16. Secondo la Open Knowledge Foundation (http://it.okfn.org/) «un
contenuto o un dato si definisce aperto se chiunque è in grado di
utilizzarlo, ri-utilizzarlo e ridistribuirlo, soggetto, al massimo, alla
richiesta di attribuzione e condivisione allo stesso modo»
…e in archeologia?
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
16 / 59
17. Qualche dato
Per capirci meglio
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
17 / 59
18. 93%
90%
64%
61%
di chi lavora in archeologia è d’accordo
sulla creazione di un archivio Open Data
archeologico
Ricercatori
83%
Professionisti
78%
Addetti alla tutela
74%
di chi lavora in archeologia
pensa che gli Open Data
rappresentino il futuro della
ricerca archeologica
di chi lavora in archeologia pensa che
siano uno strumento di pianificazione e
tutela per il MiBAC
di chi lavora in archeologia pensa che
siano uno stimolo per migliorare la qualità
dei dati prodotti
Fonte: Sondaggio Mappa http://mappaproject.arch.unipi.it/wp-content/uploads/2011/08/2013_05_31_csv.csv
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
18 / 59
19. Quindi?
Accessibili, Tempestivi, Riutilizzabili
L’archeologia è sempre e comunque un’attività di
ricerca (dal momento che produce dati unici e
irripetibili) e non vi è ricerca finché non vi è
pubblicazione del dato
OPEN
I Dati sono considerati una pubblicazione scientifica
Tutelandone la «Paternità intellettuale»
Tramite
• Attribuzione codice DOI (Digital Object Identifier), un
«ISBN» digitale
• Licenza CC BY
/ CC BY SA
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
19 / 59
22. Quali diritti?
Legge 633/1941
Protezione del diritto d'autore e di altri diritti
connessi al suo esercizio
• Diritto d'autore
• Diritto su banche di dati (art. 102-bis e seg)
• Diritto su semplici fotografie (artt- 87-92)
Fonte: Anichini F., Ciurcina M. Noti V.: MOD (Mappa Archaeological Open Data Archive): new ideas for new minds
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
22 / 59
23. Problemi
• Quando l'opera è creativa?
• Chi è l'autore?
• Chi è titolare dei diritti?
D. Lgs. 42/2004 Codice dei
beni culturali e del paesaggio
• Diritto di riproduzione (artt.
106 e seg.)
Soluzioni
Liberatoria
Autorizzazione
dall'ente preposto
D. Lgs. 196/2003 Codice in
materia di
Richiesta di diffusione
protezione dei dati personali
• Dati relativi a persone fisiche dei dati
identificate o identificabili
(o anonimizzazione)
(nomi e cognomi di persone fisiche,
fotografie e documentazione grafica, di
immobili di persone fisiche)
Fonte: Anichini F., Ciurcina M. Noti V.: MOD (Mappa Archaeological Open Data Archive): new ideas for new minds
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
23 / 59
24. Licenze
Attribuzione
Attribuzione Condividi allo stesso modo
compatibili con diritto di riproduzione art. 106 e
seg. D. Lgs. 42/2004
Fonte: Anichini F., Ciurcina M. Noti V.: MOD (Mappa Archaeological Open Data Archive): new ideas for new minds
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
24 / 59
25. MOD
Nella lista dei repositories consigliati dal Journal of Open
Archaeological Data http://openarchaeologydata.metajnl.com/
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
25 / 59
26. More info
Anichini F., L’analisi dei dati: un’archeologia
senza aggettivi
Anichini F., MAPPA survey. Gli Open Data
nell’archeologia italiana
Anichini F., Ciurcina M., Noti V, Il MOD: l’archivio
Open Data dell’archeologia italiana
Ciurcina M., Parere legale sul portale Mappa
Open Data
MAPPAproject, L’Open Data e l’archeologia
italiana. Risultati del sondaggio on-line 2013
Video
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
26 / 59
27. Modelli predittivi
Cosa sono?
Servono a stimare la
presenza/consistenza dei
depositi archeologici
A cosa servono?
• Pianificazione
• Tutele
• Ricerca
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
27 / 59
29. Alla tutela
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
29 / 59
30. Cost Surface Analysis
Land use evaluation
Map Algebra
Alla ricerca
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
30 / 59
31. Data model
SECONDARY DATA
•Dati derivati
PRIMARY DATA
•Cartografia storica
•Dati archeologici
•Dati urbani
•Dati geografici/
geomorfologici
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
31 / 59
32. Carta del Potenziale
Archeologico
Livello Informativo Archeologico
Interventi
archeologici
Fasi
Relazioni
preliminari
Attività
US
quantificazioni
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
32 / 59
33. •
•
•
•
Il potenziale archeologico di un’area rappresenta la probabilità, più o
meno alta, che vi sia conservata una stratificazione archeologica di
minore o maggiore rilevanza.
Si calcola attraverso l’analisi e lo studio di una serie di dati storicoarcheologici e paleoambientali ricavati da fonti diverse, con un grado di
approssimazione che varia a seconda della quantità e della qualità dei
dati a disposizione e delle loro relazioni spaziali e contestuali.
Il potenziale archeologico di un’area è di per sé un fattore indipendente da
qualsiasi tipo di successivo intervento si vada a realizzare, che deve
essere inteso come fattore di rischio contingente.
La cartografia di potenziale archeologico è un modello predittivo e come
tale è consapevolmente creata come strumento decisionale.
Potenziale archeologico
Parametri
•
•
•
•
•
Tipologia insediativa
Densità insediativa
Pluristratificazione dei depositi
Rimovibilità non rimovibilità del
deposito
Grado di conservazione del
deposito
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
33 / 59
34. Come?
Con un modello matematico
Perché?
I modelli matematici possono essere applicati ad altri centri urbani
generalità
• I modelli matematici sono utili nelle predizioni
• La matematica può avere un impatto sulla pratica archeologica
e sulla pianificazione territoriale
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
34 / 59
35. 1. Real-world
problem
2. Make assumptions
BASIC RULES governing the system
PROBABILITY DISTRIBUTIONS
MATHEMATICAL
MODELS
3. Formulate
the abstract
problem
STATISTICAL
MODELS
7. Report,
explain,
predict
6. Verify
the model
TESTING
4. Solve the
abstract problem
5. Interpret
the
solution
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
35 / 59
36. Formalizzazione
• Ipotesi: se si avesse una conoscenza perfetta del
sottosuolo, allora l’archeologo dovrebbe essere in
grado di assegnare il potenziale in ogni punto
• Un modello matematico è dunque un modo per
stimare il potenziale ogni qualvolta i dati non sono
noti (sempre)
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
36 / 59
37. Principi
Da un punto di vista astratto
• Un punto chiave è l’identificazione delle
relazioni tra ritrovamenti
• Tali relazioni possono essere spaziali o
funzionali
• Queste relazioni possono rafforzare o indebolire
la probabilità della presenza di una struttura più
complessa rafforzano o indeboliscono il
potenziale archeologico di un’area
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
37 / 59
38. Page Rank
• Analogia tra i criteri per attribuire il potenziale
archeologico e quelli per assegnare l’importanza
delle pagine web nei motori di ricerca
• Negli algoritmi page rank le pagine web
- attribuiscono importanza alle pagine web a cui
puntano (mediante un link)
- ricevono importanza dalle pagine web dalle
quali ricevono link
w1 = w2
w2 = 1 / 2 w1 + w3
w = 1 / 2 w
1
3
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
38 / 59
41. Categorizzazione dei
ritrovamenti archeologici
Assegnazione del valore del
potenziale informativo
[*]
Livello sincronico
Dare forma ai ritrovamenti
Relazioni tra i ritrovamenti
archeologici all’interno dello
stesso periodo
[**]
WORKFLOW
Creazione aree funzionali:
• urbana
• suburbana
• agricola
[***]
Creazione delle carte
paleogeografiche
Entrambi influiscono sulla diffusione del potenziale
Livello diacronico
Relazioni tra i ritrovamenti
archeologici di differenti
periodi
[****]
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
41 / 59
42. [*]
Assegnazione del valore del potenziale informativo
Ogni categoria di ritrovamento
archeologico può dare
informazioni su:
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Organizazione del territorio
Attività e tecniche produttive
Tecniche costruttive
Strategie e tecniche militari
Igienico-sanitario
Sistemi idrici
Viabilità/trasporti
Commerci
Coltivazione/allevamento
Alimentazione
Gestione rifiuti
Antropologia
Culto/pratiche funerarie
Aspetti politico-istituzionali
Indicatori sociali e di genere
Tempo libero
Costume
Fauna/flora
Ambiente (geomorologia)
A ciascuno è stato
assegnato un valore
binario.
La somma dei valori dà il
potenziale archeologico di
ogni categoria.
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
42 / 59
43. [**]
Relazioni tra i ritrovamenti archeologici all’interno dello stesso periodo
corte
vicolo
Casa-torre
bottega
strada
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
43 / 59
44. [***]
Creazione delle aree funzionali
Ritrovamenti
archeologici
Partendo dal presupposto che ogni centro urbano,
in ogni periodo, risulti circondato da una zona di
suburbana e, più esternamente, da una zona
agricola, l'algoritmo utilizza le aree funzionali, vale
a dire i suddetti livelli di organizzazione spaziale, e i
loro valori di potenziale assoluto, per diffondere il
potenziale.
L'individuazione delle aree funzionali avviene
sulla base di numerosi elementi, in quanto dipende
dalle tipologie di ritrovamento, dalle relazioni tra
esse e dal contesto ambientale.
Aree funzionali
Per limitare la soggettività, nel definire le aree funzionali è
stata utilizzata una procedura automatica.
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
44 / 59
45. [***]
Creazione delle carte paleogeografiche
I dati geomorfologici, stratigrafici e archeologici sono stati
processati attraverso analisi geostatistiche per ottenere i DEM
storici e per realizzare la mappe paleogeografiche dei 7 periodi
analizzati.
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
45 / 59
46. L’algoritmo MAPPA
Per il funziamento dell’algoritmo ogni DEM di periodo (ca 26 km2) è
stato diviso in un griglia di celle di 10 x 10 m per un totale di
1.850.000 celle complessive
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
46 / 59
47. Il “peso” totale dei links distribuiti da ogni cella
contenente ritrovamenti archeologici varia sulla base
della probabilità stimata della presenza di un
determinato ritrovamento vicino ad un’altro
L’ area di influenza è
proporzionale al valore
dell’area funzionale a cui
appartiene una cella
Il valore dei links è ottenuto
pesando il valore dell’area funzionale
con il dato paleogeografico
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
47 / 59
48. Età contemporanea
Età moderna
Il risultato finale
è stata la
creazione di 7
carte di
potenziale
archeologico:
una per ogni
periodo preso
in
considerazione.
Basso medioevo
Alto medioevo
Periodo romano
Periodo etrusco
Protostoria
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
48 / 59
50. Validazione
Il risultato ottenuto è stato verificato con una
campagna di 14 carotaggi.
Sono stati confrontati il potenziale assoluto dei
carotaggi con il potenziale stimato nella cella.
Il potenziale stimato è risultato:
• corretto in 9 casi su 13 pari al 69,2%;
• l’errore medio - in uno scala di potenziale
compresa tra 1 e 5 - è stato pari a 0.3077
(6,15 %).
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
50 / 59
51. La carta di Potenziale
La carta del potenziale archeologico totale è data
dalla somma pesata delle singole carta di
potenziale di periodo, nella quale i periodi con
minori informazioni acquisiscono maggiore
importanza.
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
51 / 59
52. More info
Anichini F., Dubbini N., Fabiani F., Gattiglia G.,
Gualandi M.L.: MAPPA. Metodologie Applicate
alla Predittività del Potenziale Archeologico
vol.2
Gattiglia G.: MAPPA. Pisa medievale:
archeologia, analisi spaziali e modelli predittivi
Kamermans H. : Predictive Modeling: a view
from the Ivory tower
Video
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
52 / 59
54. @MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
54 / 59
55. ?
…..e il futuro
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
55 / 59
56. Algoritmo MAPPA
1. Il modello sembra lavorare meglio con quei dati che si
concentrano in un’area piuttosto che con dati di tipo
“policentrico”. Questo è dovuto principalmente al modo in
cui vengono definite le aree funzionali. Prevediamo di
implementare l’algoitmo con modelli differenti in modo da
poterlo utilizzare su scala territoriale;
2. È necessario valutare la bontà della stima fornita dal nostro
modello, attraverso un metodo generale che identifichi un
valore minimo per la quantità dei dati e/o di relazioni che
siano rappresentativi e che permetta di decidere quando
l’applicazione del modello sia appropriata;
3. Abbiamo lavorato solo sui dati “positivi”. Per i futuri sviluppi
sarebbe importante avere anche i dati “negativi”, in modo
che partecipino alla stima del potenziale.
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
56 / 59
57. Big Data
Linked Open Data
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
57 / 59
58. Tendenze nel data storage
- digitalization processamento dati attraverso i computer
- usability
disponibilità di dati in luoghi diversi e su
dispositivi diversi
Benché il processo sia più evidente in altri campi, anche in
archeologia queste tendenze incoraggiano la produzione di grandi
quantità di dati e lo sviluppo di archivi open data
Il solo metodo per analizzare grandi quantità di dati digitali (ed
eterogenei) è utilizzare metodi automatici
Qui entra in gioco la matematica: il modo per migliorare le
analisi è passare da avere i dati migliori ad avere il miglior modo
di analizzare I dati.
@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
58 / 59