SlideShare a Scribd company logo
1 of 192
Download to read offline
Big Data
Avv. Roberto Camilli
“Big Data”


● Tante definizioni
● Un solo concetto semplice
● Grandi quantità di dati strutturati e non strutturati da
  organizzare ed analizzare
● Da qualche gigabyte ai terabyte, ai petabyte fino agli zettabyte e
  yottabyte
Dimensioni dei “Big Data”
Esempi estremi di “Big Data”

● Il sistema di generazione dati della Climate Corporation - migliaia di server
  per rielaborare periodicamente decenni di dati storici e generare 10.000
  possibili scenari relativi al tempo per ogni collocazione geografica e
  grandezza, si traduce in oltre 10 trilioni di dati relativi a possibili scenari (ad
  esempio, un valore atteso di pioggia in un luogo specifico e in un momento
  specifico) che possono essere utilizzati per determinare l’ammontare del
  premio assicurativo e per l’analisi dei rischi, per un totale di oltre 50 terabyte
  di dati presenti nei sistemi di raccolta in un qualsiasi momento.
● La Sloan Digital Sky Survey (SDSS) ha iniziato a raccogliere dati astronomici
  nel 2000 ed è riuscita a raccogliere nelle prime settimane di attività più dati
  di quanti ne siano mai stati raccolti nella storia dell’astronomia. Lavorando
  ad un ritmo di circa 200 GB per notte, SDSS ha accumulato già più di 140
  terabyte di informazioni.
● In totale i quattro rivelatori principali del Large Hadron Collider (LHC) di
  Ginevra hanno prodotto 13 petabyte di dati nel 2010 (13.000 terabyte)
Overview

● Cosa intendiamo per “Big Data”?
● Un’industria in crescita
● Esempi da vendors
● La visione universitaria
● Problematiche legali
● Discussioni
Cosa intendiamo per “Big Data”?

● McKinsey & Company nel suo report di giugno 2011 indica che il
  termine “Big Data” si riferisce a quei database la cui dimensione è al
  di là della capacità di gestione dei normali strumenti software per
  database. Questa definizione è volutamente soggettiva e incorpora
  una definizione in evoluzione di quanto debba essere grande un set di
  dati per poter essere considerato big data ...
● SAS/CEBR report (aprile 2012): “La quantità di dati continua a
  crescere in modo esponenziale, generata da Internet, dai social media,
  dal cloud computing e dai dispositivi mobili, si pone quindi una sfida
  ed un'opportunità per le organizzazioni – come gestire, analizzare ed
  utilizzare la sempre maggiore quantità di dati generati”.
● Big Data è un concetto aperto e la definizione variabile, dipende dalla
  potenza a diposizione ma anche una quantità di dati relativamente
  piccola può creare problemi di gestione
Dove è possibile reperire i “Big Data”?
● Da dove arrivano?
● Dati strutturati e non strutturati
● Quanto costano la gestione e raccolta di questi dati?
● É necessaria una nuova infrastruttura IT?
● Occorre un progetto di analisi e obiettivi da raggiungere
Dati Interni

● Ogni organizzazione produce un grande numero di dati o vi ha
  accesso.
● Questi dati sono molto spesso trascurati, conservati ma non utilizzati
  oppure semplicemente cancellati e persi.
● Dati macchina, e-mail, documenti, processi, sensori, traffico web ecc.
Il mondo digitale

● Il mondo dei dispositivi mobili e dei social network genera un numero
  sempre maggiore di nuovi dati personali e le stesse opinioni degli
  utenti possono fornire indicazioni che prima non erano
  semplicemente disponibili
Cosa si intende per Big Data? – Le tre “V”
●   Volume – il volume dei dati è sempre più grande
●   I dati globali digitali sono arrivati fino a 1.227 exabyte nel 2010 e si prevede di
    raggiungere 7.910 exabyte nel 2015. Secondo una stima, se solo un exabyte di dati fosse
    salvato su DVD sarebbero necessari 13513 Boeing 747 per il trasporto di tutti i DVD
    utilizzati.
●   Velocità – aumento della velocità di creazione, acquisizione e condivisione dei dati
●   A partire dal 2000 fino al 2010, la Sloan Digital Sky Survey ha raccolto 140 terabytes di
    informazioni. Nel 2016, il suo erede sarà in grado di raccogliere lo stesso quantitativo di
    informazioni ogni cinque anni
●   Varietà – proliferazione di tipologie diverse di dati
●   80-85% dei dati a livello globale sono considerati attualmente non strutturati.
●   Ad esempio, lo possono essere i dati relativi al traffico o alla geolocalizzazione tratti da
    telecomunicazioni, blog, RFID e dati derivanti da sensori, gli spostamenti dei veicoli o
    dati relativi alla posizione degli aeromobili, i dati relativi alle condizioni meteo, alle
    transazioni finanziarie, alle statistiche di vendita, analisi delle parole chiave etc.
●   Valore, Visione – non limitiamo il concetto alla terminologia
Cloud Computing




● Il “Cloud computing” permette l’accesso, la riorganizzazione e l’utilizzo del
  “Big Data” fornendo un accesso virtualmente illimitato ed economico a
  risorse hardware e software e ad uno spazio di archiviazione praticamente
  illimitato ed utilizzabile in modo elastico
● Progetti di analisi dei dati possono essere usati separatamente ed
  indipendentemente dal nucleo centrale delle funzioni e dei sistemi aziendali e
  non appesantire i sistemi aziendali
● Opportunità e problemi dell’uso del Cloud, non più silos ma unico database
Cosa può essere fatto con i “Big Data”
● Data Mining e Data Extraction
● Analisi e Visualizzazione dei dati
● Infinite possibilità di raccolta dati e business intelligence
● Identificazione trend, rischi, errori, sprechi
● Monitoraggio in tempo reale
● Dati oggettivi
● Nuove opportunità di business
Alcuni esempi…
● Fashion - percezione del brand - “sentiment” degli utenti – studio dei trend -
  logistica - contraffazione – analisi concorrenti
● Automotive – analisi dati sensori di bordo, manutenzione predittiva,
  assistenza, correzione errori, prevenzioni incidenti, assistenza alla guida,
  logistica prodotti e ricambi, studio garanzie prodotti
● Life Science – studi osservazionali utilizzo farmaci, studio trend
  epidemiologici popolazione, studio parametri esclusione per studi clinici,
  studio necessità popolazione, identificazione frodi
● Retail – Dati utente su consumi e budget di spesa, analisi uso siti ed e-
  commerce, preferenze di acquisto, interazione tramite strumenti portatili
  utenti, personalizzazione esperienza d’acquisto, smart carts, apps e rfid codes
  sui prodotti, suggerimenti e promozioni in tempo reale, strumenti di
  comparazione prezzi, geolocalizzazione
Ulteriori esempi
● Banche – connessione dati operazioni e iniziative retail, studio dei portafogli,
  studio sentiment clienti, servizi valore aggiunto clienti, controllo e
  prevenzione frodi
● Logistica – integrazione con dati retail, consumi e preferenze, dati
  promozioni e interventi in garanzia , ottimizzazione consegna e magazzino,
  logistica real time e consegne nello stesso giorno, dati di spedizione, viaggio,
  consegna in tempo reale
● Advertising e Marketing – studio sentiment social network, modello
  comunicazione mirata al singolo utente, uso di strumenti per analisi
  semantica, linguaggio naturale e studio di cluster informativi
● Assicurazioni – personalizzazione polizze e coperture a secondo del
  comportamento utente, studio storia veicolo, analisi rischi reali bene
  assicurato, individuazione frodi, dati ambientali per calcolo rischio
Problematiche legali

1

● Chi possiede i “Big Data”?
● Creazione e gestione del database
● Direttiva relativa al settore degli Open Data pubblici
● Dati generati dagli utenti
● Dati organizzati e strutturati
● Dati non strutturati
● Dati estratti ed analizzati
● Diritti dei fornitori di strumenti relativi a “Big Data”
Problematiche legali

2


● Tutti diventeremo dei “big brother”?
● Nuova proposta di regolamento UE per il trattamento dei dati personali
  (privacy by design, diritto all’oblio)
● Nuove tipologie di consenso, data portability, trasferimento all’estero
● Come rispettare il diritto di accesso e cancellazione?
● Dati personali persi all’interno dei “Big Data”
● Dati estratti dall’associazione di informazioni
● Data Breach Notification
● Incidente Target (previsione gravidanza)
Problematiche legali

3


● I limiti del copyright
● “Big Data”ed il principio dell’esaurimento
● Eccezioni al diritto d’autore
● Necessità di licenze per analizzare materiale protetto
● L’analisi dei dati può essere considerata utilizzo dei contenuti? Copia?
● Proposte di liberalizzazione per attività e strumenti analitici
● “Big Data” un nuovo strumento contro la pirateria?
● Proteggibilità del database e dei risultati delle analisi
Problematiche legali

4




● Sicurezza e protezione dei dati, necessità di garanzie
● Aspetti Antitrust
● Rapporti con licenze open source
● Uso dei dati in ambito contenzioso
● Aumento delle garanzie e delle responsabilità
● Mercati regolamentati (borsa, finanza, banche, pubblicità, assicurazioni)
Thank you
                                                                                 Avv Roberto Camilli
                                                                                      +39 02 30 35 60 00
                                                                     roberto.camilli@twobirds.com


                                                Bird & Bird is an international legal practice comprising Bird & Bird LLP and its affiliated and associated businesses.

         Bird & Bird LLP is a limited liability partnership, registered in England and Wales with registered number OC340318 and is authorised and regulated by the
Solicitors Regulation Authority. Its registered office and principal place of business is at 15 Fetter Lane, London EC4A 1JP. A list of members of Bird & Bird LLP and
                       of any non-members who are designated as partners, and of their respective professional qualifications, is open to inspection at that address.

                                                                                                                                                        twobirds.com
Bird & Bird & Big Data




Big Data & Small Steps
La risposta è là fuori. Qualcuno trovi una domanda intelligente.

Prof. Carlo Alberto Carnevale Maffè
Bocconi University – SDA Bocconi School of Management
                                                        C.A. Carnevale-Maffè   1
In Hoc Data, Vinces




§ Nate Silver (34 anni) ha previsto correttamente
  49 stati su 50, sia nel 2008 sia nel 2012.
§ Aveva sviluppato “Pecota” (Player Empirical
  Comparison and Optimization Test Algorithm)
  per prevedere le prestazioni dei giocatori di
  baseball.
§ Fa il blogger (“FiveThirtyEight”) sul New York
  Times

                                                    C.A. Carnevale-Maffè   2
La Ricchezza delle Nozioni
 “Se anche parlassi tutte le lingue degli uomini (…) e conoscessi
 tutti i misteri e tutta la scienza (…), sarei come un bronzo che
 risuona o un cembalo che tintinna” (1 Cor. 13,1-2)




1.Big Data, Tiny Understanding
      § Ogni possibile risposta, in attesa di qualche
        plausibile domanda


2.Gli economics degli analytics
      § L’abbondanza dei dati genera una scarsità relativa di
        attenzione umana.


3.Che farne di (questo) management?
     § Ci serve ancora chi oggi viene pagato per fare
       controllo e reporting?




                                                                    C.A. Carnevale-Maffè   3
La vertigine della complessità

§ Aumento dell’ interdipendenza
  sistemica…
§ determinato dalla specializzazione
  deliberata
§ orientata all'aumento di produttività…

Il mito newtoniano del Dato Universale:

§ Asimmetrie informative d'ambiente
§ Asimmetrie interpretative d’impresa.

§ Inoltre…

§ Razionalità limitata
§ Ambiguità causale
§ Policentrismo dei poteri e delle leggi




                                           C.A. Carnevale-Maffè   4
A tale of Builders & Brickmakers
§ “Once upon a time, there were men called scientists. These men were builders who constructed edifices, called
  explanations or laws, by assembling bricks, called facts. When the bricks were sound and were assembled
  properly, the edifice was useful and durable. If the bricks were faulty or if they were assembled badly, the edifice
  would crumble.
§ The brickmakers became obsessed with the making of bricks. When reminded that the ultimate goal was edifices,
  not bricks, they replied that, if enough bricks were available, the builders would be able to select what was
  necessary and still continue to construct edifices.
§ It became difficult to find the proper bricks for a task because one had to hunt among so many. It became difficult
  to find a suitable plot for construction of an edifice because the ground was covered with loose bricks. It became
  difficult to complete a useful edifice because, as soon as the foundations were discernible, they were buried under
  an avalanche of random bricks.
§ And, saddest of all, sometimes no effort was made even to maintain the distinction between a pile of bricks
  and a true edifice”.



  Bernard Forscher,
  “Chaos in the
  Brickyard”, Science
  Magazine, 18 October
  1963




                                                                                                  C.A. Carnevale-Maffè   5
La complessità, semplicemente…


              Specializzazione

     Flows
     Flows
              Evoluzione

              Entropia
     Stocks
     Stocks




              Inorganico           Organico        Socio-economico
              Internet of Things   Life Sciences   The Web




                                                                C.A. Carnevale-Maffè   6
Lo sviluppo urbano, esempio di
specializzazione e interdipendenza

                        piccola casa       metropoli moderna
                        nella prateria
Residenti               5                  5 ml
I/O giornalieri         1-2                1-2 ml
Alimentazione           autonoma           quasi totalmente
                                           dipendente
Energia                 locale             quasi totalmente
                                           dipendente
Delta                quasi zero            alcuni kg/giorno
CO2/individuo/giorno
Delta produttivitá/10   poco piú di zero   30-50%
anni
Interscambio            10-20%             98%
ambientale

                                                      C.A. Carnevale-Maffè   7
Fare sistema o fare mercato?




§ Fare sistema accresce
  l'interdipendenza, ma non
  necessariamente la
  specializzazione e quindi
  non migliora la
  produttività



§ Fare mercato allenta gli
  incastri (loose coupling),
  migliora la flessibilità e la
  propensione
  all’adattamento




                                  C.A. Carnevale-Maffè   8
Gli analytics sono un mercato, non un sistema



§ E’ la somma che fa il totale, ma
  non è la somma che fa il sistema.
§ Il sistema è un insieme di
  equazioni a incognite crescenti



§ La complessità è una fitta pioggia
  di piccoli asteroidi, e l'impresa è il
  mammifero intenzionale,
  l’organismo geneticamente
  automodificato




                                                C.A. Carnevale-Maffè   9
Complessità, maestra di vita

“L'essenza della tirannia è
la negazione della complessità”
Jacob Burkhardt, storico


§ Gestire la complessità vuol dire
  rinunciare a eccessive pretese di:
       § Prevedibilità temporale
       § Visibilità spaziale
       § Creazione del consenso sistemico

§ Investendo invece su:
       § Rapidità decisionale
       § Dislocamento e contestualizzazione
       § Leadership

§ Complessità come humus
  dell'impresa e graticola del dirigismo




                                              C.A. Carnevale-Maffè   10
Predicting the Present (con una sbirciatina al futuro)

§ Udite, udite:

§ La gente compra quel che sta
  cercando

e..

§ La gente non compra quel che non
  sta cercando.

§ Forecasting & “NowCasting”:
§ E’ dimostrato che l’uso di strumenti
  di analisi delle frequenze di ricerca
  consente di interpolare con
  precisione alcuni dati di breve
  periodo (vendite di prodotti,
  destinazioni di viaggi, consumer
  confidence, etc)

§   Fonte: H.Choi & H.Varian, Predicting the Present with Google
    Trends, December 18, 2011.
§   M. Marsella & C. Miani, “Il Mutuo? Si stima con Google”,
    Lavoce.info, 26 agosto 2012                                    C.A. Carnevale-Maffè   11
Gli economics degli analytics

Quando i dati diventano abbondanti, la
scarsità relativa dell’attenzione umana
aumenta
§Economics of deleting
       § Oggi costa piú cancellare che tenere.
         Prima i beni complementari alla non
         cancellazione costavano cari (e.g.,
         l’album delle foto) e la selezione aveva
         senso economico. Ora non più.
§Economics of sharing
       § C’erano più opere d’arte chiuse nelle
         cantine dei musei, di quante ce ne
         fossero visibili al pubblico. Ora non più.
§Economics of calculating
       § Si inseguiva il mito di HAL9000:
         centralizzato, strutturato, onniscente.
         Ora non più.

§Gli effetti di Big Data Analytics su:
        § R&D
        § Working Capital
        § Risk Management

                                                      C.A. Carnevale-Maffè   12
Capitale & Lavoro


§ Gli Analytics, nuova moneta

§ L'elasticitá incrociata tra capitale e lavoro si é
  notevolmente ridotta: il capitale é sempre meno una
  controparte o un sostituto del lavoro e sempre più una
  diversa forma di lavoro.
       § L'I.P. é uno stock di lavoro che diventa
          convertibile in capitale
       § Gran parte della capitalizzazione di borsa delle
          imprese è rappresentato da asset intangibili, in
          ultima analisi basati sull’accumulazione di un
          surplus di lavoro

§ Se capitale e lavoro restano due categorie
  aristoteliche inconciliabili, due entitá
  economiche e sociali separate, allora
  rimaniamo prigionieri di concetti come quello di
  classe, sia essa dirigente o operaia, e siamo
  condannati a perpetuare relazioni di tipo
  sindacale, giochi a somma zero nel processo di
  rappresentanza degli interessi.



                                                             C.A. Carnevale-Maffè   13
“First, Let’s Fire all the Managers”

§ Management is the least efficient
  activity in your organization (Gary
  Hamel, HBR, 2011).



§ Il management è una soluzione
  gerarchica e labour-intensive al
  problema della gestione della
  complessità, della hidden action e
  della hidden information.

§ La supervisione e la reportistica
  cessano di essere compiti a valore
  aggiunto.
§ Rimangono tali la leadership e
  l’imprenditorialità, ma che sono un
  tema di uomini e non di tecnologie.




                                        C.A. Carnevale-Maffè   14
Grazie e buon lavoro!

       Prof. CarloAlberto Carnevale-Maffè
Scuola di Direzione Aziendale – Università Bocconi
   Email: carloalberto.carnevale@sdabocconi.it




                                                     C.A. Carnevale-Maffè   15
Bird & Bird & Big Data




Nuvole Nere sull’Oceano Blu
“La verità, vi prego, sul Cloud Computing”


Prof. Carlo Alberto Carnevale-Maffè
                                             C.A. Carnevale-Maffè – SDA Bocconi    1
Bocconi University – School of Management               Copyright SDA Bocconi 2013
Cloud: un’Istituzione Economica,
non solo un’infrastruttura tecnologica

• Il cloud è un’istituzione
  economica, non solo
  un’infrastruttura tecnologica.
• E’ laboratorio di innovazione
  organizzativa, crocevia di
  scambi informativi, piattaforma
  di relazioni di business.
• In questo senso la nuvola dei
  processi di business è la nuova
  Unità Economica d’Italia.

                                                                2
                                    C.A. Carnevale-Maffè – SDA Bocconi   2
La nuvola non è un taxi.
              E’ uno hub
• La nuvola non è un
  offerta speciale per
  rottamare i server.
• La nuvola non è un
  hosting del nostro
  disordine applicativo, un
  monte dei pegni delle
  nostra bigiotteria
  informatica.
• La nuvola è uno hub di
  processi economici
  interoperabili.
                              C.A. Carnevale-Maffè – SDA Bocconi   3
La nuvola è meglio di Internet

• Perché è standard ma
  non è la giungla
  dell’anonimato.
• Perché è interoperabile
  ma anche difendibile
  dagli intrusi.
• Perché ha un servizio
  garantito e non è best
  effort, tipo “attendere
  prego”.
                            C.A. Carnevale-Maffè – SDA Bocconi   4
Il Cloud è la FED del computing
          (non la BCE…)
Le banche sono il cloud dei soldi.
•Nessuno pensa che sia più razionale tenerli
nella propria cassaforte, invece di depositarli
in un istituto di credito.
•E non è solo sicurezza, è il principio del
rendimento della “moneta-dato”

•Come le Banche sono il cloud dei Soldi, il
Cloud, come una brava Banca Centrale, è il
“prestatore di ultima istanza” di risorse
computazionali e garantisce la liquidità e la
libera circolazione dei dati. (Basta non
metterlo a Cipro…)



                                                  C.A. Carnevale-Maffè – SDA Bocconi   5
La nuvola, Banca d’Italia dei Dati

• Le banche sono il cloud dei
  soldi.
• Nessuno pensa che sia più
  razionale tenerli nella propria
  cassaforte, invece di depositarli
  in un istituto di credito.
• E non è solo sicurezza, è il
  principio del rendimento della
  “moneta-dato”
• Il cloud, come la Banca
  Centrale, garantisce la
  circolarità e la liquidità dei dati


                                        C.A. Carnevale-Maffè – SDA Bocconi   6
Va’ dove ti porta il cielo…
                                            1.   L’Era dei Messaggi, l’Età
                                                 delle Istanze. Il Cloud come
                                                 distruzione creativa dei sistemi
                                                 legacy.

                                            2.   Tesoro, mi si sono ristretti i
                                                 processi. Il workflow si
                                                 frammenta e si contamina.

                                            3.   Uno vale Uno, Nessuno,
                                                 Centomila. Cambia l’osmosi
                                                 organizzativa: il “Noi” e il
“E' pungente a toccarlo, come un pruno,          “Loro” convivono sotto lo
o lieve come morbido piumino?                    stesso cirro.
E' tagliente o ben liscio lungo gli orli?
La verità, vi prego, sull’Amore.”


                                                             C.A. Carnevale-Maffè – SDA Bocconi   7
Contro le Migrazioni
    La distruzione creativa dei processi legacy
•   Un progetto cloud è un volo in
    mongolfiera. Ci si solleva da terra
    per asportazione di pesi.

•   Non si vola tra le nuvole con la
    zavorra della legacy.

•   Cogliete l’occasione per spaccare
    tutto, per buttare tutto, per rifare
    tutto. Vabbé, almeno qualcosa.

•   Il problema non è mettere SAP
    sul cloud. É metterci il business.



                                           C.A. Carnevale-Maffè – SDA Bocconi   8
Microeconomia dei Cloud Services
                 OGGI…                                                 … DOMANI
Price                     S1: Traditional               Price
                          Application Silos
                                                                      D3                          S3: Cloud
 P1                                                                                               Apps +
                                          D1                                                      Data+Service
                                                                                                  s
-
          C1 = P1 x V1                S2: Cloud Applications

 P2                                                D2
          C2 = P2 x V2                                                      C3M2
        Volume           V1      +            V2                  Volume


      Growing supply of applications,                           The size of the market will have
       lower variable costs and lower                                   to grow through
        barriers to entry and access,                                “complementarities”
      increase volumes but drastically                          (with data, services, and value-
                                                                  added business processes)
          reduce average prices…

        Il Cloud è deflatore economico della bolla dei silos applicativi
                                                                           C.A. Carnevale-Maffè – SDA Bocconi    9
Il Cloud è Generale
                        (“La guerra è finita”)
Il nemico è scappato, è vinto, è battuto

•Il Cloud è già mainstream, un po’ come l’ecologia e la pace
nel mondo, le energie rinnovabili e la spending review.
•Non essere più minoranza va metabolizzato dai digitali non
nativi, quelli che vanno in giro con almeno 2 o 3 pennette
USB nella borsa.
•Quelli nativi, come i pesci, non sanno che cos’è l’Acqua del
Cloud.
•Dietro la collina non c'è più nessuno, al massimo una smart
city, un’agenda digitale già un po’ sgualcita.


Queste cinque stelle

•Con il Cloud, Internet non è più trastullo di tardoadolescenti
garruli, ma diventa movimento & istituzione, organizzazione
di lotta e di governo. Prendi un Liquid Feedback, e ci fai una
pietra d’inciampo nazionale.

                                                                  C.A. Carnevale-Maffè – SDA Bocconi   10
Il dato è come un professore in politica:
“sale” sulla nuvola. E poi non scende più

• Il Cloud è forza gravitazionale
  irresistibile, sifone di dati, black
  hole di processi, polo magnetico
  delle interazioni.

• Il Cloud è sistema simbolico di
  segnalazione, come lo sono le
  nuvole nel cielo. Unico segnale
  evidente all’occhio umano della
  dinamica dei fluidi nella rotazione
  terrestre.

• Il Cloud scatena fenomeni
  organizzativi di collaborazione, è il
  luogo della sharing economy. Che
  non è buonismo, ma efficienza.
                                          C.A. Carnevale-Maffè – SDA Bocconi   11
Il Cloud e il ciclo del processo

•   Cloud come luogo di ibridazione
    informativa dei processi.

•   Come l’acqua, il processo evapora per
    finire sulla nuvola.

•   E come l’acqua purificata
    dall’evaporazione poi si contamina
    con l’atmosfera, così il processo
    contaminato dall’interoperabilità
    ricade sulla terra.

•   A volte come pioggerellina, a volte
    come grandine.


                                            C.A. Carnevale-Maffè – SDA Bocconi   12
Uno vale Uno,
                    Nessuno, Centomila.
•   Il Cloud è la base di un modello organizzativo
    che ridefinisce le identità professionali. Sulla
    nuvola, siamo tutti Vitangelo Moscarda.

•   Mobilità, telelavoro simmetrico (non c’è più differenza di
    profondità, né asimmetria informativa determinata dal luogo
    di accesso)

•   Private/personal: il cloud è invasivo ed evasivo (nel senso
    di evasione…)

•   Company/channels: Il cloud è sistema operativo di filiera,
    non d’azienda

•   Come l’ERP ha superato le applicazioni dipartimentali, così
    il cloud supererà quelle aziendali.
                                                                  C.A. Carnevale-Maffè – SDA Bocconi   13
E smettete di mandarmi le e-mail.
• “Ti ho mandato una email” is the
  new “Peppa Tencia”.

• La PEC è la continuazione del FAX
  con altri mezzi tecnologici. Una specie
  di dichiarazione di guerra, consegnata
  ufficialmente dagli ambasciatori.

       •   Segnalatemi le istanze, sono stufo
           di fare download.

       •   Fatemi notificare un alert dal
           daemon di Facebook.

       •   Taggatemi su un contenuto
           rilevante, fate un retweet, mettete
           un hashtag.

• Ma volete imparare ad usarli per
  lavorare, ‘sti Social Network?
                                                 C.A. Carnevale-Maffè – SDA Bocconi   14
Perché Mobile & Cloud cambiano i
         processi economici?
A. It’s Yours: Authentication
   & Billing & App based
   (not just browser-based)

B. It’s Your (Share of) Life
   (personale e professionale)

C. It’s (Native) Social
   (rete di Persone, non solo
   rete di Pagine)



                                 C.A. Carnevale-Maffè – SDA Bocconi   15
Marx & il capitale sulle nuvole

           • I mezzi di produzione
             digitali appartengono al
             popolo (ne avete in tasca
             almeno uno a testa).

           • Lavoratori di tutto il
             mondo, unite i vostri dati
             (tanto il remote storage
             su FaceBook o YouTube è
             gratuito).
                         C.A. Carnevale-Maffè – SDA Bocconi   16
Uno spettro si aggira per il data-center

• Fine del monopolio delle
  imprese su:

   –   Produzione
   –   Presidio
   –   Accesso
   –   Distribuzione

dei dati digitali

                             C.A. Carnevale-Maffè – SDA Bocconi   17
La fine del monopolio sul valore aggiunto
            L’evoluzione delle “asimmetrie organizzative”
2000-2011
    •Arriva la “Rete delle Pagine”: impatto sulle “asimmetrie informative”
    •Nuove forme di disintermediazione e ri-intermediazione
    Ma:
    •Immutata struttura di mercato tra domanda e offerta




                                                                                          ?
2012-2020
    •Arriva la “Rete delle Persone”: Impatto sulle “asimmetrie organizzative”
    •Nuove forme di collaborazione/competizione tra domanda e offerta
    E:
    •Modifica della struttura di mercato, fine del monopolio aziendale sulla catena del valore
    aggiunto.


                                                                     C.A. Carnevale-Maffè – SDA Bocconi   18
Il contenuto diventa “bastardo”

•   Perduta la sua integrità originale,
    nell’attraversare le Nuvole, il
    contenuto diventa infinitamente ri-
    editabile e re-intermediabile.
    Chiunque lo guardi e lo tocchi, lo
    modifica economicamente.

•   Il paradosso dei Big Data e la
    sindrome degli Highlights: sempre
    meno utenti sono interessati al
    contenuto originale e integrale, o al
    dato puntuale e disaggregato,
    sempre più si accontentano di una
    sintesi veloce e contestualizzata (e
    possibilmente gratuita).


                                            C.A. Carnevale-Maffè – SDA Bocconi   19
Occhio che sul Cloud il cliente
       mette le mani. Anzi, le dita.



§Il Pollice
§L’Indice
§Il Medio




§(L’Anulare…)
                                C.A. Carnevale-Maffè – SDA Bocconi   20
Totò & il Dato-Malafemmina
           • “Nojo..vol-au-vent..savoir…”

              – Archetipo di interrogazione in
                linguaggio naturale, sintassi
                anticipatoria del web semantico


           • L’informazione, si sa, è ’na
             malafemmina, a cui l’IT Manager
             canta sconsolato:

              – “Te voglio bene e t'odio,
                nun te pozzo scurdà...”


                                C.A. Carnevale-Maffè – SDA Bocconi   21
Liberté, égalité, fraternité…
                    • “Tutti i dati
                      digitali sono
                      liberi, uguali e
                      interdipendenti”




                        C.A. Carnevale-Maffè – SDA Bocconi   22
Tutti i dati sono liberi?

            • Siamo davvero
              convinti di riuscire a
              tenerli chiusi nel
              perimetro aziendale?

            • Per quanto tempo
              riusciremo ad
              invocarne la proprietà
              intellettuale?

                        C.A. Carnevale-Maffè – SDA Bocconi   23
Tutti i dati sono interdipendenti?

La missione di Google:

“Organize
the world's
information
and make it
universally
accessible
and useful”

                         C.A. Carnevale-Maffè – SDA Bocconi   24
Vito Catozzo’s Way

• Driver di gestione dei
  dati digitali secondo
  IDC:

   – Security
   – Compliance
   – Preservation



                           C.A. Carnevale-Maffè – SDA Bocconi   25
Il nuovo centro?
                      E’ in periferia

– La produzione e l'accesso a documenti
  multimediali cresce proporzionalmente di
  più ai confini dell’impresa, non al centro
– Il document management infra-
  organizzativo è efficiente, ma non
  intercetta la nuova complessità “ai bordi”
  dell’impresa
– I social media sono il luogo di produzione
  e di accesso documentale più dinamico e
  dove i volumi e la complessita di formati
  crescono esponenzialmente.
– I documenti crescono al centro come
  conseguenza di quello che succede ai
  bordi.
                                               C.A. Carnevale-Maffè – SDA Bocconi   26
XaaS?

Ad unificare i
processi di filiera e di           DaaS
territorio, tra imprese
e PA, tra cittadini e
organizzazioni, serve
un nuovo strato
condiviso.

Il DaaS dev’essere
ibrido, sia pubblico
sia privato, sia aperto
sia ad accesso
condizionato


                                     C.A. Carnevale-Maffè – SDA Bocconi   27
Clouds & Weather Forecasts…
•   Il nuovo mercato del Cloud è “interstiziale”

•   La sfida è nelle opzioni di interoperabilità
    dei processi esistenti, non nella migrazione di
    servizi tradizionali dai server aziendali al
    Cloud.

•   La migrazione, in quanto tale, è un “gioco a
    somma negativa”, perché viene effettuata a
    un costo medio minore.

•   Ma il business sarà sempre “on site”: il Cloud
    è essenzialmente una nuova opportunità di
    attivare “connecting links” tra processi
    economici.

                                                      C.A. Carnevale-Maffè – SDA Bocconi   28
Il Cloud, un'arte che si fa
                "per via di levare"
1. Mercato Pubblico: “Carving out” e
   ridefinizione dei processi istituzionali del
   Paese, oggi (mal)gestiti direttamente dalla PA

2. Mercato Privato: Creazione di una
   “domanda ICT forzosa” tramite processi delle
   filiere sistemiche localizzate (e.g., tourism,
   food, logistics)

3. Mercato del lavoro : avvio di modelli di
   “Crowdsourcing” strutturale per l’aumento
   della partecipazione al lavoro giovanile e
   femminile



                                                    C.A. Carnevale-Maffè – SDA Bocconi   29
Il valore ai tempi del colera (digitale)

                                                     Diritti, standard, linguaggi
                                                     specialistici e nazionali, asset
                                                     complementari, esperienza,
                                                     comportamento associato, etc.




                         SINTASSI
• Valore = f (           LATENZA
                                                 )

       Frequenza, sincronicità verticale e
       orizzontale, sequenzialità, serialità,
       allertamento, interstizialità, set-up e
       storage, etc.

                                                            C.A. Carnevale-Maffè – SDA Bocconi   30
L’Advertising? Beyond the Line

                               Circolo Virtuoso


Valore
Cliente




          Attention     Intention   Conversion     Relation             Totale



      Advertising Intenzione di     Transazione   Servizi Post
                    acquisto                      Experience
                                                       C.A. Carnevale-Maffè – SDA Bocconi   31
Advertising: il valore del tempo e dell’incertezza



                  OGGI              DOMANI

Attention         Future/Stimato    Spot/Puntuale

Intention         (Future)/Attesa   Spot/Puntuale

Conversion        N.A.              Spot/Puntuale

Relation          Opportunistica    Strutturale




                                            C.A. Carnevale-Maffè – SDA Bocconi   32
Internet: lo Hub di un “Mercato Multilaterale”

4   Mercato della comunicazione                                                      4     Mercato Human
    tra aziende e consumatori:                   Content                                   Attention: offerta
    media company fornitrici di                 Providers                                  sussidiata e/o a
    servizi pubblicitari/ marketing                                                        pagamento all’utente
    alle aziende                                                                           finale di contenuti e
                                                                                           servizi



        Communication                                           Content Platform
          Platform                                                    (M1)
            (M2)
                                                Hub


         Merchants &                                                             People &
          Institutions                                                          Communities
                          Relation & Commerce Platform
                                      (M3)
                               4 Mercato degli scambi di beni e servizi tra aziende e
                                 consumatori: media company quali intermediari
                                 fra aziende e consumatori nella compravendita di
                                 beni e servizi
                                                                               C.A. Carnevale-Maffè – SDA Bocconi   33
34
        Quale contributo del Cloud
           al “sistema Paese”?
• Modernizzazione, abbattimento
  delle barriere fisiche, esternalità
  positive di linguaggio:

   ¿ Dopo Dante, Manzoni, Mike
     Buongiorno, ….

   ¿ La sintassi dell’ICT per la nuova
     sfida alla costruzione della
     “nazione economica”



   O si fa l’Italia (sul Cloud), o si muore
                                         C.A. Carnevale-Maffè – SDA Bocconi   34
Grazie!

        Prof. Carlo Alberto Carnevale-Maffè

             Strategic Managament Dept.
Bocconi University- SDA Bocconi School of Management
               Twitter: @carloalberto
        Facebook.com/Carloalberto.Carnevale


                                              C.A. Carnevale-Maffè – SDA Bocconi   35
Cloud Computing Summit



                  L’Italia vista dalla Nuvola
                             Relazione di:
                 Prof. Carlo Alberto Carnevale Maffè
          Scuola di Direzione Aziendale – Università Bocconi



La nuvola è un’istituzione economica, non solo un’infrastruttura
tecnologica.
E’ laboratorio di innovazione organizzativa, crocevia di scambi
informativi, piattaforma di relazioni di business.
In questo senso la nuvola è la nuova Unità Economica d’Italia.

Tra i cirri del credit crunch e i cumulonembi della recessione, la
nuvola di tecnologia all’orizzonte è quindi gravida di novità per le
imprese e per il Paese. Le piccole e medie aziende guardano tuttora
le innegabili opportunità del cloud con un certo scetticismo, per il
timore di vedersi sottratto il controllo dei propri dati o di non poter
più disporre di un interlocutore che si prenda la responsabilità del
servizio. Si sbagliano. Vediamo perché, in tre semplici passaggi. 1) Il
cloud è il modo più sicuro e flessibile per gestire l’ICT nelle piccole e
medie imprese. Non solo fa risparmiare, ma contribuisce a crescere.
2) Il mondo delle software house e dei systems integrator che oggi
affianca le PMI, lungi dallo scomparire, vede schiudersi un nuovo
mercato di integrazione dei processi, oltre il presidio dei tradizionali
sistemi IT interni all’azienda. 3) Una volta sul cloud, le PMI vi
ritroveranno anche le grandi imprese e la PA, colmando il
tradizionale gap infrastrutturale, con applicazioni e informazioni alle
quali oggi non hanno accesso.

La nuvola non è un offerta speciale per rottamare i server. La nuvola
non è un hosting del nostro disordine applicativo, un monte dei pegni
delle nostra bigiotteria informatica. La nuvola è uno hub di processi
economici interoperabili.
L’esempio di Google è lampante. Le foto pubblicate su Picasa dagli
utenti sono sì sulla nuvola, ma tramite la geolocalizzazione possono
essere viste anche da google maps e street view. Stessa cosa succede
per i giudizi degli utenti sui locali pubblici, che non sono chiusi
dentro al silos applicativo verticale, ma condivisi.
Le piattaforme di accesso autenticato tramite FB, Twitter o G+ sono
un altro esempio di come la nuvola consenta l’interoperabilità tra
processi e l’ottenimento di grandi effetti di esternalità positiva.

Comunque, sia, la nuvola è troppo importante per lasciarla agli
ingegneri.

La nuvola è meglio di internet. Perché è standard ma non è la giungla
dell’anonimato. Perché è interoperabile ma anche difendibile dagli
intrusi. Perché ha un servizio garantito e non è best effort, tipo
“attendere prego”.


Dunque, sopra alle nuvole, il sole? Sì, ma a certe condizioni.
Per prima cosa sgombriamo il campo dalle diffuse ma infondate
obiezioni sulla sicurezza dei dati. Il cloud è il modo più affidabile e
sicuro per conservare e rendere disponibili in ogni momento dati e
applicazioni cruciali per le imprese.
Le statistiche parlano chiaro: il livello di ridondanza architetturale e
di disponibilità reale che offrono i servizi cloud professionali sono
nettamente superiori a quelli accessibili a una piccola e media
impresa che tiene tutto sul proprio server nello scantinato. Basti una
semplice metafora: le banche sono il cloud dei soldi. Nessuna azienda
pensa che sia più razionale tenerli nella propria cassaforte e rischiare
scassi e furti, invece di depositarli nei forzieri di un istituto di credito.
Oltre alla maggiore affidabilità l’altro fattore determinante è la
flessibilità e l’economicità d’esercizio. I servizi cloud propongono un
percorso ineludibile nell’evoluzione dell’ICT dal ruolo di pura
infrastruttura tecnologica a funzione flessibile di servizio nel
supportare l’azienda nei repentini cambiamenti e nelle diverse fasi
del ciclo economico. Funzionano con un modello di costi su base
flessibile, consentendo alle piccole e medie aziende di affrancarsi
dall’onere di investimenti al buio. Se a questo si aggiungono la
rapidità di implementazione e la flessibilità, non è difficile
comprendere come la nuvola meriti il serio interesse dei responsabili
IT e degli imprenditori di aziende di ogni settore e dimensione, che
vedono in questo modello una valida alternativa per trasformare
costi fissi in più maneggevoli costi variabili d’esercizio.
Per quanto riguarda l’offerta dei servizi da parte dei systems
integrator, va smentita l’idea che il cloud ne cancelli il ruolo. Al
contrario, nei Paesi dove il cloud ha già preso piede, si è registrata
una crescita di nuove imprese dell’ecosistema ICT. Certamente, alle
tradizionali software house la nuvola richiede un’evoluzione dei
modelli di relazione e di proposizione nei confronti dei propri clienti,
nonché un importante sforzo di educazione relativo agli ambiti di
applicazione e alle modalità di valutazione della tecnologia erogata in
forma di servizio. Invece che sui tradizionali sistemi IT, i
professionisti che affiancano le imprese dovranno focalizzarsi
sull’integrazione di processi di business e di nuovi devices, aprendosi
al grande scenario della cosiddetta “Internet of Things”, dove
l’informatica non mette più in rete solo posti di lavoro, ma ogni
elemento fisico di un’organizzazione.

Ma l’infrastruttura che serve per far migrare le piccole medie
imprese sul cloud richiede uno sforzo congiunto degli operatori,
della Pubblica amministrazione e di tutto il Sistema Paese. In altre
parole: c’è banda e banda. Un conto è la banda larga per le famiglie, e
un altro quella per le imprese. La banda che serve per il cloud
professionale deve essere non solo larga, ma stabile, garantita,
disponibile e sicura. Il cloud a cosiddetto “best effort”, che non
garantisce alcun livello di servizio, va bene al più per i ragazzotti
garruli e per le start-up squattrinate. Alle PMI serve un cloud
garantito “end-to-end” che connetta affidabilmente i luoghi di lavoro
ai data center. Vale ancora l’esempio della banca: se le affidate i
gioielli di famiglia, non reagireste bene se vi rispondesse: tornate tra
qualche giorno, oggi abbiamo un problema.

Per far ripartire il motore ingolfato dell'economia italiana serve
dunque aria nuova, d'alta quota, oltre le nebbie della crisi, seguendo i
venti dell'innovazione. L’imprenditore che vuole crescere, oggi, ha la
testa sulla Nuvola e i piedi ben piantati in terra.

I servizi cloud non sono solo un vantaggio economico per la singola
impresa o istituzione pubblica, ma consentono di unire tra loro
aziende e PA, di collegare processi ora frammentati e incompatibili,
di scambiare dati aperti, gli Open Data, in linea con le direttive
europee e l'Agenda Digitale Italiana. Sulla nuvola tecnologica dei
servizi cloud, l'Italia dell'innovazione si può ritrovare più unita, senza
tuttavia doversi uniformare a un unico modello, anzi conservando
tutte le sue specificità, ma guadagnando in immediatezza e
interoperabilità. Con la nuvola, le imprese e la PA hanno accesso ai
migliori servizi disponibili al mondo, ma alla giusta dimensione,
pensati per crescere con loro. E insieme, più uniti, far tornare a
crescere il Paese.
Overview della
 proposta IBM
   22.marzo.2013



Carlo Patrini
Information Architect
carlo.patrini@it.ibm.com
+393357248561

                           © 2013 IBM Corporation
Abbiamo bisogno di acquisire maggiore conoscenza




Le esigenze di acquisire maggior conoscenza
(insights) sono sempre più necessarie ed urgenti




                                                               2
                                             © 2013 IBM Corporation
Rispondere a domande.. sempre nuove, sempre urgenti
 e sempre… strategiche
                                                  Qual è stata l’ efficacia    Come potremmo sfruttare al
                Vorrei scoprire nuovi             della campagna C123 ?          meglio i dati storici per
                segmenti cliente….                                              capire in anticipo le azioni
                                                                                  dei nostri compratori ?
       Quali prodotti si
     vendono meglio oggi
          in Italia?


                                                                         Cosa dicono le persone del nostro
                                                                                 nuovo prodotto ?

   il 91% dei clienti insoddisfatti si
       rivolgerà ad altri fornitori                                           Cosa dice la gente al
                                                                                 nostro servizio
  Come migliorare la ns customer                                                  Call center ?
           retention ?



lIntegrare il Business con la Tecnologia
lUtilizzare dati storici e di sintesi – strutturati e non
lTrarre il massimo profitto dall'analisi delle informazioni estratte da tutte le fonti disponibili

                                                                                                               3
                                                                                                 2012 IBM Corporation
Il Data Warehouse e la Business Analytics
                       sono un’ottima risposta
   …sempre sollecitata dal mercato che chiede..

     • Volumi più elevati
     • Più elevata qualità dei dati
     • Maggior controllo sul processo
                                                          Reporting
     •e soprattutto maggior SEMPLICITA                          Analysis
     AUTONOMIA e PERFORMANCE                                     Predictive Analytics
                         •…….



Master Data
Management                                              Cubi


  Fonti                                       Data
 dati da                                    Warehouse
 sistemi                         ETL
gestionali                       Data
                             Integration
                            Data Quality
                            Data Delivery
                                                                                         4
                                                                           2012 IBM Corporation
DWH più snelli, veloci e reattivi …
l’appliance DWH è la soluzione




Il DWH è fondamentale
però a volte è lento e troppo          Mumble
ingessato e non evolve
con i tempi del business ..           mumble….
la soluzione è
IBM Netezza

                                                               5
                                             © 2013 IBM Corporation
E il business è interessato ad acquisire info che
vanno oltre la transazione

                                                Fail
                                                 Fail    Fail                    Yes!
                         Fail            Fail
                 Fail       Fail                           Fail



                  Fail                   Fail                     Fail
                                                          Fail
        Inizio                                    Fail                         Fine
   processo acquisto            Fail                                     processo acquisto
                                         Fail
    Albero
                                  Il DWH generalmente traccia la transazione
 decisionale
                                            finale, quella conclusiva.
      del
                                Per “leggere” meglio il processo di acquisto serve
  processo
                                            conoscere anche il resto
 di acquisto


                                                                                             6
                                                                               2012 IBM Corporation
Big Data: il nuovo oceano dei dati
                          I dati sotto la superficie ancora
                                     inesplorati



          12+ terabytes                            30 miliardi
                di Tweets                           Sensori, RFID, altri device
                al giorno                             che generano dati in
                                                            streaming

                          Volume     Velocità




                          Varietà    Veridicità
          100’s                                   Solo 1 su 3
              Di tipi dati diversi                Utenti di business ritiene di
                                                  avere informazioni affidabili              7
7                                                                          © 2013 IBM Corporation
La conoscenza è contenuta anche in fonti non
 convenzionali …perchè ignorarle?
                                                              25Tb Facebook /giorno
q Il Business necessita di gestire ed usare in modo
  massivo una quantità sempre crescente di
  informazioni non convenzionali e generalmente
  create all’esterno delle organizzazioni aziendali

q La maggior parte di queste informazioni non
  convenzionali, sono semistrutturate o
  completamente destrutturate

q Le organizzazioni soffrono se non possono
  acquisire la conoscenza contenuta nelle
  informazioni di business
  Ø I sistemi tradizionali analizzano solo dati strutturati
  Ø Il mancante 80% è costituito da informazioni non
     strutturate o semi strutturate (Gartner).

                                                               200k twitter al minuto

                Big Data                                      290 milioni twitter anno
                                                                12Tb twitter/giorno


                                                                                              8
                                                                                2012 IBM Corporation
Quando si parla di “data explosion”




                         83x


6,000,000 users on Twitter      500,000,000 users on Twitter
   pushing out 300,000            pushing out 400,000,000
       tweets per day                   tweets per day
                             1333x

                                                                       9
                                                         2012 IBM Corporation
Approccio Tradizionale e Approccio Big Data




                                                         10
                                              2012 IBM Corporation
BIG DATA
Stato dell’arte
                             11
                  2012 IBM Corporation
Which is the State-of-The-Art?




         >1100 Business Managers                               >200 CIOs

     IBM and the Saïd Business School (on Global Scale) and SDA Bocconi University (on local
                      Scale) partnered to benchmark global big data activities
12    www.ibm.com/2012bigdatastudy                                                             12
Big Data: lo stato dell’arte

 1            Customer analytics are driving big data initiatives


               Big data is dependent upon a scalable and extensible
 2                             information foundation

            Initial big data efforts are focused on gaining insights
 3              from existing and new sources of internal data


 4                 Big data requires strong analytics capabilities


                    The emerging pattern of big data adoption is
 5              focused upon delivering measureable business value

IBM e Saïd Business School (Università di Oxford – ricerca globale) e Università SDA Bocconi
            (Italia) hanno collaborato per un benchmark sulle iniziative Big Data
                                                                                               13
Key Findings: Big Data Activities


                                              >1000 Business Managers




         24%                      47%                               28%
Have Not Begun Big Data   Planning Big Data                 Pilot & Implementation of
       Activities             Activities                        Big Data Activities



        25%                               57%                         18%

                                                        >200 CIOs

                                                                                        14
IBM Big Data Platform & Ecosystem
         IBM SOCIAL MEDIA ANALYTICS                                          IBM CONTENT ANALYTICS
             Out-of-the-Box Social Analytics                                   Out-of-the-Box Text analytics
6                      Environment                                        Open environment with Enterprise Search          5

                                               Analytic Applications
      INFOSPHERE                 BI /    Exploration / Functional Industry Predictive Content
    DATA EXPLORER              Reporting Visualization   App        App    Analytics Analytics
                                                                                        BI /      PURE DATA for Analytics
                                                                                      Reporting
       (VIVISIMO)                                                                                       (NETEZZA)
                                              IBM Big Data Platform                                                             2
4            4
                                  Visualization        Application          Systems                  – Optimized Very Large
 – Search (and federate
                                  & Discovery         Development          Management                  Data Warehousing
data) in a big data context


                                                         Accelerators


                                     Hadoop              Stream               Data                   INFOSPHERE
    INFOSPHERE
                                     System             Computing           Warehouse                  STREAMS
    BIGINSIGHTS
                                                                                                                                3
    1
                                                                                                         – Analyse large
      1 – Analyse large
                                                                                                         structured and
        structured and                                                                               unstructured data set in
    unstructured data sets                Information Integration & Governance
                                                                                                            streaming


                                                                                                                         15
Il Data Warehouse e la Business Analytics…. ben si
        integrano con la BIG DATA platform
                                1    IBM InfoSphere BigInsights


                                                             6
                                                                 Cognos     5
              External Source Systems
                                                                   Applications
                      Structured,
          Semi Structured/ Unstructured Data                            Spreadsheets 4
Sensors                                                                    IBM Vivisimo
                         Data
                       Warehouse               2
Master Data
Management                                                   Cubi


                                      Netezza
                              ETL
                        Data Integration                 3
                         Data Quality              IBM InfoSphere Streams
                         Data Delivery


                                                                                          16
                                                                               2012 IBM Corporation
L’ecosistema Big Data : la chiave è l’interoperabilità


                     Traditional /
                      Relational
 Traditional
 Warehouse          Data Sources

                                                         Data         Analytics on
                                                       Warehouse     Structured Data




                   Non-Traditional /
                    Non-Relational
 Streaming          Data Sources
    Data

                                          InfoSphere                       Analytics on
                                            Streams                       Data In-Motion


                   Non-Traditional/
                   Non-Relational
                    Data Sources
Internet-Scale
  Data Sets
                 Traditional/Relational                InfoSphere      Analytics on
                                                       BigInsights     Data at Rest
                     Data Sources




                                                                                             17
                                                                                  2012 IBM Corporation
La piattaforma IBM Big Data:
           La nuova frontiera di Analisi

                                                                                      Data Ingest
                                                                   01011001100011101001001001001
100100100110100101010011100101001111001000100100010010001000100101 11000100101001001011001001010
                                                                   01100100101001001010100010010
                                                                   01100100101001001010100010010
                                                                   11000100101001001011001001010
                                                                   01100100101001001010100010010
                                Arricchire                         01100100101001001010100010010
                 Analisi Real Time




                                                                   01100100101001001010100010010
                                                                   01100100101001001010100010010
                                                                   11000100101001001011001001010
                                                                   01100100101001001010100010010
                                                                   01100100101001001010100010010
                                                                   01100100101001001010100010010
                                     Modello                       01100100101001001010100010010
                                                                   01100100101001001010100010010
                                     Analitico                     11000100101001001011001001010
                                                                   01100100101001001010100010010
                                     Adattivo                      01100100101001001010100010010
                                                                   01100100101001001010100010010
                                                                   11000100101001001011001001010

                                                                                                   18
            18
Analisi Tradizionale estesa ai Big Data


   1 Pre-Processing Hub                 2 Query-able Archive             3 Exploratory Analysis




                      Data Explorer
                                                                                         Combinare dati
                                                                                          strutturati con
                                                         Data Explorer                   non strutturati
                       BigInsight                        Find and view


Streams                               BigInsight                                                BigInsight


                                                                         Streams
                       Information     Information                                      Information Server
                          Server          Server




            Data                                     Data                            Data
          Warehouse                                Warehouse                       Warehouse
                                                                                                         19
  19                                                                                       © 2013 IBM Corporation
Applicazioni Big Data

                                                      q Analisi cosa si dice sui Social
                                                      Media di un argomento
                                                      q Analisi messaggi Call Center
                                                      q Analisi dei LOG.
                                                      q Identificazione delle frodi.
                                                      q Ricercare dati attraverso un
                                                        motore federato
                                                      q Analisi di dati provenienti
                                                          da sensori
                                                      q ........
Si ricorre ad una soluzione Big Data, ad esempio, quando:

- risulta necessario analizzare TUTTI i dati potenzialmente disponibili e
   quando l’elaborazione di un loro campione non sarebbe significativa
   e in grado di fornire risultati efficaci.
- si vuole ESPLORARE, anche in modo interattivo, i dati disponibili nei casi
   in cui le misure e gli indicatori di business non siano predeterminati.
- occorre analizzare un FLUSSO CONTINUO ed ampio di dati per prendere
  decisioni in tempo reale

Il fenomeno Big Data non è legato ad un particolare settore di industria
fa leva sulla crescita del volume dei dati e su ulteriori dimensioni come la
Velocità e la Varietà dei dati disponibili.                                           20
Biginsights per elaborare in
                                Vestas optimizes
modo molto veloce Petabytes
di dati                        capital investments
                                  based on 2.5
                                  Petabytes of
                                  information.
                                 § Model the weather to
                                  optimize placement of
                               turbines, maximizing power
                                generation and longevity.
                                § Reduce time required to
                               identify placement of turbine
                                   from weeks to hours.
                                 § Incorporate 2.5 PB of
                                    structured and semi-
                               structured information flows.
                                 Data volume expected to
                                        grow to 6 PB.     21
                                                               21
                                                    2012 IBM Corporation
Infosphere Streams e             Cisco turns to IBM big
Biginsights                        data for intelligent
per la gestione degli ambienti
                                     infrastructure
                                     management.
                                  § Optimize building energy
                                  consumption with centralized
                                    monitoring and control of
                                   building monitoring system.
                                  § Automates preventive and
                                    corrective maintenance of
                                        building systems.
                                 § Uses Streams, InfoSphere
                                    BigInsights and Cognos
                                                      §   Log Analytics
                                             §       Energy Bill Forecasting
                                    §       Energy consumption optimization
                                        §    Detection of anomalous usage
                                                                                 22
22
                                        §    Presence-aware energy mgt.
                                                                                 22
                                                                      2012 IBM Corporation
                                                 §     Policy enforcement
Infosphere Streams nel campo medico



Big Data enabled doctors from University of Ontario to apply neonatal infant monitoring to
                      predict infection in ICU 24 hours in advance




                                                                     IBM Data Baby
                                                                      youtube.com
                                                                                          23
                                                                                          23
                                                                               2012 IBM Corporation
Infosphere Streams per la     Dublin City Centre Increases
     ottimizzazione del traffico       Bus Transportation
                                          Performance
                                                         Capabilities Utilized:
                                                               Stream Computing

                                    •           Public transportation awareness solution
                                                  improves on-time performance and
                                                  provides real-time bus arrival info to
                                                                  riders
                                    •           Continuously analyzes bus location data
                                                 to infer traffic conditions and predict
                                                                  arrivals
                                                •     Collects, processes, and visualizes
                                                       location data of all bus vehicles
                                        •           Automatically generates transportation
                                                         routes and stop locations

                                                                 Results:
                                    •               Monitoring 600 buses across 150 routes
                                        •           Analyzing 50 bus locations per second
                                            •        Anticipated to Increase bus ridership
                                                                                             24
                                                                                             24
                                                                                  2012 IBM Corporation
24
CUSTOMER Analytics – GRUPO BBVA
  seamlessly monitors and improves its online reputation
.
 - Enables BBVA to consistently respond to and gain insight
 into customer needs and feedback.
                                                                        “What is great about this
                                                                         solution is that it helps
 - Gives BBVA the ability to measure the success of its outputs          us to focus our actions
                                                                         on the most important
 and approaches to engaging stakeholders and customers.                      topics of online
                                                                             discussions and
                                                                          immediately plan the
 - Shows whether positive or negative sentiments have
                                                                            correct and most
 increased or not, looks for the source and reason of                      suitable reaction.” –
                                                                            Online Communication
 comments and helps make decisions and plans.                                Department, BBVA




                                                           Behavioral
                                                             Data
                                                                                               25
CUSTOMER Analytics – MEDIASET
.
Social Analytics to collect Customer longitudinal point
of views from Web 2.0 and correlate them
with internal data                             “Big Data is a great
                                                                      opportunity for TV
                                                                  innovation in the next
  Better understand its marketing campaigns and consumer
                                                                    years. TV viewing is
  preferences,                                                       transforming into a
                                                                      multiplatform and
                                                                participative experience:
  Looking for ways to analyze and differentiate consumer
                                                                the better we know and
  experiences                                                   understand our viewers,
                                                                the better we can serve
                                                                 them." – Valerio Motti,
  Helped the client to assess the company’s corporate brands,        Head of Marketing
  with respect to one of its main pay-TV competitors               Innovation, Mediaset
                                                                            S.p.A.


                                                                           Trandational
                                                                              Data




                                             Behavioral
                                               Data
  26
                                                                                     26
VIVISIMO – referenze




                                  27
                       2012 IBM Corporation
CASE
History

                     28
          2012 IBM Corporation
SUCCESS STORIES : tra le varie fonti…. eccone due




LINK




 PDF File
Ricorda : Recuperare link che contiene questo doc              29
                                                    2012 IBM Corporation
LINK UTILI

                        30
             2012 IBM Corporation
BIG Data : alcuni utili link

 Big Data HUB & Success Stories
                   http://www.ibmbigdatahub.com/




   Big Data University
   http://bigdatauniversity.com/




 BigInsights tec enablement wiki
https://www.ibm.com/developerworks/mydeveloperworks/wi
         kis/home?lang=en_US#/wiki/BigInsights




   FREE ebook – Harness the power of BigData
 http://www.ibmbigdatahub.com/blog/research-director-reflects-
                     new-big-data-book


                                                                            31
                                                                 2012 IBM Corporation
Mi fermo qui….

      grazie per la
        pazienza

                                    32
32                    © 2013 IBM Corporation
HADOOP
     &
BIGINSIGHTS
                         33
              2012 IBM Corporation
Biginsights basato su Hadoop ….. perchè ?

  CPU istruzioni al secondo – miglioramenti significativi
   1990          44 Mips at 40 Mhz
   2000     3.562 Mips at 1.2 Ghz
   2010    147.600 Mips at 3.3 Ghz

  RAM Memory - miglioramenti significativi
   – 1990  640 K
   – 2000   64 Mb
   – 2010   8-32 GB

  Disk capacity - miglioramenti significativi
   – 1990      20 MB
   – 2000      10 GB
   – 2010       1 TB

  Disk latency (velocità di leggere e scrivere su disco ) - miglioramenti
  poco significativi
   Negli ultimi 7-10 anni non ci sono state enormi migliorie
  correntemente la velocita è di circa 70 – 80 MB / sec

                                                                                   34
                                                                        2012 IBM Corporation
Quanto tempo ci vuole per scandire 1 TB ?

q 1 TB (at 80 MB / sec)
   –     1 disk         3.4 hours
   –    10 disks         20 min
   – 100 disks           2 min
   – 1000 disks         12 sec


q Per ovviare alla Disc Latency la risposta è la ..elaborazione parallela

q Hadoop : un nuovo modo per memorizzare ed elaborare i dati


        ØScritto in Java
        ØProgettato per lavorare su hardware non specializzato
        ØGira in ambiente Linux
        ØScalabile, Flessibile,Robusto




                                                                                  35
                                                                       2012 IBM Corporation
What is Hadoop?

§ Apache Hadoop = free, open source framework for data-
  intensive applications
  –   Inspired by Google technologies (MapReduce, GFS)
  –   Yahoo has been the largest contributor to the project (Doug Cutting),
  –   Well-suited to batch-oriented, read-intensive applications
  –   Originally built to address scalability problems of Nutch, an open source
      Web search technology

§ Enables applications to work with thousands of nodes and
  petabytes of data in a highly parallel, cost effective manner
  – CPU + disks of commodity box = Hadoop “node”
  – Boxes can be combined into clusters
  – New nodes can be added as needed without changing
       • Data formats
       • How data is loaded
       • How jobs are written



                                                                                 36
                                                                      2012 IBM Corporation
Two Key Aspects of Hadoop



§ MapReduce framework
  – MapReduce is a software framework introduced by
    Google to support distributed computing on large data
    sets of clusters of computers.
  – How Hadoop understands and assigns work to the nodes
    (machines)

§ Hadoop Distributed File System = HDFS
  – Where Hadoop stores data
  – A file system that spans all the nodes in a Hadoop cluster
  – It links together the file systems on many local nodes to
    make them into one big file system

                                                                   37
                                                        2012 IBM Corporation
Hadoop ed il paradigma Map Reduce
             §I dati sono memorizzati su un sistema distribuito di server
             §Le funzioni elaborative vengono inviate dove ci sono I dati
             §Ogni server elabora I dati di propria competenza e condivide i risultati
             §Il sistema può scalare raggiungendo migliaia di nodi e PB di dati

       public static class TokenizerMapper
        public static class TokenizerMapper
                                                                                   Hadoop Data Nodes
   extends Mapper<Object,Text,Text,IntWritable> {{
    extends Mapper<Object,Text,Text,IntWritable>
          private final static IntWritable
           private final static IntWritable
                one == new IntWritable(1);
                 one    new IntWritable(1);
           private Text word == new Text();
            private Text word    new Text();
   public void map(Object key, Text val, Context
    public void map(Object key, Text val, Context
                 StringTokenizer itr ==
                  StringTokenizer itr
          new StringTokenizer(val.toString());
           new StringTokenizer(val.toString());
            while (itr.hasMoreTokens()) {{
             while (itr.hasMoreTokens())
              word.set(itr.nextToken());
               word.set(itr.nextToken());
                context.write(word, one);
                 context.write(word, one);
                        }}
                                                                                                          1. Map Phase
                                                                                                       (spezza il job in piccole parti)
                           }}
                          }}

        public static class IntSumReducer

                                                                                                             2. Shuffle
         public static class IntSumReducer
   extends Reducer<Text,IntWritable,Text,IntWrita
    extends Reducer<Text,IntWritable,Text,IntWrita

                                                           Distribute map
  private IntWritable result == new IntWritable();
   private IntWritable result    new IntWritable();
            public void reduce(Text key,
             public void reduce(Text key,
     Iterable<IntWritable> val, Context context){
      Iterable<IntWritable> val, Context context){
                      int sum == 0;
                       int sum    0;
              for (IntWritable vv :: val) {{               tasks to cluster                            (riordina I risultati parziali per
               for (IntWritable       val)
                     sum += v.get();
                      sum += v.get();
                      .. .. ..
                                                                                                           le elaborazione finale)
                                                                                                       3. Reduce Phase
                                                                                                       (rielabora il tutto per ottenere
MapReduce Application
                                                                                                             un singolo risultato)
                                                                   Shuffle




             Result Set                               Return a single result set



                                                                                                                                     38
                                                                                                                          2012 IBM Corporation
BigInsights estende le capabilities di Hadoop open
  source con l’aggiunta di nuove funzionalità ….

                 InfoSphere BigInsights

                    Advanced Engines

                    Development Tools
                                                            Analytic Applications
Enterprise             Indexing
                                               BI /    Exploration / Functional Industry Predictive Content

capabilities                                 Reporting Visualization   App        App                 BI /
                                                                                         Analytics Analytics
                                                                                                     Report

                      Connectors                                                                      ing

                                                          IBM Big Data Platform
                                                Visualization        Application         Systems
                  Workload Optimization         & Discovery         Development         Management



                 Administration & Security                             Accelerators


                                                   Hadoop             Stream               Data
                                                   System            Computing           Warehouse


Open source     IBM tested & supported
  based        open source components                  Information Integration & Governance
components



                                                                                                        39
                                                                                        2012 IBM Corporation
Infosphere BigInsights : due edizioni




Con BigInsights le aziende possono indirizzare l’ elaborazione di enormi quantità di
dati mai prima sfruttate e ricavare nuova conoscenza in modo efficiente, ottimizzato e
                                        scalabile.
  Tale infrastruttura sfrutta il MapReduce framework di Hadoop per affrontare
     l’elaborazione parallela di grandi insiemi di dati distribuiti su numerosi nodi. 40
                                                                                        40
                                                                             2012 IBM Corporation
Infosphere BigInsights : due edizioni



                      Enterprise Edition
                                                      GPFS-SNC Native Support*
                                              Spreadsheet-style data exploration
                                                  Job and Workflow Management
                                        Productivity and Efficiency Improvements
                                          Integration with InfoSphere Warehouse
                                                          Integration with Netezza
                                                              Integration with DB2
                                                             Large Scale Indexing
            Basic Edition                                            Text Analytics
                                                                Machine Learning*
     Free Download, Easy Installation                      Tiered Terabyte Pricing
       24x7 Web Support, 10TB Limit
                Paid Support Option                               * = coming soon




                                                                                      41
Biginsights on Cloud




                                  42
                       2012 IBM Corporation
IBM BigInsights on Cloud
Hadoop for everyone




                                      43
                           2012 IBM Corporation
Infosphere Streams

                           44
                2012 IBM Corporation
Infosphere Streams

  InfoSphere Streams dispone di un’infrastruttura software agile e scalabile per
  l’analisi in tempo reale di enormi flussi di dati in movimento, di qualsiasi natura e
  provenienti da innumerevoli sorgenti.




Tale tipo di elaborazione aumenta la precisione e la velocità del processo
decisionale in diversi campi come quelli sanitario, astronomico,
manifatturiero, finanziario e molti altri ancora.
                                                                                          45
                                                                               2012 IBM Corporation
Categories of Problems Solved by Streams

§ Applications that require on-the-fly processing, filtering and analysis
  of streaming data
   – Sensors: environmental, industrial, surveillance video, GPS, …
   – “Data exhaust”: network/system/web server/app server log files
   – High-rate transaction data: financial transactions, call detail records

§ Criteria: two or more of the following
   – Messages are processed in isolation or in limited data windows
   – Sources include non-traditional data (spatial, imagery, text, …)
   – Sources vary in connection methods, data rates, and processing
     requirements, presenting integration challenges
   – Data rates/volumes require the resources of multiple processing nodes
   – Analysis and response are needed with sub-millisecond latency
   – Data rates and volumes are too great for store-and-mine approaches




                                                                              46
                                                                   2012 IBM Corporation
Elaborazione real time time con infosphere streams

 à continuous ingestion                  infrastructure provides services for
                                              scheduling analytics across h/w nodes
          à continuous analysis
                                              establishing streaming connectivity
                                             …
                     Filter
                                                 Transform      Annotate




                                       Correlate
                                                     Classify




  achieve scale
      by partitioning applications into components                                    47
      by distributing across stream-connected hardware nodes               2012 IBM Corporation
Infosphere Data
    Explorer
 (ex VIVISIMO)
                             48
                  2012 IBM Corporation
Vivisimo e la sua missione



 Aiuta le organizzazioni a scoprire,
 organizzare, analizzare e navigare
grandi quantità di dati eterogenei e
    dinamici, sia strutturati che
destrutturati, indipendentemente da
dove siano gestiti o storicizzati, per
incrementare l’efficienza ed il valore
     nei processi di business.




                                                    49
                                         2012 IBM Corporation
Vivisimo nell’azienda


                                               Relational
                                                 Data §     Garantire l'accesso a numerose
                                                              applicazioni e archivi dati
                                                 File
                                               Systems
                                                      § Scoprire e navigare all’interno di
                                                Content
                                              Management
                                                                 tutta l’azienda
                                                      § Fondere informazioni strutturate
                                                 Email


                          Velocity Platform
                                                         e non strutturate per guidare
                                                               l’azienda verso:
                                                 CRM
    Application/                                               – Migliori decisioni
      Users
                                                Supply
                                                            – Operazioni più efficienti
                                                Chain     – Migliore comprensione dei
                                                                       clienti
                                                 ERP
                                                                  – Innovazione
             Commenting

                                              RSS Feeds       § Strumenti Social per la
             Tagging
                                                             collaborazione ed il riutilizzo
             Rating                              Cloud

             Shared                            Custom
             Folders                           Sources

      Social Tools                             External
                                               Sources
                                                                                                50
                                                                                     2012 IBM Corporation
Vivisimo ricerca federata




                                       51
                                       51
                            2012 IBM Corporation
Vivisimo architettura




        User Profiles                       Application SDK                               Federated Sources

                                        Authentication/Authorization
                                           Query transformation
                                             Personalization
                                                  Display                             Subscriptions   Feeds Web Results



      Text Analytics                                                                         Meta-Data
                                             Search Engine
           Thesauri                                                                            Faceting
         Clustering                                                                               BI
      Ontology Support                                                                         Tagging
     Semantic Processing                                                                      Taxonomy
       Entity Extraction                                                                     Collaboration
         Relevancy




  Connector
  Framework

               CM, RM, DM   RDBMS   Feeds   Web 2.0      Email     Web   CRM, ERP File Systems



                                                                                                                        52
                                                                                                             2012 IBM Corporation
CUSTOMER
 Analytics
 esempi..
                        53
             2012 IBM Corporation
CUSTOMER Analytics - alcuni esempi ..
     Deeper Customer Analytics Examples and Best Practice and leverage Big Data:
                                Ready for Business

                                  Behavioral Data




                                                  Connect with Clients &
                                                  prospects, with Brands
                                               ...analyse strong and weak
Delight customers with targeted                    signals in discussion
     ….social and transactional
                   propositions        You


                             Real time interaction
    Interaction Data          across channels                   Transaction
                                    Interact!
                                                                   Data

                                                                        Single view
                                                                         Business Data,
                                                                          Social Data,
                                                                        Interactive data

                                                                                   Enterprise Systems
                                                                                                        54
CUSTOMER Analytics – MOBY Lines .
Digital marketing optimization: lifetime individual
tracking, microsegmentation, channel attribution,
proposition automation
                                                                                       Intuitive

                                                                                      Social
                                                                                        collection




                            Digital & Multichannel
                            Marketing / individual
                           digital analytics, real time   Single view
                                                           Business Data,
                           monitoring, I/O ERP data,        Social Data,
                                                          Interactive data
                           dynamic segments, mkt.
                                   automation                                   55
                                                                 Enterprise Systems
CUSTOMER Analytics – GARANTY bank – un filmato..
Garanty Real time interaction across channels




   Single view
    Business Data,
     Social Data,
   Interactive data


                                                   56
Copyright © 2013 Splunk, Inc.




Splunking Big Data

 Michele Guglielmo – Territory Manager Italy
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar

More Related Content

What's hot

Gestione dei big data: Web 3.0, motori semantici, soft computing
Gestione dei big data: Web 3.0, motori semantici, soft computing Gestione dei big data: Web 3.0, motori semantici, soft computing
Gestione dei big data: Web 3.0, motori semantici, soft computing Valerio Eletti
 
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso  M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso Istituto nazionale di statistica
 
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)Vincenzo Manzoni
 
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Massimiliano Lovati
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Massimiliano LovatiSignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Massimiliano Lovati
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Massimiliano LovatiDigital Law Communication
 
Big Data - Breve panoramica
Big Data - Breve panoramicaBig Data - Breve panoramica
Big Data - Breve panoramicaLuca Naso
 
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Enrico Pelino
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Enrico PelinoSignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Enrico Pelino
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Enrico PelinoDigital Law Communication
 

What's hot (10)

Gestione dei big data: Web 3.0, motori semantici, soft computing
Gestione dei big data: Web 3.0, motori semantici, soft computing Gestione dei big data: Web 3.0, motori semantici, soft computing
Gestione dei big data: Web 3.0, motori semantici, soft computing
 
_ABIlab-BigData-Finale
_ABIlab-BigData-Finale_ABIlab-BigData-Finale
_ABIlab-BigData-Finale
 
Appunti di big data
Appunti di big dataAppunti di big data
Appunti di big data
 
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso  M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso
 
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
 
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Massimiliano Lovati
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Massimiliano LovatiSignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Massimiliano Lovati
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Massimiliano Lovati
 
Big Data - Breve panoramica
Big Data - Breve panoramicaBig Data - Breve panoramica
Big Data - Breve panoramica
 
La salute e i big data
La salute e i big dataLa salute e i big data
La salute e i big data
 
Big Data
Big DataBig Data
Big Data
 
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Enrico Pelino
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Enrico PelinoSignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Enrico Pelino
SignEAT - Evento AIFAG del 15 giugno 2017 - Intervento Enrico Pelino
 

Viewers also liked

Come gestire un progetto Big Data
Come gestire un progetto Big DataCome gestire un progetto Big Data
Come gestire un progetto Big DataMiriade Spa
 
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi SMAU
 
WORKSHOP Blockchain Governance algoritmi per costruire la fiducia
WORKSHOP Blockchain Governance algoritmi per costruire la fiduciaWORKSHOP Blockchain Governance algoritmi per costruire la fiducia
WORKSHOP Blockchain Governance algoritmi per costruire la fiduciaMauro Giorgi
 
Blockchain - crittomonete, Bitcoin e altre applicazioni
Blockchain - crittomonete, Bitcoin e altre applicazioniBlockchain - crittomonete, Bitcoin e altre applicazioni
Blockchain - crittomonete, Bitcoin e altre applicazioniDavide Carboni
 
I vantaggi del cloud
I vantaggi del cloudI vantaggi del cloud
I vantaggi del cloudMiriade Spa
 
Dalla Business Intelligence ai Big Data
Dalla Business Intelligence ai Big DataDalla Business Intelligence ai Big Data
Dalla Business Intelligence ai Big DataMiriade Spa
 
Big data e pubblica amministrazione
Big data e pubblica amministrazioneBig data e pubblica amministrazione
Big data e pubblica amministrazioneGianfranco Andriola
 
Come diventare data scientist - Paolo Pellegrini
Come diventare data scientist - Paolo PellegriniCome diventare data scientist - Paolo Pellegrini
Come diventare data scientist - Paolo PellegriniDonatella Cambosu
 
Big Data Analysis: dalla teoria alla pratica
Big Data Analysis: dalla teoria alla praticaBig Data Analysis: dalla teoria alla pratica
Big Data Analysis: dalla teoria alla praticaGiulio Lazzaro
 
2015 Upload Campaigns Calendar - SlideShare
2015 Upload Campaigns Calendar - SlideShare2015 Upload Campaigns Calendar - SlideShare
2015 Upload Campaigns Calendar - SlideShareSlideShare
 
What to Upload to SlideShare
What to Upload to SlideShareWhat to Upload to SlideShare
What to Upload to SlideShareSlideShare
 
Getting Started With SlideShare
Getting Started With SlideShareGetting Started With SlideShare
Getting Started With SlideShareSlideShare
 

Viewers also liked (15)

Come gestire un progetto Big Data
Come gestire un progetto Big DataCome gestire un progetto Big Data
Come gestire un progetto Big Data
 
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
 
WORKSHOP Blockchain Governance algoritmi per costruire la fiducia
WORKSHOP Blockchain Governance algoritmi per costruire la fiduciaWORKSHOP Blockchain Governance algoritmi per costruire la fiducia
WORKSHOP Blockchain Governance algoritmi per costruire la fiducia
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Blockchain - crittomonete, Bitcoin e altre applicazioni
Blockchain - crittomonete, Bitcoin e altre applicazioniBlockchain - crittomonete, Bitcoin e altre applicazioni
Blockchain - crittomonete, Bitcoin e altre applicazioni
 
I vantaggi del cloud
I vantaggi del cloudI vantaggi del cloud
I vantaggi del cloud
 
Dalla Business Intelligence ai Big Data
Dalla Business Intelligence ai Big DataDalla Business Intelligence ai Big Data
Dalla Business Intelligence ai Big Data
 
Big data e pubblica amministrazione
Big data e pubblica amministrazioneBig data e pubblica amministrazione
Big data e pubblica amministrazione
 
Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...
Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...
Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...
 
Big data presentation
Big data presentationBig data presentation
Big data presentation
 
Come diventare data scientist - Paolo Pellegrini
Come diventare data scientist - Paolo PellegriniCome diventare data scientist - Paolo Pellegrini
Come diventare data scientist - Paolo Pellegrini
 
Big Data Analysis: dalla teoria alla pratica
Big Data Analysis: dalla teoria alla praticaBig Data Analysis: dalla teoria alla pratica
Big Data Analysis: dalla teoria alla pratica
 
2015 Upload Campaigns Calendar - SlideShare
2015 Upload Campaigns Calendar - SlideShare2015 Upload Campaigns Calendar - SlideShare
2015 Upload Campaigns Calendar - SlideShare
 
What to Upload to SlideShare
What to Upload to SlideShareWhat to Upload to SlideShare
What to Upload to SlideShare
 
Getting Started With SlideShare
Getting Started With SlideShareGetting Started With SlideShare
Getting Started With SlideShare
 

Similar to Big Data & Bird & Bird - seminar

Big Data & Data Mining
Big Data  & Data MiningBig Data  & Data Mining
Big Data & Data MiningAndrea Frison
 
Big data & RWE rischio o opportunità?
Big data & RWE rischio o opportunità?Big data & RWE rischio o opportunità?
Big data & RWE rischio o opportunità?Medi-Pragma
 
Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support
 
Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...Data Driven Innovation
 
Alessia Palladino Diricto - SMAU NAPOLI 2017
Alessia Palladino Diricto - SMAU NAPOLI 2017Alessia Palladino Diricto - SMAU NAPOLI 2017
Alessia Palladino Diricto - SMAU NAPOLI 2017SMAU
 
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...Cultura Digitale
 
AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3Fabio Lazzarini
 
Smau Bologna 2015 - AISM
Smau Bologna 2015 - AISMSmau Bologna 2015 - AISM
Smau Bologna 2015 - AISMSMAU
 
Federico Morando - Big Data - Digital for Business
Federico Morando - Big Data - Digital for BusinessFederico Morando - Big Data - Digital for Business
Federico Morando - Big Data - Digital for BusinessCultura Digitale
 
Startup e open data a firenze saaa2018
Startup e open data a firenze saaa2018Startup e open data a firenze saaa2018
Startup e open data a firenze saaa2018Francesca De Chiara
 
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...OpenGeoDataItalia
 
Criticità per la protezione dei dati personali connesse all’utilizzo di dispo...
Criticità per la protezione dei dati personali connesse all’utilizzo di dispo...Criticità per la protezione dei dati personali connesse all’utilizzo di dispo...
Criticità per la protezione dei dati personali connesse all’utilizzo di dispo...festival ICT 2016
 
Big Data Vs. Open Data
Big Data Vs.  Open Data Big Data Vs.  Open Data
Big Data Vs. Open Data Consulthinkspa
 
Un aiuto per adeguarsi al GDPR: i codici di condotta
Un aiuto per adeguarsi al GDPR: i codici di condottaUn aiuto per adeguarsi al GDPR: i codici di condotta
Un aiuto per adeguarsi al GDPR: i codici di condottaRegister.it
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaValerio Torriero
 
Data Virtualization - How to Create a Single View of All Data
Data Virtualization - How to Create a Single View of All DataData Virtualization - How to Create a Single View of All Data
Data Virtualization - How to Create a Single View of All DataDenodo
 
Big Data e Open data in aziende e imprese
Big Data e Open data in aziende e impreseBig Data e Open data in aziende e imprese
Big Data e Open data in aziende e impreseMarco_Br
 

Similar to Big Data & Bird & Bird - seminar (20)

Big Data & Data Mining
Big Data  & Data MiningBig Data  & Data Mining
Big Data & Data Mining
 
Big data & RWE rischio o opportunità?
Big data & RWE rischio o opportunità?Big data & RWE rischio o opportunità?
Big data & RWE rischio o opportunità?
 
Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)
 
Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...
 
Alessia Palladino Diricto - SMAU NAPOLI 2017
Alessia Palladino Diricto - SMAU NAPOLI 2017Alessia Palladino Diricto - SMAU NAPOLI 2017
Alessia Palladino Diricto - SMAU NAPOLI 2017
 
Data Governance at work
Data Governance at workData Governance at work
Data Governance at work
 
Gaetano Pellegrino - Open Gate Italia
Gaetano Pellegrino - Open Gate ItaliaGaetano Pellegrino - Open Gate Italia
Gaetano Pellegrino - Open Gate Italia
 
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
 
AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3
 
Smau Bologna 2015 - AISM
Smau Bologna 2015 - AISMSmau Bologna 2015 - AISM
Smau Bologna 2015 - AISM
 
Federico Morando - Big Data - Digital for Business
Federico Morando - Big Data - Digital for BusinessFederico Morando - Big Data - Digital for Business
Federico Morando - Big Data - Digital for Business
 
Startup e open data a firenze saaa2018
Startup e open data a firenze saaa2018Startup e open data a firenze saaa2018
Startup e open data a firenze saaa2018
 
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
 
Criticità per la protezione dei dati personali connesse all’utilizzo di dispo...
Criticità per la protezione dei dati personali connesse all’utilizzo di dispo...Criticità per la protezione dei dati personali connesse all’utilizzo di dispo...
Criticità per la protezione dei dati personali connesse all’utilizzo di dispo...
 
Big Data Vs. Open Data
Big Data Vs.  Open Data Big Data Vs.  Open Data
Big Data Vs. Open Data
 
Un aiuto per adeguarsi al GDPR: i codici di condotta
Un aiuto per adeguarsi al GDPR: i codici di condottaUn aiuto per adeguarsi al GDPR: i codici di condotta
Un aiuto per adeguarsi al GDPR: i codici di condotta
 
Zeebra big dataanalytics_v1.1
Zeebra big dataanalytics_v1.1Zeebra big dataanalytics_v1.1
Zeebra big dataanalytics_v1.1
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social Media
 
Data Virtualization - How to Create a Single View of All Data
Data Virtualization - How to Create a Single View of All DataData Virtualization - How to Create a Single View of All Data
Data Virtualization - How to Create a Single View of All Data
 
Big Data e Open data in aziende e imprese
Big Data e Open data in aziende e impreseBig Data e Open data in aziende e imprese
Big Data e Open data in aziende e imprese
 

Recently uploaded

Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...
Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...
Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...Associazione Digital Days
 
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”Associazione Digital Days
 
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...Associazione Digital Days
 
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...Associazione Digital Days
 
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...Associazione Digital Days
 
ScrapeGraphAI: a new way to scrape context with AI
ScrapeGraphAI: a new way to scrape context with AIScrapeGraphAI: a new way to scrape context with AI
ScrapeGraphAI: a new way to scrape context with AIinfogdgmi
 
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...Associazione Digital Days
 
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...Associazione Digital Days
 
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...Associazione Digital Days
 

Recently uploaded (9)

Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...
Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...
Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...
 
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”
 
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...
 
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...
 
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...
 
ScrapeGraphAI: a new way to scrape context with AI
ScrapeGraphAI: a new way to scrape context with AIScrapeGraphAI: a new way to scrape context with AI
ScrapeGraphAI: a new way to scrape context with AI
 
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...
 
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...
 
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...
 

Big Data & Bird & Bird - seminar

  • 2. “Big Data” ● Tante definizioni ● Un solo concetto semplice ● Grandi quantità di dati strutturati e non strutturati da organizzare ed analizzare ● Da qualche gigabyte ai terabyte, ai petabyte fino agli zettabyte e yottabyte
  • 4.
  • 5. Esempi estremi di “Big Data” ● Il sistema di generazione dati della Climate Corporation - migliaia di server per rielaborare periodicamente decenni di dati storici e generare 10.000 possibili scenari relativi al tempo per ogni collocazione geografica e grandezza, si traduce in oltre 10 trilioni di dati relativi a possibili scenari (ad esempio, un valore atteso di pioggia in un luogo specifico e in un momento specifico) che possono essere utilizzati per determinare l’ammontare del premio assicurativo e per l’analisi dei rischi, per un totale di oltre 50 terabyte di dati presenti nei sistemi di raccolta in un qualsiasi momento. ● La Sloan Digital Sky Survey (SDSS) ha iniziato a raccogliere dati astronomici nel 2000 ed è riuscita a raccogliere nelle prime settimane di attività più dati di quanti ne siano mai stati raccolti nella storia dell’astronomia. Lavorando ad un ritmo di circa 200 GB per notte, SDSS ha accumulato già più di 140 terabyte di informazioni. ● In totale i quattro rivelatori principali del Large Hadron Collider (LHC) di Ginevra hanno prodotto 13 petabyte di dati nel 2010 (13.000 terabyte)
  • 6. Overview ● Cosa intendiamo per “Big Data”? ● Un’industria in crescita ● Esempi da vendors ● La visione universitaria ● Problematiche legali ● Discussioni
  • 7. Cosa intendiamo per “Big Data”? ● McKinsey & Company nel suo report di giugno 2011 indica che il termine “Big Data” si riferisce a quei database la cui dimensione è al di là della capacità di gestione dei normali strumenti software per database. Questa definizione è volutamente soggettiva e incorpora una definizione in evoluzione di quanto debba essere grande un set di dati per poter essere considerato big data ... ● SAS/CEBR report (aprile 2012): “La quantità di dati continua a crescere in modo esponenziale, generata da Internet, dai social media, dal cloud computing e dai dispositivi mobili, si pone quindi una sfida ed un'opportunità per le organizzazioni – come gestire, analizzare ed utilizzare la sempre maggiore quantità di dati generati”. ● Big Data è un concetto aperto e la definizione variabile, dipende dalla potenza a diposizione ma anche una quantità di dati relativamente piccola può creare problemi di gestione
  • 8. Dove è possibile reperire i “Big Data”? ● Da dove arrivano? ● Dati strutturati e non strutturati ● Quanto costano la gestione e raccolta di questi dati? ● É necessaria una nuova infrastruttura IT? ● Occorre un progetto di analisi e obiettivi da raggiungere
  • 9. Dati Interni ● Ogni organizzazione produce un grande numero di dati o vi ha accesso. ● Questi dati sono molto spesso trascurati, conservati ma non utilizzati oppure semplicemente cancellati e persi. ● Dati macchina, e-mail, documenti, processi, sensori, traffico web ecc.
  • 10. Il mondo digitale ● Il mondo dei dispositivi mobili e dei social network genera un numero sempre maggiore di nuovi dati personali e le stesse opinioni degli utenti possono fornire indicazioni che prima non erano semplicemente disponibili
  • 11. Cosa si intende per Big Data? – Le tre “V” ● Volume – il volume dei dati è sempre più grande ● I dati globali digitali sono arrivati fino a 1.227 exabyte nel 2010 e si prevede di raggiungere 7.910 exabyte nel 2015. Secondo una stima, se solo un exabyte di dati fosse salvato su DVD sarebbero necessari 13513 Boeing 747 per il trasporto di tutti i DVD utilizzati. ● Velocità – aumento della velocità di creazione, acquisizione e condivisione dei dati ● A partire dal 2000 fino al 2010, la Sloan Digital Sky Survey ha raccolto 140 terabytes di informazioni. Nel 2016, il suo erede sarà in grado di raccogliere lo stesso quantitativo di informazioni ogni cinque anni ● Varietà – proliferazione di tipologie diverse di dati ● 80-85% dei dati a livello globale sono considerati attualmente non strutturati. ● Ad esempio, lo possono essere i dati relativi al traffico o alla geolocalizzazione tratti da telecomunicazioni, blog, RFID e dati derivanti da sensori, gli spostamenti dei veicoli o dati relativi alla posizione degli aeromobili, i dati relativi alle condizioni meteo, alle transazioni finanziarie, alle statistiche di vendita, analisi delle parole chiave etc. ● Valore, Visione – non limitiamo il concetto alla terminologia
  • 12. Cloud Computing ● Il “Cloud computing” permette l’accesso, la riorganizzazione e l’utilizzo del “Big Data” fornendo un accesso virtualmente illimitato ed economico a risorse hardware e software e ad uno spazio di archiviazione praticamente illimitato ed utilizzabile in modo elastico ● Progetti di analisi dei dati possono essere usati separatamente ed indipendentemente dal nucleo centrale delle funzioni e dei sistemi aziendali e non appesantire i sistemi aziendali ● Opportunità e problemi dell’uso del Cloud, non più silos ma unico database
  • 13. Cosa può essere fatto con i “Big Data” ● Data Mining e Data Extraction ● Analisi e Visualizzazione dei dati ● Infinite possibilità di raccolta dati e business intelligence ● Identificazione trend, rischi, errori, sprechi ● Monitoraggio in tempo reale ● Dati oggettivi ● Nuove opportunità di business
  • 14. Alcuni esempi… ● Fashion - percezione del brand - “sentiment” degli utenti – studio dei trend - logistica - contraffazione – analisi concorrenti ● Automotive – analisi dati sensori di bordo, manutenzione predittiva, assistenza, correzione errori, prevenzioni incidenti, assistenza alla guida, logistica prodotti e ricambi, studio garanzie prodotti ● Life Science – studi osservazionali utilizzo farmaci, studio trend epidemiologici popolazione, studio parametri esclusione per studi clinici, studio necessità popolazione, identificazione frodi ● Retail – Dati utente su consumi e budget di spesa, analisi uso siti ed e- commerce, preferenze di acquisto, interazione tramite strumenti portatili utenti, personalizzazione esperienza d’acquisto, smart carts, apps e rfid codes sui prodotti, suggerimenti e promozioni in tempo reale, strumenti di comparazione prezzi, geolocalizzazione
  • 15. Ulteriori esempi ● Banche – connessione dati operazioni e iniziative retail, studio dei portafogli, studio sentiment clienti, servizi valore aggiunto clienti, controllo e prevenzione frodi ● Logistica – integrazione con dati retail, consumi e preferenze, dati promozioni e interventi in garanzia , ottimizzazione consegna e magazzino, logistica real time e consegne nello stesso giorno, dati di spedizione, viaggio, consegna in tempo reale ● Advertising e Marketing – studio sentiment social network, modello comunicazione mirata al singolo utente, uso di strumenti per analisi semantica, linguaggio naturale e studio di cluster informativi ● Assicurazioni – personalizzazione polizze e coperture a secondo del comportamento utente, studio storia veicolo, analisi rischi reali bene assicurato, individuazione frodi, dati ambientali per calcolo rischio
  • 16. Problematiche legali 1 ● Chi possiede i “Big Data”? ● Creazione e gestione del database ● Direttiva relativa al settore degli Open Data pubblici ● Dati generati dagli utenti ● Dati organizzati e strutturati ● Dati non strutturati ● Dati estratti ed analizzati ● Diritti dei fornitori di strumenti relativi a “Big Data”
  • 17. Problematiche legali 2 ● Tutti diventeremo dei “big brother”? ● Nuova proposta di regolamento UE per il trattamento dei dati personali (privacy by design, diritto all’oblio) ● Nuove tipologie di consenso, data portability, trasferimento all’estero ● Come rispettare il diritto di accesso e cancellazione? ● Dati personali persi all’interno dei “Big Data” ● Dati estratti dall’associazione di informazioni ● Data Breach Notification ● Incidente Target (previsione gravidanza)
  • 18. Problematiche legali 3 ● I limiti del copyright ● “Big Data”ed il principio dell’esaurimento ● Eccezioni al diritto d’autore ● Necessità di licenze per analizzare materiale protetto ● L’analisi dei dati può essere considerata utilizzo dei contenuti? Copia? ● Proposte di liberalizzazione per attività e strumenti analitici ● “Big Data” un nuovo strumento contro la pirateria? ● Proteggibilità del database e dei risultati delle analisi
  • 19. Problematiche legali 4 ● Sicurezza e protezione dei dati, necessità di garanzie ● Aspetti Antitrust ● Rapporti con licenze open source ● Uso dei dati in ambito contenzioso ● Aumento delle garanzie e delle responsabilità ● Mercati regolamentati (borsa, finanza, banche, pubblicità, assicurazioni)
  • 20. Thank you Avv Roberto Camilli +39 02 30 35 60 00 roberto.camilli@twobirds.com Bird & Bird is an international legal practice comprising Bird & Bird LLP and its affiliated and associated businesses. Bird & Bird LLP is a limited liability partnership, registered in England and Wales with registered number OC340318 and is authorised and regulated by the Solicitors Regulation Authority. Its registered office and principal place of business is at 15 Fetter Lane, London EC4A 1JP. A list of members of Bird & Bird LLP and of any non-members who are designated as partners, and of their respective professional qualifications, is open to inspection at that address. twobirds.com
  • 21. Bird & Bird & Big Data Big Data & Small Steps La risposta è là fuori. Qualcuno trovi una domanda intelligente. Prof. Carlo Alberto Carnevale Maffè Bocconi University – SDA Bocconi School of Management C.A. Carnevale-Maffè 1
  • 22. In Hoc Data, Vinces § Nate Silver (34 anni) ha previsto correttamente 49 stati su 50, sia nel 2008 sia nel 2012. § Aveva sviluppato “Pecota” (Player Empirical Comparison and Optimization Test Algorithm) per prevedere le prestazioni dei giocatori di baseball. § Fa il blogger (“FiveThirtyEight”) sul New York Times C.A. Carnevale-Maffè 2
  • 23. La Ricchezza delle Nozioni “Se anche parlassi tutte le lingue degli uomini (…) e conoscessi tutti i misteri e tutta la scienza (…), sarei come un bronzo che risuona o un cembalo che tintinna” (1 Cor. 13,1-2) 1.Big Data, Tiny Understanding § Ogni possibile risposta, in attesa di qualche plausibile domanda 2.Gli economics degli analytics § L’abbondanza dei dati genera una scarsità relativa di attenzione umana. 3.Che farne di (questo) management? § Ci serve ancora chi oggi viene pagato per fare controllo e reporting? C.A. Carnevale-Maffè 3
  • 24. La vertigine della complessità § Aumento dell’ interdipendenza sistemica… § determinato dalla specializzazione deliberata § orientata all'aumento di produttività… Il mito newtoniano del Dato Universale: § Asimmetrie informative d'ambiente § Asimmetrie interpretative d’impresa. § Inoltre… § Razionalità limitata § Ambiguità causale § Policentrismo dei poteri e delle leggi C.A. Carnevale-Maffè 4
  • 25. A tale of Builders & Brickmakers § “Once upon a time, there were men called scientists. These men were builders who constructed edifices, called explanations or laws, by assembling bricks, called facts. When the bricks were sound and were assembled properly, the edifice was useful and durable. If the bricks were faulty or if they were assembled badly, the edifice would crumble. § The brickmakers became obsessed with the making of bricks. When reminded that the ultimate goal was edifices, not bricks, they replied that, if enough bricks were available, the builders would be able to select what was necessary and still continue to construct edifices. § It became difficult to find the proper bricks for a task because one had to hunt among so many. It became difficult to find a suitable plot for construction of an edifice because the ground was covered with loose bricks. It became difficult to complete a useful edifice because, as soon as the foundations were discernible, they were buried under an avalanche of random bricks. § And, saddest of all, sometimes no effort was made even to maintain the distinction between a pile of bricks and a true edifice”. Bernard Forscher, “Chaos in the Brickyard”, Science Magazine, 18 October 1963 C.A. Carnevale-Maffè 5
  • 26. La complessità, semplicemente… Specializzazione Flows Flows Evoluzione Entropia Stocks Stocks Inorganico Organico Socio-economico Internet of Things Life Sciences The Web C.A. Carnevale-Maffè 6
  • 27. Lo sviluppo urbano, esempio di specializzazione e interdipendenza piccola casa metropoli moderna nella prateria Residenti 5 5 ml I/O giornalieri 1-2 1-2 ml Alimentazione autonoma quasi totalmente dipendente Energia locale quasi totalmente dipendente Delta quasi zero alcuni kg/giorno CO2/individuo/giorno Delta produttivitá/10 poco piú di zero 30-50% anni Interscambio 10-20% 98% ambientale C.A. Carnevale-Maffè 7
  • 28. Fare sistema o fare mercato? § Fare sistema accresce l'interdipendenza, ma non necessariamente la specializzazione e quindi non migliora la produttività § Fare mercato allenta gli incastri (loose coupling), migliora la flessibilità e la propensione all’adattamento C.A. Carnevale-Maffè 8
  • 29. Gli analytics sono un mercato, non un sistema § E’ la somma che fa il totale, ma non è la somma che fa il sistema. § Il sistema è un insieme di equazioni a incognite crescenti § La complessità è una fitta pioggia di piccoli asteroidi, e l'impresa è il mammifero intenzionale, l’organismo geneticamente automodificato C.A. Carnevale-Maffè 9
  • 30. Complessità, maestra di vita “L'essenza della tirannia è la negazione della complessità” Jacob Burkhardt, storico § Gestire la complessità vuol dire rinunciare a eccessive pretese di: § Prevedibilità temporale § Visibilità spaziale § Creazione del consenso sistemico § Investendo invece su: § Rapidità decisionale § Dislocamento e contestualizzazione § Leadership § Complessità come humus dell'impresa e graticola del dirigismo C.A. Carnevale-Maffè 10
  • 31. Predicting the Present (con una sbirciatina al futuro) § Udite, udite: § La gente compra quel che sta cercando e.. § La gente non compra quel che non sta cercando. § Forecasting & “NowCasting”: § E’ dimostrato che l’uso di strumenti di analisi delle frequenze di ricerca consente di interpolare con precisione alcuni dati di breve periodo (vendite di prodotti, destinazioni di viaggi, consumer confidence, etc) § Fonte: H.Choi & H.Varian, Predicting the Present with Google Trends, December 18, 2011. § M. Marsella & C. Miani, “Il Mutuo? Si stima con Google”, Lavoce.info, 26 agosto 2012 C.A. Carnevale-Maffè 11
  • 32. Gli economics degli analytics Quando i dati diventano abbondanti, la scarsità relativa dell’attenzione umana aumenta §Economics of deleting § Oggi costa piú cancellare che tenere. Prima i beni complementari alla non cancellazione costavano cari (e.g., l’album delle foto) e la selezione aveva senso economico. Ora non più. §Economics of sharing § C’erano più opere d’arte chiuse nelle cantine dei musei, di quante ce ne fossero visibili al pubblico. Ora non più. §Economics of calculating § Si inseguiva il mito di HAL9000: centralizzato, strutturato, onniscente. Ora non più. §Gli effetti di Big Data Analytics su: § R&D § Working Capital § Risk Management C.A. Carnevale-Maffè 12
  • 33. Capitale & Lavoro § Gli Analytics, nuova moneta § L'elasticitá incrociata tra capitale e lavoro si é notevolmente ridotta: il capitale é sempre meno una controparte o un sostituto del lavoro e sempre più una diversa forma di lavoro. § L'I.P. é uno stock di lavoro che diventa convertibile in capitale § Gran parte della capitalizzazione di borsa delle imprese è rappresentato da asset intangibili, in ultima analisi basati sull’accumulazione di un surplus di lavoro § Se capitale e lavoro restano due categorie aristoteliche inconciliabili, due entitá economiche e sociali separate, allora rimaniamo prigionieri di concetti come quello di classe, sia essa dirigente o operaia, e siamo condannati a perpetuare relazioni di tipo sindacale, giochi a somma zero nel processo di rappresentanza degli interessi. C.A. Carnevale-Maffè 13
  • 34. “First, Let’s Fire all the Managers” § Management is the least efficient activity in your organization (Gary Hamel, HBR, 2011). § Il management è una soluzione gerarchica e labour-intensive al problema della gestione della complessità, della hidden action e della hidden information. § La supervisione e la reportistica cessano di essere compiti a valore aggiunto. § Rimangono tali la leadership e l’imprenditorialità, ma che sono un tema di uomini e non di tecnologie. C.A. Carnevale-Maffè 14
  • 35. Grazie e buon lavoro! Prof. CarloAlberto Carnevale-Maffè Scuola di Direzione Aziendale – Università Bocconi Email: carloalberto.carnevale@sdabocconi.it C.A. Carnevale-Maffè 15
  • 36. Bird & Bird & Big Data Nuvole Nere sull’Oceano Blu “La verità, vi prego, sul Cloud Computing” Prof. Carlo Alberto Carnevale-Maffè C.A. Carnevale-Maffè – SDA Bocconi 1 Bocconi University – School of Management Copyright SDA Bocconi 2013
  • 37. Cloud: un’Istituzione Economica, non solo un’infrastruttura tecnologica • Il cloud è un’istituzione economica, non solo un’infrastruttura tecnologica. • E’ laboratorio di innovazione organizzativa, crocevia di scambi informativi, piattaforma di relazioni di business. • In questo senso la nuvola dei processi di business è la nuova Unità Economica d’Italia. 2 C.A. Carnevale-Maffè – SDA Bocconi 2
  • 38. La nuvola non è un taxi. E’ uno hub • La nuvola non è un offerta speciale per rottamare i server. • La nuvola non è un hosting del nostro disordine applicativo, un monte dei pegni delle nostra bigiotteria informatica. • La nuvola è uno hub di processi economici interoperabili. C.A. Carnevale-Maffè – SDA Bocconi 3
  • 39. La nuvola è meglio di Internet • Perché è standard ma non è la giungla dell’anonimato. • Perché è interoperabile ma anche difendibile dagli intrusi. • Perché ha un servizio garantito e non è best effort, tipo “attendere prego”. C.A. Carnevale-Maffè – SDA Bocconi 4
  • 40. Il Cloud è la FED del computing (non la BCE…) Le banche sono il cloud dei soldi. •Nessuno pensa che sia più razionale tenerli nella propria cassaforte, invece di depositarli in un istituto di credito. •E non è solo sicurezza, è il principio del rendimento della “moneta-dato” •Come le Banche sono il cloud dei Soldi, il Cloud, come una brava Banca Centrale, è il “prestatore di ultima istanza” di risorse computazionali e garantisce la liquidità e la libera circolazione dei dati. (Basta non metterlo a Cipro…) C.A. Carnevale-Maffè – SDA Bocconi 5
  • 41. La nuvola, Banca d’Italia dei Dati • Le banche sono il cloud dei soldi. • Nessuno pensa che sia più razionale tenerli nella propria cassaforte, invece di depositarli in un istituto di credito. • E non è solo sicurezza, è il principio del rendimento della “moneta-dato” • Il cloud, come la Banca Centrale, garantisce la circolarità e la liquidità dei dati C.A. Carnevale-Maffè – SDA Bocconi 6
  • 42. Va’ dove ti porta il cielo… 1. L’Era dei Messaggi, l’Età delle Istanze. Il Cloud come distruzione creativa dei sistemi legacy. 2. Tesoro, mi si sono ristretti i processi. Il workflow si frammenta e si contamina. 3. Uno vale Uno, Nessuno, Centomila. Cambia l’osmosi organizzativa: il “Noi” e il “E' pungente a toccarlo, come un pruno, “Loro” convivono sotto lo o lieve come morbido piumino? stesso cirro. E' tagliente o ben liscio lungo gli orli? La verità, vi prego, sull’Amore.” C.A. Carnevale-Maffè – SDA Bocconi 7
  • 43. Contro le Migrazioni La distruzione creativa dei processi legacy • Un progetto cloud è un volo in mongolfiera. Ci si solleva da terra per asportazione di pesi. • Non si vola tra le nuvole con la zavorra della legacy. • Cogliete l’occasione per spaccare tutto, per buttare tutto, per rifare tutto. Vabbé, almeno qualcosa. • Il problema non è mettere SAP sul cloud. É metterci il business. C.A. Carnevale-Maffè – SDA Bocconi 8
  • 44. Microeconomia dei Cloud Services OGGI… … DOMANI Price S1: Traditional Price Application Silos D3 S3: Cloud P1 Apps + D1 Data+Service s - C1 = P1 x V1 S2: Cloud Applications P2 D2 C2 = P2 x V2 C3M2 Volume V1 + V2 Volume Growing supply of applications, The size of the market will have lower variable costs and lower to grow through barriers to entry and access, “complementarities” increase volumes but drastically (with data, services, and value- added business processes) reduce average prices… Il Cloud è deflatore economico della bolla dei silos applicativi C.A. Carnevale-Maffè – SDA Bocconi 9
  • 45. Il Cloud è Generale (“La guerra è finita”) Il nemico è scappato, è vinto, è battuto •Il Cloud è già mainstream, un po’ come l’ecologia e la pace nel mondo, le energie rinnovabili e la spending review. •Non essere più minoranza va metabolizzato dai digitali non nativi, quelli che vanno in giro con almeno 2 o 3 pennette USB nella borsa. •Quelli nativi, come i pesci, non sanno che cos’è l’Acqua del Cloud. •Dietro la collina non c'è più nessuno, al massimo una smart city, un’agenda digitale già un po’ sgualcita. Queste cinque stelle •Con il Cloud, Internet non è più trastullo di tardoadolescenti garruli, ma diventa movimento & istituzione, organizzazione di lotta e di governo. Prendi un Liquid Feedback, e ci fai una pietra d’inciampo nazionale. C.A. Carnevale-Maffè – SDA Bocconi 10
  • 46. Il dato è come un professore in politica: “sale” sulla nuvola. E poi non scende più • Il Cloud è forza gravitazionale irresistibile, sifone di dati, black hole di processi, polo magnetico delle interazioni. • Il Cloud è sistema simbolico di segnalazione, come lo sono le nuvole nel cielo. Unico segnale evidente all’occhio umano della dinamica dei fluidi nella rotazione terrestre. • Il Cloud scatena fenomeni organizzativi di collaborazione, è il luogo della sharing economy. Che non è buonismo, ma efficienza. C.A. Carnevale-Maffè – SDA Bocconi 11
  • 47. Il Cloud e il ciclo del processo • Cloud come luogo di ibridazione informativa dei processi. • Come l’acqua, il processo evapora per finire sulla nuvola. • E come l’acqua purificata dall’evaporazione poi si contamina con l’atmosfera, così il processo contaminato dall’interoperabilità ricade sulla terra. • A volte come pioggerellina, a volte come grandine. C.A. Carnevale-Maffè – SDA Bocconi 12
  • 48. Uno vale Uno, Nessuno, Centomila. • Il Cloud è la base di un modello organizzativo che ridefinisce le identità professionali. Sulla nuvola, siamo tutti Vitangelo Moscarda. • Mobilità, telelavoro simmetrico (non c’è più differenza di profondità, né asimmetria informativa determinata dal luogo di accesso) • Private/personal: il cloud è invasivo ed evasivo (nel senso di evasione…) • Company/channels: Il cloud è sistema operativo di filiera, non d’azienda • Come l’ERP ha superato le applicazioni dipartimentali, così il cloud supererà quelle aziendali. C.A. Carnevale-Maffè – SDA Bocconi 13
  • 49. E smettete di mandarmi le e-mail. • “Ti ho mandato una email” is the new “Peppa Tencia”. • La PEC è la continuazione del FAX con altri mezzi tecnologici. Una specie di dichiarazione di guerra, consegnata ufficialmente dagli ambasciatori. • Segnalatemi le istanze, sono stufo di fare download. • Fatemi notificare un alert dal daemon di Facebook. • Taggatemi su un contenuto rilevante, fate un retweet, mettete un hashtag. • Ma volete imparare ad usarli per lavorare, ‘sti Social Network? C.A. Carnevale-Maffè – SDA Bocconi 14
  • 50. Perché Mobile & Cloud cambiano i processi economici? A. It’s Yours: Authentication & Billing & App based (not just browser-based) B. It’s Your (Share of) Life (personale e professionale) C. It’s (Native) Social (rete di Persone, non solo rete di Pagine) C.A. Carnevale-Maffè – SDA Bocconi 15
  • 51. Marx & il capitale sulle nuvole • I mezzi di produzione digitali appartengono al popolo (ne avete in tasca almeno uno a testa). • Lavoratori di tutto il mondo, unite i vostri dati (tanto il remote storage su FaceBook o YouTube è gratuito). C.A. Carnevale-Maffè – SDA Bocconi 16
  • 52. Uno spettro si aggira per il data-center • Fine del monopolio delle imprese su: – Produzione – Presidio – Accesso – Distribuzione dei dati digitali C.A. Carnevale-Maffè – SDA Bocconi 17
  • 53. La fine del monopolio sul valore aggiunto L’evoluzione delle “asimmetrie organizzative” 2000-2011 •Arriva la “Rete delle Pagine”: impatto sulle “asimmetrie informative” •Nuove forme di disintermediazione e ri-intermediazione Ma: •Immutata struttura di mercato tra domanda e offerta ? 2012-2020 •Arriva la “Rete delle Persone”: Impatto sulle “asimmetrie organizzative” •Nuove forme di collaborazione/competizione tra domanda e offerta E: •Modifica della struttura di mercato, fine del monopolio aziendale sulla catena del valore aggiunto. C.A. Carnevale-Maffè – SDA Bocconi 18
  • 54. Il contenuto diventa “bastardo” • Perduta la sua integrità originale, nell’attraversare le Nuvole, il contenuto diventa infinitamente ri- editabile e re-intermediabile. Chiunque lo guardi e lo tocchi, lo modifica economicamente. • Il paradosso dei Big Data e la sindrome degli Highlights: sempre meno utenti sono interessati al contenuto originale e integrale, o al dato puntuale e disaggregato, sempre più si accontentano di una sintesi veloce e contestualizzata (e possibilmente gratuita). C.A. Carnevale-Maffè – SDA Bocconi 19
  • 55. Occhio che sul Cloud il cliente mette le mani. Anzi, le dita. §Il Pollice §L’Indice §Il Medio §(L’Anulare…) C.A. Carnevale-Maffè – SDA Bocconi 20
  • 56. Totò & il Dato-Malafemmina • “Nojo..vol-au-vent..savoir…” – Archetipo di interrogazione in linguaggio naturale, sintassi anticipatoria del web semantico • L’informazione, si sa, è ’na malafemmina, a cui l’IT Manager canta sconsolato: – “Te voglio bene e t'odio, nun te pozzo scurdà...” C.A. Carnevale-Maffè – SDA Bocconi 21
  • 57. Liberté, égalité, fraternité… • “Tutti i dati digitali sono liberi, uguali e interdipendenti” C.A. Carnevale-Maffè – SDA Bocconi 22
  • 58. Tutti i dati sono liberi? • Siamo davvero convinti di riuscire a tenerli chiusi nel perimetro aziendale? • Per quanto tempo riusciremo ad invocarne la proprietà intellettuale? C.A. Carnevale-Maffè – SDA Bocconi 23
  • 59. Tutti i dati sono interdipendenti? La missione di Google: “Organize the world's information and make it universally accessible and useful” C.A. Carnevale-Maffè – SDA Bocconi 24
  • 60. Vito Catozzo’s Way • Driver di gestione dei dati digitali secondo IDC: – Security – Compliance – Preservation C.A. Carnevale-Maffè – SDA Bocconi 25
  • 61. Il nuovo centro? E’ in periferia – La produzione e l'accesso a documenti multimediali cresce proporzionalmente di più ai confini dell’impresa, non al centro – Il document management infra- organizzativo è efficiente, ma non intercetta la nuova complessità “ai bordi” dell’impresa – I social media sono il luogo di produzione e di accesso documentale più dinamico e dove i volumi e la complessita di formati crescono esponenzialmente. – I documenti crescono al centro come conseguenza di quello che succede ai bordi. C.A. Carnevale-Maffè – SDA Bocconi 26
  • 62. XaaS? Ad unificare i processi di filiera e di DaaS territorio, tra imprese e PA, tra cittadini e organizzazioni, serve un nuovo strato condiviso. Il DaaS dev’essere ibrido, sia pubblico sia privato, sia aperto sia ad accesso condizionato C.A. Carnevale-Maffè – SDA Bocconi 27
  • 63. Clouds & Weather Forecasts… • Il nuovo mercato del Cloud è “interstiziale” • La sfida è nelle opzioni di interoperabilità dei processi esistenti, non nella migrazione di servizi tradizionali dai server aziendali al Cloud. • La migrazione, in quanto tale, è un “gioco a somma negativa”, perché viene effettuata a un costo medio minore. • Ma il business sarà sempre “on site”: il Cloud è essenzialmente una nuova opportunità di attivare “connecting links” tra processi economici. C.A. Carnevale-Maffè – SDA Bocconi 28
  • 64. Il Cloud, un'arte che si fa "per via di levare" 1. Mercato Pubblico: “Carving out” e ridefinizione dei processi istituzionali del Paese, oggi (mal)gestiti direttamente dalla PA 2. Mercato Privato: Creazione di una “domanda ICT forzosa” tramite processi delle filiere sistemiche localizzate (e.g., tourism, food, logistics) 3. Mercato del lavoro : avvio di modelli di “Crowdsourcing” strutturale per l’aumento della partecipazione al lavoro giovanile e femminile C.A. Carnevale-Maffè – SDA Bocconi 29
  • 65. Il valore ai tempi del colera (digitale) Diritti, standard, linguaggi specialistici e nazionali, asset complementari, esperienza, comportamento associato, etc. SINTASSI • Valore = f ( LATENZA ) Frequenza, sincronicità verticale e orizzontale, sequenzialità, serialità, allertamento, interstizialità, set-up e storage, etc. C.A. Carnevale-Maffè – SDA Bocconi 30
  • 66. L’Advertising? Beyond the Line Circolo Virtuoso Valore Cliente Attention Intention Conversion Relation Totale Advertising Intenzione di Transazione Servizi Post acquisto Experience C.A. Carnevale-Maffè – SDA Bocconi 31
  • 67. Advertising: il valore del tempo e dell’incertezza OGGI DOMANI Attention Future/Stimato Spot/Puntuale Intention (Future)/Attesa Spot/Puntuale Conversion N.A. Spot/Puntuale Relation Opportunistica Strutturale C.A. Carnevale-Maffè – SDA Bocconi 32
  • 68. Internet: lo Hub di un “Mercato Multilaterale” 4 Mercato della comunicazione 4 Mercato Human tra aziende e consumatori: Content Attention: offerta media company fornitrici di Providers sussidiata e/o a servizi pubblicitari/ marketing pagamento all’utente alle aziende finale di contenuti e servizi Communication Content Platform Platform (M1) (M2) Hub Merchants & People & Institutions Communities Relation & Commerce Platform (M3) 4 Mercato degli scambi di beni e servizi tra aziende e consumatori: media company quali intermediari fra aziende e consumatori nella compravendita di beni e servizi C.A. Carnevale-Maffè – SDA Bocconi 33
  • 69. 34 Quale contributo del Cloud al “sistema Paese”? • Modernizzazione, abbattimento delle barriere fisiche, esternalità positive di linguaggio: ¿ Dopo Dante, Manzoni, Mike Buongiorno, …. ¿ La sintassi dell’ICT per la nuova sfida alla costruzione della “nazione economica” O si fa l’Italia (sul Cloud), o si muore C.A. Carnevale-Maffè – SDA Bocconi 34
  • 70. Grazie! Prof. Carlo Alberto Carnevale-Maffè Strategic Managament Dept. Bocconi University- SDA Bocconi School of Management Twitter: @carloalberto Facebook.com/Carloalberto.Carnevale C.A. Carnevale-Maffè – SDA Bocconi 35
  • 71. Cloud Computing Summit L’Italia vista dalla Nuvola Relazione di: Prof. Carlo Alberto Carnevale Maffè Scuola di Direzione Aziendale – Università Bocconi La nuvola è un’istituzione economica, non solo un’infrastruttura tecnologica. E’ laboratorio di innovazione organizzativa, crocevia di scambi informativi, piattaforma di relazioni di business. In questo senso la nuvola è la nuova Unità Economica d’Italia. Tra i cirri del credit crunch e i cumulonembi della recessione, la nuvola di tecnologia all’orizzonte è quindi gravida di novità per le imprese e per il Paese. Le piccole e medie aziende guardano tuttora le innegabili opportunità del cloud con un certo scetticismo, per il timore di vedersi sottratto il controllo dei propri dati o di non poter più disporre di un interlocutore che si prenda la responsabilità del servizio. Si sbagliano. Vediamo perché, in tre semplici passaggi. 1) Il cloud è il modo più sicuro e flessibile per gestire l’ICT nelle piccole e medie imprese. Non solo fa risparmiare, ma contribuisce a crescere. 2) Il mondo delle software house e dei systems integrator che oggi affianca le PMI, lungi dallo scomparire, vede schiudersi un nuovo mercato di integrazione dei processi, oltre il presidio dei tradizionali sistemi IT interni all’azienda. 3) Una volta sul cloud, le PMI vi ritroveranno anche le grandi imprese e la PA, colmando il tradizionale gap infrastrutturale, con applicazioni e informazioni alle quali oggi non hanno accesso. La nuvola non è un offerta speciale per rottamare i server. La nuvola non è un hosting del nostro disordine applicativo, un monte dei pegni delle nostra bigiotteria informatica. La nuvola è uno hub di processi economici interoperabili. L’esempio di Google è lampante. Le foto pubblicate su Picasa dagli utenti sono sì sulla nuvola, ma tramite la geolocalizzazione possono essere viste anche da google maps e street view. Stessa cosa succede
  • 72. per i giudizi degli utenti sui locali pubblici, che non sono chiusi dentro al silos applicativo verticale, ma condivisi. Le piattaforme di accesso autenticato tramite FB, Twitter o G+ sono un altro esempio di come la nuvola consenta l’interoperabilità tra processi e l’ottenimento di grandi effetti di esternalità positiva. Comunque, sia, la nuvola è troppo importante per lasciarla agli ingegneri. La nuvola è meglio di internet. Perché è standard ma non è la giungla dell’anonimato. Perché è interoperabile ma anche difendibile dagli intrusi. Perché ha un servizio garantito e non è best effort, tipo “attendere prego”. Dunque, sopra alle nuvole, il sole? Sì, ma a certe condizioni. Per prima cosa sgombriamo il campo dalle diffuse ma infondate obiezioni sulla sicurezza dei dati. Il cloud è il modo più affidabile e sicuro per conservare e rendere disponibili in ogni momento dati e applicazioni cruciali per le imprese. Le statistiche parlano chiaro: il livello di ridondanza architetturale e di disponibilità reale che offrono i servizi cloud professionali sono nettamente superiori a quelli accessibili a una piccola e media impresa che tiene tutto sul proprio server nello scantinato. Basti una semplice metafora: le banche sono il cloud dei soldi. Nessuna azienda pensa che sia più razionale tenerli nella propria cassaforte e rischiare scassi e furti, invece di depositarli nei forzieri di un istituto di credito. Oltre alla maggiore affidabilità l’altro fattore determinante è la flessibilità e l’economicità d’esercizio. I servizi cloud propongono un percorso ineludibile nell’evoluzione dell’ICT dal ruolo di pura infrastruttura tecnologica a funzione flessibile di servizio nel supportare l’azienda nei repentini cambiamenti e nelle diverse fasi del ciclo economico. Funzionano con un modello di costi su base flessibile, consentendo alle piccole e medie aziende di affrancarsi dall’onere di investimenti al buio. Se a questo si aggiungono la rapidità di implementazione e la flessibilità, non è difficile comprendere come la nuvola meriti il serio interesse dei responsabili IT e degli imprenditori di aziende di ogni settore e dimensione, che vedono in questo modello una valida alternativa per trasformare costi fissi in più maneggevoli costi variabili d’esercizio.
  • 73. Per quanto riguarda l’offerta dei servizi da parte dei systems integrator, va smentita l’idea che il cloud ne cancelli il ruolo. Al contrario, nei Paesi dove il cloud ha già preso piede, si è registrata una crescita di nuove imprese dell’ecosistema ICT. Certamente, alle tradizionali software house la nuvola richiede un’evoluzione dei modelli di relazione e di proposizione nei confronti dei propri clienti, nonché un importante sforzo di educazione relativo agli ambiti di applicazione e alle modalità di valutazione della tecnologia erogata in forma di servizio. Invece che sui tradizionali sistemi IT, i professionisti che affiancano le imprese dovranno focalizzarsi sull’integrazione di processi di business e di nuovi devices, aprendosi al grande scenario della cosiddetta “Internet of Things”, dove l’informatica non mette più in rete solo posti di lavoro, ma ogni elemento fisico di un’organizzazione. Ma l’infrastruttura che serve per far migrare le piccole medie imprese sul cloud richiede uno sforzo congiunto degli operatori, della Pubblica amministrazione e di tutto il Sistema Paese. In altre parole: c’è banda e banda. Un conto è la banda larga per le famiglie, e un altro quella per le imprese. La banda che serve per il cloud professionale deve essere non solo larga, ma stabile, garantita, disponibile e sicura. Il cloud a cosiddetto “best effort”, che non garantisce alcun livello di servizio, va bene al più per i ragazzotti garruli e per le start-up squattrinate. Alle PMI serve un cloud garantito “end-to-end” che connetta affidabilmente i luoghi di lavoro ai data center. Vale ancora l’esempio della banca: se le affidate i gioielli di famiglia, non reagireste bene se vi rispondesse: tornate tra qualche giorno, oggi abbiamo un problema. Per far ripartire il motore ingolfato dell'economia italiana serve dunque aria nuova, d'alta quota, oltre le nebbie della crisi, seguendo i venti dell'innovazione. L’imprenditore che vuole crescere, oggi, ha la testa sulla Nuvola e i piedi ben piantati in terra. I servizi cloud non sono solo un vantaggio economico per la singola impresa o istituzione pubblica, ma consentono di unire tra loro aziende e PA, di collegare processi ora frammentati e incompatibili, di scambiare dati aperti, gli Open Data, in linea con le direttive europee e l'Agenda Digitale Italiana. Sulla nuvola tecnologica dei servizi cloud, l'Italia dell'innovazione si può ritrovare più unita, senza tuttavia doversi uniformare a un unico modello, anzi conservando tutte le sue specificità, ma guadagnando in immediatezza e
  • 74. interoperabilità. Con la nuvola, le imprese e la PA hanno accesso ai migliori servizi disponibili al mondo, ma alla giusta dimensione, pensati per crescere con loro. E insieme, più uniti, far tornare a crescere il Paese.
  • 75. Overview della proposta IBM 22.marzo.2013 Carlo Patrini Information Architect carlo.patrini@it.ibm.com +393357248561 © 2013 IBM Corporation
  • 76. Abbiamo bisogno di acquisire maggiore conoscenza Le esigenze di acquisire maggior conoscenza (insights) sono sempre più necessarie ed urgenti 2 © 2013 IBM Corporation
  • 77. Rispondere a domande.. sempre nuove, sempre urgenti e sempre… strategiche Qual è stata l’ efficacia Come potremmo sfruttare al Vorrei scoprire nuovi della campagna C123 ? meglio i dati storici per segmenti cliente…. capire in anticipo le azioni dei nostri compratori ? Quali prodotti si vendono meglio oggi in Italia? Cosa dicono le persone del nostro nuovo prodotto ? il 91% dei clienti insoddisfatti si rivolgerà ad altri fornitori Cosa dice la gente al nostro servizio Come migliorare la ns customer Call center ? retention ? lIntegrare il Business con la Tecnologia lUtilizzare dati storici e di sintesi – strutturati e non lTrarre il massimo profitto dall'analisi delle informazioni estratte da tutte le fonti disponibili 3 2012 IBM Corporation
  • 78. Il Data Warehouse e la Business Analytics sono un’ottima risposta …sempre sollecitata dal mercato che chiede.. • Volumi più elevati • Più elevata qualità dei dati • Maggior controllo sul processo Reporting •e soprattutto maggior SEMPLICITA Analysis AUTONOMIA e PERFORMANCE Predictive Analytics •……. Master Data Management Cubi Fonti Data dati da Warehouse sistemi ETL gestionali Data Integration Data Quality Data Delivery 4 2012 IBM Corporation
  • 79. DWH più snelli, veloci e reattivi … l’appliance DWH è la soluzione Il DWH è fondamentale però a volte è lento e troppo Mumble ingessato e non evolve con i tempi del business .. mumble…. la soluzione è IBM Netezza 5 © 2013 IBM Corporation
  • 80. E il business è interessato ad acquisire info che vanno oltre la transazione Fail Fail Fail Yes! Fail Fail Fail Fail Fail Fail Fail Fail Fail Inizio Fail Fine processo acquisto Fail processo acquisto Fail Albero Il DWH generalmente traccia la transazione decisionale finale, quella conclusiva. del Per “leggere” meglio il processo di acquisto serve processo conoscere anche il resto di acquisto 6 2012 IBM Corporation
  • 81. Big Data: il nuovo oceano dei dati I dati sotto la superficie ancora inesplorati 12+ terabytes 30 miliardi di Tweets Sensori, RFID, altri device al giorno che generano dati in streaming Volume Velocità Varietà Veridicità 100’s Solo 1 su 3 Di tipi dati diversi Utenti di business ritiene di avere informazioni affidabili 7 7 © 2013 IBM Corporation
  • 82. La conoscenza è contenuta anche in fonti non convenzionali …perchè ignorarle? 25Tb Facebook /giorno q Il Business necessita di gestire ed usare in modo massivo una quantità sempre crescente di informazioni non convenzionali e generalmente create all’esterno delle organizzazioni aziendali q La maggior parte di queste informazioni non convenzionali, sono semistrutturate o completamente destrutturate q Le organizzazioni soffrono se non possono acquisire la conoscenza contenuta nelle informazioni di business Ø I sistemi tradizionali analizzano solo dati strutturati Ø Il mancante 80% è costituito da informazioni non strutturate o semi strutturate (Gartner). 200k twitter al minuto Big Data 290 milioni twitter anno 12Tb twitter/giorno 8 2012 IBM Corporation
  • 83. Quando si parla di “data explosion” 83x 6,000,000 users on Twitter 500,000,000 users on Twitter pushing out 300,000 pushing out 400,000,000 tweets per day tweets per day 1333x 9 2012 IBM Corporation
  • 84. Approccio Tradizionale e Approccio Big Data 10 2012 IBM Corporation
  • 85. BIG DATA Stato dell’arte 11 2012 IBM Corporation
  • 86. Which is the State-of-The-Art? >1100 Business Managers >200 CIOs IBM and the Saïd Business School (on Global Scale) and SDA Bocconi University (on local Scale) partnered to benchmark global big data activities 12 www.ibm.com/2012bigdatastudy 12
  • 87. Big Data: lo stato dell’arte 1 Customer analytics are driving big data initiatives Big data is dependent upon a scalable and extensible 2 information foundation Initial big data efforts are focused on gaining insights 3 from existing and new sources of internal data 4 Big data requires strong analytics capabilities The emerging pattern of big data adoption is 5 focused upon delivering measureable business value IBM e Saïd Business School (Università di Oxford – ricerca globale) e Università SDA Bocconi (Italia) hanno collaborato per un benchmark sulle iniziative Big Data 13
  • 88. Key Findings: Big Data Activities >1000 Business Managers 24% 47% 28% Have Not Begun Big Data Planning Big Data Pilot & Implementation of Activities Activities Big Data Activities 25% 57% 18% >200 CIOs 14
  • 89. IBM Big Data Platform & Ecosystem IBM SOCIAL MEDIA ANALYTICS IBM CONTENT ANALYTICS Out-of-the-Box Social Analytics Out-of-the-Box Text analytics 6 Environment Open environment with Enterprise Search 5 Analytic Applications INFOSPHERE BI / Exploration / Functional Industry Predictive Content DATA EXPLORER Reporting Visualization App App Analytics Analytics BI / PURE DATA for Analytics Reporting (VIVISIMO) (NETEZZA) IBM Big Data Platform 2 4 4 Visualization Application Systems – Optimized Very Large – Search (and federate & Discovery Development Management Data Warehousing data) in a big data context Accelerators Hadoop Stream Data INFOSPHERE INFOSPHERE System Computing Warehouse STREAMS BIGINSIGHTS 3 1 – Analyse large 1 – Analyse large structured and structured and unstructured data set in unstructured data sets Information Integration & Governance streaming 15
  • 90. Il Data Warehouse e la Business Analytics…. ben si integrano con la BIG DATA platform 1 IBM InfoSphere BigInsights 6 Cognos 5 External Source Systems Applications Structured, Semi Structured/ Unstructured Data Spreadsheets 4 Sensors IBM Vivisimo Data Warehouse 2 Master Data Management Cubi Netezza ETL Data Integration 3 Data Quality IBM InfoSphere Streams Data Delivery 16 2012 IBM Corporation
  • 91. L’ecosistema Big Data : la chiave è l’interoperabilità Traditional / Relational Traditional Warehouse Data Sources Data Analytics on Warehouse Structured Data Non-Traditional / Non-Relational Streaming Data Sources Data InfoSphere Analytics on Streams Data In-Motion Non-Traditional/ Non-Relational Data Sources Internet-Scale Data Sets Traditional/Relational InfoSphere Analytics on BigInsights Data at Rest Data Sources 17 2012 IBM Corporation
  • 92. La piattaforma IBM Big Data: La nuova frontiera di Analisi Data Ingest 01011001100011101001001001001 100100100110100101010011100101001111001000100100010010001000100101 11000100101001001011001001010 01100100101001001010100010010 01100100101001001010100010010 11000100101001001011001001010 01100100101001001010100010010 Arricchire 01100100101001001010100010010 Analisi Real Time 01100100101001001010100010010 01100100101001001010100010010 11000100101001001011001001010 01100100101001001010100010010 01100100101001001010100010010 01100100101001001010100010010 Modello 01100100101001001010100010010 01100100101001001010100010010 Analitico 11000100101001001011001001010 01100100101001001010100010010 Adattivo 01100100101001001010100010010 01100100101001001010100010010 11000100101001001011001001010 18 18
  • 93. Analisi Tradizionale estesa ai Big Data 1 Pre-Processing Hub 2 Query-able Archive 3 Exploratory Analysis Data Explorer Combinare dati strutturati con Data Explorer non strutturati BigInsight Find and view Streams BigInsight BigInsight Streams Information Information Information Server Server Server Data Data Data Warehouse Warehouse Warehouse 19 19 © 2013 IBM Corporation
  • 94. Applicazioni Big Data q Analisi cosa si dice sui Social Media di un argomento q Analisi messaggi Call Center q Analisi dei LOG. q Identificazione delle frodi. q Ricercare dati attraverso un motore federato q Analisi di dati provenienti da sensori q ........ Si ricorre ad una soluzione Big Data, ad esempio, quando: - risulta necessario analizzare TUTTI i dati potenzialmente disponibili e quando l’elaborazione di un loro campione non sarebbe significativa e in grado di fornire risultati efficaci. - si vuole ESPLORARE, anche in modo interattivo, i dati disponibili nei casi in cui le misure e gli indicatori di business non siano predeterminati. - occorre analizzare un FLUSSO CONTINUO ed ampio di dati per prendere decisioni in tempo reale Il fenomeno Big Data non è legato ad un particolare settore di industria fa leva sulla crescita del volume dei dati e su ulteriori dimensioni come la Velocità e la Varietà dei dati disponibili. 20
  • 95. Biginsights per elaborare in Vestas optimizes modo molto veloce Petabytes di dati capital investments based on 2.5 Petabytes of information. § Model the weather to optimize placement of turbines, maximizing power generation and longevity. § Reduce time required to identify placement of turbine from weeks to hours. § Incorporate 2.5 PB of structured and semi- structured information flows. Data volume expected to grow to 6 PB. 21 21 2012 IBM Corporation
  • 96. Infosphere Streams e Cisco turns to IBM big Biginsights data for intelligent per la gestione degli ambienti infrastructure management. § Optimize building energy consumption with centralized monitoring and control of building monitoring system. § Automates preventive and corrective maintenance of building systems. § Uses Streams, InfoSphere BigInsights and Cognos § Log Analytics § Energy Bill Forecasting § Energy consumption optimization § Detection of anomalous usage 22 22 § Presence-aware energy mgt. 22 2012 IBM Corporation § Policy enforcement
  • 97. Infosphere Streams nel campo medico Big Data enabled doctors from University of Ontario to apply neonatal infant monitoring to predict infection in ICU 24 hours in advance IBM Data Baby youtube.com 23 23 2012 IBM Corporation
  • 98. Infosphere Streams per la Dublin City Centre Increases ottimizzazione del traffico Bus Transportation Performance Capabilities Utilized: Stream Computing • Public transportation awareness solution improves on-time performance and provides real-time bus arrival info to riders • Continuously analyzes bus location data to infer traffic conditions and predict arrivals • Collects, processes, and visualizes location data of all bus vehicles • Automatically generates transportation routes and stop locations Results: • Monitoring 600 buses across 150 routes • Analyzing 50 bus locations per second • Anticipated to Increase bus ridership 24 24 2012 IBM Corporation 24
  • 99. CUSTOMER Analytics – GRUPO BBVA seamlessly monitors and improves its online reputation . - Enables BBVA to consistently respond to and gain insight into customer needs and feedback. “What is great about this solution is that it helps - Gives BBVA the ability to measure the success of its outputs us to focus our actions on the most important and approaches to engaging stakeholders and customers. topics of online discussions and immediately plan the - Shows whether positive or negative sentiments have correct and most increased or not, looks for the source and reason of suitable reaction.” – Online Communication comments and helps make decisions and plans. Department, BBVA Behavioral Data 25
  • 100. CUSTOMER Analytics – MEDIASET . Social Analytics to collect Customer longitudinal point of views from Web 2.0 and correlate them with internal data “Big Data is a great opportunity for TV innovation in the next Better understand its marketing campaigns and consumer years. TV viewing is preferences, transforming into a multiplatform and participative experience: Looking for ways to analyze and differentiate consumer the better we know and experiences understand our viewers, the better we can serve them." – Valerio Motti, Helped the client to assess the company’s corporate brands, Head of Marketing with respect to one of its main pay-TV competitors Innovation, Mediaset S.p.A. Trandational Data Behavioral Data 26 26
  • 101. VIVISIMO – referenze 27 2012 IBM Corporation
  • 102. CASE History 28 2012 IBM Corporation
  • 103. SUCCESS STORIES : tra le varie fonti…. eccone due LINK PDF File Ricorda : Recuperare link che contiene questo doc 29 2012 IBM Corporation
  • 104. LINK UTILI 30 2012 IBM Corporation
  • 105. BIG Data : alcuni utili link Big Data HUB & Success Stories http://www.ibmbigdatahub.com/ Big Data University http://bigdatauniversity.com/ BigInsights tec enablement wiki https://www.ibm.com/developerworks/mydeveloperworks/wi kis/home?lang=en_US#/wiki/BigInsights FREE ebook – Harness the power of BigData http://www.ibmbigdatahub.com/blog/research-director-reflects- new-big-data-book 31 2012 IBM Corporation
  • 106. Mi fermo qui…. grazie per la pazienza 32 32 © 2013 IBM Corporation
  • 107. HADOOP & BIGINSIGHTS 33 2012 IBM Corporation
  • 108. Biginsights basato su Hadoop ….. perchè ? CPU istruzioni al secondo – miglioramenti significativi 1990 44 Mips at 40 Mhz 2000 3.562 Mips at 1.2 Ghz 2010 147.600 Mips at 3.3 Ghz RAM Memory - miglioramenti significativi – 1990 640 K – 2000 64 Mb – 2010 8-32 GB Disk capacity - miglioramenti significativi – 1990 20 MB – 2000 10 GB – 2010 1 TB Disk latency (velocità di leggere e scrivere su disco ) - miglioramenti poco significativi Negli ultimi 7-10 anni non ci sono state enormi migliorie correntemente la velocita è di circa 70 – 80 MB / sec 34 2012 IBM Corporation
  • 109. Quanto tempo ci vuole per scandire 1 TB ? q 1 TB (at 80 MB / sec) – 1 disk 3.4 hours – 10 disks 20 min – 100 disks 2 min – 1000 disks 12 sec q Per ovviare alla Disc Latency la risposta è la ..elaborazione parallela q Hadoop : un nuovo modo per memorizzare ed elaborare i dati ØScritto in Java ØProgettato per lavorare su hardware non specializzato ØGira in ambiente Linux ØScalabile, Flessibile,Robusto 35 2012 IBM Corporation
  • 110. What is Hadoop? § Apache Hadoop = free, open source framework for data- intensive applications – Inspired by Google technologies (MapReduce, GFS) – Yahoo has been the largest contributor to the project (Doug Cutting), – Well-suited to batch-oriented, read-intensive applications – Originally built to address scalability problems of Nutch, an open source Web search technology § Enables applications to work with thousands of nodes and petabytes of data in a highly parallel, cost effective manner – CPU + disks of commodity box = Hadoop “node” – Boxes can be combined into clusters – New nodes can be added as needed without changing • Data formats • How data is loaded • How jobs are written 36 2012 IBM Corporation
  • 111. Two Key Aspects of Hadoop § MapReduce framework – MapReduce is a software framework introduced by Google to support distributed computing on large data sets of clusters of computers. – How Hadoop understands and assigns work to the nodes (machines) § Hadoop Distributed File System = HDFS – Where Hadoop stores data – A file system that spans all the nodes in a Hadoop cluster – It links together the file systems on many local nodes to make them into one big file system 37 2012 IBM Corporation
  • 112. Hadoop ed il paradigma Map Reduce §I dati sono memorizzati su un sistema distribuito di server §Le funzioni elaborative vengono inviate dove ci sono I dati §Ogni server elabora I dati di propria competenza e condivide i risultati §Il sistema può scalare raggiungendo migliaia di nodi e PB di dati public static class TokenizerMapper public static class TokenizerMapper Hadoop Data Nodes extends Mapper<Object,Text,Text,IntWritable> {{ extends Mapper<Object,Text,Text,IntWritable> private final static IntWritable private final static IntWritable one == new IntWritable(1); one new IntWritable(1); private Text word == new Text(); private Text word new Text(); public void map(Object key, Text val, Context public void map(Object key, Text val, Context StringTokenizer itr == StringTokenizer itr new StringTokenizer(val.toString()); new StringTokenizer(val.toString()); while (itr.hasMoreTokens()) {{ while (itr.hasMoreTokens()) word.set(itr.nextToken()); word.set(itr.nextToken()); context.write(word, one); context.write(word, one); }} 1. Map Phase (spezza il job in piccole parti) }} }} public static class IntSumReducer 2. Shuffle public static class IntSumReducer extends Reducer<Text,IntWritable,Text,IntWrita extends Reducer<Text,IntWritable,Text,IntWrita Distribute map private IntWritable result == new IntWritable(); private IntWritable result new IntWritable(); public void reduce(Text key, public void reduce(Text key, Iterable<IntWritable> val, Context context){ Iterable<IntWritable> val, Context context){ int sum == 0; int sum 0; for (IntWritable vv :: val) {{ tasks to cluster (riordina I risultati parziali per for (IntWritable val) sum += v.get(); sum += v.get(); .. .. .. le elaborazione finale) 3. Reduce Phase (rielabora il tutto per ottenere MapReduce Application un singolo risultato) Shuffle Result Set Return a single result set 38 2012 IBM Corporation
  • 113. BigInsights estende le capabilities di Hadoop open source con l’aggiunta di nuove funzionalità …. InfoSphere BigInsights Advanced Engines Development Tools Analytic Applications Enterprise Indexing BI / Exploration / Functional Industry Predictive Content capabilities Reporting Visualization App App BI / Analytics Analytics Report Connectors ing IBM Big Data Platform Visualization Application Systems Workload Optimization & Discovery Development Management Administration & Security Accelerators Hadoop Stream Data System Computing Warehouse Open source IBM tested & supported based open source components Information Integration & Governance components 39 2012 IBM Corporation
  • 114. Infosphere BigInsights : due edizioni Con BigInsights le aziende possono indirizzare l’ elaborazione di enormi quantità di dati mai prima sfruttate e ricavare nuova conoscenza in modo efficiente, ottimizzato e scalabile. Tale infrastruttura sfrutta il MapReduce framework di Hadoop per affrontare l’elaborazione parallela di grandi insiemi di dati distribuiti su numerosi nodi. 40 40 2012 IBM Corporation
  • 115. Infosphere BigInsights : due edizioni Enterprise Edition GPFS-SNC Native Support* Spreadsheet-style data exploration Job and Workflow Management Productivity and Efficiency Improvements Integration with InfoSphere Warehouse Integration with Netezza Integration with DB2 Large Scale Indexing Basic Edition Text Analytics Machine Learning* Free Download, Easy Installation Tiered Terabyte Pricing 24x7 Web Support, 10TB Limit Paid Support Option * = coming soon 41
  • 116. Biginsights on Cloud 42 2012 IBM Corporation
  • 117. IBM BigInsights on Cloud Hadoop for everyone 43 2012 IBM Corporation
  • 118. Infosphere Streams 44 2012 IBM Corporation
  • 119. Infosphere Streams InfoSphere Streams dispone di un’infrastruttura software agile e scalabile per l’analisi in tempo reale di enormi flussi di dati in movimento, di qualsiasi natura e provenienti da innumerevoli sorgenti. Tale tipo di elaborazione aumenta la precisione e la velocità del processo decisionale in diversi campi come quelli sanitario, astronomico, manifatturiero, finanziario e molti altri ancora. 45 2012 IBM Corporation
  • 120. Categories of Problems Solved by Streams § Applications that require on-the-fly processing, filtering and analysis of streaming data – Sensors: environmental, industrial, surveillance video, GPS, … – “Data exhaust”: network/system/web server/app server log files – High-rate transaction data: financial transactions, call detail records § Criteria: two or more of the following – Messages are processed in isolation or in limited data windows – Sources include non-traditional data (spatial, imagery, text, …) – Sources vary in connection methods, data rates, and processing requirements, presenting integration challenges – Data rates/volumes require the resources of multiple processing nodes – Analysis and response are needed with sub-millisecond latency – Data rates and volumes are too great for store-and-mine approaches 46 2012 IBM Corporation
  • 121. Elaborazione real time time con infosphere streams à continuous ingestion infrastructure provides services for scheduling analytics across h/w nodes à continuous analysis establishing streaming connectivity … Filter Transform Annotate Correlate Classify achieve scale by partitioning applications into components 47 by distributing across stream-connected hardware nodes 2012 IBM Corporation
  • 122. Infosphere Data Explorer (ex VIVISIMO) 48 2012 IBM Corporation
  • 123. Vivisimo e la sua missione Aiuta le organizzazioni a scoprire, organizzare, analizzare e navigare grandi quantità di dati eterogenei e dinamici, sia strutturati che destrutturati, indipendentemente da dove siano gestiti o storicizzati, per incrementare l’efficienza ed il valore nei processi di business. 49 2012 IBM Corporation
  • 124. Vivisimo nell’azienda Relational Data § Garantire l'accesso a numerose applicazioni e archivi dati File Systems § Scoprire e navigare all’interno di Content Management tutta l’azienda § Fondere informazioni strutturate Email Velocity Platform e non strutturate per guidare l’azienda verso: CRM Application/ – Migliori decisioni Users Supply – Operazioni più efficienti Chain – Migliore comprensione dei clienti ERP – Innovazione Commenting RSS Feeds § Strumenti Social per la Tagging collaborazione ed il riutilizzo Rating Cloud Shared Custom Folders Sources Social Tools External Sources 50 2012 IBM Corporation
  • 125. Vivisimo ricerca federata 51 51 2012 IBM Corporation
  • 126. Vivisimo architettura User Profiles Application SDK Federated Sources Authentication/Authorization Query transformation Personalization Display Subscriptions Feeds Web Results Text Analytics Meta-Data Search Engine Thesauri Faceting Clustering BI Ontology Support Tagging Semantic Processing Taxonomy Entity Extraction Collaboration Relevancy Connector Framework CM, RM, DM RDBMS Feeds Web 2.0 Email Web CRM, ERP File Systems 52 2012 IBM Corporation
  • 127. CUSTOMER Analytics esempi.. 53 2012 IBM Corporation
  • 128. CUSTOMER Analytics - alcuni esempi .. Deeper Customer Analytics Examples and Best Practice and leverage Big Data: Ready for Business Behavioral Data Connect with Clients & prospects, with Brands ...analyse strong and weak Delight customers with targeted signals in discussion ….social and transactional propositions You Real time interaction Interaction Data across channels Transaction Interact! Data Single view Business Data, Social Data, Interactive data Enterprise Systems 54
  • 129. CUSTOMER Analytics – MOBY Lines . Digital marketing optimization: lifetime individual tracking, microsegmentation, channel attribution, proposition automation Intuitive Social collection Digital & Multichannel Marketing / individual digital analytics, real time Single view Business Data, monitoring, I/O ERP data, Social Data, Interactive data dynamic segments, mkt. automation 55 Enterprise Systems
  • 130. CUSTOMER Analytics – GARANTY bank – un filmato.. Garanty Real time interaction across channels Single view Business Data, Social Data, Interactive data 56
  • 131. Copyright © 2013 Splunk, Inc. Splunking Big Data Michele Guglielmo – Territory Manager Italy