SlideShare uma empresa Scribd logo
1 de 37
Baixar para ler offline
Big Data

                   Détails d’une mise en œuvre
Hervé Desaunois
 Responsable IT
Méthodologie    Cas d’utilisation Valtech




Architecture!   Tendance Big Data
Sommaire

Méthodologie


      Ò  Présentation
      Ò  Cas d’utilisation
      Ò  Architecture
      Ò  Cas Pratique
      Ò  Conclusion
      Ò  Références
      Ò  Annexes




                              3
Big Data / Méthodologie


La mise en place d’une démarche Big Data est toujours
composée de trois étapes :

   Ò  Collecter, stocker les données.

   Ò  Analyser, explorer, corréler, agréger les données.

   Ò  Visualiser, exploiter.
Architecture
Architecture Big Data
                                                                BUSINESS
 LES DONNEES
  COLLECTER




                                Audio,      Docs,                       Social,        Capteurs,
                                                        Web logs,                                   Spatial,
                                Vidéo,      Texte,                      Graphs,         Graphs,                      Autres
                                                         Clicks,                                     GPS
                                Image        XML                         RSS,            RSS,
   STOCKAGE & ORGANISATION




                                    Base de données                 Distributed File
                                    Orientée colonne                                                 Base de
                                                                        System
                                         NoSQL                                                     données SQL
   EXTRACTION




                                                       Map Reduce                                              SQL
VISUALISER

ANALYSER




                                           Analytiques , Business Intelligent
    &
Architecture Big Data
                                                                BUSINESS
 LES DONNEES
  COLLECTER




                                Audio,       Docs,                      Social,      Capteurs,
                                                        Web logs,                                 Spatial,
                                Vidéo,       Texte,                     Graphs,       Graphs,                      Autres
                                                         Clicks,                                   GPS
                                Image         XML                        RSS,          RSS,
   STOCKAGE & ORGANISATION




                                    HBase, Big Table,               HDFS, GFS, S3,
                                      Cassandra,                                                 Oracle, DB2,
                                                                          …
                                     DynamoDB, …                                                  MySQL, …
   EXTRACTION




                                                                                                             SQL
VISUALISER

ANALYSER
    &
Cas d’utilisation Valtech eReputation
Sommaire

Itération I


        Ò  Présentation
        Ò  Cas d’utilisation
        Ò  Architecture
        Ò  Cas Pratique
        Ò  Conclusion
        Ò  Références
        Ò  Annexes




                                9
Cas d’utilisation Valtech eReputation

                        ERM
                     MapReduce




                S3
  DynamoDB



                                 eReputation
                                   Server




                                                Histogramme
                                               Client RIA GWT
Collecter les données


             Connecteurs Web Service




   Web Service / Rest      Web Service / Rest    Web Service / Rest
Google Custom Search API   Twitter Search API   Facebook Search API
Stockage


     Base de données Orientée
             Colonne
Organisation




   Modèle de données – Attributs, éléments et tables
Organisation




  Modèle de données – Attributs, éléments et tables
Extraction



      Amazon Elastic MapReduce
Analyser


    Stocker les réponses sur S3
Analyser


  Visualisation du résultat sur S3
Visualiser

             Client RIA GWT
Démo eReputation Valtech
BIG DATA Complexité




 Big Data                                         Big Data
                                              Self Intelligent ?



                                                Data
                                              Scientist


            Big Data + Business Intelligent = ROI
Sommaire

Itération II


        Ò  Présentation
        Ò  Cas d’utilisation
        Ò  Architecture
        Ò  Cas Pratique
        Ò  Conclusion
        Ò  Références
        Ò  Annexes




                                21
Cas d’utilisation Valtech eReputation

                         MapReduce




                                       New
                                      SaaS

                    S3
  DynamoDB

                                                   New
                                     eReputation
                                       Server




New           New
Aujourd'hui

• Volumes de données importants (Tera, Peta, ..)

• De l’infiniment petit (génomique) à l’infiniment grand (astrophysique)

• Du plus quotidien (reconnaissance de l’écriture manuscrite sur les enveloppes) au
moins quotidien (aide au pilotage aéronautique)

• Du plus ouvert (e-commerce) au plus sécuritaire (détection de la fraude dans la
téléphonie mobile ou les cartes bancaires)

• Du plus industriel (contrôle qualité…) au plus théorique (sciences humaines,
biologie…)

• Du plus alimentaire (agronomie et agroalimentaire) au plus divertissant (prévisions
d’audience TV)

• Systèmes d’aide à la décision plus ou moins automatiques


                                              © Stéphane Tufféry
Machine Learning



  L'apprentissage automatique (machine learning en
  anglais), un des champs d'étude de l'intelligence artificielle,
  est la discipline scientifique concernée par le développement,
  l'analyse et l'implémentation de méthodes automatisables qui
  permettent à une machine (au sens large) d'évoluer grâce à
  un processus d'apprentissage, et ainsi de remplir des tâches
  qu'il est difficile ou impossible de remplir par des
  moyens algorithmiques plus classiques.
Analyse - Algorithme Machine Learning




   Recommandation

   Classification
   Cluster
Analyse sémantique



 Natural Language Processing




                  Utilisation d’une solution
                              de
     ”Catégorisation de document – Machine learning”
Analyse sémantique


   Natural Language Processing

Catégorisation : Expertise java

Ò  26 mai 2008 – Grâce à son expertise Java, Valtech Technology s'associe avec
    Talend pour améliorer l'agilité des systèmes d'information de ses clients.
Ò  Cédric Bertrand, Consultant confirmé JAVA/J2EE, Valtech de Paris (Ile-de-France).
Ò  Valtech Agency propose une triple maîtrise dans les domaines du conseil, ... Des
    compétences de développement Java, ..
Ò  Valtech: conseil en management, en technologies. Conseil et projets ebusiness,
    agence web, Offshore, Formation nouvelles technologies, objet, Java EE
Ò  Au travers du déroulement itératif d'un projet, vous utiliserez des techniques moins
    connues de programmation Java comme la gestion poussée des Threads
Analyser


       Algorithme de clusters
              K-Means
Data Scientist



     L’intelligence des données
     Web Mining & Text Mining
Analyser -

       Algorithme Data Mining
Tendance Big Data
Gartner talk

« D'ici 2015, 4,4 millions d'emplois informatiques seront créés dans
le monde pour soutenir le Big Data, dont 1,9 millions aux Etat-
Unis », a déclaré Peter Sondergaard, senior vice-président et
responsable mondial de la recherche chez Gartner.




                      Wanted
                   « Data Scientist »
                  100 000 to 500 000 $
Valtech Web Scientiste



     L’intelligence des données
     Web Mining & Text Mining
Big Data tendance Cloud
Big Data full solution
Thank you
Tarification!


Ò  ERM :
    http://aws.amazon.com/fr/elasticmapreduce/#pricing
Ò  DynamoDB :
    http://aws.amazon.com/fr/dynamodb/#pricing
Ò  S3 : http://aws.amazon.com/fr/s3/pricing/
Ò  EC2 : http://aws.amazon.com/fr/ec2/pricing/

Mais conteúdo relacionado

Mais procurados

Introduction à la big data V2
Introduction à la big data V2Introduction à la big data V2
Introduction à la big data V2Mehdi TAZI
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusCHAKER ALLAOUI
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Aleph Technologies
 
Le Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’AssuranceLe Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’AssuranceAbdessatar Hammedi
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data TalendJean-Michel Franco
 
Conférence "le big data en entreprise" de René Lefébure lors de l'évènement D...
Conférence "le big data en entreprise" de René Lefébure lors de l'évènement D...Conférence "le big data en entreprise" de René Lefébure lors de l'évènement D...
Conférence "le big data en entreprise" de René Lefébure lors de l'évènement D...Aurélien Malo
 
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...Jean-Pierre Riehl
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesKezhan SHI
 
Big Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache HadoopBig Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache Hadoophajlaoui jaleleddine
 
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceHélène Etienne
 
#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big DataNetSecure Day
 
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Jean-Michel Franco
 
Big Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesBig Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesHassan Lâasri
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applicationsAffinity Engine
 
Meetup intro techno big data
Meetup intro techno big dataMeetup intro techno big data
Meetup intro techno big dataRomain Jouin
 
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataAzure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataMicrosoft
 

Mais procurados (20)

Introduction à la big data V2
Introduction à la big data V2Introduction à la big data V2
Introduction à la big data V2
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processus
 
Introduction au BIG DATA
Introduction au BIG DATAIntroduction au BIG DATA
Introduction au BIG DATA
 
Chapitre i-intro
Chapitre i-introChapitre i-intro
Chapitre i-intro
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.
 
Le Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’AssuranceLe Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’Assurance
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
Conférence "le big data en entreprise" de René Lefébure lors de l'évènement D...
Conférence "le big data en entreprise" de René Lefébure lors de l'évènement D...Conférence "le big data en entreprise" de René Lefébure lors de l'évènement D...
Conférence "le big data en entreprise" de René Lefébure lors de l'évènement D...
 
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
 
Conférence big data
Conférence big dataConférence big data
Conférence big data
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuaires
 
Big Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache HadoopBig Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache Hadoop
 
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligence
 
#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data
 
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
 
Big Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesBig Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologies
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applications
 
Meetup intro techno big data
Meetup intro techno big dataMeetup intro techno big data
Meetup intro techno big data
 
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataAzure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
 
Cours Big Data Part I
Cours Big Data Part ICours Big Data Part I
Cours Big Data Part I
 

Destaque

Ergonomie des sites internet touristique
Ergonomie des sites internet touristiqueErgonomie des sites internet touristique
Ergonomie des sites internet touristiqueUNITEC
 
Cp volcan trinidad & tobago
Cp volcan trinidad & tobagoCp volcan trinidad & tobago
Cp volcan trinidad & tobagoJoseph Nodin
 
AAP Végétalisation Innovante_Projets Agriculture Urbaine
AAP Végétalisation Innovante_Projets Agriculture UrbaineAAP Végétalisation Innovante_Projets Agriculture Urbaine
AAP Végétalisation Innovante_Projets Agriculture UrbaineSRPRL
 
One resultats 2011-2012-press_opt
One resultats 2011-2012-press_optOne resultats 2011-2012-press_opt
One resultats 2011-2012-press_opt366
 
Le métier insolite - Photographe sous-marin
Le métier insolite - Photographe sous-marinLe métier insolite - Photographe sous-marin
Le métier insolite - Photographe sous-marinevilagines
 
DRONE VOLT Euronext Capital.fr Avril2015
DRONE VOLT   Euronext Capital.fr Avril2015DRONE VOLT   Euronext Capital.fr Avril2015
DRONE VOLT Euronext Capital.fr Avril2015Jerome Marsac
 
DroneFest au FabLab Festival
DroneFest au FabLab FestivalDroneFest au FabLab Festival
DroneFest au FabLab FestivalDrone Fest
 
Témoignage SI PME e-Commerce
Témoignage SI PME e-CommerceTémoignage SI PME e-Commerce
Témoignage SI PME e-CommerceCYB@RDECHE
 
Cp ecole des metiers du drone pixiel-13 avril2015[1]
Cp ecole des metiers du drone pixiel-13 avril2015[1]Cp ecole des metiers du drone pixiel-13 avril2015[1]
Cp ecole des metiers du drone pixiel-13 avril2015[1]Esperluette & Associés
 
Sous-marin nucléaire lanceur d'engins
Sous-marin nucléaire lanceur d'enginsSous-marin nucléaire lanceur d'engins
Sous-marin nucléaire lanceur d'enginsjufanch
 
Drone Hacking - Qualitek Security Day 2014
Drone Hacking - Qualitek Security Day 2014Drone Hacking - Qualitek Security Day 2014
Drone Hacking - Qualitek Security Day 2014Eduardo Barros Santos
 
D'autres modèles d'accès ouvert sont possibles | Marin Dacos, Paris, 23 jan...
D'autres modèles d'accès ouvert sont possibles | Marin Dacos, Paris, 23 jan...D'autres modèles d'accès ouvert sont possibles | Marin Dacos, Paris, 23 jan...
D'autres modèles d'accès ouvert sont possibles | Marin Dacos, Paris, 23 jan...OpenEdition
 
Le projet ECO et les MOOCs français du projet
Le projet ECO et les MOOCs français du projetLe projet ECO et les MOOCs français du projet
Le projet ECO et les MOOCs français du projetAdeline Bossu
 
La médiation du patrimoine sous-marin
La médiation du patrimoine sous-marinLa médiation du patrimoine sous-marin
La médiation du patrimoine sous-marincirili_web
 
Interação além da tela: design de aplicações para as próximas gerações (JATIC)
Interação além da tela: design de aplicações para as próximas gerações� (JATIC)Interação além da tela: design de aplicações para as próximas gerações� (JATIC)
Interação além da tela: design de aplicações para as próximas gerações (JATIC)Tatiana Tavares
 
AdWords Updates der letzten 12 Monate
AdWords Updates der letzten 12 MonateAdWords Updates der letzten 12 Monate
AdWords Updates der letzten 12 Monatemarc hoeft
 

Destaque (20)

Ergonomie des sites internet touristique
Ergonomie des sites internet touristiqueErgonomie des sites internet touristique
Ergonomie des sites internet touristique
 
Cp volcan trinidad & tobago
Cp volcan trinidad & tobagoCp volcan trinidad & tobago
Cp volcan trinidad & tobago
 
AAP Végétalisation Innovante_Projets Agriculture Urbaine
AAP Végétalisation Innovante_Projets Agriculture UrbaineAAP Végétalisation Innovante_Projets Agriculture Urbaine
AAP Végétalisation Innovante_Projets Agriculture Urbaine
 
One resultats 2011-2012-press_opt
One resultats 2011-2012-press_optOne resultats 2011-2012-press_opt
One resultats 2011-2012-press_opt
 
Le métier insolite - Photographe sous-marin
Le métier insolite - Photographe sous-marinLe métier insolite - Photographe sous-marin
Le métier insolite - Photographe sous-marin
 
DRONE VOLT Euronext Capital.fr Avril2015
DRONE VOLT   Euronext Capital.fr Avril2015DRONE VOLT   Euronext Capital.fr Avril2015
DRONE VOLT Euronext Capital.fr Avril2015
 
DroneFest au FabLab Festival
DroneFest au FabLab FestivalDroneFest au FabLab Festival
DroneFest au FabLab Festival
 
Témoignage SI PME e-Commerce
Témoignage SI PME e-CommerceTémoignage SI PME e-Commerce
Témoignage SI PME e-Commerce
 
Cp ecole des metiers du drone pixiel-13 avril2015[1]
Cp ecole des metiers du drone pixiel-13 avril2015[1]Cp ecole des metiers du drone pixiel-13 avril2015[1]
Cp ecole des metiers du drone pixiel-13 avril2015[1]
 
Sous-marin nucléaire lanceur d'engins
Sous-marin nucléaire lanceur d'enginsSous-marin nucléaire lanceur d'engins
Sous-marin nucléaire lanceur d'engins
 
Drone Hacking - Qualitek Security Day 2014
Drone Hacking - Qualitek Security Day 2014Drone Hacking - Qualitek Security Day 2014
Drone Hacking - Qualitek Security Day 2014
 
D'autres modèles d'accès ouvert sont possibles | Marin Dacos, Paris, 23 jan...
D'autres modèles d'accès ouvert sont possibles | Marin Dacos, Paris, 23 jan...D'autres modèles d'accès ouvert sont possibles | Marin Dacos, Paris, 23 jan...
D'autres modèles d'accès ouvert sont possibles | Marin Dacos, Paris, 23 jan...
 
Einparkhilfe Präsentation
Einparkhilfe PräsentationEinparkhilfe Präsentation
Einparkhilfe Präsentation
 
Fils RSS, réseaux sociaux et outils de curation : de nouvelles sources de vei...
Fils RSS, réseaux sociaux et outils de curation : de nouvelles sources de vei...Fils RSS, réseaux sociaux et outils de curation : de nouvelles sources de vei...
Fils RSS, réseaux sociaux et outils de curation : de nouvelles sources de vei...
 
Le projet ECO et les MOOCs français du projet
Le projet ECO et les MOOCs français du projetLe projet ECO et les MOOCs français du projet
Le projet ECO et les MOOCs français du projet
 
La médiation du patrimoine sous-marin
La médiation du patrimoine sous-marinLa médiation du patrimoine sous-marin
La médiation du patrimoine sous-marin
 
Interação além da tela: design de aplicações para as próximas gerações (JATIC)
Interação além da tela: design de aplicações para as próximas gerações� (JATIC)Interação além da tela: design de aplicações para as próximas gerações� (JATIC)
Interação além da tela: design de aplicações para as próximas gerações (JATIC)
 
Carlos 8ºb
Carlos 8ºbCarlos 8ºb
Carlos 8ºb
 
Hackeando drones com Software Livre
Hackeando drones com Software LivreHackeando drones com Software Livre
Hackeando drones com Software Livre
 
AdWords Updates der letzten 12 Monate
AdWords Updates der letzten 12 MonateAdWords Updates der letzten 12 Monate
AdWords Updates der letzten 12 Monate
 

Semelhante a Valtech - Big Data : Détails d’une mise en œuvre

SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...
SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...
SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...Microsoft Technet France
 
Big data Paris Presentation Solocal 20150310
Big data Paris Presentation Solocal 20150310Big data Paris Presentation Solocal 20150310
Big data Paris Presentation Solocal 20150310Abed Ajraou
 
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...Yassine, LASRI
 
Track 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec IntelTrack 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec IntelAmazon Web Services
 
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...Microsoft Décideurs IT
 
Microsoft - La Transformation Big Data
Microsoft - La Transformation Big DataMicrosoft - La Transformation Big Data
Microsoft - La Transformation Big DataValtech
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientDenodo
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Converteo
 
Datastax-fraud_detection_webinar
Datastax-fraud_detection_webinarDatastax-fraud_detection_webinar
Datastax-fraud_detection_webinarDataStax
 
3 short big_data_oracle
3 short big_data_oracle3 short big_data_oracle
3 short big_data_oraclepour action !
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013ADBS
 
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...OpenDataSoft
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentariesRima Jamli Faidi
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesConverteo
 
24HOP French 2017 - Azure Data Lake, le Big Data 2.0
24HOP French 2017 - Azure Data Lake, le Big Data 2.024HOP French 2017 - Azure Data Lake, le Big Data 2.0
24HOP French 2017 - Azure Data Lake, le Big Data 2.0Jean-Pierre Riehl
 
Présentation OCSInventory SolutionsLinux 2009
Présentation OCSInventory SolutionsLinux 2009Présentation OCSInventory SolutionsLinux 2009
Présentation OCSInventory SolutionsLinux 2009Gonéri Le Bouder
 
OpenDataSoft -Transformez votre organisation en plateforme d'innovation
OpenDataSoft -Transformez votre organisation en plateforme d'innovationOpenDataSoft -Transformez votre organisation en plateforme d'innovation
OpenDataSoft -Transformez votre organisation en plateforme d'innovationOpenDataSoft
 

Semelhante a Valtech - Big Data : Détails d’une mise en œuvre (20)

SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...
SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...
SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...
 
Big data Paris Presentation Solocal 20150310
Big data Paris Presentation Solocal 20150310Big data Paris Presentation Solocal 20150310
Big data Paris Presentation Solocal 20150310
 
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
 
Track 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec IntelTrack 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec Intel
 
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...
 
Microsoft - La Transformation Big Data
Microsoft - La Transformation Big DataMicrosoft - La Transformation Big Data
Microsoft - La Transformation Big Data
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance client
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
 
Datastax-fraud_detection_webinar
Datastax-fraud_detection_webinarDatastax-fraud_detection_webinar
Datastax-fraud_detection_webinar
 
Let’s do IT differently !
Let’s do IT differently !Let’s do IT differently !
Let’s do IT differently !
 
3 short big_data_oracle
3 short big_data_oracle3 short big_data_oracle
3 short big_data_oracle
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
 
Présentation OCARA
Présentation OCARAPrésentation OCARA
Présentation OCARA
 
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentaries
 
DataStax Enterprise BBL
DataStax Enterprise BBLDataStax Enterprise BBL
DataStax Enterprise BBL
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakes
 
24HOP French 2017 - Azure Data Lake, le Big Data 2.0
24HOP French 2017 - Azure Data Lake, le Big Data 2.024HOP French 2017 - Azure Data Lake, le Big Data 2.0
24HOP French 2017 - Azure Data Lake, le Big Data 2.0
 
Présentation OCSInventory SolutionsLinux 2009
Présentation OCSInventory SolutionsLinux 2009Présentation OCSInventory SolutionsLinux 2009
Présentation OCSInventory SolutionsLinux 2009
 
OpenDataSoft -Transformez votre organisation en plateforme d'innovation
OpenDataSoft -Transformez votre organisation en plateforme d'innovationOpenDataSoft -Transformez votre organisation en plateforme d'innovation
OpenDataSoft -Transformez votre organisation en plateforme d'innovation
 

Mais de Valtech

Valtech - Réalité virtuelle : analyses, perspectives, démonstrations
Valtech - Réalité virtuelle : analyses, perspectives, démonstrationsValtech - Réalité virtuelle : analyses, perspectives, démonstrations
Valtech - Réalité virtuelle : analyses, perspectives, démonstrationsValtech
 
CES 2016 - Décryptage et revue des tendances
CES 2016 - Décryptage et revue des tendancesCES 2016 - Décryptage et revue des tendances
CES 2016 - Décryptage et revue des tendancesValtech
 
Stéphane Roche - Agilité en milieu multiculturel
Stéphane Roche - Agilité en milieu multiculturelStéphane Roche - Agilité en milieu multiculturel
Stéphane Roche - Agilité en milieu multiculturelValtech
 
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech
 
Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015Valtech
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech
 
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015Valtech
 
Valtech - Architecture Agile des SI
Valtech - Architecture Agile des SIValtech - Architecture Agile des SI
Valtech - Architecture Agile des SIValtech
 
Valtech - Big Data en action
Valtech - Big Data en actionValtech - Big Data en action
Valtech - Big Data en actionValtech
 
Tendances mobiles et digitales du MWC 2015
Tendances mobiles et digitales du MWC 2015Tendances mobiles et digitales du MWC 2015
Tendances mobiles et digitales du MWC 2015Valtech
 
CES 2015 : Décryptage et tendances / Objets connectés
CES 2015 : Décryptage et tendances / Objets connectésCES 2015 : Décryptage et tendances / Objets connectés
CES 2015 : Décryptage et tendances / Objets connectésValtech
 
Valtech - Big Data en action
Valtech - Big Data en actionValtech - Big Data en action
Valtech - Big Data en actionValtech
 
Valtech - Economie Collaborative
Valtech - Economie CollaborativeValtech - Economie Collaborative
Valtech - Economie CollaborativeValtech
 
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014Valtech
 
[Veille thématique et décryptage] Cannes Lions 2014
[Veille thématique et décryptage] Cannes Lions 2014[Veille thématique et décryptage] Cannes Lions 2014
[Veille thématique et décryptage] Cannes Lions 2014Valtech
 
Valtech - Usages et technologie SaaS
Valtech - Usages et technologie SaaSValtech - Usages et technologie SaaS
Valtech - Usages et technologie SaaSValtech
 
[ Revue Innovations ] Valtech - Mobile World Congress
[ Revue Innovations ] Valtech - Mobile World Congress[ Revue Innovations ] Valtech - Mobile World Congress
[ Revue Innovations ] Valtech - Mobile World CongressValtech
 
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014Valtech
 
[ Veille de tendances ] Valtech : Objets connectés
[ Veille de tendances ] Valtech : Objets connectés[ Veille de tendances ] Valtech : Objets connectés
[ Veille de tendances ] Valtech : Objets connectésValtech
 
Valtech - Sharepoint et le cloud Azure
Valtech - Sharepoint et le cloud AzureValtech - Sharepoint et le cloud Azure
Valtech - Sharepoint et le cloud AzureValtech
 

Mais de Valtech (20)

Valtech - Réalité virtuelle : analyses, perspectives, démonstrations
Valtech - Réalité virtuelle : analyses, perspectives, démonstrationsValtech - Réalité virtuelle : analyses, perspectives, démonstrations
Valtech - Réalité virtuelle : analyses, perspectives, démonstrations
 
CES 2016 - Décryptage et revue des tendances
CES 2016 - Décryptage et revue des tendancesCES 2016 - Décryptage et revue des tendances
CES 2016 - Décryptage et revue des tendances
 
Stéphane Roche - Agilité en milieu multiculturel
Stéphane Roche - Agilité en milieu multiculturelStéphane Roche - Agilité en milieu multiculturel
Stéphane Roche - Agilité en milieu multiculturel
 
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raison
 
Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entreprise
 
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
 
Valtech - Architecture Agile des SI
Valtech - Architecture Agile des SIValtech - Architecture Agile des SI
Valtech - Architecture Agile des SI
 
Valtech - Big Data en action
Valtech - Big Data en actionValtech - Big Data en action
Valtech - Big Data en action
 
Tendances mobiles et digitales du MWC 2015
Tendances mobiles et digitales du MWC 2015Tendances mobiles et digitales du MWC 2015
Tendances mobiles et digitales du MWC 2015
 
CES 2015 : Décryptage et tendances / Objets connectés
CES 2015 : Décryptage et tendances / Objets connectésCES 2015 : Décryptage et tendances / Objets connectés
CES 2015 : Décryptage et tendances / Objets connectés
 
Valtech - Big Data en action
Valtech - Big Data en actionValtech - Big Data en action
Valtech - Big Data en action
 
Valtech - Economie Collaborative
Valtech - Economie CollaborativeValtech - Economie Collaborative
Valtech - Economie Collaborative
 
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014
 
[Veille thématique et décryptage] Cannes Lions 2014
[Veille thématique et décryptage] Cannes Lions 2014[Veille thématique et décryptage] Cannes Lions 2014
[Veille thématique et décryptage] Cannes Lions 2014
 
Valtech - Usages et technologie SaaS
Valtech - Usages et technologie SaaSValtech - Usages et technologie SaaS
Valtech - Usages et technologie SaaS
 
[ Revue Innovations ] Valtech - Mobile World Congress
[ Revue Innovations ] Valtech - Mobile World Congress[ Revue Innovations ] Valtech - Mobile World Congress
[ Revue Innovations ] Valtech - Mobile World Congress
 
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014
 
[ Veille de tendances ] Valtech : Objets connectés
[ Veille de tendances ] Valtech : Objets connectés[ Veille de tendances ] Valtech : Objets connectés
[ Veille de tendances ] Valtech : Objets connectés
 
Valtech - Sharepoint et le cloud Azure
Valtech - Sharepoint et le cloud AzureValtech - Sharepoint et le cloud Azure
Valtech - Sharepoint et le cloud Azure
 

Valtech - Big Data : Détails d’une mise en œuvre

  • 1. Big Data Détails d’une mise en œuvre Hervé Desaunois Responsable IT
  • 2. Méthodologie Cas d’utilisation Valtech Architecture! Tendance Big Data
  • 3. Sommaire Méthodologie Ò  Présentation Ò  Cas d’utilisation Ò  Architecture Ò  Cas Pratique Ò  Conclusion Ò  Références Ò  Annexes 3
  • 4. Big Data / Méthodologie La mise en place d’une démarche Big Data est toujours composée de trois étapes : Ò  Collecter, stocker les données. Ò  Analyser, explorer, corréler, agréger les données. Ò  Visualiser, exploiter.
  • 6. Architecture Big Data BUSINESS LES DONNEES COLLECTER Audio, Docs, Social, Capteurs, Web logs, Spatial, Vidéo, Texte, Graphs, Graphs, Autres Clicks, GPS Image XML RSS, RSS, STOCKAGE & ORGANISATION Base de données Distributed File Orientée colonne Base de System NoSQL données SQL EXTRACTION Map Reduce SQL VISUALISER ANALYSER Analytiques , Business Intelligent &
  • 7. Architecture Big Data BUSINESS LES DONNEES COLLECTER Audio, Docs, Social, Capteurs, Web logs, Spatial, Vidéo, Texte, Graphs, Graphs, Autres Clicks, GPS Image XML RSS, RSS, STOCKAGE & ORGANISATION HBase, Big Table, HDFS, GFS, S3, Cassandra, Oracle, DB2, … DynamoDB, … MySQL, … EXTRACTION SQL VISUALISER ANALYSER &
  • 9. Sommaire Itération I Ò  Présentation Ò  Cas d’utilisation Ò  Architecture Ò  Cas Pratique Ò  Conclusion Ò  Références Ò  Annexes 9
  • 10. Cas d’utilisation Valtech eReputation ERM MapReduce S3 DynamoDB eReputation Server Histogramme Client RIA GWT
  • 11. Collecter les données Connecteurs Web Service Web Service / Rest Web Service / Rest Web Service / Rest Google Custom Search API Twitter Search API Facebook Search API
  • 12. Stockage Base de données Orientée Colonne
  • 13. Organisation Modèle de données – Attributs, éléments et tables
  • 14. Organisation Modèle de données – Attributs, éléments et tables
  • 15. Extraction Amazon Elastic MapReduce
  • 16. Analyser Stocker les réponses sur S3
  • 17. Analyser Visualisation du résultat sur S3
  • 18. Visualiser Client RIA GWT
  • 20. BIG DATA Complexité Big Data Big Data Self Intelligent ? Data Scientist Big Data + Business Intelligent = ROI
  • 21. Sommaire Itération II Ò  Présentation Ò  Cas d’utilisation Ò  Architecture Ò  Cas Pratique Ò  Conclusion Ò  Références Ò  Annexes 21
  • 22. Cas d’utilisation Valtech eReputation MapReduce New SaaS S3 DynamoDB New eReputation Server New New
  • 23. Aujourd'hui • Volumes de données importants (Tera, Peta, ..) • De l’infiniment petit (génomique) à l’infiniment grand (astrophysique) • Du plus quotidien (reconnaissance de l’écriture manuscrite sur les enveloppes) au moins quotidien (aide au pilotage aéronautique) • Du plus ouvert (e-commerce) au plus sécuritaire (détection de la fraude dans la téléphonie mobile ou les cartes bancaires) • Du plus industriel (contrôle qualité…) au plus théorique (sciences humaines, biologie…) • Du plus alimentaire (agronomie et agroalimentaire) au plus divertissant (prévisions d’audience TV) • Systèmes d’aide à la décision plus ou moins automatiques © Stéphane Tufféry
  • 24. Machine Learning L'apprentissage automatique (machine learning en anglais), un des champs d'étude de l'intelligence artificielle, est la discipline scientifique concernée par le développement, l'analyse et l'implémentation de méthodes automatisables qui permettent à une machine (au sens large) d'évoluer grâce à un processus d'apprentissage, et ainsi de remplir des tâches qu'il est difficile ou impossible de remplir par des moyens algorithmiques plus classiques.
  • 25. Analyse - Algorithme Machine Learning Recommandation Classification Cluster
  • 26. Analyse sémantique Natural Language Processing Utilisation d’une solution de ”Catégorisation de document – Machine learning”
  • 27. Analyse sémantique Natural Language Processing Catégorisation : Expertise java Ò  26 mai 2008 – Grâce à son expertise Java, Valtech Technology s'associe avec Talend pour améliorer l'agilité des systèmes d'information de ses clients. Ò  Cédric Bertrand, Consultant confirmé JAVA/J2EE, Valtech de Paris (Ile-de-France). Ò  Valtech Agency propose une triple maîtrise dans les domaines du conseil, ... Des compétences de développement Java, .. Ò  Valtech: conseil en management, en technologies. Conseil et projets ebusiness, agence web, Offshore, Formation nouvelles technologies, objet, Java EE Ò  Au travers du déroulement itératif d'un projet, vous utiliserez des techniques moins connues de programmation Java comme la gestion poussée des Threads
  • 28. Analyser Algorithme de clusters K-Means
  • 29. Data Scientist L’intelligence des données Web Mining & Text Mining
  • 30. Analyser - Algorithme Data Mining
  • 32. Gartner talk « D'ici 2015, 4,4 millions d'emplois informatiques seront créés dans le monde pour soutenir le Big Data, dont 1,9 millions aux Etat- Unis », a déclaré Peter Sondergaard, senior vice-président et responsable mondial de la recherche chez Gartner. Wanted « Data Scientist » 100 000 to 500 000 $
  • 33. Valtech Web Scientiste L’intelligence des données Web Mining & Text Mining
  • 35. Big Data full solution
  • 37. Tarification! Ò  ERM : http://aws.amazon.com/fr/elasticmapreduce/#pricing Ò  DynamoDB : http://aws.amazon.com/fr/dynamodb/#pricing Ò  S3 : http://aws.amazon.com/fr/s3/pricing/ Ò  EC2 : http://aws.amazon.com/fr/ec2/pricing/