SlideShare uma empresa Scribd logo
1 de 26
INTRODUCTION DU SUJET
AIT EL MOUDEN Zakariyaa
Définition
 Les big data, littéralement les « grosses données »,
ou mégadonnées, désignent des ensembles de données qui
deviennent tellement volumineux qu'ils en deviennent
difficiles à travailler avec des outils classiques de gestion
de base de données ou de gestion de l'information.
-wikipédia-
2
D’où vient les données ?
 Les applications et les services professionnels:
- ERP ’Entreprise Resource planning’
en français « progiciel de gestion intégré » (PGI) : Ce type de
logiciel correspond, pour une organisation, au support de base
capable d'assurer une « gestion intégrée», définie comme étant
l'interconnexion et l'intégration de l'ensemble des fonctions de
l'entreprise dans un système informatique centralisé (et
généralement configuré selon le mode client-serveur).
Les sources de production des données :
3
- CRM ’Customer Relationship Management’
en français « La gestion de la relation client » (GRC) : est l'ensemble
des outils et techniques destinés à capter, traiter, analyser les
informations relatives aux clients et aux prospects, dans le but de les
fidéliser en leur offrant le meilleur service
- SCM ‘supply chain management’
en français «gestion de la chaîne logistique» (GCL)
vise à garantir l'organisation et la qualité du service logistique en
conformité avec les dispositions figurant au cahier des charges
logistique.
- les outils de production de contenu et de bureautique (série
office) ou les intranets, etc.
Les sources de production des données : (suite)
4
 Le Web
En utilisant le Web, Les entreprises et les organisations créent
un volume considérable de données (sites d’actualités, e-
commerce, publicités … )
Avec l’utilisation des moteurs de recherche et les annuaires
dans le web, le nombre des données crées est de plus en plus
innombrables.
"Nous créons actuellement en deux jours autant d'information
que nous en avions créée depuis la naissance de la civilisation
jusqu'en 2003".
rappelait récemment Eric Schmidt, Chairman de Google.
Les sources de production des données : (suite)
5
 Les Media sociaux
Avec le développement des outils d’expression (le Web 2.0) ces
dix dernières années, le volume des données produites à eu une
croissance phénoménale.
exemples :
Réseaux sociaux : facebook, twitter, youtube, etc
Plateformes de partage : SlideShare, Flickr, Instagram, etc
Statistique :
Chaque minute, plus de 30 heures de vidéo sont uploadées sur
YouTube, 2 millions de posts sont publiés sur Facebook et
100.000 tweets diffusés sur Twitter.
Les sources de production des données : (suite)
6
 Le Mobile
Avec l’évolution du mobile, et l’apparition du ‘smartphone’, Le
téléphone mobile est devenu une source respectable de
production des données.
Les statistiques prouvent qu’ il y a actuellement 4 fois plus de
téléphone mobiles en usage que des ordinateurs et tablettes.
Statistique :
A la fin 2013, l'App Store de Apple et Google Play auront
dépassé les 50 milliards d'applications téléchargées.
Les sources de production des données : (suite)
7
 Internet des objets (IdO)
en anglais « Internet Of Things » (IoT)
un réseau qui permet, via des systèmes d’identification
électronique normalisés et sans fil, d’identifier et de
communiquer numériquement avec des objets physiques afin de
pouvoir mesurer et échanger des données entre les mondes
physiques et virtuels.
L'internet des objets est considéré comme la troisième
évolution de l'Internet, baptisée Web 3.0
Les sources de production des données : (suite)
8
Les catégories des données
 Données Structurées
les informations structurées sont disposées de façon à être traitées
automatiquement et efficacement par un logiciel, mais non
nécessairement par un humain.
La ligne de code Java : int salaire = 6000; String nom=« Ali";
est un exemple simple d’informations structurées ,nous connaissons
les valeurs, dont le nom est associé à la fonction. Nous pouvons ici
supposer que le nom de l’individu est Jean et que son salaire est de
6 000 Dh.
Par opposition, la chaîne de caractères « Ali gagne un salaire de
60 000 dirhams » n’est pas structurée, car nous ne pouvons nous
attendre à ce qu’un logiciel puisse lire et comprendre une phrase
écrite en français.
9
Les catégories des données (suite)
 Le plus souvent, nous disposons les informations structurées
dans des tableaux, comme dans une base de données
relationnelle
Nom Salaire
Ali 6000
Mohammed 7000
10
Les catégories des données (suite)
 Les données non structurées
Il est impossible de tout stocker sous la forme d’informations
structurées (p. ex. lettres, courriels, livres, rapports, collections
d’images ou de vidéos, brevets, images satellites, offres de service
et CV, appels d’offre). Il s’agit pourtant d’informations que les
organisations doivent traiter.
 Les big data sont généralement des données semi structurées.
11
Les dimensions du BIG DATA
Les
dimensions
du big data
Volume
Vitesse
Variété
Véracité
Visibilité
Valeur
12
 Le Volume : Le premier concept qui intervient dans la notion
du big data, données en petabyte( 1015 bytes )
 La Vitesse : Analyse et exploitation des données en temps réel.
 La Variété : Les données sont non structurées, et de plus sont de
formats différents (images, texte, sons, vidéos , etc.)
 La Valeur : Les données concernées sont de valeur importante
dans l’entreprise.
Les 4v principaux
13
Pourquoi la notion du big data est
récente ?
 L’expression « Big data » fait finalement son apparition en
octobre 1997 dans la bibliothèque numérique de l’ACM*, au sein
d’articles scientifiques qui pointent du doigt les défis
technologiques à visualiser les « grands ensembles de données ».
Le Big data est né, et avec lui ses nombreux défis..
*Association For Computing Machinery, association américaine à but non
lucratif fondée en 1947 et vouée à l’informatique. Sa bibliothèque
numérique est particulièrement riche quand il s’agit de retracer l’histoire
de la discipline.
14
Facteurs de naissance du Big data
 Le cout du stockage : Ce concept n’est plus un problème majeur
pour les entreprises avec l’apparition du Cloud Computing.
 Réseaux à très haut débit (THD) : Le stockage des données dans
des serveurs distants n’est pas une vrai solution sans un réseau
hait débit pour atteindre ces données avec une transparence à la
localisation.
 Evolution des technologie de gestion et d’analyse des données :
Analyse et gestion en temps réel
15
Usages des Big Data
 Optimisation
Optimisation du temps de calcul, recherche, traitement des
données, etc.
exemple:
Une société de de fabrication d’éoliennes nommée Vestas ,
utilise les ‘ big data analytics ’ d’IBM pour décider la localisation
d’éoliennes en optimisant le temps de traitement des données
variées et non structurées (données météorologiques et géo
spatiales, des images satellites, etc. )
>> résultat fournit en quelques heures, au lieu des études qui
prennent des semaines sur terrain.
16
 Tracer et cibler
Les big data permettent d’analyser la situation et le contexte de
millier de personnes en temps réel.
Application : (big data dans l’aéroport)
les passagers doivent obligatoirement passer un certain
nombre de tests de sécurité (ce qui génère du stress, des temps
d’attente).
Une application de géolocalisation dans l’aéroport pourrait
offrir aux passagers, en retour de leurs données émises, un guide
interactif du lieu, des informations sur les temps d’attente aux
différents postes de sécurité, sur les horaires des vols et portes
d’embarquement, alors ils peuvent exploiter leurs temps
d’attente dans des boutiques ou des restaurants, etc.
17
Usages des Big Data (suite)
Usages des Big Data (suite)
 Prévoir et prédire
L’analyse prédictive permet de faire des projections ultra
réalistes pour identifier des nouvelles sources d’opportunités (ou
des menaces) et ainsi anticiper les réponses adaptées à la
situation réelle.
Exemple :
‘Flu Trends’ est un modèle de Google qui permet d’estimer la
propagation des cas réels de grippe en fonction des recherches
sur Internet, prenant en compte le fait que tous les internautes
qui tapent « grippe » sur leur clavier ne sont pas nécessairement
malades.
 Automobile et Autres usages …
18
Visualisation des données
 Pourquoi on visualise les données ?
‘’ Une image (data visualisation) vaut mieux qu'un long (big)
discours (data) ‘’
Une visualisation intelligente et utilisable des analytics sont un
facteur clé dans le déploiement du Big Data dans les entreprises.
Le développement des infographies va d'ailleurs de pair avec le
développement des techniques d'exploitation des données.
19
Visualisation des données (suite)
La visualisation des big data permet :
 La prise de décision
Une Data Visualisation de qualité donnera aux managers le
moyen de manipuler de larges volumes de données pour faire
émerger des tendances, ou encore répondre à des questions
spécifiques.
Grâce à des outils de comparaison et de croisement dynamiques,
les managers peuvent faire apparaître des informations perdues
sous le flot de données, qui ne peuvent se révéler qu’après avoir
été visualisées.
20
Visualisation des données (suite)
 se concentrer sur l’essentiel, plus rapidement
La principale raison pour laquelle la Data Visualisation est
demandée par les entreprises est la confusion qui accompagne la
surcharge de données : celles-ci sont éparpillées dans des feuilles
de calculs, des bases de données, des espaces de stockages… Leur
interprétation devient difficile. A l’inverse, le but de la Data
Visualisation va à l’essentiel en regroupant toutes ces données
sur un seul écran, et en les traitant intelligemment grâce à des
filtres, des groupes et des classements pertinents.
21
Visualisation des données (suite)
22
Exemple :
 Fichier visualisé :
Les misérables de Victor Hugo
 Nombre de nœuds : 77
 Nombre des liens : 254
 Algorithme de spatialisation :
Force Atlas
 Outil de visualisation :
Gephi 0.8.1
Visualisation des données (suite)
 Même fichier avec d’autres algorithmes de spatialisation :
23
Fruchterman-Reingold Force Atlas 2
Conclusion
 Avec la notion du big data, les problèmes volume des
données, variance, hétérogénéité, le temps d’analyse
des données et plein d’autres problèmes ne sont plus
de la même complexité qu’avant. C’est la nouvelle
génération des données.
24
Références
 www.wiki.gephi.org
 www.awt.be
 http://physicsbjj.perso.sfr.fr/
 www.wikipedia.org
 le big data, Christophe de Maistre
25
Chapitre suivant :
Algorithmes de spatialisation

Mais conteúdo relacionado

Mais procurados

Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesJean-Michel Franco
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big dataAbdelghani Azri
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQLLilia Sfaxi
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introductionMouna Torjmen
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2Amal Abid
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehousekhlifi z
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data MiningTakfarinas KENOUCHE
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?Jean-Marc Dupont
 

Mais procurados (20)

Big data
Big dataBig data
Big data
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendances
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Big data
Big dataBig data
Big data
 
Conférence big data
Conférence big dataConférence big data
Conférence big data
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehouse
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 
Présentation bi 1.0
Présentation bi 1.0Présentation bi 1.0
Présentation bi 1.0
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
Partie1BI-DW2019
Partie1BI-DW2019Partie1BI-DW2019
Partie1BI-DW2019
 
Cours Big Data Part I
Cours Big Data Part ICours Big Data Part I
Cours Big Data Part I
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
 
Hive ppt (1)
Hive ppt (1)Hive ppt (1)
Hive ppt (1)
 

Destaque

Application Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdkApplication Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdkNazih Heni
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataNicolas Peene
 
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achatBig data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achatfifi75
 
Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...Louise Antonio
 
Big Data
Big DataBig Data
Big DataNGDATA
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing
 

Destaque (11)

Application Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdkApplication Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdk
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big Data
 
Confessions of a horrified audience
Confessions of a horrified audienceConfessions of a horrified audience
Confessions of a horrified audience
 
AIR POWERED ENGINE PPT
AIR POWERED ENGINE PPTAIR POWERED ENGINE PPT
AIR POWERED ENGINE PPT
 
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achatBig data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
 
Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...
 
Big Data
Big DataBig Data
Big Data
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMP
 
Big data ppt
Big data pptBig data ppt
Big data ppt
 
Big data ppt
Big  data pptBig  data ppt
Big data ppt
 
What is Big Data?
What is Big Data?What is Big Data?
What is Big Data?
 

Semelhante a Introduction au BIG DATA

Big data-2-170220212621
Big data-2-170220212621Big data-2-170220212621
Big data-2-170220212621Haifa Akermi
 
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Altares D&B
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceExcelerate Systems
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015IBM France Lab
 
Baina bigdata le futur eldorado
Baina bigdata le futur eldoradoBaina bigdata le futur eldorado
Baina bigdata le futur eldoradoKarim Baïna
 
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdfcdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdfZkSadrati
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientDenodo
 
EXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxEXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxInfopole1
 
dt_medecine_personalis.pptx
dt_medecine_personalis.pptxdt_medecine_personalis.pptx
dt_medecine_personalis.pptxnour91922
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurMicrosoft Ideas
 
La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)Nicolae Sfetcu
 
Etude AKOYA Big Data
Etude AKOYA Big DataEtude AKOYA Big Data
Etude AKOYA Big DataJocelyn Muret
 
Qu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobreQu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobreSimon Boucher
 

Semelhante a Introduction au BIG DATA (20)

Introduction
IntroductionIntroduction
Introduction
 
Analyse spatiale en Big data
Analyse spatiale en Big dataAnalyse spatiale en Big data
Analyse spatiale en Big data
 
Big data-2-170220212621
Big data-2-170220212621Big data-2-170220212621
Big data-2-170220212621
 
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
 
BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems France
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Baina bigdata le futur eldorado
Baina bigdata le futur eldoradoBaina bigdata le futur eldorado
Baina bigdata le futur eldorado
 
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdfcdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance client
 
EXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxEXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptx
 
dt_medecine_personalis.pptx
dt_medecine_personalis.pptxdt_medecine_personalis.pptx
dt_medecine_personalis.pptx
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeur
 
La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)
 
Etude AKOYA Big Data
Etude AKOYA Big DataEtude AKOYA Big Data
Etude AKOYA Big Data
 
Qu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobreQu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobre
 
bgi-data-1 (1).pptx
bgi-data-1 (1).pptxbgi-data-1 (1).pptx
bgi-data-1 (1).pptx
 

Mais de Zakariyaa AIT ELMOUDEN (11)

Les réseaux informatiques 3
Les réseaux informatiques 3Les réseaux informatiques 3
Les réseaux informatiques 3
 
Les réseaux informatiques 2
Les réseaux informatiques 2Les réseaux informatiques 2
Les réseaux informatiques 2
 
Exercices : Algorithmes et Langage C
Exercices : Algorithmes et Langage CExercices : Algorithmes et Langage C
Exercices : Algorithmes et Langage C
 
Algorithmique
AlgorithmiqueAlgorithmique
Algorithmique
 
Introduction aux réseaux informatiques
Introduction aux réseaux informatiquesIntroduction aux réseaux informatiques
Introduction aux réseaux informatiques
 
Langage HTML
Langage HTMLLangage HTML
Langage HTML
 
Introduction au Web
Introduction au WebIntroduction au Web
Introduction au Web
 
QCM Sécurité Informatique
QCM Sécurité InformatiqueQCM Sécurité Informatique
QCM Sécurité Informatique
 
Excel : Les fonctions mathématiques
Excel : Les fonctions mathématiquesExcel : Les fonctions mathématiques
Excel : Les fonctions mathématiques
 
Atelier EXCEL : Les fonctions financières
Atelier EXCEL :  Les fonctions financièresAtelier EXCEL :  Les fonctions financières
Atelier EXCEL : Les fonctions financières
 
Installer et configurer NAGIOS sous linux
Installer et configurer NAGIOS sous linuxInstaller et configurer NAGIOS sous linux
Installer et configurer NAGIOS sous linux
 

Último

GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...Institut de l'Elevage - Idele
 
conception d'un batiment r+4 comparative de defferente ariante de plancher
conception d'un  batiment  r+4 comparative de defferente ariante de plancherconception d'un  batiment  r+4 comparative de defferente ariante de plancher
conception d'un batiment r+4 comparative de defferente ariante de planchermansouriahlam
 
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageGAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageInstitut de l'Elevage - Idele
 
GAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéGAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéInstitut de l'Elevage - Idele
 
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...Institut de l'Elevage - Idele
 
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Ville de Châteauguay
 
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...Institut de l'Elevage - Idele
 
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusGAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusInstitut de l'Elevage - Idele
 
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfInstitut de l'Elevage - Idele
 
JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfInstitut de l'Elevage - Idele
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfInstitut de l'Elevage - Idele
 
Algo II : les piles ( cours + exercices)
Algo II :  les piles ( cours + exercices)Algo II :  les piles ( cours + exercices)
Algo II : les piles ( cours + exercices)Sana REFAI
 
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...Institut de l'Elevage - Idele
 
comprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestioncomprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestionyakinekaidouchi1
 
firefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdffirefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdffirstjob4
 
GAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesGAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesInstitut de l'Elevage - Idele
 
WBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdfWBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdfSophie569778
 
DISPOSITIFS-MEDICAUX-PPT.pdf............
DISPOSITIFS-MEDICAUX-PPT.pdf............DISPOSITIFS-MEDICAUX-PPT.pdf............
DISPOSITIFS-MEDICAUX-PPT.pdf............cheddadzaineb
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfmia884611
 

Último (20)

GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
 
conception d'un batiment r+4 comparative de defferente ariante de plancher
conception d'un  batiment  r+4 comparative de defferente ariante de plancherconception d'un  batiment  r+4 comparative de defferente ariante de plancher
conception d'un batiment r+4 comparative de defferente ariante de plancher
 
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageGAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
 
JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdfJTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
 
GAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéGAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversité
 
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
 
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
 
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
 
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusGAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
 
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
 
JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdf
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdf
 
Algo II : les piles ( cours + exercices)
Algo II :  les piles ( cours + exercices)Algo II :  les piles ( cours + exercices)
Algo II : les piles ( cours + exercices)
 
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
 
comprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestioncomprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestion
 
firefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdffirefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdf
 
GAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesGAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentes
 
WBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdfWBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdf
 
DISPOSITIFS-MEDICAUX-PPT.pdf............
DISPOSITIFS-MEDICAUX-PPT.pdf............DISPOSITIFS-MEDICAUX-PPT.pdf............
DISPOSITIFS-MEDICAUX-PPT.pdf............
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdf
 

Introduction au BIG DATA

  • 1. INTRODUCTION DU SUJET AIT EL MOUDEN Zakariyaa
  • 2. Définition  Les big data, littéralement les « grosses données », ou mégadonnées, désignent des ensembles de données qui deviennent tellement volumineux qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données ou de gestion de l'information. -wikipédia- 2
  • 3. D’où vient les données ?  Les applications et les services professionnels: - ERP ’Entreprise Resource planning’ en français « progiciel de gestion intégré » (PGI) : Ce type de logiciel correspond, pour une organisation, au support de base capable d'assurer une « gestion intégrée», définie comme étant l'interconnexion et l'intégration de l'ensemble des fonctions de l'entreprise dans un système informatique centralisé (et généralement configuré selon le mode client-serveur). Les sources de production des données : 3
  • 4. - CRM ’Customer Relationship Management’ en français « La gestion de la relation client » (GRC) : est l'ensemble des outils et techniques destinés à capter, traiter, analyser les informations relatives aux clients et aux prospects, dans le but de les fidéliser en leur offrant le meilleur service - SCM ‘supply chain management’ en français «gestion de la chaîne logistique» (GCL) vise à garantir l'organisation et la qualité du service logistique en conformité avec les dispositions figurant au cahier des charges logistique. - les outils de production de contenu et de bureautique (série office) ou les intranets, etc. Les sources de production des données : (suite) 4
  • 5.  Le Web En utilisant le Web, Les entreprises et les organisations créent un volume considérable de données (sites d’actualités, e- commerce, publicités … ) Avec l’utilisation des moteurs de recherche et les annuaires dans le web, le nombre des données crées est de plus en plus innombrables. "Nous créons actuellement en deux jours autant d'information que nous en avions créée depuis la naissance de la civilisation jusqu'en 2003". rappelait récemment Eric Schmidt, Chairman de Google. Les sources de production des données : (suite) 5
  • 6.  Les Media sociaux Avec le développement des outils d’expression (le Web 2.0) ces dix dernières années, le volume des données produites à eu une croissance phénoménale. exemples : Réseaux sociaux : facebook, twitter, youtube, etc Plateformes de partage : SlideShare, Flickr, Instagram, etc Statistique : Chaque minute, plus de 30 heures de vidéo sont uploadées sur YouTube, 2 millions de posts sont publiés sur Facebook et 100.000 tweets diffusés sur Twitter. Les sources de production des données : (suite) 6
  • 7.  Le Mobile Avec l’évolution du mobile, et l’apparition du ‘smartphone’, Le téléphone mobile est devenu une source respectable de production des données. Les statistiques prouvent qu’ il y a actuellement 4 fois plus de téléphone mobiles en usage que des ordinateurs et tablettes. Statistique : A la fin 2013, l'App Store de Apple et Google Play auront dépassé les 50 milliards d'applications téléchargées. Les sources de production des données : (suite) 7
  • 8.  Internet des objets (IdO) en anglais « Internet Of Things » (IoT) un réseau qui permet, via des systèmes d’identification électronique normalisés et sans fil, d’identifier et de communiquer numériquement avec des objets physiques afin de pouvoir mesurer et échanger des données entre les mondes physiques et virtuels. L'internet des objets est considéré comme la troisième évolution de l'Internet, baptisée Web 3.0 Les sources de production des données : (suite) 8
  • 9. Les catégories des données  Données Structurées les informations structurées sont disposées de façon à être traitées automatiquement et efficacement par un logiciel, mais non nécessairement par un humain. La ligne de code Java : int salaire = 6000; String nom=« Ali"; est un exemple simple d’informations structurées ,nous connaissons les valeurs, dont le nom est associé à la fonction. Nous pouvons ici supposer que le nom de l’individu est Jean et que son salaire est de 6 000 Dh. Par opposition, la chaîne de caractères « Ali gagne un salaire de 60 000 dirhams » n’est pas structurée, car nous ne pouvons nous attendre à ce qu’un logiciel puisse lire et comprendre une phrase écrite en français. 9
  • 10. Les catégories des données (suite)  Le plus souvent, nous disposons les informations structurées dans des tableaux, comme dans une base de données relationnelle Nom Salaire Ali 6000 Mohammed 7000 10
  • 11. Les catégories des données (suite)  Les données non structurées Il est impossible de tout stocker sous la forme d’informations structurées (p. ex. lettres, courriels, livres, rapports, collections d’images ou de vidéos, brevets, images satellites, offres de service et CV, appels d’offre). Il s’agit pourtant d’informations que les organisations doivent traiter.  Les big data sont généralement des données semi structurées. 11
  • 12. Les dimensions du BIG DATA Les dimensions du big data Volume Vitesse Variété Véracité Visibilité Valeur 12
  • 13.  Le Volume : Le premier concept qui intervient dans la notion du big data, données en petabyte( 1015 bytes )  La Vitesse : Analyse et exploitation des données en temps réel.  La Variété : Les données sont non structurées, et de plus sont de formats différents (images, texte, sons, vidéos , etc.)  La Valeur : Les données concernées sont de valeur importante dans l’entreprise. Les 4v principaux 13
  • 14. Pourquoi la notion du big data est récente ?  L’expression « Big data » fait finalement son apparition en octobre 1997 dans la bibliothèque numérique de l’ACM*, au sein d’articles scientifiques qui pointent du doigt les défis technologiques à visualiser les « grands ensembles de données ». Le Big data est né, et avec lui ses nombreux défis.. *Association For Computing Machinery, association américaine à but non lucratif fondée en 1947 et vouée à l’informatique. Sa bibliothèque numérique est particulièrement riche quand il s’agit de retracer l’histoire de la discipline. 14
  • 15. Facteurs de naissance du Big data  Le cout du stockage : Ce concept n’est plus un problème majeur pour les entreprises avec l’apparition du Cloud Computing.  Réseaux à très haut débit (THD) : Le stockage des données dans des serveurs distants n’est pas une vrai solution sans un réseau hait débit pour atteindre ces données avec une transparence à la localisation.  Evolution des technologie de gestion et d’analyse des données : Analyse et gestion en temps réel 15
  • 16. Usages des Big Data  Optimisation Optimisation du temps de calcul, recherche, traitement des données, etc. exemple: Une société de de fabrication d’éoliennes nommée Vestas , utilise les ‘ big data analytics ’ d’IBM pour décider la localisation d’éoliennes en optimisant le temps de traitement des données variées et non structurées (données météorologiques et géo spatiales, des images satellites, etc. ) >> résultat fournit en quelques heures, au lieu des études qui prennent des semaines sur terrain. 16
  • 17.  Tracer et cibler Les big data permettent d’analyser la situation et le contexte de millier de personnes en temps réel. Application : (big data dans l’aéroport) les passagers doivent obligatoirement passer un certain nombre de tests de sécurité (ce qui génère du stress, des temps d’attente). Une application de géolocalisation dans l’aéroport pourrait offrir aux passagers, en retour de leurs données émises, un guide interactif du lieu, des informations sur les temps d’attente aux différents postes de sécurité, sur les horaires des vols et portes d’embarquement, alors ils peuvent exploiter leurs temps d’attente dans des boutiques ou des restaurants, etc. 17 Usages des Big Data (suite)
  • 18. Usages des Big Data (suite)  Prévoir et prédire L’analyse prédictive permet de faire des projections ultra réalistes pour identifier des nouvelles sources d’opportunités (ou des menaces) et ainsi anticiper les réponses adaptées à la situation réelle. Exemple : ‘Flu Trends’ est un modèle de Google qui permet d’estimer la propagation des cas réels de grippe en fonction des recherches sur Internet, prenant en compte le fait que tous les internautes qui tapent « grippe » sur leur clavier ne sont pas nécessairement malades.  Automobile et Autres usages … 18
  • 19. Visualisation des données  Pourquoi on visualise les données ? ‘’ Une image (data visualisation) vaut mieux qu'un long (big) discours (data) ‘’ Une visualisation intelligente et utilisable des analytics sont un facteur clé dans le déploiement du Big Data dans les entreprises. Le développement des infographies va d'ailleurs de pair avec le développement des techniques d'exploitation des données. 19
  • 20. Visualisation des données (suite) La visualisation des big data permet :  La prise de décision Une Data Visualisation de qualité donnera aux managers le moyen de manipuler de larges volumes de données pour faire émerger des tendances, ou encore répondre à des questions spécifiques. Grâce à des outils de comparaison et de croisement dynamiques, les managers peuvent faire apparaître des informations perdues sous le flot de données, qui ne peuvent se révéler qu’après avoir été visualisées. 20
  • 21. Visualisation des données (suite)  se concentrer sur l’essentiel, plus rapidement La principale raison pour laquelle la Data Visualisation est demandée par les entreprises est la confusion qui accompagne la surcharge de données : celles-ci sont éparpillées dans des feuilles de calculs, des bases de données, des espaces de stockages… Leur interprétation devient difficile. A l’inverse, le but de la Data Visualisation va à l’essentiel en regroupant toutes ces données sur un seul écran, et en les traitant intelligemment grâce à des filtres, des groupes et des classements pertinents. 21
  • 22. Visualisation des données (suite) 22 Exemple :  Fichier visualisé : Les misérables de Victor Hugo  Nombre de nœuds : 77  Nombre des liens : 254  Algorithme de spatialisation : Force Atlas  Outil de visualisation : Gephi 0.8.1
  • 23. Visualisation des données (suite)  Même fichier avec d’autres algorithmes de spatialisation : 23 Fruchterman-Reingold Force Atlas 2
  • 24. Conclusion  Avec la notion du big data, les problèmes volume des données, variance, hétérogénéité, le temps d’analyse des données et plein d’autres problèmes ne sont plus de la même complexité qu’avant. C’est la nouvelle génération des données. 24
  • 25. Références  www.wiki.gephi.org  www.awt.be  http://physicsbjj.perso.sfr.fr/  www.wikipedia.org  le big data, Christophe de Maistre 25