SlideShare uma empresa Scribd logo
1 de 39
Bases de données :

 Introduction et
    Objectifs
2


                       1. Introduction
• Les entreprises gèrent des volumes de données très grands
   – Giga, Terra, Péta –octets
   – Numériques, Textuelles, Multi-média (images, films,...)
• Il faut pouvoir facilement
   – Archiver les données sur mémoires secondaires permanente
   – Retrouver les données pertinentes à un traitement
   – Mettre à jour les données variant dans le temps
• Les données sont structurées et identifiées
   – Données élémentaires ex: Votre salaire, Votre note en BD
   – Données composées ex: Votre CV, vos résultats de l'année
   – Identifiant humain ex: NSS ou machine: P26215
• Qu'est-ce qu'une BD ?
   – Collection de données structurées reliées par des relations
   – Interrogeable et modifiable par des langages de haut niveau
3


           La hiérarchie des mémoires
Capacité         Mémoire
   vs            terciaire
Coût &                            • Un accès disque est environ
Vitesse                             100,000 fois plus lent qu’un
                                    accès mémoire!
5-10 ms          Mémoire
                                  •    ⇒
                secondaire
                                      – Eviter les accès disques
                                           • grande mémoire principale

80-200 ns    Mémoire principale       – Amortir les accès disques
                 (RAM)                     • placement des données
                                      – Minimiser le nombre d’accès disques
3-10 ns       Cache (SRAM)                 • méthodes d’accès


2-5 ns           Registres
4


                       Un peu d'histoire
• Années 60:
   – Récipients logique de données  fichiers sur dique
   – Accès séquentiel puis sur clé
       • Lire (Nomf, Article), Ecrire (Nomf, Article)
       • Lire (Nomf, Article, Clé), Ecrire (Nomf, article, Clé)

• Années 70:
   – Avènement des Bases de Données Réseaux (BD)
   – Ensemble de fichiers reliés par des pointeurs
   – Langage d'interrogation par navigation
• Années 80:
   – Avènement des Bases de Données Relationnelles (BDR)
   – Relations entre ensemble de données
   – Langage d'interrogation par assertion logique
Systèmes de fichiers         Caractéristiques
                                                  5




Comptabilité      Chirurgie



                               Problèmes

Consultations    Psychiatrie
Format des fichiers                    Caractéristiques
                                                                  6



                                       Plusieurs applications
                                        plusieurs formats
    Dupont            Dupond
    Symptomes : y
    Turlututu : sqj
                      Turlututusqjsk
                      Symptom: yyyy
                       Analyses xxxx
                                        plusieurs langages
    Symptomes : y
    Turlututu : sdd   Turlututudhjsd
    Analyses : xxx     Analyses :xx




                                       Problèmes
                                        Difficultés de gestion




    Duhpon            Duipont
                      Turlututu : sq

    Symptomes : yy    Symptomyyyy
    Analyses : xxxx    Analysesxxxx

    Symptomes : yy    Turlututudhjsd
Redondance (données) Caractéristiques                               7



                                        Plusieurs applications
                                         plusieurs formats
     Dupont            Dupond
     Symptomes : y
     Turlututu : sqj
                       Turlututusqjsk
                       Symptom: yyyy
                        Analyses xxxx
                                         plusieurs langages
     Symptomes : y
     Turlututu : sdd   Turlututudhjsd
     Analyses : xxx     Analyses :xx
                                        Redondance de données




                                        Problèmes
                                         Difficultés de gestion
                                         Incohérence des données



     Duhpon            Duipont
                       Turlututu : sq

     Symptomes : yy    Symptomyyyy
     Analyses : xxxx    Analysesxxxx

     Symptomes : yy    Turlututudhjsd
Interrogations                                                 Caractéristiques
                                                                                                 8



                                                               Plusieurs applications
 ComptaSoft                                                     plusieurs formats
              Dupont            Dupond




                                                  ChiruSoft
              Symptomes : y
              Turlututu : sqj
                                Turlututusqjsk
                                Symptom: yyyy
                                 Analyses xxxx
                                                                plusieurs langages
              Symptomes : y
              Turlututu : sdd   Turlututudhjsd
              Analyses : xxx     Analyses :xx
                                                               Redondance de données
                                                               Pas de facilité d’interrogation
                                                                Question ⇒développement




                                                               Problèmes
                                                                  Difficultés de gestion
                                                                  Incohérence des données
                                                                  Coûts élevés
                                                                  Maintenance difficile
                                                 PsychiaSoft
ConsultSoft




              Duhpon            Duipont
                                Turlututu : sq

              Symptomes : yy    Symptomyyyy
              Analyses : xxxx    Analysesxxxx

              Symptomes : yy    Turlututudhjsd
Pannes ???                                       Caractéristiques
                                                                                                 9



                                                               Plusieurs applications
 ComptaSoft                                                     plusieurs formats
              Dupont            Dupond




                                                  ChiruSoft
              Symptomes : y
              Turlututu : sqj
                                Turlututusqjsk
                                Symptom: yyyy
                                 Analyses xxxx
                                                                plusieurs langages
              Symptomes : y
              Turlututu : sdd   Turlututudhjsd
              Analyses : xxx     Analyses :xx
                                                               Redondance de données
                                                               Pas de facilité d’interrogation
                                                                Question ⇒développement

                                                               Redondance de code


                                                               Problèmes
                                                                  Difficultés de gestion
                                                                  Incohérence des données
                                                                  Coûts élevés
                                                                  Maintenance difficile
                                                 PsychiaSoft
ConsultSoft




              Duhpon            Duipont
                                Turlututu : sq
                                                                  Gestion de pannes ???
              Symptomes : yy    Symptomyyyy
              Analyses : xxxx    Analysesxxxx

              Symptomes : yy    Turlututudhjsd
Partage de données                                               Caractéristiques
                                                                                                   10



                                                                 Plusieurs applications
   ComptaSoft                                                     plusieurs formats
                Dupont            Dupond




                                                    ChiruSoft
                Symptomes : y
                Turlututu : sqj
                                  Turlututusqjsk
                                  Symptom: yyyy
                                   Analyses xxxx
                                                                  plusieurs langages
                Symptomes : y
                Turlututu : sdd   Turlututudhjsd
                Analyses : xxx     Analyses :xx
                                                                 Redondance de données
                                                                 Pas de facilité d’interrogation
                                                                  Question ⇒développement

                                                                 Redondance de code


                                                                 Problèmes
                                                                    Difficultés de gestion
                                                                    Incohérence des données
                                                                    Coûts élevés
                                                                    Maintenance difficile
                                                   PsychiaSoft
  ConsultSoft




                Duhpon            Duipont
                                  Turlututu : sq
                                                                    Gestion de pannes ???
                Symptomes : yy
                Analyses : xxxx
                                  Symptomyyyy
                                   Analysesxxxx                     Partage des données ???
                Symptomes : yy    Turlututudhjsd
Confidentialité                                                Caractéristiques
                                                                                                 11



                                                               Plusieurs applications
 ComptaSoft                                                     plusieurs formats
              Dupont            Dupond




                                                  ChiruSoft
              Symptomes : y
              Turlututu : sqj
                                Turlututusqjsk
                                Symptom: yyyy
                                 Analyses xxxx
                                                                plusieurs langages
              Symptomes : y
              Turlututu : sdd   Turlututudhjsd
              Analyses : xxx     Analyses :xx
                                                               Redondance de données
                                                               Pas de facilité d’interrogation
                                                                Question ⇒développement

                                                               Redondance de code


                                                               Problèmes
                                                                  Difficultés de gestion
                                                                  Incohérence des données
                                                                  Coûts élevés
                                                                  Maintenance difficile
                                                 PsychiaSoft
ConsultSoft




              Duhpon            Duipont
                                Turlututu : sq
                                                                  Gestion de pannes ???
              Symptomes : yy
              Analyses : xxxx
                                Symptomyyyy
                                 Analysesxxxx                     Partage des données ???
              Symptomes : yy    Turlututudhjsd

                                                                  Confidentialité ???
12


    L’approche ‘‘Bases de données’’
• Modélisation des données
   Eliminer la redondance de données
   Centraliser et organiser correctement les données
   Plusieurs niveaux de modélisation
   Outils de conception


• Logiciel «Système de Gestion de Bases de Données»
  Factorisation des modules de contrôle des applications
     - Interrogation, cohérence, partage, gestion de pannes, etc…
  Administration facilitées des données
13

             Modélisation du réel

Réel

             • Indépendant du
Modèle         modèle de données

conceptuel   • Indépendant du
               SGBD                    Médecin          effectue          Visite



             • Dépendant du
Modèle         modèle de données
                                   Codasyl       Relationnel       Objet           XML
logique      • Indépendant du
               SGBD


Modèle       • Dépendant du
               modèle de données
                                        • Organisation physique des données
                                        • Structures de stockage des données
Physique     • Dépendant du SGBD        • Structures accélératrices (index)
14

        Modélisation Relationnelle (1)
                                      Champs, attributs,
Relation ou table                        colonnes


                    Id-D   Nom      Prénom
                     1     Dupont   Pierre
                     2     Durand    Paul
                     3     Masse     Jean
                    ….     ……..      ……




                                              Tuples, lignes ou
                                                  n-uplets
15

                  Modélisation Relationnelle (2)
       Docteurs                                                                                  Prescriptions
Id-D    Nom       Prénom                                                                Id-V     Ligne    Id-M    Posologie
 1     Dupont      Pierre
                                     Visites                                                1     1        12     1 par jour
 2     Durand       Paul                                                                    1     2         5     10 gouttes
                               Id-D     Id-P   Id-V     Date            Prix
 3     Masse        Jean                                                                    2     1         8     2 par jour
                                 1       2      1      15 juin          250
….     ……..         ……                                                                      2     2        12     1 par jour
                                 1       1      2     12 août           180
                                 2       2      3     13 juillet        350                 2     3         3      2 gouttes

                                 2       3      4      1 mars           250                 ….    ….       ….     …………


                Patients
Id-P    Nom        Prénom     Ville                                                     Médicaments
 1     Lebeau      Jacques    Paris                              Id-M             Nom                    Description
 2      Troger      Zoe       Evry                                 1          Aspegic 1000       ……………………………..
 3       Doe        John      Paris                                2            Fluisédal        ……………………………..
 4      Perry       Paule    Valenton                              3           Mucomyst          ……………………………..
 ….     …….         …….       …….                                  ….            ……..            ……………………………..
2. Objectifs des SGBD                                                    16




                          I- Indépendance
                              Physique


        X - Standards                           II- Indépendance
                                                     Logique


IX - Gestion de la                                     III – Langage de
 confidentialité                                         manipulation


VIII - Concurrence            BD                       IV - Gestion des
      d’accès                                                vues


      VII - Gestion des                        V - Optimisation des
           pannes                                   questions


                          VI - Gestion de la
                              cohérence
17


       I - Indépendance Physique
• Indépendance des programmes
  d'applications vis à vis du modèle physique :
  – Possibilité de modifier les structures de stockage
    (fichiers, index, chemins d'accès, …) sans modifier
    les programmes;
  – Ecriture des applications par des non-spécialistes
    des fichiers et des structures de stockage;
  – Meilleure portabilité des applications et
    indépendance vis à vis du matériel.
18


                        II - Indépendance Logique
Les applications peuvent définir des vues logiques de la BD
        Gestion des médicaments                                                  Cabinet du Dr. Masse
                   Nombre_Médicaments                                                                                                                        Prescription
                                                                                                                                                  Id - V    Ligne     Id - M      Posologie
 Id-M       Nom             Description   Nombre                                           Visites
                                                                                                                                                    1        1          12        1 par jour
                                                                                  Id - D     Id - P   Id - V   Date            Prix
                                                                                                                                                    1        2          5         10 gouttes
  1      Aspegic 1000   ……………………………..       30                                      1          2        1      15 juin         250
                                                                                                                                                   ….       ….         ….         …………
                                                                                    2          3        4      1 mars          250
  2        Fluisédal    ……………………………..       20
                                                            Patients
  3       Mucomyst      ……………………………..      230     Id - P   Nom        Prénom                                                                     Médicament
                                                     1      Lebeau     Jacques                                        Id - M            Nom                         Description
 ….         ……..        ……………………………..      …..       2      Troger      Zoe                                              1        Aspegic 1000             ……………………………..

                                                    ….      …….        …….                                               2            Fluisédal            ……………………………..
                                                                                                                         3            Mucomyst             ……………………………..
                                                                                                                         ….            ……..                ……………………………..
19


Avantages de l’indépendance logique
• Possibilité pour chaque application d'ignorer les besoins des
  autres (bien que partageant la même BD).
• Possibilité d'évolution de la base de données sans réécriture
  des applications :
   – ajout de champs, ajout de relation, renommage de champs.

• Possibilité d'intégrer des applications existantes sans
  modifier les autres.
• Possibilité de limiter les conséquences du partage : Données
  confidentielles.
20


         III - Manipulation aisée
• La manipulation se fait via un langage déclaratif
   – La question déclare l’objectif sans décrire la méthode
   – Le langage suit une norme commune à tous les SGBD
   – SQL : Structured Query Langage

• Sémantique
   – Logique du 1er ordre ++
• Syntaxe (aperçu !)
   – SELECT <structure des résultats>
   – FROM <relations>
   – WHERE <conditions>
21


IV – Des vues multiples des données
• Les vues permettent d’implémenter l’indépendance logique
  en permettant de créer des relations virtuelles
• Vue = Question stockée
• Le SGBD stocke la définition et non le résultat
• Exemple :
   –   la vue des patients parisiens
   –   la vue des docteurs avec leurs patients
   –   La vue des services statistiques
   –   ...
22


       V –Exécution et Optimisation
• Traduction automatique des questions déclaratives en
  programmes procéduraux :
    Utilisation de l’algèbre relationnelle

• Optimisation automatique des questions
    Utilisation de l’aspect déclaratif de SQL
    Gestion centralisée des chemins d'accès (index, hachages, …)
    Techniques d’optimisation poussées

• Economie de l'astuce des programmeurs
   – milliers d'heures d'écriture et de maintenance de logiciels.
23


               VI - Intégrité Logique
• Objectif : Détecter les mises à jour erronées

• Contrôle sur les données élémentaires
   – Contrôle de types: ex: Nom alphabétique
   – Contrôle de valeurs: ex: Salaire mensuel entre 5 et 50kf

• Contrôle sur les relations entre les données
   – Relations entre données élémentaires:
      • Prix de vente > Prix d'achat
   – Relations entre objets:
      • Un électeur doit être inscrit sur une seule liste électorale
24


          Contraintes d’intégrité
• Avantages :
  – simplification du code des applications
  – sécurité renforcée par l'automatisation
  – mise en commun des contraintes


• Nécessite :
  – un langage de définition de contraintes d'intégrité
  – la vérification automatique de ces contraintes
25


               VII - Intégrité Physique
• Motivations : Tolérance aux fautes
   –   Transaction Failure : Contraintes d'intégrité, Annulation
   –   System Failure : Panne de courant, Crash serveur ...
   –   Media Failure : Perte du disque
   –   Communication Failure : Défaillance du réseau

• Objectifs :
   – Assurer l'atomicité des transactions
   – Garantir la durabilité des effets des transactions commises

• Moyens :
   – Journalisation : Mémorisation des états successifs des données
   – Mécanismes de reprise
26


                  Transaction

                  Incohérence possible...
  Etat cohérent                             Etat cohérent


Begin                                                   Commit
                    Transaction



         Begin
          CEpargne = CEpargne - 3000
          CCourant = CCourant + 3000
         Commit T1
27


             Atomicité et Durabilité


   ATOMICITE                            DURABILITE
                        Panne
Begin                           Begin
 CEpargne = CEpargne - 3000      CEpargne = CEpargne - 3000
 CCourant = CCourant + 3000      CCourant = CCourant + 3000
Commit T1                       Commit T1
                                          Crash disque



 Annuler le débit !!            S’assurer que le
                                virement a été fait !
28


         VIII - Partage des données


               BD




• Accès concurrent aux mêmes données
Conflits d’accès !!
29


             Isolation et Cohérence


                BD



• Le SGBD gère les accès concurrents
 Chacun à l’impression d’être seul (Isolation)
 Cohérence conservée (Pas de maj conflictuelles)
30


               IX – Confidentialité
• Objectif : Protéger les données de la BD contre des accès
  non autorisés

• Deux niveaux :
   – Connexion restreinte aux usagers répertoriés (mot de passe)
   – Privilèges d'accès aux objets de la base

• Usagers : Usager ou groupe d’usagers

• Objets : Relation, Vue, autres objets (procédures, etc.)
31


               X - Standardisation
• L’approche bases de données est basée sur plusieurs
  standards
   – Langage SQL (SQL1, SQL2, SQL3)
   – Communication SQL CLI (ODBC / JDBC)
   – Transactions (X/Open DTP, OSI-TP)


• Force des standards
   – Portabilité
   – Interopérabilté
   – Applications multisources…
3. Architecture des
                        SGBD sont très liées au mode de
Les architectures physiques de SGBD
répartition.
— BD centralisée
— BD client/serveur
— BD client/multi-serveurs
— BD répartie
— BD hétérogène
— BD mobile
Le challenge se déplace des Péta-bases aux Pico-bases.
— Péta-bases => parallélisme et grandes mémoires
— Pico-bases => faible empreinte et forte sécurité
33

Architecture centralisée

                               Terminaux passifs




                                    réseau




                                   Mainframe
Appli 1   Appli 2    Appli n



            SGBD

           données
Architecture client-
        serveur
                                Clients intelligents


Appli 1
           Appli 2
                      Appli n         réseau




                                      serveur



          SGBD


 code       données
35

                   Architecture Client-
                     Multiserveurs

                            Appli 1
                      SQL             SQL


                   ODBC                     ODBC

                                                SQL
         SQL



       SGBD 1                                  SGBD 2

code     données                        code     données
Architecture
                          répartie
                   Appli 1
                             Appli 2
                                       Appli n




       SGBD 1                                    SGBD 2

code     données                        code       données
Architecture
           mobile
                             Clients intelligents
                                   mobiles



       Données répliquées
        et/ou personnelles     Réseau sans fil




                                   serveur



        SGBD


code        données
38

 4. Applications traditionnelles
           des SGBD
• OLTP (On Line Transaction Processing)
  –   Cible des SGBD depuis leur existence
  –   Banques, réservation en ligne ...
  –   Très grand nombre de transactions en parallèle
  –   Transactions simples

• OLAP (On Line Analytical Processing)
  – Entrepôts de données, DataCube, Data Mining …
  – Faible nombre de transactions
  – Transactions très complexes
39


                Evolution des BD

               BD             BD          BD ‘light’    PicoDBMS
           d’entreprise   personnelles   (PDA / Tél.)   carte à puce

Capacité


  Prix


Nombre

Mais conteúdo relacionado

Mais procurados

Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelFrédéric FAURE
 
Architectures orientés services (SOA)
Architectures orientés services (SOA)Architectures orientés services (SOA)
Architectures orientés services (SOA)Heithem Abbes
 
Cours langage c
Cours langage cCours langage c
Cours langage ccoursuniv
 
Internet et ses services
Internet et ses servicesInternet et ses services
Internet et ses servicesAbdoulaye Dieng
 
Integration de donnees_etl
Integration de donnees_etlIntegration de donnees_etl
Integration de donnees_etlhoracio lassey
 
Formation C# - Cours 1 - Introduction, premiers pas, concepts
Formation C# - Cours 1 - Introduction, premiers pas, conceptsFormation C# - Cours 1 - Introduction, premiers pas, concepts
Formation C# - Cours 1 - Introduction, premiers pas, conceptskemenaran
 
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...ENSET, Université Hassan II Casablanca
 
Cours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURICours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURIMansouri Khalifa
 
Base de données distribuée
Base de données distribuéeBase de données distribuée
Base de données distribuéekamar MEDDAH
 
Fiche TD sur les systèmes informatiques
Fiche TD sur les systèmes informatiquesFiche TD sur les systèmes informatiques
Fiche TD sur les systèmes informatiquesATPENSC-Group
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Chp3 - Les Services Web
Chp3 - Les Services WebChp3 - Les Services Web
Chp3 - Les Services WebLilia Sfaxi
 
Cours complet Base de donne Bac
Cours complet Base de donne Bac Cours complet Base de donne Bac
Cours complet Base de donne Bac Amri Ossama
 
Chp2 - Vers les Architectures Orientées Services
Chp2 - Vers les Architectures Orientées ServicesChp2 - Vers les Architectures Orientées Services
Chp2 - Vers les Architectures Orientées ServicesLilia Sfaxi
 
Ch2-Notions de base & actions élémentaires.pdf
Ch2-Notions de base & actions élémentaires.pdfCh2-Notions de base & actions élémentaires.pdf
Ch2-Notions de base & actions élémentaires.pdfFadouaBouafifSamoud
 

Mais procurados (20)

Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et Opérationnel
 
Architectures orientés services (SOA)
Architectures orientés services (SOA)Architectures orientés services (SOA)
Architectures orientés services (SOA)
 
Cours langage c
Cours langage cCours langage c
Cours langage c
 
Introduction au langage SQL
Introduction au langage SQLIntroduction au langage SQL
Introduction au langage SQL
 
Internet et ses services
Internet et ses servicesInternet et ses services
Internet et ses services
 
Tp java ee.pptx
Tp java ee.pptxTp java ee.pptx
Tp java ee.pptx
 
Cours access
Cours accessCours access
Cours access
 
Integration de donnees_etl
Integration de donnees_etlIntegration de donnees_etl
Integration de donnees_etl
 
Formation C# - Cours 1 - Introduction, premiers pas, concepts
Formation C# - Cours 1 - Introduction, premiers pas, conceptsFormation C# - Cours 1 - Introduction, premiers pas, concepts
Formation C# - Cours 1 - Introduction, premiers pas, concepts
 
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...
 
Cours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURICours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURI
 
Base de données distribuée
Base de données distribuéeBase de données distribuée
Base de données distribuée
 
Fiche TD sur les systèmes informatiques
Fiche TD sur les systèmes informatiquesFiche TD sur les systèmes informatiques
Fiche TD sur les systèmes informatiques
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Chp3 - Les Services Web
Chp3 - Les Services WebChp3 - Les Services Web
Chp3 - Les Services Web
 
C#
C#C#
C#
 
Cours complet Base de donne Bac
Cours complet Base de donne Bac Cours complet Base de donne Bac
Cours complet Base de donne Bac
 
Chp2 - Vers les Architectures Orientées Services
Chp2 - Vers les Architectures Orientées ServicesChp2 - Vers les Architectures Orientées Services
Chp2 - Vers les Architectures Orientées Services
 
LES JOINTURES
LES JOINTURESLES JOINTURES
LES JOINTURES
 
Ch2-Notions de base & actions élémentaires.pdf
Ch2-Notions de base & actions élémentaires.pdfCh2-Notions de base & actions élémentaires.pdf
Ch2-Notions de base & actions élémentaires.pdf
 

Destaque

Merise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigésMerise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigésMajid CHADAD
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql Yassine Badri
 
exercices Corrigées du merise
exercices Corrigées du  meriseexercices Corrigées du  merise
exercices Corrigées du meriseYassine Badri
 
Types of databases
Types of databasesTypes of databases
Types of databasesPAQUIAAIZEL
 
La historia de mi vida joselin cervantes
La historia de mi vida joselin cervantesLa historia de mi vida joselin cervantes
La historia de mi vida joselin cervantesjoselinCervantes
 
Los derechos humanos en el contexto de la violencia política peruana de los ú...
Los derechos humanos en el contexto de la violencia política peruana de los ú...Los derechos humanos en el contexto de la violencia política peruana de los ú...
Los derechos humanos en el contexto de la violencia política peruana de los ú...Carlos Alberto Zavala Rodríguez
 
Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association ARIJ BenHarrath
 
Les nouveautés de System Center Configuration Manager vNext
Les nouveautés de System Center Configuration Manager vNextLes nouveautés de System Center Configuration Manager vNext
Les nouveautés de System Center Configuration Manager vNextMicrosoft Décideurs IT
 
Hotel android
Hotel androidHotel android
Hotel androidgh hassen
 
Exportación y bibliografía
Exportación y bibliografíaExportación y bibliografía
Exportación y bibliografíaahlemdris
 
Cavas arbol de los sueños
Cavas arbol de los sueñosCavas arbol de los sueños
Cavas arbol de los sueñosfrancyamu
 
Grupo 3 informática
Grupo 3 informáticaGrupo 3 informática
Grupo 3 informáticaNena Suriaga
 
Archivierung von Video
Archivierung von VideoArchivierung von Video
Archivierung von Videoyvesnie
 
System Center 2012, la machinerie de l'ITIL
System Center 2012, la machinerie de l'ITILSystem Center 2012, la machinerie de l'ITIL
System Center 2012, la machinerie de l'ITILMicrosoft Décideurs IT
 

Destaque (20)

Introduction aux SGBD
Introduction aux SGBDIntroduction aux SGBD
Introduction aux SGBD
 
Cours Excel
Cours ExcelCours Excel
Cours Excel
 
Merise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigésMerise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigés
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql
 
exercices Corrigées du merise
exercices Corrigées du  meriseexercices Corrigées du  merise
exercices Corrigées du merise
 
Types of databases
Types of databasesTypes of databases
Types of databases
 
Introduction to database
Introduction to databaseIntroduction to database
Introduction to database
 
La historia de mi vida joselin cervantes
La historia de mi vida joselin cervantesLa historia de mi vida joselin cervantes
La historia de mi vida joselin cervantes
 
Los derechos humanos en el contexto de la violencia política peruana de los ú...
Los derechos humanos en el contexto de la violencia política peruana de los ú...Los derechos humanos en el contexto de la violencia política peruana de los ú...
Los derechos humanos en el contexto de la violencia política peruana de los ú...
 
Ppt Einstein
Ppt EinsteinPpt Einstein
Ppt Einstein
 
Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association
 
Les nouveautés de System Center Configuration Manager vNext
Les nouveautés de System Center Configuration Manager vNextLes nouveautés de System Center Configuration Manager vNext
Les nouveautés de System Center Configuration Manager vNext
 
Community managers
Community managersCommunity managers
Community managers
 
Hotel android
Hotel androidHotel android
Hotel android
 
Exportación y bibliografía
Exportación y bibliografíaExportación y bibliografía
Exportación y bibliografía
 
Cavas arbol de los sueños
Cavas arbol de los sueñosCavas arbol de los sueños
Cavas arbol de los sueños
 
Grupo 3 informática
Grupo 3 informáticaGrupo 3 informática
Grupo 3 informática
 
Le Mag Sud Ouest
Le Mag Sud OuestLe Mag Sud Ouest
Le Mag Sud Ouest
 
Archivierung von Video
Archivierung von VideoArchivierung von Video
Archivierung von Video
 
System Center 2012, la machinerie de l'ITIL
System Center 2012, la machinerie de l'ITILSystem Center 2012, la machinerie de l'ITIL
System Center 2012, la machinerie de l'ITIL
 

Introduction aux bases de données

  • 1. Bases de données : Introduction et Objectifs
  • 2. 2 1. Introduction • Les entreprises gèrent des volumes de données très grands – Giga, Terra, Péta –octets – Numériques, Textuelles, Multi-média (images, films,...) • Il faut pouvoir facilement – Archiver les données sur mémoires secondaires permanente – Retrouver les données pertinentes à un traitement – Mettre à jour les données variant dans le temps • Les données sont structurées et identifiées – Données élémentaires ex: Votre salaire, Votre note en BD – Données composées ex: Votre CV, vos résultats de l'année – Identifiant humain ex: NSS ou machine: P26215 • Qu'est-ce qu'une BD ? – Collection de données structurées reliées par des relations – Interrogeable et modifiable par des langages de haut niveau
  • 3. 3 La hiérarchie des mémoires Capacité Mémoire vs terciaire Coût & • Un accès disque est environ Vitesse 100,000 fois plus lent qu’un accès mémoire! 5-10 ms Mémoire • ⇒ secondaire – Eviter les accès disques • grande mémoire principale 80-200 ns Mémoire principale – Amortir les accès disques (RAM) • placement des données – Minimiser le nombre d’accès disques 3-10 ns Cache (SRAM) • méthodes d’accès 2-5 ns Registres
  • 4. 4 Un peu d'histoire • Années 60: – Récipients logique de données  fichiers sur dique – Accès séquentiel puis sur clé • Lire (Nomf, Article), Ecrire (Nomf, Article) • Lire (Nomf, Article, Clé), Ecrire (Nomf, article, Clé) • Années 70: – Avènement des Bases de Données Réseaux (BD) – Ensemble de fichiers reliés par des pointeurs – Langage d'interrogation par navigation • Années 80: – Avènement des Bases de Données Relationnelles (BDR) – Relations entre ensemble de données – Langage d'interrogation par assertion logique
  • 5. Systèmes de fichiers Caractéristiques 5 Comptabilité Chirurgie Problèmes Consultations Psychiatrie
  • 6. Format des fichiers Caractéristiques 6 Plusieurs applications  plusieurs formats Dupont Dupond Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Problèmes  Difficultés de gestion Duhpon Duipont Turlututu : sq Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 7. Redondance (données) Caractéristiques 7 Plusieurs applications  plusieurs formats Dupont Dupond Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Problèmes  Difficultés de gestion  Incohérence des données Duhpon Duipont Turlututu : sq Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 8. Interrogations Caractéristiques 8 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoft ConsultSoft Duhpon Duipont Turlututu : sq Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 9. Pannes ??? Caractéristiques 9 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Redondance de code Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoft ConsultSoft Duhpon Duipont Turlututu : sq  Gestion de pannes ??? Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 10. Partage de données Caractéristiques 10 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Redondance de code Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoft ConsultSoft Duhpon Duipont Turlututu : sq  Gestion de pannes ??? Symptomes : yy Analyses : xxxx Symptomyyyy Analysesxxxx  Partage des données ??? Symptomes : yy Turlututudhjsd
  • 11. Confidentialité Caractéristiques 11 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Redondance de code Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoft ConsultSoft Duhpon Duipont Turlututu : sq  Gestion de pannes ??? Symptomes : yy Analyses : xxxx Symptomyyyy Analysesxxxx  Partage des données ??? Symptomes : yy Turlututudhjsd  Confidentialité ???
  • 12. 12 L’approche ‘‘Bases de données’’ • Modélisation des données  Eliminer la redondance de données  Centraliser et organiser correctement les données  Plusieurs niveaux de modélisation  Outils de conception • Logiciel «Système de Gestion de Bases de Données» Factorisation des modules de contrôle des applications - Interrogation, cohérence, partage, gestion de pannes, etc… Administration facilitées des données
  • 13. 13 Modélisation du réel Réel • Indépendant du Modèle modèle de données conceptuel • Indépendant du SGBD Médecin effectue Visite • Dépendant du Modèle modèle de données Codasyl Relationnel Objet XML logique • Indépendant du SGBD Modèle • Dépendant du modèle de données • Organisation physique des données • Structures de stockage des données Physique • Dépendant du SGBD • Structures accélératrices (index)
  • 14. 14 Modélisation Relationnelle (1) Champs, attributs, Relation ou table colonnes Id-D Nom Prénom 1 Dupont Pierre 2 Durand Paul 3 Masse Jean …. …….. …… Tuples, lignes ou n-uplets
  • 15. 15 Modélisation Relationnelle (2) Docteurs Prescriptions Id-D Nom Prénom Id-V Ligne Id-M Posologie 1 Dupont Pierre Visites 1 1 12 1 par jour 2 Durand Paul 1 2 5 10 gouttes Id-D Id-P Id-V Date Prix 3 Masse Jean 2 1 8 2 par jour 1 2 1 15 juin 250 …. …….. …… 2 2 12 1 par jour 1 1 2 12 août 180 2 2 3 13 juillet 350 2 3 3 2 gouttes 2 3 4 1 mars 250 …. …. …. ………… Patients Id-P Nom Prénom Ville Médicaments 1 Lebeau Jacques Paris Id-M Nom Description 2 Troger Zoe Evry 1 Aspegic 1000 …………………………….. 3 Doe John Paris 2 Fluisédal …………………………….. 4 Perry Paule Valenton 3 Mucomyst …………………………….. …. ……. ……. ……. …. …….. ……………………………..
  • 16. 2. Objectifs des SGBD 16 I- Indépendance Physique X - Standards II- Indépendance Logique IX - Gestion de la III – Langage de confidentialité manipulation VIII - Concurrence BD IV - Gestion des d’accès vues VII - Gestion des V - Optimisation des pannes questions VI - Gestion de la cohérence
  • 17. 17 I - Indépendance Physique • Indépendance des programmes d'applications vis à vis du modèle physique : – Possibilité de modifier les structures de stockage (fichiers, index, chemins d'accès, …) sans modifier les programmes; – Ecriture des applications par des non-spécialistes des fichiers et des structures de stockage; – Meilleure portabilité des applications et indépendance vis à vis du matériel.
  • 18. 18 II - Indépendance Logique Les applications peuvent définir des vues logiques de la BD Gestion des médicaments Cabinet du Dr. Masse Nombre_Médicaments Prescription Id - V Ligne Id - M Posologie Id-M Nom Description Nombre Visites 1 1 12 1 par jour Id - D Id - P Id - V Date Prix 1 2 5 10 gouttes 1 Aspegic 1000 …………………………….. 30 1 2 1 15 juin 250 …. …. …. ………… 2 3 4 1 mars 250 2 Fluisédal …………………………….. 20 Patients 3 Mucomyst …………………………….. 230 Id - P Nom Prénom Médicament 1 Lebeau Jacques Id - M Nom Description …. …….. …………………………….. ….. 2 Troger Zoe 1 Aspegic 1000 …………………………….. …. ……. ……. 2 Fluisédal …………………………….. 3 Mucomyst …………………………….. …. …….. ……………………………..
  • 19. 19 Avantages de l’indépendance logique • Possibilité pour chaque application d'ignorer les besoins des autres (bien que partageant la même BD). • Possibilité d'évolution de la base de données sans réécriture des applications : – ajout de champs, ajout de relation, renommage de champs. • Possibilité d'intégrer des applications existantes sans modifier les autres. • Possibilité de limiter les conséquences du partage : Données confidentielles.
  • 20. 20 III - Manipulation aisée • La manipulation se fait via un langage déclaratif – La question déclare l’objectif sans décrire la méthode – Le langage suit une norme commune à tous les SGBD – SQL : Structured Query Langage • Sémantique – Logique du 1er ordre ++ • Syntaxe (aperçu !) – SELECT <structure des résultats> – FROM <relations> – WHERE <conditions>
  • 21. 21 IV – Des vues multiples des données • Les vues permettent d’implémenter l’indépendance logique en permettant de créer des relations virtuelles • Vue = Question stockée • Le SGBD stocke la définition et non le résultat • Exemple : – la vue des patients parisiens – la vue des docteurs avec leurs patients – La vue des services statistiques – ...
  • 22. 22 V –Exécution et Optimisation • Traduction automatique des questions déclaratives en programmes procéduraux :  Utilisation de l’algèbre relationnelle • Optimisation automatique des questions  Utilisation de l’aspect déclaratif de SQL  Gestion centralisée des chemins d'accès (index, hachages, …)  Techniques d’optimisation poussées • Economie de l'astuce des programmeurs – milliers d'heures d'écriture et de maintenance de logiciels.
  • 23. 23 VI - Intégrité Logique • Objectif : Détecter les mises à jour erronées • Contrôle sur les données élémentaires – Contrôle de types: ex: Nom alphabétique – Contrôle de valeurs: ex: Salaire mensuel entre 5 et 50kf • Contrôle sur les relations entre les données – Relations entre données élémentaires: • Prix de vente > Prix d'achat – Relations entre objets: • Un électeur doit être inscrit sur une seule liste électorale
  • 24. 24 Contraintes d’intégrité • Avantages : – simplification du code des applications – sécurité renforcée par l'automatisation – mise en commun des contraintes • Nécessite : – un langage de définition de contraintes d'intégrité – la vérification automatique de ces contraintes
  • 25. 25 VII - Intégrité Physique • Motivations : Tolérance aux fautes – Transaction Failure : Contraintes d'intégrité, Annulation – System Failure : Panne de courant, Crash serveur ... – Media Failure : Perte du disque – Communication Failure : Défaillance du réseau • Objectifs : – Assurer l'atomicité des transactions – Garantir la durabilité des effets des transactions commises • Moyens : – Journalisation : Mémorisation des états successifs des données – Mécanismes de reprise
  • 26. 26 Transaction Incohérence possible... Etat cohérent Etat cohérent Begin Commit Transaction Begin CEpargne = CEpargne - 3000 CCourant = CCourant + 3000 Commit T1
  • 27. 27 Atomicité et Durabilité ATOMICITE DURABILITE Panne Begin Begin CEpargne = CEpargne - 3000 CEpargne = CEpargne - 3000 CCourant = CCourant + 3000 CCourant = CCourant + 3000 Commit T1 Commit T1 Crash disque  Annuler le débit !!  S’assurer que le virement a été fait !
  • 28. 28 VIII - Partage des données BD • Accès concurrent aux mêmes données Conflits d’accès !!
  • 29. 29 Isolation et Cohérence BD • Le SGBD gère les accès concurrents  Chacun à l’impression d’être seul (Isolation)  Cohérence conservée (Pas de maj conflictuelles)
  • 30. 30 IX – Confidentialité • Objectif : Protéger les données de la BD contre des accès non autorisés • Deux niveaux : – Connexion restreinte aux usagers répertoriés (mot de passe) – Privilèges d'accès aux objets de la base • Usagers : Usager ou groupe d’usagers • Objets : Relation, Vue, autres objets (procédures, etc.)
  • 31. 31 X - Standardisation • L’approche bases de données est basée sur plusieurs standards – Langage SQL (SQL1, SQL2, SQL3) – Communication SQL CLI (ODBC / JDBC) – Transactions (X/Open DTP, OSI-TP) • Force des standards – Portabilité – Interopérabilté – Applications multisources…
  • 32. 3. Architecture des SGBD sont très liées au mode de Les architectures physiques de SGBD répartition. — BD centralisée — BD client/serveur — BD client/multi-serveurs — BD répartie — BD hétérogène — BD mobile Le challenge se déplace des Péta-bases aux Pico-bases. — Péta-bases => parallélisme et grandes mémoires — Pico-bases => faible empreinte et forte sécurité
  • 33. 33 Architecture centralisée Terminaux passifs réseau Mainframe Appli 1 Appli 2 Appli n SGBD données
  • 34. Architecture client- serveur Clients intelligents Appli 1 Appli 2 Appli n réseau serveur SGBD code données
  • 35. 35 Architecture Client- Multiserveurs Appli 1 SQL SQL ODBC ODBC SQL SQL SGBD 1 SGBD 2 code données code données
  • 36. Architecture répartie Appli 1 Appli 2 Appli n SGBD 1 SGBD 2 code données code données
  • 37. Architecture mobile Clients intelligents mobiles Données répliquées et/ou personnelles Réseau sans fil serveur SGBD code données
  • 38. 38 4. Applications traditionnelles des SGBD • OLTP (On Line Transaction Processing) – Cible des SGBD depuis leur existence – Banques, réservation en ligne ... – Très grand nombre de transactions en parallèle – Transactions simples • OLAP (On Line Analytical Processing) – Entrepôts de données, DataCube, Data Mining … – Faible nombre de transactions – Transactions très complexes
  • 39. 39 Evolution des BD BD BD BD ‘light’ PicoDBMS d’entreprise personnelles (PDA / Tél.) carte à puce Capacité Prix Nombre