Este documento describe las bases de datos distribuidas, incluyendo sus tipos (centralizada, replicada, fragmentada e híbrida), objetivos (autonomía local, no dependencia de un sitio central, operación continua, independencia con respecto a la localización), y ventajas y desventajas (las ventajas incluyen reflejar la estructura organizacional y disponibilidad, mientras que las desventajas son la complejidad y falta de estándares).
1. Introducción
Emily Rubens 2013-1644
Rey Andrés 2013-1547
Juan Carlos 2012-1357
Brenst Cabrera 2013-1481
Francisco Gabriel 2012-1347
Base datos
distribuidas (BDD)
Tipos de BDD
Ambientes de BDD
Objetivos de una
BDD
Ventajas y
desventajas
2. Base de datos Distribuidas
Una base de datos distribuida (BDD) es un conjunto de
múltiples bases de datos lógicamente relacionadas las cuales
se encuentran distribuidas en diferentes espacios lógicos e
interconectados por una red de comunicaciones. Dichas BDD
tienen la capacidad de realizar procesamiento autónomo,
esto permite realizar operaciones locales o distribuidas.
3. Breve Historia
La necesidad de almacenar datos de
forma masiva dio paso a la creación
de los sistemas de bases de datos. En
1970 Edgar Frank Codd escribió un
artículo con nombre: "A Relational
Model of Data for Large Shared Data
Banks" ("Un modelo relacional para
grandes bancos de datos
compartidos"). Con este artículo y
otras publicaciones, definió el modelo
de bases de datos relacionales y
reglas para poder evaluar un
administrador de bases de datos
relacionales.
4. Tipos de Base de datos distribuidas.
Centralizada, Replicada , Fragmentada, e
Híbrida.
5. Tipos de Base de datos distribuidas.
Centralizada: Es muy similar al modelo de
Cliente/Servidor en el sentido que la BDD está
centraliza en un lugar y los usuario están
distribuidos.
Replicadas: El esquema de BDD de replicación
consiste en que nada nodo debe tener su copia
completa de la base de datos.
6. Particionadas: Este modelo consiste en que solo hay
una copia de cada elemento, pero la información
esta distribuida a través de los nodos. La
fragmentación se puede realizar también de tres
formas:
• Horizontal
• Vertical
• Mixto
Hibrida: Este esquema simplemente representa la
combinación del esquema de partición y replicación.
Se partición la relación y a al vez los fragmentos están
selectivamente replicados a través del sistema de
BDD.
7. Un Sistema de base de datos distribuida o SBDD
Es entonces el resultado de la integración de una base de
datos distribuida con un sistema para su manejo.
SMBDD o Sistema de Manejo de Base de datos. Es aquel que
se encarga del manejo de la BDD y proporciona un
mecanismo de acceso que hace que la distribución sea
transparente a los usuarios.
8. Ambientes de bases de datos
distribuidas.
Las BDD pueden ser:
Homogéneas:
Todos los sitios tienen el mismo SGBD.
Heterogéneas:
Cada sitio puede tener un SGBD distinto así como esquemas
diferentes.
9. Los ambientes en los que se encuentra con mayor
frecuencia el uso de las bases de datos distribuidas son:
Cualquier organización que tiene una estructura
descentralizada. Casos típicos de los anterior son:
organismo gubernamentales y/o de servicio privado.
La industria de la manufactura, particularmente,
aquella con plantas múltiples. Por ejemplo, la industria
automotriz.
Aplicaciones de control y comando militar.
Líneas de transportación aérea.
Cadenas hoteleras.
Servicios bancarios y financieros.
10. Objetivos de las Base de datos
distribuidas
1. Autonomía Local.
Los sitios de un sistema distribuido deben ser autónomos. La
autonomía local significa que todas las operaciones en un sitio dado
se controlan en ese sitio; ningún sitio X deberá depender de algún
otro sitio Y para su buen funcionamiento (pues de otra manera el
sitio X podría ser incapaz de trabajar, aunque no tenga en sí
problema alguno, si cae el sitio Y, situación a todas luces
indeseable) La autonomía local implica también un propietario y
una administración locales de los datos, con responsabilidad local:
todos los datos pertenecen " en realidad" a una base de datos
local, aunque sean accesibles desde algún sitio remoto.
2. No dependencia de un sitio central.
La autonomía local implica que todos los sitios deben tratarse igual;
no debe haber dependencia de un sitio central "maestro" para
obtener un servicio central, como por ejemplo un procesamiento
centralizado de las consultas o una administración centralizada de
las transacciones, de modo que todo el sistema dependa de ese
sitio central.
11. 3. Operación continua.
En un sistema distribuido, lo mismo que en uno no distribuido,
idealmente nunca debería haber necesidad de apagar a propósito
el sistema Es decir, el sistema nunca debería necesitar apagarse
para que se pueda realizar alguna función, como añadirse un
nuevo sitio o instalar una versión mejorada del DBMS en un sitio ya
existente.
4. Independencia con respecto a la localización.
La idea básica de la independencia con respecto a la localización
(también conocida como transparencia de localización) es simple :
no debe ser necesario que los usuarios sepan dónde están
almacenados físicamente los datos, sino que más bien deben poder
comportarse – al menos desde un punto de vista lógico - como si
todos los datos estuvieran almacenados en su propio sitio local.
5. Independencia con respecto a la fragmentación.
Un sistema maneja fragmentación de los datos si es posible dividir
una relación en partes o "fragmentos" para propósitos de
almacenamiento físico.
12. 6. Independencia de réplica.
Un sistema maneja réplica de datos si una relación dada (ó en
términos más generales, un fragmento dado en una relación) se puede
representar en el nivel físico mediante varias copias réplicas, en
muchos sitios distintos.
7. Procesamiento distribuido de consultas.
El sistema debe ser capaz de procesar consultas que afecten a datos
de más de un sitio y hacerlo de forma optimizada. Este hecho puede
ser considerado como otra razón por la que los sistemas distribuidos
siempre son relacionales (Las peticiones relacionales son optimizables ,
mientras que las no relacionales no lo son).
8. Manejo distribuido de transacciones.
El manejo de transacciones tiene dos aspectos principales, el control
de recuperación y el control de concurrencia, cada uno de los cuales
requiere un tratamiento más amplio en el ambiente distribuido.
13. 9. Independencia con respecto al equipo.
En realidad, no hay mucho que decir acerca de este tema, el título lo dice
todo. Las instalaciones de cómputo en el mundo real por lo regular incluyen
varias máquinas diferentes -máquinas IBM, DEC, HP, UNISYS, PC etc.
o 10. Independencia con respecto al sistema operativo.
Es obvia la conveniencia no sólo de poder ejecutar el mismo DBMS en
diferentes equipos, sino también poder ejecutarlo en diferentes sistemas
operativos y lograr que una versión MVS y una UNIX y una PC/DOS participen
todas en el mismo sistema distribuido.
11. Independencia con respecto a la red.
Si el sistema ha de poder manejar múltiples sitios diferentes, con equipo
distinto y diferentes sistemas operativos, resulta obvia la conveniencia de
poder manejar también varias redes de comunicación distintas.
12. Independencia con respecto al DBMS
Bajo este título consideramos las implicaciones de relajar la suposición
de homogeneidad estricta.
14. Ventajas y desventajas
Ventajas
Refleja una estructura organizacional - los fragmentos de la base de datos se
ubican en los departamentos a los que tienen relación.
Autonomía local - un departamento puede controlar los datos que le
pertenecen.
Disponibilidad - un fallo en una parte del sistema solo afectará a un
fragmento, en lugar de a toda la base de datos.
Rendimiento - los datos generalmente se ubican cerca del sitio con mayor
demanda, también los sistemas trabajan en paralelo, lo cual permite
balancear la carga en los servidores.
Economía - es más barato crear una red de muchas computadoras
pequeñas, que tener una sola computadora muy poderosa.
Modularidad - se pueden modificar, agregar o quitar sistemas de la base de
datos distribuida sin afectar a los demás sistemas (módulos).
15. Ventajas y desventajas
Desventajas
Complejidad - Se debe asegurar que la base de datos sea transparente, se debe lidiar con
varios sistemas diferentes que pueden presentar dificultades únicas. El diseño de la base de
datos se tiene que trabajar tomando en cuenta su naturaleza distribuida, por lo cual no
podemos pensar en hacer joins que afecten varios sistemas.
Economía - la complejidad y la infraestructura necesaria implica que se necesitará una
mayor mano de obra.
Seguridad - se debe trabajar en la seguridad de la infraestructura así como cada uno de los
sistemas.
Integridad - Se vuelve difícil mantener la integridad, aplicar las reglas de integridad a través
de la red puede ser muy caro en términos de transmisión de datos.
Falta de experiencia - las bases de datos distribuidas son un campo relativamente nuevo y
poco común por lo cual no existe mucho personal con experiencia o conocimientos
adecuados.
Carencia de estándares - aún no existen herramientas o metodologías que ayuden a los
usuarios a convertir un DBMS centralizado en un DBMS distribuido.
Diseño de la base de datos se vuelve más complejo - además de las dificultades que
generalmente se encuentran al diseñar una base de datos, el diseño de una base de datos
distribuida debe considerar la fragmentación, replicación y ubicación de los fragmentos en
sitios específicos.
16. Fin de la
Presentación
Gracias por
escucharnos!