1. Sistema de Gestión de Base de Datos. 1
Presentado por:
LLiulli Lopez Jackeline
Loa Ferrel Arelís
Menacho Alvarez Vani Judith
Peña Soto Jean Carlos
Docente :
Ing. Marleny Peralta Ascue
Base de Datos Distribuido
UNIVERSIDAD NACIONAL MICAELA BASTIDAS DE APURIMAC
C.P. INGENIERIA INFORMATICA Y SISTEMAS
Abancay
2014
2. Sistema de Gestión de Base de Datos. 2
TABLA DE CONTENIDO
1. Sistema de Cómputo Distribuido. ...................................................................................... 5
1.1. Una base de datos distribuida (BDD) ........................................................................... 6
1.2. Un sistema de bases de datos distribuidos (SBDD) ....................................................... 6
1.3. Un sistema de manejo de bases de datos distribuidas (SMBDD) .................................. 6
1.4. Un sistema de base de datos distribuida (SBDD) .......................................................... 6
2. Base de Datos Distribuida. ................................................................................................ 7
3. Definición de una Base de Datos Distribuido: .................................................................. 8
5. Características. ................................................................................................................. 10
6. Construcción de una base de datos distribuidos. ............................................................. 11
8. Ventajas de las bases de datos distribuidas ..................................................................... 13
9. Desventajas de las bases de datos distribuidas ................................................................ 15
10. Modelo de una arquitectura distribuida ............................................................................ 15
11. Diseño de la base de datos distribuidos ........................................................................ 16
11.1 Almacenamiento distribuido de datos ......................................................................... 16
11.2. Ventajas de la fragmentación: .................................................................................... 20
12. Transparencia de la red ..................................................................................................... 20
13. Transparencia de localización ........................................................................................... 21
14. Modelo de transacciones distribuidas ............................................................................... 21
3. Sistema de Gestión de Base de Datos. 3
15. Aplicación ....................................................................................................................... 23
16. Conclusión. ....................................................................................................................... 24
17. Anexos. ............................................................................................................................. 25
4. Sistema de Gestión de Base de Datos. 4
TABLA DE ILUSTRACIONES
Figura 1. (Logo de Base de Datos
Distribuido.)……………………………………………..Error! Bookmark not defined.
Figura 2 (Logo Base de Datos Distribuido)………………………………………………..9.
Figura 3 (Logo Base Distribuida Particionada)……………………………………………12
Figura 4 (Logo Base de Datos Multiplicada y Distribuida)……………………………….12
Figura 5 (Logo Base de Datos Combinando)……………………………………………..13
Figura 6 distribuido geográficamente.)……………………………………………………16
Figura 7 (Modelo de una Arquitectura Distribuida)………………………………………18
Figura 8 (Logo Fragmentación Horizontal)…………………………………………………19
Figura 9 (Logo Fragmentación Vertical)………………………………………………….20
Figura 10 (Logo Fragmentación Mixta)……………………………………………………21
5. Sistema de Gestión de Base de Datos. 5
BASE DE DATOS DISTRIBUIDAS.
Los sistemas de información empezaron a utilizar las bases de datos distribuidas
aproximadamente a mediados de la década de los 70’s, pero no fue sino hasta 1980.
Originalmente se había pensado en almacenar la información de manera centralizada utilizando
un conjunto de herramientas que facilitarán este BASES DE DATOS DISTRIBUIDAS .Pero con
el paso del tiempo esto produjo ciertos inconvenientes que no eran posibles solucionar.
Estos problemas impulsaron la creación de ALMACENAMIENTO DISTRIBUIDO, los cuales
hoy en día proveen características indispensables en el manejo de información; es decir, la
combinación de las redes de comunicación y las bases de datos.
En el mundo actual, diversos tipos de personas, en varios lugares a nivel mundial, querrán
compartir un gran base de datos, estas empresas que tienen la finalidad de garantizar el
compartimiento de los archivos de los usuarios optan por dividir esta base de datos en unas más
pequeñas denominados fragmentos, los cuales se pueden colocar en distintas ubicaciones.
Entonces llamamos base de datos distribuidas a los fragmentos que se encuentran almacenados en
lugares distintos. Estos sitios constan con una computadora y una DBMS (Sistema de gestión de
base de datos), para administrar la base local situada conectándose entre sí aquellos fragmentos
de una base distribuida por medio de una red de comunicación.
6. Sistema de Gestión de Base de Datos. 6
1. Sistema de Cómputo Distribuido.
Es un conjunto de elementos de procesamiento autónomos (no necesariamente homogéneos) se
interconectan por una red de comunicaciones y cooperan entre ellos para realizar sus tareas
asignadas.
1.1. Una base de datos distribuida (BDD)
Es un conjunto de múltiples bases de datos lógicamente relacionados las cuales se
encuentran distribuidas entre diferentes sitios interconectados por una red de
comunicaciones.
1.2. Un sistema de bases de datos distribuidos (SBDD)
Es un sistema en el cual múltiples sitios de bases de datos están ligados por un sistema
de comunicaciones , de tal forma que ,un usuario en cualquier sitio puede accesar los
datos en cualquier parte de la red exactamente como si los datos estuvieran
almacenados en su sitio propio .
1.3. Un sistema de manejo de bases de datos distribuidas (SMBDD)
Es aquel que se encarga del manejo de la BDD y proporciona un mecanismo de acceso
que hace que la distribución sea trasparente a los usuarios. El término transparente
significa que la aplicación trabajaría, desde un punto de vista lógico, como si un solo
SMBD ejecutado en una sola máquina, administra esos datos.
1.4. Un sistema de base de datos distribuida (SBDD)
Es entonces el resultado de la integración de una base de datos distribuida con un
sistema para su manejo.
En un sistema de base de datos distribuida, los datos se almacenan en varios
computadores (llamados sitios o nodos). Los computadores de un sistema distribuido se
comunican entre sí a través de diversos medios de comunicación.
7. Sistema de Gestión de Base de Datos. 7
Un Sistema de Base de Datos Distribuida (DDBS)=DDB +DDBMS.
2. Base de Datos Distribuida.
Una BD Distribuida es aquella donde los datos están repartidos entre más de una máquina y un
SGBD que lo gestiona haciendo que la distribución sea transparente al usuario, el actúa ve toda la
base de datos.
También es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se
encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones, los
cuales tienen la capacidad de procesamiento autónomo lo cual indica que puede realizar
operaciones locales o distribuidas. Un sistema de Bases de Datos Distribuida (SBDD) es un
sistema en el cual múltiples sitios de bases de datos están ligados por un sistema de
comunicaciones de tal forma que, un usuario en cualquier sitio puede acceder los datos en
cualquier parte de la red exactamente como si los datos estuvieran. Un sistema distribuido de
bases de datos se almacena en varias computadoras.
El soporte de las bases de datos distribuidas es que sola una aplicación sea capaz de operar de
manera transparente sobre todos los datos dispersos en una variedad de bases de datos diferentes,
administradas por diferentes SGBDs ejecutadas desde diferentes maquinas, manejadas por
diferentes sistemas operativos.
8. Sistema de Gestión de Base de Datos. 8
Figura 1. (Logo de Base de Datos Distribuido.)
Una BDD es en realidad un tipo de BD virtual cuyas partes componentes están almacenadas en
varias BD “reales” distintas que se encuentran en varios sitios distintos (de hecho, es la unión
lógica de esas BD reales).
3. Definición de una Base de Datos Distribuido:
En otras palabras, cada sitio local tiene
Sus propias BD “reales”
Sus propios usuarios locales
Su propio DBMS local
Software de administración de transacciones (incluyendo su propio
software local para bloqueo, registro en bitácora, recuperación, etc.)
Así como su propio administrador de comunicación de datos local.
9. Sistema de Gestión de Base de Datos. 9
La base de datos distribuidos son fragmentos que se encuentran almacenados en lugares
distintos. Estos sitios constan con una computadora y una DBMS (Sistema de gestión de base de
datos), para administrar la base local situada conectándose entre sí aquellos fragmentos de una
base distribuida por medio de una red de comunicación.
Figura 2 (Logo Base de Datos Distribuido)
Al momento de surgir una petición de consulta de cualquier sitio, el administrador general de la
base de datos, analiza esta petición y determina qué tipo de base de datos distribuidos.
(fragmentos) se puede necesitar. Las bases de datos locales pueden conectarse físicamente de
diversas formas:
Red totalmente conectada
Red prácticamente conectada
Red con estructura de árbol
Red de estrella
Red de anillo
10. Sistema de Gestión de Base de Datos. 10
Las principales diferencias entre estos tipos de configuraciones podemos tener lo siguiente:
Costo de la instalación: El costo de conectar físicamente las localidades del
sistema
Costo de la comunicación: El costo del tiempo y el dinero que interviene en
enviar un mensaje desde una localidad a otra.
Fiabilidad: La frecuencia con que falla una línea de comunicación o una
localidad.
Disponibilidad: La posibilidad de acceder a la información a pesar que podrían
existir los fallos en algunas localidades o líneas de comunicación.
5. Características.
Autonomía Local: Los sitios distribuido deben ser autónomos, es decir que todas las
operaciones en un sitio dado se controlan en ese sitio.
No dependencia de un sitio central: No debe de haber dependencia de un sitio
central para obtener un servicio.
Operación Continua: Nunca debería apagarse para que se pueda realizar alguna
función, como añadir un nuevo sitio.
Independencia con respecto a la localización: No debe de ser necesario que los
usuarios sepan dónde están almacenados físicamente los datos, sino que más el
usuario lo debe de ver como si solo existiera un sitio local
Independencia con respecto a la fragmentación: La fragmentación es deseable por
razones de desempeño, los datos, pueden almacenarse en la localidad donde se
11. Sistema de Gestión de Base de Datos. 11
utilizan con mayor frecuencia de manera que la mayor parte de las operaciones sean
sólo locales y se reduzca el tráfico en la red.
Independencia de réplica: Si una relación dada (es decir, un fragmento dado de una
relación) se puede presentar en el nivel físico mediante varias copias almacenadas o
réplicas, en muchos sitios distintos.
Procesamiento Distribuido de Consultas: El objetivo es convertir transacciones de
usuario en instrucciones para manipulación de datos, y así reducir el tráfico en la red
implica que el proceso mismo de optimización de consultas debe ser distribuido.
Manejo Distribuido de Transacciones: Tiene dos aspectos principales, el control de
recuperación y el control de concurrencia, cada uno de los cuales requiere un
tratamiento más amplio en el ambiente distribuido.
Independencia con respecto al equipo
Independencia con respecto al Sistema Operativo
Independencia con respecto a la red
Es que se puede leer o escribir datos localizados en diferentes nodos de
la red
Todos los usuarios accedan a la BDD a través de un esquema global en
forma transparente al usuario.
El mismo SMBD es usado por cada localidad.
6. Construcción de una base de datos distribuidos.
12. Sistema de Gestión de Base de Datos. 12
Base distribuida particionada: Una base de datos global se divide en tres partes (A, B,
C), donde cada una de las bases se almacena en lugares diferentes.
Figura 3 (Logo Base Distribuida Particionada)
Base de datos multiplicada y distribuida: Las bases de datos se duplican en cada sitio,
con el objetivo de reducir costos de comunicación y aumentar el desempeño del sistema,
eliminando la necesidad de la transmisión de datos en las diferentes ubicaciones.
Figura 4 (Logo Base de Datos Multiplicada y Distribuida)
13. Sistema de Gestión de Base de Datos. 13
Distribución de la base de datos combinando replicas y particiones: en la actualidad
este tipo de distribución se emplea con mayor frecuencia. El archivo se divide basándose
en el patrón que usa, es decir los datos se guardan en los lugares donde puede ser
accesado con más frecuencia, pero si requiere un dato en más de un sitio, este fragmento
puede estar almacenado en cada uno de estos sitios.
Figura 5 (Logo Base de Datos Combinando)
8. Ventajas de las bases de datos distribuidas
La principal ventaja de los sistemas distribuidos es la capacidad de compartir y acceder a la
información de una forma fiable y eficaz
Compartimiento de Datos: Los usuarios pueden acceder a los datos de todas las
distribuciones como si fuera centralizada.
14. Sistema de Gestión de Base de Datos. 14
Autonomía Local: Cada Distribución puede conservar cierto grado de control sobre
los datos que maneja localmente. Cada Distribución actúa como administrador de las
responsabilidades asignada.
Disponibilidad: Si el sistema falla en una distribución los restantes pueden seguir
funcionando, y si hay una duplicación de los datos en varias distribuciones se puede
acceder a alguno de estos y puede seguir funcionado. El cierre de una distribución o
nodo no afecta al funcionamiento de los demás
Eficiencia de procesamiento :(los datos se mantienen cerca del punto en donde se
usan más frecuentemente).
Mayor accesibilidad (es posible acceder a una cuenta remota y viceversa, por medio
de la red de comunicaciones).Probablemente el mayor beneficio de los sistemas
distribuidos es que permiten que la estructura de la BD refleje la estructura de la
empresa.
Figura 6 (Logo Base de Datos Distribuido)
Planta A
Almacén
Planta C
Planta B
15. Sistema de Gestión de Base de Datos. 15
9. Desventajas de las bases de datos distribuidas
Coste de desarrollo del software. La complejidad añadida que es necesaria para
mantener la coordinación entre nodos hace que el desarrollo de software sea más
costoso.
Mayor probabilidad de errores. Como los nodos que constituyen el sistema
funcionan en paralelo, es más difícil asegurar el funcionamiento correcto de los
algoritmos, así como de los procedimientos de recuperación de fallos del sistema.
Mayor sobrecarga de procesamiento. El intercambio de mensajes y ejecución de
algoritmos para el mantenimiento de la coordinación entre nodos supone una
sobrecarga que no se da en los sistemas centralizados.La mayor desventaja es el
hecho de que los sistemas distribuidos son complejos (al menos desde el punto de
vista técnico).
10. Modelo de una arquitectura distribuida
Figura 6 (Modelo de una Arquitectura Distribuida)
16. Sistema de Gestión de Base de Datos. 16
11. Diseño de la base de datos distribuidos
Transparencia y autonomía
Es importante que el sistema reduzca al mínimo la necesidad de que el usuario se dé
cuenta de cómo está almacenada una relación. El sistema puede ocultar los detalles de la
información en la red. Esto se denomina transparencia de la red. La transparencia de la
red se relaciona con la autonomía local. La transparencia de la red es el método por el
cual los usuarios del sistema pueden ignorar los detalles del diseño distribuido. La
autonomía local es el método por el cual el diseñador o administrador de una localidad
pueden ser independientes del resto del sistema distribuido.
Nombre de los datos.
Repetición de los datos.
Fragmentación de los datos.
Localización de las bases locales y sus copias.
11.1 Almacenamiento distribuido de datos
Replica: El sistema consiste en varias copias iguales, donde cada copia se guarda en una
base diferente, lo que significa la réplica de los datos.
o Disponibilidad
o Distribución de la base de datos combinando replicas y particiones
o Actualización de los datos duplicados
17. Sistema de Gestión de Base de Datos. 17
Fragmentación de datos: si una base se encuentra fragmentada, esta base se dividirá en
numerosos fragmentos. Los fragmentos contienen suficiente información para permitir la
reconstrucción de la base original.
o Fragmentación horizontal: divide la base asignando a cada división a uno o
varios fragmentos.
Figura 7 (Logo Fragmentación Horizontal)
o Fragmentación vertical: Divide la base de un modo especial, igual que una
descomposición, implica el concepto de varios subconjuntos. Todos los esquemas
resultantes contienen una clave candidato común (o superclase) .Se añade un
atributo especial que actúa como clave candidata.
Ambos tipos de fragmentación se pueden mezclar.
18. Sistema de Gestión de Base de Datos. 18
Ejemplo:
type cuenta =record
nombre: char(22);
maquina: char(8);
login: char(8);
end
Figura 8 (Logo Fragmentación Vertical)
o Fragmentación mixta: la base se divide por medio de una serie de relaciones de
fragmentos, donde cada fragmento tiene como resultado los procedimientos de las
fragmentaciones horizontales y mixtas.
19. Sistema de Gestión de Base de Datos. 19
Figura 9 (Logo Fragmentación Mixta)
Replica y fragmentación de datos: La réplica y fragmentación de datos se puede aplicar
de manera continua, es decir de una pequeña división que anteriormente se ha
fragmentado también se puede hacer una réplica y estos fragmentos también se pueden
volver a fragmentar.
20. Sistema de Gestión de Base de Datos. 20
11.2. Ventajas de la fragmentación:
Horizontal
– permite el procesamiento paralelo de una relación
– permite que una tabla global pueda estar donde se utiliza más frecuentemente
Vertical
– permite que una tabla pueda ser distribuida en función del uso de sus atributos.
– permite descomposiciones adicionales que se pueden conseguir con normalización.
– el atributo especial facilita la mezcla de fragmentos verticales
– permite el procesamiento paralelo de una relación
12. Transparencia de la red
Los datos se pueden guardar de muchas maneras en el sistema de bases distribuidas, pero
también es de suma importancia que este sistema disminuya cualquier información que los
usuarios necesitan saber cómo se guarda el dato en la base. Entonces el sistema pude
ocultar este tipo de detalle de la distribución de los datos en la red a esto se lo llama
transparencia de red:
Denominación de los elementos de datos: Todos los elementos de los datos, las
divisiones, y las copias de las bases, deben tener nombres únicos, pero en este tipo
de sistemas hay que asegurarse de que dos procedimientos no utilicen el mismo
nombre para distintos elementos de datos. Cada copia y cada fragmento de un
elemento deben tener también un nombre único, es muy importante diferenciar
cuales copias y fragmentos de las bases del mismo elemento.
21. Sistema de Gestión de Base de Datos. 21
Transparencia y actualizaciones: Es muy importante asegurar que todas las
copias de un elemento o una base y que todas sus fragmentaciones se actualicen
constantemente, pero también puede que exista muchos problemas si hay
constantemente acceso a alguna base en específica, lo que da lugar a que se
actualice una base antes que otra.
13. Transparencia de localización
Si el sistema es transparente en cuanto a la repetición y fragmentación de las bases donde se
ocultará al usuario gran parte del esquema de la base de datos distribuida. Sin embargo, el
componente de los nombres que identifican a la base obliga al usuario a darse cuenta del hecho
de que el sistema está distribuido.
14. Modelo de transacciones distribuidas
El acceso a los diferentes elementos de las bases en los sistemas de bases distribuidas se puede
realizar mediante transacciones donde se debe conservar las propiedades ACID (conjunto de
características que se necesitan para que una serie de instrucciones puedan ser consideradas como
transacciones) Hay que tener en cuenta dos tipos de transacciones.
14.1 Transacciones locales
Tienen total acceso y actualización de datos en una sola de las bases locales
14.2 Transacciones globales
Tienen total acceso y actualización en varias bases de datos en varias bases de datos
locales
22. Sistema de Gestión de Base de Datos. 22
14.3 Arquitectura del sistema:
Cada procedimiento tiene su propio gestor de transacciones locales, cuya función es
asegurar las propiedades ACID, los diferentes gestores de transacciones ayudan para
la ejecución de las transacciones globales, por lo tanto cada procedimiento del
sistema contiene en si dos subsistemas:
Gestor de transacciones: gestiona la ejecución de las transacciones que tienen el
total acceso a los datos guardados en la base local, pero tomando en cuenta que
las transacciones de este tipo solo pueden ser locales.
El coordinador de transacciones: coordina la ejecución de las diferentes
transacciones tanto locales como globales.
14.4 Modos de fallos del sistema.
Los sistemas de bases de datos distribuidos pueden tener los mismos fallos que los
sistemas de base de datos centralizados, por ejemplo: errores de software, hardware,
fallos graves del disco, pero existen otros fallos muy importantes en este tipo de
sistema.
Fallos de un procedimiento
Perdida de mensajes: es muy usual en este tipo de sistemas distribuidos,
utilizan protocolos de control de la transmisión, como TCP/IP.
Fallos de un enlace de comunicaciones
División de la red
23. Sistema de Gestión de Base de Datos. 23
15. Aplicación
Aplicaciones
Manufactura(multiplantas)
Comando y control militar.
Microsoft SQL Server 2008
SIGs corporativos Aerolíneas
Cadenas hoteleras
24. Sistema de Gestión de Base de Datos. 24
16. Conclusión.
Las bases de datos distribuidas son cada vez más usadas por las empresas y suponen una ventaja
competitiva frente a los sistemas centralizados, siempre y cuando la empresa en cuestión tenga necesidad
de usar una base de datos de este tipo. Lo más habitual es disponer de varias sedes y tener que manejar
información común, para lo cual las bases de datos distribuidas son especialmente útiles.
25. Sistema de Gestión de Base de Datos. 25
17. Anexos.
http://unefazuliasistemas.files.wordpress.com/2011/04/fundamentos-de-bases-de-datos-silberschatz-korth-
sudarshan.pdf
http://conten.pearson.es/ib/NPcd/IB_BooksVis?cod_primaria=1000187&codigo_libro=2155
http://www.intercambiosvirtuales.org/libros-manuales/fundamentos-de-bases-de-datos-abraham