Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Unidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdf
1. Universidad de Guayaquil
Facultad de Ciencias Matemáticas y
Físicas
Carrera de Ingeniería
Tecnologías de la Información
Base de Datos
“Introducción a los Sistemas de Gestión
Base de Datos”
2. Base de Datos
Objetivos
• Conocer los fundamentos de los Sistemas de Base
de Datos y Gestión de Base de Datos.
• Comprender la ventajas y desventajas del uso de
base de datos.
• Conocer la arquitectura de los subsitemas de base
de datos.
• Identificar los roles/funciones que intervienen en la
base de datos.
• Comprender el diseño de base de datos.
• Entender las características de los sistemas NoSQL.
3. Archivos
• Un archivo es un conjunto de registros
relacionados que un sistema operativo guarda
como unidad.
• Pueden contener instrucciones de programas o
información creada o usada por un programa.
• Independientes del programa.
Base de Datos
4. Archivos
• SO construye abstracciones:
1.- Creación de archivos, aísla al usuario de los problemas
físicos de almacenamiento.
2.- El uso de directorios.
Base de Datos
5. Características de un archivo
• Representables, poseen nombre cuya
extensión máxima es de 255 caracteres.
• Únicos por directorio, en una carpeta no
pueden existir dos archivos con el mismo
nombre.
• Modificables, mayoría de archivos pueden:
borrarse, crearse, modificarse, renombrase.
• Poseen un tamaño, de acuerdo a la cantidad
de información que poseen.
Base de Datos
6. Propósitos de los Sistemas de Bases de Datos
• Sistemas de BD surgieron en respuesta a los
primeros métodos de gestión informatizada de
los datos comerciales.
• Años sesenta, almacenamiento de información
bancaria por sistema de archivos.
• Manipulación de información mediante uso de
varios programas para:
o Efectuar cargos o abono a cuenta.
o Añadir cuentas.
o Calcular saldos.
o Generar extractos mensuales.
Base de Datos
8. Inconvenientes del uso de sistema de archivos:
• Redundancia e Inconsistencias de los datos:
o Programas diferentes, archivos diferentes formatos y
variabilidad en el tiempo.
o Información duplicada en varios archivos.
o Consumo procesamiento y almacenamiento.
Base de Datos
9. • Dificultad en el acceso a los datos:
o No permite recuperar los datos necesarios de una forma
práctica y eficiente.
o Falta de sistemas de recuperación de datos más
adecuado de uso general.
Base de Datos
10. • Aislamientos de datos:
o Datos dispersos en varios archivos.
o Archivos con diferentes formatos.
o Dificultad de escribir nuevos programas de aplicación
para nuevos requerimientos de datos.
Base de Datos
11. • Problema de integridad:
o Valores de datos deben satisfacer ciertos tipos de
restricciones de consistencia.
o Restricciones en lógica de negocio y dificultad de
implementación de nuevas restricciones.
o Peor en diferentes datos de diferentes archivos.
Base de Datos
12. • Problema de atomicidad:
o Restauración de datos a estado consistente en el caso de
fallas.
o Transaccionalidad atómica: se ejecuta todo o no se
ejecuta nada.
Base de Datos
13. • Anomalías en el acceso concurrente:
o Acceso de varios usuarios simultáneamente.
o Modificaciones concurrentes.
o Sistema debe mantener un concepto de supervisión.
Base de Datos
14. • Problemas de seguridad:
o No todos los usuarios deben tener acceso a todos los
datos.
o Dificultad en cumplimiento de restricciones de seguridad.
Base de Datos
15. Historia de los Sistemas de Bases de Datos
Las técnicas de procesamiento de datos han
evolucionado a lo largo de los años:
Base de Datos
16. Origen de las Bases de Datos
• En la antiguedad existían bibliotecas y toda clase de
registros.
• BD para información de cosechas y censo de
población.
• Búsqueda de información lenta
e ineficaz.
• Auge al necesitar almacenar
gran cantidad de información.
• En 1884, Herman Hollerith creó
máquina de tarjetas perforadas.
• Censo de 1890 se pudo conocer
en dos años.
Base de Datos
17. Década de 1950
• Cintas magnéticas para almacenamiento de datos.
• Automatización de procesos con los datos
almacenados.
• Leer datos de una o varias cintas y escribirlos en otra
(simulación de backup).
• Lectura secuencial, tamaño de datos mucho mayor
que memoria ->
procesamiento en orden
establecido y mezcla de
datos de las cintas.
Base de Datos
18. Década de 1960
• Empleo generalizado de discos
duros.
• Permitió acceso directo a los
datos (ya no secuencial).
• Estructura de datos como listas y
árboles almacenadas en disco y
manipulables.
• BD complejas, inflexibles y
usadas por personal calificado.
• Primeras generaciones de BD en
red y base de datos jerárquicas.
• Alianza de IBM y American
Airlines para creación de SABRE.
Base de Datos
19. Década de 1970
• Trabajos de Edgard
Frank Codd (inglés).
• Teoría de BD
relacionales.
• Nacimiento de Segunda
Generación de BD.
• Aparición de BD
ORacle?
Base de Datos
20. Década de 1980
• Comercialización de los sistemas
relacionales.
• SQL (Structured Query Language),
posicionó como estándar de la
industria.
• Construcción de Sistema de BD
relacional eficiente (Proyecto System
R de IBM).
• Sistemas Comerciales: DB2, Oracle,
Ingres y Rdb de DEC.
• Facilidad de uso, abstracción del
programador de las tareas de bajo
nivel.
• Paralelismo y Distribución de la BD e
inicio de BD orientadas a objetos.
Base de Datos
21. Década de 1990
• Estudio de BD orientadas a Objetos.
• Desarrollo de herramientas como MS Access (Tercera
Generación de BD).
• Modificación de versión de SQL (expresiones regulares,
recursividad, triggers y OO).
• Uso de herramientas para analizar grandes cantidades
de datos, estuvo en aumento.
• Introducción de varias
marcas y soporte a BD
relacionales y
orientadas a objetos.
Base de Datos
22. • Boom del World Wide Web (www), al final de los
90s.
• Soporte a tasas de procesamiento de
transacciones más elevadas.
• Fiabilidad alta y disponibilidad 24x7x365.
• Soporte para interfaces Web de los datos.
Base de Datos
23. Siglo XXI
• Emerge de XML (Extensible Markup Language) y su
lenguaje de consulta asociado, XQuery.
• Crecimiento de técnicas de “informática
autónoma/administración autónoma”.
Base de Datos
24. • Compañías que dominan mercado: IBM, Microsoft
y Oracle.
• Google gestiona gran cantidad de información.
• Programa LINQ de Microsoft .NET.
• Extensión de uso de aplicaciones de
Datawarehouse.
Base de Datos
25. Evolución de la nueva tecnología de Base de Datos
Grid Computacional, permite utilizar de forma
coordinada recursos heterogéneos no sujetos a
control centralizado.
• Servicio consistente y basado en estándares.
• Posibilidad de acceso a cualquier punto de la grid,
y extraer su potencia.
• Precio atractivo para su
universalidad.
Base de Datos
26. Desventajas de la grid
• Servicios básicos para trabajar: Internet y
seguridad.
• No existen muchas aplicaciones que hagan uso del
grid.
• Comunicación lenta y no uniforme.
• Dificultad de sincronización de procesos en los
equipos.
• Procesamiento en paralelo.
Base de Datos
27. Cloud Computacional, permite realizar diferentes
acciones de manera remota como acceder:
➢ distintos softwares,
➢ almacenar archivos,
➢ Procesar datos pro medio de Internet.
• Permite a las empresas y usuarios uso de un pool de
recursos informáticos: seguro, fácil acceso,
esquema bajo demanda con buen nivel de
mantenimiento.
Base de Datos
28. Características del Cloud Computing
✓ Bajo demanda.
✓ Multiplataforma.
✓ Recursos en Pool.
✓ Flexibilidad rápida.
✓ Servicio medido.
Base de Datos
29. Data Mining, conjunto de técnicas y tecnologías que
permiten explorar grandes bases de datos, de
manera automática o semiautomática, para
encontrar patrones repetitivos, tendencias o reglas
que expliquen el comportamiento de datos en
determinados contextos.
• Ayuda a comprender el
contenido de un repositorio.
• Usa técnicas estadísticas,
algoritmos de búsqueda,
IA y redes neuronales.
Base de Datos
30. Sistemas Objetos-Relacionales, evolucionado el
modelo relacional hasta convertirse en híbrida:
relacional y objetos.
• Integra fundamentos teóricos de BD relacional del
paradigma de orientación a objetos.
• Organización de datos complejos: texto e imagen,
mapas, datos de rango
Base de Datos
31. Concepto de Base de Datos
Una Base de Datos (BD) es una colección de
información organizada de tal modo que sea
fácilmente accesible, gestionada y actualizada.
Base de Datos
32. Características de las Base de Datos
Ciertas características o propiedades que poseen
las bases de datos y que no se encuentran en los
archivos comunes, entre ellas:
✓ Control mediante un sistema de administración de
bases de datos (DBMS, DataBase Management
System).
✓ Abstracción de capas de datos.
✓ Independencia física de los datos.
✓ Independencia lógica de los datos.
Base de Datos
33. Aplicaciones de los sistemas de bases de datos
Los sistemas de BD se usan ampliamente:
• Banca.
• Líneas aéreas.
• Universidades.
• Transacciones de tarjetas de crédito.
• Telecomunicaciones.
• Finanzas.
• Ventas.
• Comercio en Línea.
• Producción.
• Recurso Humano.
Base de Datos
34. • BD parte esencial de las empresas.
• Crecimiento del uso de las BD en empresas en las últimas 4
décadas.
• Interacción directa o indirectamente con BD:
• Indirectamente:
o Extracto de Tarjetas de Créditos (TC).
o Agentes de cajeros o Agentes de reserva de líneas aéreas.
• Directamente:
o Cajeros automáticos.
o Interfaces telefónicas.
• ¿Cómo la revolución del Internet aumentó significativamente
el acceso directo de los usuarios a la BD?
Base de Datos
35. Integridad
• Se refiere a la validez y consistencia de los datos
almacenados.
• Se expresa mediante restricciones o reglas que no
se pueden violar.
• Los datos son manipulados, identificados y
abordados. Errores humanos inicios de falencias en
integridad.
❖ Errores humanos al ingreso de datos.
❖ Errores en la transferencia o copia de datos.
❖ Caída en base de datos.
❖ Los datos deben permanecer intactos en el ciclo
de vida.
Base de Datos
36. Redundancia
• Almacenamiento de datos varias veces en
diferentes lugares.
• Problemas: desperdicio de espacio o inconsistencia
de datos.
• Desventajas:
❖ Reducción en capacidad de almacenamiento.
❖ Dificultad en búsqueda de información.
Base de Datos
37. Consistencia
• Coherencia de los datos de la base de datos.
• Se pierde la integridad -> pierde consistencia.
Base de Datos
38. Ventajas y Desventajas de los Sistemas de Bases de Datos
Ventajas
✓ Acceso rápido a los datos.
✓ Evita datos repetidos o duplicados.
✓ Aumenta la productividad.
✓ Permiten ingresar datos ilimitados.
✓ Compartir datos globalmente.
✓ Centralizar la información.
✓ Reducción del espacio físico.
✓ Permiten hacer respaldos.
✓ Son dinámicas.
✓ Son portables.
Base de Datos
39. Desventajas
• Pueden crecer mucho.
• Incremento de costos.
• Actualizaciones.
• Pueden fallar críticamente.
• Ataques remotos.
Base de Datos
40. Clasificación de las bases de datos
Según variabilidad
Base de Datos
•Exclusivas para lecturas.
•Almacena datos históricos.
•Utilizadas para estudio del comportamiento de datos en
el tiempo: realizar proyecciones y tomar decisiones.
Bases de Datos
Estáticas
•Modificables en el tiempo.
•Permite realizar actualizaciones, borrado y edición de
datos.
Base de Datos
Dinámicas
41. Según contenido
Base de Datos
•Almacena entrada de fuente primaria.
•Registro: autor, fecha de publicación, editorial, título, edición…
•Resumen o extracto de publicación original.
Bases de Datos
Bibliográficas
•Almacena fuentes primarias.
•Guías telefónicas en formato electrónico.
Bases de Datos de
Textos Completos
•Almacenan diferentes tipos de información relaciona a una
disciplina.
Bases de Datos o
“bibliotecas” de
información
42. Según el modelo
Base de Datos
•Datos se organizan como árbol invertido.
•Nodo padre contiene información de los nodos hijos.
•Nodo que no tiene padres es “nodo raíz”, nodo que no tiene hijos es
“nodo hoja”.
Bases de Datos
Jerárquicas
•Permite que el nodo tenga varios padres.
•Mejora que el modelo jerárquico ya que solucionaba eficientemente
la redundancia de datos.
Bases de Datos
de Red
•Fin es el envío y recepción de datos a grandes velocidades.
•Dirigidas al análisis de calidad, datos de producción e industrial.
•Redundancia y duplicación de datos no es problema.
•Permite conectividad a base de datos relacionales.
Bases de Datos
Transaccionales
43. Base de Datos
•Desarrolla aplicaciones concretas como Cubos OLAP.
•Similares a base de datos relacionales.
•Diferencia a nivel conceptual, los campos o atributos pueden representar dimensiones o
métricas.
Bases de Datos
Multidimensionales
•Propio de modelo informático de Programación Orientada a Objetos.
•Almacena la base de datos como objetos complejos.
Bases de Datos
Orientadas a Objetos
•Permite indexación a texto completo y en líneas generales.
•Búsquedas más potentes.
•Almacenas grandes volúmenes de datos como registros históricos.
Bases de Datos
Documentales
•Permite deducciones a a través de inferencias.
•Se basa en reglas y hechos almacenados.
•Bases de Datos Lógicas.
•Solución a base de datos relacional para consultas recursivas o deducir relaciones indirectas.
Base de Datos
Deductivas
44. Concepto de Sistema Gestor de Base de Datos
• Las información se trataba y gestionaba utilizando
sistema de gestión de archivos.
• Definición de los datos codificada dentro de los
programas de aplicaciones.
• Control de acceso y manipulación estaban en el
programa.
• Idea de separación de datos contenidos en los
archivos de los programas que los manipulan.
• Modificar la estructura de archivos sin modificar los
programas.
Base de Datos
45. • Sistema Gestor de Bases de Datos (SGBD) consiste
en una colección de datos interrelacionados y un
conjunto de programas para acceder a dichos
datos.
• Objetivo principal de un SGBD es proporcionar una
forma de almacenar y recuperar la información de
una base de datos de manera que sea tanto
práctica como eficiente.
Base de Datos
46. Arquitectura del Sistema Gestor de Base de Datos
• La arquitectura de los sistemas de bases de datos
se ve muy influida por el sistema informático
subyacente.
• Comprende:
o Análisis de la cadena de valor,
o Modelado de datos,
o Arquitectura de datos relacionales,
• Se puede integrar de manera exitosa en el
conjunto de estrategias corporativas, bajo la
directrices del Gobierno de Dato.
Base de Datos
47. Esquemas y Niveles
• Los SBD necesitan conocer las estructuras
(entidades, atributos, tipos)
• Los SGBD necesitan que se les proporcionen una
descripción y definición de la BD.
• En 1975-1982, ANSI intenta establecer las bases
para crear los estándares.
• El comité ANSI/SPARC (American National Standard
Institute / Standard Planning and Requirements
Commitee) recomendó la arquitectura de los SGBD
de tres niveles:
Base de Datos
48. Arquitectura de 3 niveles
• Objetivo de la arquitectura de tres niveles, separar
los programas de aplicación de la base de datos
física.
• En esta arquitectura, el esquema de una base de
datos se define en tres niveles de abstracción
distintos:
✓ Nivel Interno
✓ Nivel Conceptual
✓ Nivel Externo
Base de Datos
50. Nivel Interno
• También denominado físico.
• Describe la estructura física de la base de datos
mediante un esquema interno.
• Esquema se especifica mediante un modelo físico y
describe todos los detalles para el
almacenamiento de la base de datos, así como:
los archivos que contienen la información, su
organización, los métodos de acceso a los registros,
los tipos de registros, la longitud y los campos que
los compone.
Base de Datos
51. Nivel Conceptual
• Describe la estructura de toda la base de datos
para una comunidad de usuarios (empresa u
organización), mediante un esquema conceptual.
• Este esquema oculta los detalles de las estructuras
de almacenamiento y se concentra en describir
entidades, atributos, relaciones, operaciones de los
usuarios y restricciones.
• En este nivel se puede utilizar un modelo
conceptual o un modelo lógico para especificar el
esquema.
Base de Datos
52. Nivel Externo
• También denominado de visión.
• Describen varios esquemas externos o vistas de
usuario.
• Cada esquema externo describe la parte de la
base de datos que interesa a un grupo de usuarios
determinados.
• Oculta a ese grupo el resto de la base de datos.
• En este nivel se puede utilizar un modelo
conceptual o un modelo lógico para especificar
los esquemas.
Base de Datos
53. La arquitectura de tres niveles es útil para explicar el
concepto de independencia de datos
Independencia de datos es la capacidad para
modificar el esquema en un nivel del sistema sin tener
que modificar el esquema del nivel inmediato
superior.
Base de Datos
54. Se pueden definir dos tipos de independencia de
datos:
Independencia Lógica
• Capacidad de modificar el esquema conceptual
sin tener que alterar los esquemas externos ni los
programas de aplicación.
• Se puede modificar el esquema conceptual para
ampliar la base de datos o para reducirla. Ej, se
reduce la base de datos eliminando una entidad,
los esquemas externos que no se refieran a ella no
deberán verse afectados.
Base de Datos
55. Independencia física
• Es la capacidad de modificar el esquema interno
sin tener que alterar el esquema conceptual (o los
externos).
• Ej. puede ser necesario reorganizar ciertos ficheros
físicos con el fin de mejorar el rendimiento de las
operaciones de consulta o de actualización de
datos.
• Dado que la independencia física se refiere sólo a
la separación entre las aplicaciones y las
estructuras físicas de almacenamiento, es más fácil
de conseguir que la independencia lógica.
Base de Datos
56. Arquitectura de 4 niveles
Nivel Conceptual o Visión
• Punto de vista organizativo.
• Independiente del SGBD o de utilización de sistema de
BD.
• Describe información de la organización (objetos y
relaciones) desde un punto de vista no informático.
Nivel Lógico o Visión
• Estructura expresada desde un SGBD en concreto.
• Se representan las entidades y relaciones de acuerdo a
las características de un modelo.
Base de Datos
57. Nivel Interno
• Representación en la
memoria externa de la
computadora de los
datos del esquema
lógico, interrelaciones e
instrumentos de acceso.
Niveles Externos
• Describe los datos y
relaciones entre ellos de
interés en una
aplicación.
• Subconjuntos del
modelo lógico de la BD.
Base de Datos
58. Otro tipo de Arquitectura:
• Pueden estar centralizados o ser del tipo cliente-
servidor.
• Se pueden diseñar para aprovechar arquitecturas
de computadoras paralelas.
• Las BD distribuidas se extienden por varias
máquinas geográficamente separadas.
Base de Datos
59. • Hoy en día la mayor parte de los usuarios de los
sistemas de bases de datos no está presente en el
lugar físico.
• Se conectan a él a través de una red.
• Sistema Cliente (usuarios remotos de BD) y Sistema
Servidor (donde se ejecuta la BD).
Base de Datos
60. • Las aplicaciones de bases de datos suelen dividirse
en dos o tres partes:
Base de Datos
61. Arquitectura de dos Capas
• Componente que reside en la máquina cliente.
• Realiza llamados a la máquina servidora mediante
el uso de lenguaje de consultas.
• Estándares de API como ODBC y JDBC para la
interacción del cliente con el servidor.
Base de Datos
62. Arquitectura de tres Capas
• Máquina cliente es una parte visible al usuario. No
realiza llamada directa a la BD.
• El cliente se comunica con un Servidor de
Aplicaciones, por interfaz de formulario.
• El servidor de aplicaciones se comunica con la BD.
• La lógica de negocio (acciones a realizar) se
incorporan en el servidor de aplicaciones.
• Este tipo de arquitectura es adecuada para
aplicaciones de gran tamaño y aplicaciones web.
Base de Datos
63. Características de un Sistema Gestor de Base de
Datos
• Integración de toda la información de la
organización, se crean para dar servicio a toda o
parte de la organización.
• Evitar redundancia de información.
• Persistencia de los datos, disponibles en todo
momento.
• Accesibilidad simultánea para distintos usuarios,
compartida por distintos grupos de usuarios
(concurrencia)
Base de Datos
64. • Independencia de los programas respecto a la
representación física de los datos.- Aplicaciones
deben ser independientes de la implementación
elegida para las estructuras de la base de datos
(Independencia de datos).
• Definición de vistas parciales de los datos para
distintos usuarios, datos que interesan a grupo de
usuarios de la organización. Se debe permitir definir
vistas parciales de la base de datos para garantizar
confidencialidad.
Base de Datos
65. • Mecanismos para controlar la integridad y la
seguridad de los datos, el SGBD debe asegurar en
todo momento la calidad de la información
almacenada (integridad) evitando que ésta se
deteriore por un uso incorrecto (actualizaciones,
accesos concurrentes no controlados, etc.).
• Debe asegurar que a la información almacenada
sólo acceden las personas autorizadas y en la
forma autorizada (seguridad)
Base de Datos
66. • Los SGBD que se construyen para aplicar estas
técnicas deben asegurar:
o la independencia
o la integridad y
o la seguridad de
los datos
Base de Datos
67. Usuarios y administradores de Base de Datos
• Diferentes tipos de usuarios, diferenciados por la
forma en que esperan interactuar con la base de
datos:
• Usuarios normales, son usuarios no sofisticados que
interactúan con el sistema invocando alguno de los
programas de aplicación que se han escrito
previamente. Ej programa de transferencia
bancaria.
Base de Datos
68. • Programadores de aplicaciones son profesionales
informáticos que escriben programas de
aplicación. Usan herramientas para desarrollo de
interfaces de usuario.
Base de Datos
69. • Usuarios sofisticados interactúan con el sistema sin
escribir programas.
• Remiten consultas al procesador de consultas
(divide instrucciones que el gestor de
almacenamiento entienda).
• Analistas para explorar base de datos.
Base de Datos
70. • Usuarios especializados son usuarios sofisticados
que escriben aplicaciones de bases de datos
especializadas que no encajan en el marco
tradicional del procesamiento de datos.
• Sistemas de diseño asistido por computadoras,
sistemas expertos, almacenamiento complejo de
datos…
Base de Datos
72. Administrador de Base de Datos (ABD o DBA, inglés)
• Tiene el control sobre el Sistema de Base de Datos.
Funciones:
✓ La definición del esquema. El ABD crea el esquema
original de la base de datos.
✓ La definición de la estructura y del método de
acceso.
✓ La modificación del esquema y de la organización
física. El ABD realiza modificaciones en el esquema
y en la organización física para reflejar las
necesidades cambiantes de la organización.
Base de Datos
73. ✓ La concesión de autorización para el acceso a los
datos. Mediante la concesión de diferentes tipos
de autorización. Información de autorización se
guarda en una estructura especial del sistema que
el SGBD consulta siempre que alguien intenta tener
acceso a los datos del sistema.
Base de Datos
74. ✓ El mantenimiento rutinario. Algunas actividades son:
o Copia de seguridad periódica de la base de datos, bien
sobre cinta o sobre servidores remotos, para impedir la
pérdida de datos en caso de desastres como las
inundaciones.
o Asegurarse de que se dispone de suficiente espacio libre
en disco para las operaciones normales y aumentar el
espacio en disco según sea necesario.
o Supervisar los trabajos que se ejecuten en la base de
datos y asegurarse de que el rendimiento no se degrade
debido a que algún usuario haya remitido tareas muy
costosas.
Base de Datos
75. Estructura de un sistema de Base de Datos
• El sistema de BD se divide en módulos.
• Responsabilidad de una parte del sistema
completo.
• A grandes rasgos, se tiene:
o Gestor de Almacenamiento
o Procesador de Consultas.
Base de Datos
76. Gestor de Almacenamiento
• Las bases de datos suelen necesitar una gran cantidad de
espacio de almacenamiento.
• Tienen un tamaño que va de los centenares de gigabytes
hasta, para las bases de datos de mayor tamaño, los
terabytes de datos.
• Debido a que la memoria principal de las computadoras no
puede almacenar toda esta información, la información se
almacena en discos.
• Datos se intercambian entre los discos de almacenamiento y
la memoria principal cuando sea necesario.
• El intercambio de datos con el disco es lento comparado con
la velocidad de la unidad central de procesamiento:
• Fundamental que el sistema de base de datos estructure los
datos para minimizar la necesidad de intercambio de datos
entre los discos y la memoria principal.
Base de Datos
77. Procesador de Consultas
• Importante porque ayuda a simplificar y facilitar el
acceso a los datos.
• Vistas de alto nivel ayudan a conseguir este objetivo, los
usuarios no se ven molestados innecesariamente con los
detalles físicos de la implementación del sistema.
• El rápido procesamiento de las actualizaciones y de las
consultas es importante, traducir las actualizaciones y
las consultas escritas en lenguajes no procedimentales,
en el nivel lógico, en una secuencia eficiente de
operaciones en el nivel físico.
Base de Datos
79. Gestor de Almacenamiento
• Módulo de programa que proporciona la interfaz entre
los datos de bajo nivel almacenados en la base de
datos y los programas de aplicación y las consultas
remitidas al sistema.
• Es responsable de la interacción con el gestor de
archivos.
• Datos en bruto se almacenan en el disco mediante el
sistema de archivos proporcionado por un SO.
• Gestor de almacenamiento traduce las diferentes
instrucciones LMD (DML) a comandos de bajo nivel del
sistema de archivos.
• Así, el gestor de almacenamiento es responsable del
almacenamiento, la recuperación y la actualización de
los datos de la base de datos.
Base de Datos
80. Componentes del Gestor de Almacenamiento
• Gestor de autorizaciones e integridad, comprueba
que se satisfagan las restricciones de integridad y la
autorización de los usuarios para tener acceso a los
datos.
• Gestor de transacciones, garantiza que la BD
quede en un estado consistente (correcto) a pesar
de los fallos del sistema, y que la ejecución
concurrente de transacciones transcurra sin
conflictos.
Base de Datos
81. • Gestor de archivos, gestiona la asignación de
espacio de almacenamiento de disco y las
estructuras de datos usadas para representar la
información almacenada en el disco.
• Gestor de la memoria intermedia, responsable de
traer los datos desde el disco de almacenamiento
a la memoria principal y decidir los datos a guardar
en la memoria caché.
o Es una parte fundamental de los sistemas de BD, ya que
permite que la base de datos maneje tamaños de datos
que son mucho mayores que el tamaño de la memoria
principal.
Base de Datos
82. El gestor de almacenamiento implementa varias
estructuras de datos como parte de la implementación
física del sistema:
• Archivos de datos, que almacenan la base de datos en
sí misma.
• Diccionario de datos, que almacena metadatos acerca
de la estructura de la base de datos; en particular, su
esquema.
• Índices, pueden proporcionar un acceso rápido a los
elementos de datos.
o Como el índice de un libro de texto.
o Índices de las BD facilitan punteros a los elementos de
datos que tienen un valor concreto. Ej, se puede usar un
índice para buscar todos los registros cuenta con un
número_cuenta determinado.
Base de Datos
83. Procesador de Consultas
• Intérprete del LDD, que interpreta las instrucciones del
LDD (DDL) y registra las definiciones en el diccionario de
datos.
• Compilador del LMD, que traduce las instrucciones del
LMD (DML) en un lenguaje de consultas a un plan de
evaluación que consiste en instrucciones de bajo nivel
que entienda el motor de evaluación de consultas.
o Las consultas se suelen poder traducir en varios planes de ejecución
alternativos, todos los cuales proporcionan el mismo resultado. El compilador
del LMD también realiza optimización de consultas, es decir, elige el plan de
evaluación de menor coste de entre todas las opciones posibles.
• Motor de evaluación de consultas, que ejecuta las
instrucciones de bajo nivel generadas por el compilador
del LMD.
Base de Datos
84. Parámetros de Selección de un Sistema de Base de
Datos
• Que sea fácil de usar, para todo el personal.
• Seguridad de los datos.
• Funcionalidad.
• Capacidad de Integración.
• Soporte y desarrollo.
• Escalabilidad.
• Coste e Idoneidad.
Base de Datos
85. Ciclo de Vida de un Sistema de Base de Datos
• Abarca todos los eventos: desde la necesidad, pasa por
su etapa de desarrollo y despliegue, y concluye cuando
se retira de servicio.
• Asegurar que funcione sin contratiempos, costo
eficiente y resultado cumpla expectativas del cliente.
• Se desarrollan otros componentes: interfaz de usuario,
programas de aplicaciones e informes.
Base de Datos
86. El Ciclo de Vida Tradicional
• Proceso Ciclo de Vida del Desarrollo del Sistema.
• Variaciones como autores, vendedores de software
y empresas.
Base de Datos
87.
88. Planeación
• Situación actual de la empresa.
• Lanzar Estudio de Factibilidad: estimaciones de
recursos son compatibles con tiempo requerido y
presupuesto definido.
• Integrante persistente es el Administrador del
Proyecto.
• Modelo orientado a datos y orientado a los
procesos.
Base de Datos
89. Recopilación de Requisitos
• Reunir y documentar descripción de alto nivel y
precisa del resultado del proyecto.
• Incluir procesos de negocios existentes y esperados,
reglas del negocio y entidades.
• Mayor interés en las vistas de usuarios: informes,
formularios, pantallas.
• Técnicas: realización de entrevistas, encuestas,
observación y revisión de documentos.
Base de Datos
90. Diseño Conceptual
• Diseño de elementos externos de las aplicaciones y
bases de datos. Diseño externo.
• Finaliza diseño: informes, pantallas, formularios.
• Diagrama de Flujo.
• Vista de usuarios, entidades y reglas de negocio.
Base de Datos
91. Diseño Lógico
• Diseño técnico de aplicaciones y bases de datos.
Diseño interno.
• Aplicaciones se dividen en módulos y se redacta
implementación de cada unidad.
• Uso de diagrama de flujo o flujogramas.
• Esfuerzo de normalización.
Base de Datos
92. Diseño Físico
• Diseño lógico se convierte en hardware y sistemas
de software reales.
• Estimaciones de capacidad de procesadores,
dispositivos de discos y banda ancha de red.
• Diseño se implementa en el DBMS.
Base de Datos
93. Construcción
• Desarrolladores de aplicaciones codifican y
pruebas unidades funcionales.
• Ambiente de pruebas.
• Concluidas pruebas pasa a ambiente de calidad,
para asegurar a los requisitos mencionados.
• Intervención área de calidad o usuarios
funcionales.
• Ambiente similar al entorno de producción.
• Capacitación final de usuarios.
Base de Datos
94. Implementación y Lanzamiento
• Implementación, es instalar los nuevos
componentes del sistema de aplicaciones en el
sistema real.
• Lanzamiento, ubicar grupos de usuarios de negocio
en la nueva aplicación.
• Implementación en frío o en fases.
• Versiones nuevas y antiguas deben funcionar en
paralelo un tiempo (método en caliente).
Base de Datos
95. Soporte continuo
• Por parte de equipo de soporte de producción.
• Resolver: complicaciones, problemas de
desempeño, resultados anormales…
• Clasificar, asignar, priorizar.
• Tareas:
• Aplicación de Parches.
• Afinación del rendimiento.
• Monitoreo del espacio y rendimiento.
• Reparaciones de defectos.
Base de Datos
96. El Ciclo de Vida no Tradicional
Dos modelos:
• Creación de prototipos
• Desarrollo rápido de aplicaciones (RAD, en inglés).
Base de Datos
97. Creación de Prototipos
• Desarrollo de aplicaciones mediante grupos de
iterativos de los pasos de diseño, desarrollo e
implementación para determinar los requisitos.
• Extensa participación de los usuarios de negocio.
• Reuniones para revisiones y definiciones de iteraciones.
• Creación de prototipo nunca concluye, cualquier
mejoramiento es considerado
otro prototipo.
• Desventaja es el desgaste del
equipo de desarrollo.
Base de Datos
98. Desarrollo Rápido de Aplicaciones, RAD
• Permite crear esquemas de aplicaciones funcionales en
tan solo 60 a 90 días.
• Soluciones intermedias en las que el 80% de trabajo
requerido puede concluirse en 20% del tiempo.
• Técnica no útil para proyectos con calendarios y
presupuestos definidos.
Base de Datos
100. Bases de Datos no Relacionales (NoSQL)
• Hasta ahora estábamos acostumbrados a utilizar
bases de datos SQL como son MySQL, Oracle o MS
SQL
• Hace algún tiempo han aparecido otras que
reciben el nombre de NoSQL (Not only SQL – No
sólo SQL).
• Intención de hacer frente a las bases relacionales
utilizadas por la mayoría de los usuarios.
Base de Datos
101. ¿Qué son?
• Aparición del término NoSQL aparece con la
llegada de la web 2.0
• Con la llegada de aplicaciones como Facebook,
Twitter o Youtube, cualquier usuario puede subir
contenidos.
• En un principio, para solucionar estos problemas de
accesibilidad, las empresas optaron por utilizar un
mayor número de máquinas
Base de Datos
102. • Hablar de BD NoSQL es hablar de estructuras que
permiten almacenar información en donde las BD
relacionales tienen problemas de escalabilidad y
rendimiento, donde se dan cita miles de usuarios
concurrentes y con millones de consultas diarias.
• No cumplen con esquema entidad relación.
• No poseen estructura en forma de tabla.
• Almacenamiento en formatos: clave-valor, mapeo
de columnas o grafos.
Base de Datos
103. Ventajas
• Se ejecutan en máquinas con pocos recursos.
• Escalabilidad horizontal: Para mejorar el
rendimiento de estos sistemas simplemente se
consigue añadiendo más nodos.
• Pueden manejar gran cantidad de datos: Esto es
debido a que utiliza una estructura distribuida.
• No genera cuellos de botella: El principal problema
de los sistemas SQL es que necesitan transcribir
cada sentencia para poder ser ejecutada, y cada
sentencia compleja requiere además de un nivel
de ejecución aún más complejo.
Base de Datos
104. Diferencias con BD SQL
• No utilizan SQL como lenguaje de consultas. Ej. Cassandra
utiliza el lenguaje CQL, MongoDB utiliza JSON o BigTable hace
uso de GQL.
• No utilizan estructuras fijas como tablas para el
almacenamiento de los datos. Permiten hacer uso de otros
tipos de modelos de almacenamiento de información como
sistemas de clave–valor, objetos o grafos.
• No suelen permitir operaciones JOIN. Al disponer de un
volumen de datos tan extremadamente grande suele resultar
deseable evitar los JOIN.
• Arquitectura distribuida. en los casos NoSQL la información la
información puede estar compartida en varias máquinas
mediante mecanismos de tablas Hash distribuidas
Base de Datos
105. Tipos de bases de datos NoSQL
Bases de datos clave-valor
• Más popular y más sencilla en
funcionalidad.
• Cada elemento esta
identificado por una llave
única, que permite
recuperación de información.
• Información almacenada en
objeto binario (blob).
• Son eficientes para lecturas y
escrituras.
• Cassandra, BigTable o Hbase.
Base de Datos
106. Bases de datos documentales
• Almacena información
como documento.
• Utiliza estructura como JSON
o XML, y se usa clave única
por cada registro.
• Permite realizar búsqueda
clave-valor y consultas
avanzadas sobre el
contenido.
• Son las más versátiles,
utilizadas en varios
proyectos.
• MongoBD o CouchDB.
Base de Datos
107. Bases de datos en grafo
• Información se representa
como nodos de un grafo y
sus relaciones son aristas.
• Uso de Teoría de Grafos
para recorrerla.
• Estructura debe estar
normalizada, cada tabla
una sola columna y cada
relación dos.
• Neo4j, InfoGrid o Virtuoso.
Base de Datos
108. Bases de datos orientadas a objetos
• En este tipo, la información se representa mediante
objetos.
• Forma que son representados en los lenguajes de
programación orientada a objetos (POO): JAVA,
C# o Visual Basic .NET.
• Zope, Gemstone o Db4o
Base de Datos