1. Diseño de bases de
datos para proyectos de
investigación
Lluís Codina
UPF
Departamento de Comunicación - Grupo DigiDoc
2014
2. Contexto
• Objeto de estudio
• Una o más entidades: “cosas”
• Entidades con facetas o: las cosas tienen propiedades
• Su número supera un umbral cuantitativo (algunos cientos…)
• Complementan los análisis cualitativos o cuantitativos
• Son los únicos análisis posibles
• Ejemplos clásicos. Análisis de:
• Noticias
• Sitios web
• Anuncios
• Imágenes
• Obras de arte
• Films
• Series de televisión, etc.
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
2
3. Alternativas
Bases de datos Hoja de cálculo Editor de texto
Control y
Administración
* * * * * *
Explotación * * * * * * *
Funciones * * * * * * * * *
Seguridad * * * * * -
Tratamiento
numérico
* * * * * * -
Tratamiento
textual
* * * - * *
Componentes
multimedia
* * * - * *
Entidades
facetadas
* * * * * *
Gran volumen de
información
* * * * * *
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
3
4. Una solución común
• Diversidad de:
• Objetivos
• Marcos teóricos
• Objetos de estudio
• Una misma necesidad de información:
• Controlar información facetada y voluminosa
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
4
5. Principios básicos
• Diseñar una base de datos es modelar una parte de la realidad
• Que tenemos en el mundo real:
• Cosas: Entidades
• Propiedades de las cosas: Atributos de la entidades
• Relaciones entre las entidades (las cosas tienen relaciones entre
ellas)
• En qué se convierte en la base de datos
• Entidades: Tablas o Registros
• Atributos: Columnas o Campos en un registro
• Relaciones: Tablas o Registros adicionales
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
5
6. Tipo y Ocurrencia de Entidad
• Diferencia fundamental
• Tipo de Entidad > Concepto general
• Ocurrencia de Entidad > Caso concreto
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
6
Mundo real Base de datos
Tipo de entidad Tabla o Modelo de Registro
Ocurrencia de entidad Fila o Registro número N
7. Relaciones
• Las entidades del mundo real tienen relaciones entre ellas
• En la base de datos deben quedar representadas
• Tipos de relaciones:
• 1 : 1
• 1 : N
• N : M
• Implicaciones
• Si la relación es:
• 1 : 1 > Una sola tabla. Solamente hay una entidad y un atributo
• 1 : M > Necesitamos dos tablas: una para cada entidad
• N : M > Necesitamos tres tablas, una para cada entidad y otra para la
relación
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
7
8. Una Entidad como una tabla
• Tabla = Tipo de Entidad
• Filas = Ocurrencia de entidad
• Columnas = Propiedades de las entidades
• Celdas = Valores adquiridos por la propiedad
Tabla para registrar (p.e.) artículos de revista
Autor Título Fuente Resumen
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
8
9. Una Entidad como una ficha
• Modelo de Ficha = Tipo de Entidad
• Ficha concreta = Ocurrencia de Entidad
• Campos = Propiedades de la Entidad
Autor
Título
Ficha (Modelo de Registro) para registrar artículos de revista
Fuente
Resumen
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
9
10. Resumen
1. Base de datos = un modelo o un mapeado posible de una
parte de la realidad
2. Tipos de Entidad = las clases de entidades que queremos
representar (controlar) en la base de datos
3. Ocurrencia de Entidad = un individuo o un miembro
perteneciente a la clase de entidad
4. Atributos = Características relevantes del tipo de entidad
5. Relaciones = conexiones que mantienen los diversos tipos
de entidad entre sí
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
10
11. El Diccionario de Datos
• Modelo de representación de la información extraído de la
confluencia de:
• Características (de la parte) del mundo real que nos interesa
• Tipo de análisis y objetivos de nuestro proyecto
• Componentes:
• Lista de entidades
• Lista de atributos > campos de cada entidad
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
11
12. Componentes
• Tratamiento sistemático para cada campo:
• Etiqueta > título corto para nombrar el campo
• Dominio > definición o enumeración
• Tipo de dato > numérico, textual, fecha, lógico, etc.
• Indización > sí/no
• Valores admitidos > campo libre o controlado
• Restricciones > obligatorio, repetible, único, etc.
• Campos fijos:
• ID
• Alta
• Modificación
• Operador
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
12
13. Proceso
1. Análisis mundo real
• Tipos de entidades
• Propiedades relevantes de las entidades
• Relaciones ente entidades
• Objetivos del proyecto
2. Factor crítico
• Campos con contenidos (valores) controlados:
• Palabras clave
• Descriptores
• Categorías
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
13
14. Ejemplo – Base de Datos Imago
• Base de datos para el análisis del uso de imágenes fotográficas
en cibermedios
• Tipos de Entidades
• Cibermedios
• Fotografías
• Relación identificada N : M
• Necesitamos tres tablas
• Tabla Fotografías
• Tabla Cibermedios
• Tabla para la Relación N:M
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
14
15. Ejemplo (2)
Campos Tabla Fotografías. Entidad: las fotografías
• Título
• Cibermedio (*)
• URL
• Fecha
• Fotógrafo
• Elementos icónicos
• Elementos conceptuales
• Alta
• Modificación
• Operador
• ID
Notas: (*) = Campo común (el mismo dominio) con la Tabla
Cibermedios.
Habrá tantos registros como número total de fotografías analizadas.
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
15
16. Ejemplo (3)
Campos Tabla Cibermedios. Entidad: los medios
• Cibermedio (*)
• Grupo Editorial
• URL
• País
• Idioma
• Categorización
• Notas: Habrá tantos registros como número total de
cibermedios objeto de análisis
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
16
17. Ejemplo (4)
Campos Tabla Relación (Cibermedio-Fotografía)
• Cibermedio (*)
• Fotografía (*)
• Fecha Publicación
• Nota: Habrá tantos registros como el número de veces que se
han publicado en total todas las fotografías; pero si la
fotografía X se ha publicado en tres ocasiones distintas, habrá
tres registros distintos solo para la fotografía X, etc.
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
17
19. El diccionariode datos implementadoen un
gestorde bases de datos (FileMaker)
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
19
20. Un registro como una fila en
una tabla
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
20
21. Un registro como una ficha
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
21
22. Ejercicio 1
• Completar el diccionario de datos (campos sombreados) de la
simulación de la base de datos Imago de análisis de
fotoperiodismo en cibermedios
• Utilizar la plantilla del Aula Global
• Alternativa: diseñe su propia base de datos relacionada con su
proyecto. Identifique las posibles entidades, haga un listado
de campos, defina en el diccionario de datos para algunos de
los campos.
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
22
23. Ejercicio 2
• Pruebas con FileMaker: implementar una parte del
diccionario de datos y probar a dar algunas altas
Nov.
2014
L.
Codina
-
Grupo
DigiDoc
UPF
23