SlideShare uma empresa Scribd logo
1 de 127
Baixar para ler offline
MMAANNUUAALL DDEE AANNÁÁLLIISSIISS YY DDIISSEEÑÑOO
DDEE AALLGGOORRIITTMMOOSS
VVeerrssiióónn 11..00
DDiirreecccciióónn ddee ÁÁrreeaa IInnffoorrmmááttiiccaa
ww wwww ..iinnffoorrmmaattiiccaa..iinnaa ccaapp..ccll
Página 1
Colaboraron en el presente manual:
Víctor Valenzuela Ruz
v_valenzuela@inacap.cl
Docente
Ingeniería en Gestión Informática
INACAP Copiapó
Página 2
Copyright
© 2003 de Instituto Nacional de Capacitación. Todos los derechos reservados. Copiapó, Chile.
Este documento puede ser distribuido libre y gratuitamente bajo cualquier soporte siempre y
cuando se respete su integridad.
Queda prohibida su venta y reproducción sin permiso expreso del autor.
Página 3
PPrreeffaacciioo
"Lo que debemos aprender a hacer lo aprendemos haciéndolo".
Aristóteles, Ethica Nicomachea II (325 A.C.)
El presente documento ha sido elaborado originalmente como apoyo a la
asignatura de “Análisis y Diseño de Algoritmos” del séptimo semestre de la
carrera de Ingeniería en Gestión Informática, del Instituto Nacional de
Capacitación (INACAP). Este documento engloba la mayor parte de la materia
de este curso troncal e incluye ejemplos resueltos y algunos ejercicios que serán
desarrollados en clases.
El manual ha sido concebido para ser leído en forma secuencial, pero también
para ser de fácil consulta para verificar algún tema específico.
No se pretende que estos apuntes sustituyan a la bibliografía de la asignatura ni
a las clases teóricas, sino que sirvan más bien como complemento a las notas
que el alumno debe tomar en clases. Asimismo, no debe considerarse un
documento definitivo y exento de errores, si bien ha sido elaborado con
detenimiento y revisado exhaustivamente.
El autor pretende que sea mejorado, actualizado y ampliado con cierta
frecuencia, lo que probablemente desembocará en sucesivas versiones, y para
ello nadie mejor que los propios lectores para plantear dudas, buscar errores y
sugerir mejoras.
El Autor.
Copiapó, Enero 2003
Página 4
ÍÍnnddiiccee GGeenneerraall
Página
Presentación 7
1. Introducción
1.1. Motivación y Objetivos 8
1.2. Algunas Notas sobre la Historia de los Algoritmos 10
1.3. Fundamentos Matemáticos 11
2. Algoritmos y Problemas
2.1. Definición de Algoritmo 18
2.2. Formulación y Resolución de Problemas 19
2.3. Razones para Estudiar los Algoritmos 22
2.4. Formas de Representación de Algoritmos 23
2.5. La Máquina de Turing 24
3. Eficiencia de Algoritmos
3.1. Introducción 25
3.2. Concepto de Eficiencia 25
3.3. Medidas de Eficiencia 26
3.4. Análisis A Priori y Prueba A Posteriori 27
3.5. Concepto de Instancia 27
3.6. Tamaño de los Datos 28
3.7. Cálculo de Costos de Algoritmos
3.7.1. Cálculo de eficiencia en análisis iterativo 29
3.7.2. Cálculo de eficiencia en análisis recursivo 29
3.8. Principio de Invarianza 31
3.9. Análisis Peor Caso, Mejor Caso y Caso Promedio 31
4. Análisis de Algoritmos
4.1. Introducción 34
4.2. Tiempos de Ejecución 34
4.3. Concepto de Complejidad 36
4.4. Órdenes de Complejidad 37
4.5. Notación Asintótica
4.5.1. La O Mayúscula 39
4.5.2. La o Minúscula 39
4.5.3. Diferencias entre O y o 42
4.5.4. Las Notaciones Ω y Θ 42
4.5.5. Propiedades y Cotas más Usuales 42
4.6. Ecuaciones de Recurrencias
4.6.1. Introducción 45
4.6.2. Resolución de Recurrecias 45
Página 5
4.6.3. Método del Teorema Maestro 45
4.6.4. Método de la Ecuación Característica 46
4.6.5. Cambio de Variable 48
4.7. Ejemplos y Ejercicios 49
5. Estrategias de Diseño de Algoritmos
5.1. Introducción 51
5.2. Recursión 51
5.3. Dividir para Conquistar 55
5.4. Programación Dinámica 57
5.5. Algoritmos Ávidos 58
5.6. Método de Retroceso (backtracking) 60
5.7. Método Branch and Bound 61
6. Algoritmos de Ordenamiento
6.1. Concepto de Ordenamiento 63
6.2. Ordenamiento por Inserción 63
6.3. Ordenamiento por Selección 64
6.4. Ordenamiento de la Burbuja (Bublesort) 65
6.5. Ordenamiento Rápido (Quicksort) 65
6.6. Ordenamiento por Montículo (Heapsort) 68
6.7. Otros Métodos de Ordenamiento
6.7.1. Ordenamiento por Incrementos Decrecientes 74
6.7.2. Ordenamiento por Mezclas Sucesivas 75
7. Algoritmos de Búsqueda
7.1. Introducción 78
7.2. Búsqueda Lineal 78
7.3. Búsqueda Binaria 80
7.4. Árboles de Búsqueda 81
7.5. Búsqueda por Transformación de Claves (Hashing) 81
7.6. Búsqueda en Textos
7.6.1. Algoritmo de Fuerza Bruta 88
7.6.2. Algoritmo de Knuth-Morris-Pratt 88
7.6.3. Algoritmo de Boyer-Moore 92
8. Teoría de Grafos
8.1. Definiciones Básicas 97
8.2. Representaciones de Grafos
8.2.1. Matriz y Lista de Adyacencia 101
8.2.2. Matriz y Lista de Incidencia 103
8.3. Recorridos de Grafos
8.3.1. Recorridos en Amplitud 104
8.3.2. Recorridos en Profundidad 106
8.4. Grafos con Pesos 108
8.5. Árboles 108
Página 6
8.6. Árbol Cobertor Mínimo
8.6.1. Algoritmo de Kruskal 109
8.6.2. Algoritmo de Prim 111
8.7. Distancias Mínimas en un Grafo Dirigido
8.7.1. Algoritmo de Dijkstra 113
8.7.2. Algoritmo de Ford 114
8.7.3. Algoritmo de Floyd-Warshall 115
9. Complejidad Computacional
9.1. Introducción 118
9.2. Algoritmos y Complejidad 118
9.3. Problemas NP Completos 118
9.4. Problemas Intratables 121
9.5. Problemas de Decisión 123
9.6. Algoritmos No Determinísticos 124
Bibliografía 126
Página 7
Presentación
El curso de Análisis y Diseño de Algoritmos (ADA) tiene como propósito
fundamental proporcionar al estudiante las estructuras y técnicas de manejo de
datos más usuales y los criterios que le permitan decidir, ante un problema
determinado, cuál es la estructura y los algoritmos óptimos para manipular los
datos.
El curso está diseñado para proporcionar al alumno la madurez y los
conocimientos necesarios para enfrentar, tanto una gran variedad de los
problemas que se le presentarán en su vida profesional futura, como aquellos que
se le presentarán en los cursos más avanzados.
El temario gira en torno a dos temas principales: estructuras de datos y análisis de
algoritmos. Haciendo énfasis en la abstracción, se presentan las estructuras de
datos más usuales (tanto en el sentido de útiles como en el de comunes), sus
definiciones, sus especificaciones como tipos de datos abstractos (TDA's), su
implantación, análisis de su complejidad en tiempo y espacio y finalmente algunas
de sus aplicaciones. Se presentan también algunos algoritmos de ordenación, de
búsqueda, de recorridos en gráficas y para resolver problemas mediante recursión
y retroceso mínimo analizando también su complejidad, lo que constituye una
primera experiencia del alumno con el análisis de algoritmos y le proporcionará
herramientas y madurez que le serán útiles el resto de su carrera.
Hay que enfatizar que el curso no es un curso de programación avanzada, su
objetivo es preparar al estudiante brindándole una visión amplia de las
herramientas y métodos más usuales para la solución de problemas y el análisis de
la eficiencia de dichas soluciones. Al terminar el curso el alumno poseerá un
nutrido "arsenal" de conocimientos de los que puede echar mano cuando lo
requiera en su futura vida académica y profesional. Sin embargo, dadas estas
características del curso, marca generalmente la frontera entre un programador
principiante y uno maduro, capaz de analizar, entender y programar sistemas de
software más o menos complejos.
Para realizar las implantaciones de las distintas estructuras de datos y de los
algoritmos que se presentan en el curso se hará uso del lenguaje de programación
MODULA-2, C++ y Java.
Página 8
Capítulo 1
Introducción
1.1 Motivación y Objetivos
La representación de información es fundamental para las Ciencias de la
Computación.
La Ciencia de la Computación (Computer Science), es mucho más que el
estudio de cómo usar o programar las computadoras. Se ocupa de
algoritmos, métodos de calcular resultados y máquinas autómatas.
Antes de las computadoras, existía la computación, que se refiere al uso de
métodos sistemáticos para encontrar soluciones a problemas algebraicos o
simbólicos.
Los babilonios, egipcios y griegos, desarrollaron una gran variedad de
métodos para calcular cosas, por ejemplo el área de un círculo o cómo
calcular el máximo común divisor de dos números enteros (teorema de
Euclides).
En el siglo XIX, Charles Babbage describió una máquina que podía liberar a
los hombres del tedio de los cálculos y al mismo tiempo realizar cálculos
confiables.
La motivación principal de la computación por muchos años fue la de
desarrollar cómputo numérico más preciso. La Ciencia de la Computación
creció del interés en sistemas formales para razonar y la mecanización de la
lógica, así cómo también del procesamiento de datos de negocios. Sin
embargo, el verdadero impacto de la computación vino de la habilidad de las
computadoras de representar, almacenar y transformar la información.
La computación ha creado muchas nuevas áreas como las de correo
electrónico, publicación electrónica y multimedia.
La solución de problemas del mundo real, ha requerido estudiar más de
cerca cómo se realiza la computación. Este estudio ha ampliado la gama de
problemas que pueden ser resueltos.
Por otro lado, la construcción de algoritmos es una habilidad elegante de un
gran significado práctico. Computadoras más poderosas no disminuyen el
significado de algoritmos veloces. En la mayoría de las aplicaciones no es el
hardware el cuello de botella sino más bien el software inefectivo.
Página 9
Este curso trata de tres preguntas centrales que aparecen cuando uno quiere
que un computador haga algo: ¿Es posible hacerlo? ¿Cómo se hace? y ¿Cuán
rápido puede hacerse? El curso da conocimientos y métodos para responder
estas preguntas, al mismo tiempo intenta aumentar la capacidad de
encontrar algoritmos efectivos. Los problemas para resolver, son un
entrenamiento en la solución algorítmica de problemas, y para estimular el
aprendizaje de la materia.
Objetivos Generales:
1. Introducir al alumno en el análisis de complejidad de los algoritmos,
así como en el diseño e implementación de éstos con las técnicas y
métodos más usados.
2. Desarrollar habilidades en el uso de las técnicas de análisis y diseño
de algoritmos computacionales.
3. Analizar la eficiencia de diversos algoritmos para resolver una
variedad de problemas, principalmente no numéricos.
4. Enseñar al alumno a diseñar y analizar nuevos algoritmos.
5. Reconocer y clasificar los problemas de complejidad polinómica y no
polinómica.
Metas del curso:
Al finalizar este curso, el estudiante debe estar capacitado para:
• analizar, diseñar e implementar algoritmos iterativos y recursivos
correctos.
• medir la eficiencia de algoritmos iterativos y recursivos, y de tipos o
clases de datos orientados por objetos.
• utilizar la técnica de diseño de algoritmos más adecuada para una
aplicación en particular.
• definir la aplicabilidad de las diferentes técnicas de búsqueda y
ordenamiento, del procesamiento de cadenas de caracteres, de los
métodos geométricos, del uso de los algoritmos de grafos, de los
algoritmos paralelos y de los algoritmos de complejidad no
polinómica.
• diferenciar entre los algoritmos de complejidad polinómica y no
polinómica.
Página 10
1.2 Algunas Notas sobre la Historia de los Algoritmos
El término proviene del matemático árabe Al'Khwarizmi, que escribió un
tratado sobre los números. Este texto se perdió, pero su versión latina,
Algoritmi de Numero Indorum, sí se conoce.
El trabajo de Al'Khwarizmipermitió preservar y difundir el conocimiento de
los griegos (con la notable excepción del trabajo de Diofanto) e indios,
pilares de nuestra civilización. Rescató de los griegos la rigurosidad y de los
indios la simplicidad (en vez de una larga demostración, usar un diagrama
junto a la palabra Mira). Sus libros son intuitivos y prácticos y su principal
contribución fue simplificar las matemáticas a un nivel entendible por no
expertos. En particular muestran las ventajas de usar el sistema decimal
indio, un atrevimiento para su época, dado lo tradicional de la cultura árabe.
La exposición clara de cómo calcular de una manera sistemática a través de
algoritmos diseñados para ser usados con algún tipo de dispositivo mecánico
similar a un ábaco, más que con lápiz y papel, muestra la intuición y el poder
de abstracción de Al'Khwarizmi. Hasta se preocupaba de reducir el número
de operaciones necesarias en cada cálculo. Por esta razón, aunque no haya
sido él el inventor del primer algoritmo, merece que este concepto esté
asociado a su nombre.
Los babilonios que habitaron en la antigua Mesopotania, empleaban unas
pequeñas bolas hechas de semillas o pequeñas piedras, a manera de
"cuentas" y que eran agrupadas en carriles de caña. Más aún, en 1.800 A.C.
un matemático babilónico inventó los algoritmos que le permitieron resolver
problemas de cálculo numérico.
En 1850 A.C., un algoritmo de multiplicación similar al de expansión binaria
es usado por los egipcios.
La teoría de las ciencias de la computación trata cualquier objeto
computacional para el cual se puede crear un buen modelo. La investigación
en modelos formales de computación se inició en los 30's y 40's por Turing,
Post, Kleene, Church y otros. En los 50's y 60's los lenguajes de
programación, compiladores y sistemas operativos estaban en desarrollo,
por lo tanto, se convirtieron tanto en el sujeto como la base para la mayoría
del trabajo teórico.
El poder de las computadoras en este período estaba limitado por
procesadores lentos y por pequeñas cantidades de memoria. Así, se
desarrollaron teorías (modelos, algoritmos y análisis) para hacer un uso
eficiente de ellas. Esto dio origen al desarrollo del área que ahora se conoce
como "Algoritmos y Estructuras de Datos". Al mismo tiempo se hicieron
estudios para comprender la complejidad inherente en la solución de
algunos problemas. Esto dió origen a lo que se conoce como la jerarquía de
problemas computacionales y al área de "Complejidad Computacional".
Página 11
1.3 Fundamentos Matemáticos
Monotonicidad
Una función f es monótona si es creciente o decreciente. Es creciente si
rige la implicación siguiente:
∀ n0, n1 : (n1 = n2) è f(n1) = f(n2 )
Es decreciente si rige la implicación siguiente:
∀ n0, n1 : (n1 = n2) è f(n1) = f(n2 )
Una función f(n) es monotónicamente creciente si m ≤ n implica que
f(m) ≤ f(n). Similarmente, es monotónicamente decreciente si m ≤ n
implica que f(m) ≥ f(n). Una función f(n) es estrictamente crecientesi
m < n implica que f(m) < f(n) y estrictamente decreciente si m < n
implica que f(m) > f(n).
Conjuntos
Un conjunto es una colección de miembros o elementos distinguibles. Los
miembros se toman típicamente de alguna población más grande conocida
como tipo base. Cada miembro del conjunto es un elemento primitivo
del tipo base o es un conjunto. No hay concepto de duplicación en un
conjunto.
Un orden lineal tiene las siguientes propiedades:
• Para cualesquier elemento a y b en el conjunto S, exactamente uno de
a < b, a = b, o a > b es verdadero.
• Para todos los elementos a, b y c en el conjunto S, si a < b, y b < c,
entonces a < c. Esto es conocido como la propiedad de
transitividad.
Permutación
Una permutación de una secuencia es simplemente los elementos de la
secuencia arreglados en cualquier orden. Si la secuencia contiene n
elementos, existe n! permutaciones.
Página 12
Funciones Piso y Techo
Piso (floor) y techo (ceiling) de un número real x. Son respectivamente
el mayor entero menor o igual que x, y el menor entero mayor o igual a x.
Para cualquier número real x, denotamos al mayor entero, menor que o igual
a x como floor(x), y al menor entero, mayor que o igual a x como
ceiling(x); (floor=piso, ceiling=techo). Para toda x real,
x - 1 < floor(x) ≤ x ≤ ceiling(x) < x + 1
Para cualquier entero n,
ceiling(x/2) + floor(x/2) = n,
y para cualquier entero n y enteros a ≠ 0 y b ≠ 0,
ceiling(ceiling(n/a)/b) = ceiling(n/ab) y
floor(floor(n/a)/b) = floor(n/ab).
Las funciones floory ceiling son monótonas crecientes.
Operador módulo
Esta función regresa el residuo de una división entera. Generalmente se
escribe n mod m, y el resultado es el entero r, tal que n= qm+r para q un
entero y/0 menor o igual que r y r < m.
Por ejemplo: 5 mod 3 = 2 y 25 mod 3 = 1
Polinomios
Dado un entero positivo d, un polinomio en n de grado d es una función
p(n) de la forma:
p(n) = ∑ d*ai ni
i=0
donde las constantes a0, a1,..., ad son los coeficientes del polinimio y ad ≠
0. Un polinomio es asintóticamente positivo si y sólo si ad > 0. Para un
polinomio asintóticamente positivo p(n) de grado d, tenemos que p(n) =
O(nd). Para cualquier constante real a ≥ 0, la función na es monótona
creciente, y para cualquier constante real a ≤ 0, la función na es monótona
decreciente. Decimos que una función f(n) es polinomialmente acotada
si f(n) = nO(1), que es equivalente en decir que f(n) = O(nk) para alguna
constante k.
Página 13
Exponenciales
Para toda a ≠ 0, m y n, tenemos las siguientes identidades:
aº = 1
a¹ = a
a(-1) =1/a
(a m) n = a m n
(a m) n = (a n)m
a m a n = a m +n
Para todo n y a ≥ ,1
lim nà ∞ nb/an = 0
de lo que concluimos que nb=o(an).
Entonces, cualquier función exponencial positiva crece más rápido que
cualquier polinomio.
i=0
exp(x) = ∑ x i /(i!)
∞
Logaritmos
Un logaritmo de base b para el valor y, es la potencia al cual debe elevarse
b para obtener y. Logb y = x ó bx =y.
Usos para los logaritmos:
• ¿Cuál es el número mínimo de bits necesarios para codificar una
colección de objetos? La respuesta es techo(log2 n).
• Por ejemplo, si se necesitan 1000 códigos que almacenar, se
requerirán al menos techo(log2 1000) = 10 bits para tener 1000
códigos distintos. De hecho con 10 bits hay 1024 códigos distintos
disponibles.
• Análisis de algoritmos que trabajan rompiendo un problema en
subproblemas más pequeños. Por ejemplo, la búsqueda binaria de un
valor dado en una lista ordenada por valor. ¿Cuántas veces puede
una lista de tamaño n ser divida a la mitad hasta que un sólo
elemento quede en la lista final? La respuesta es log2 n.
Página 14
Los logaritmos tienen las siguientes propiedades:
• log nm = log n + log m
• log n/m = log n – log m
• log nr = r log n
• loga n = logb n/ logb a (para a y b enteros)
Esta última propiedad dice que el logaritmo de n en distintas bases, está
relacionado por una constante (que es logaritmo de una base en la otra). Así
que análisis de complejidad que se hacen en una base de logaritmos, pueden
fácilmente traducirse en otra, simplemente con un factor de
proporcionalidad.
Factoriales
La notación n! se define para los enteros n ≥ 0 como:
1 si n=0
n! =
n·(n-1)! si n>0
Entonces, n!=1·2·3·4 ··· n.
Una cota superior débil de la función factorial es n! ≤ nn, pues cada uno de
los n términos en el producto factorial es a lo más n. La aproximación de
Stirling, proporciona una cota superior ajustada, y también una cota
inferior:
n! = sqrt{2pn} (n/e)n (1 + Q(1/n))
donde e es la base del logaritmo natural. Usando la aproximación de
Stirling, podemos demostrar que:
n! = o(nn)
n! = (2n)
lg(n!) = Q(n lg n)
Números de Fibonacci
Los números de Fibonacci se definen por la siguiente recurrencia:
F0 = 0
F1 = 1
Fi = Fi-1 + Fi-2 para i ≥ 2
Página 15
Entonces cada número de Fibonacci es la suma de los números previos,
produciendo la sucesión:
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, ...
Recursión
Un algoritmo es recursivo si se llama a sí mismo para hacer parte del
trabajo. Para que este enfoque sea exitoso, la llamada debe ser en un
problema menor que al originalmente intentado.
En general, un algoritmo recursivo tiene dos partes:
• El caso base, que maneja una entrada simple que puede ser resuelta
sin una llamada recursiva
• La parte recursiva, que contiene una o más llamadas recursivas al
algoritmo, donde los parámetros están en un sentido más cercano al
caso base, que la llamada original.
Ejemplos de aplicación: cálculo del factorial, torres de Hanoi y función de
Ackermann.
Sumatorias y recurrencias
Las sumatorias se usan mucho para el análisis de la complejidad de
programas, en especial de ciclos, ya que realizan conteos de operaciones
cada vez que se entra al ciclo.
Cuando se conoce una ecuación que calcula el resultado de una sumatoria,
se dice que esta ecuación representa una solución en forma cerrada.
Ejemplos de soluciones en forma cerrada:
• Σ i = n(n+1)/2
• Σ I 2 = (2n 3 +3n 2 + n)/6
• Σ 1 log n n = n log n
• Σ∞
a i = 1/(1-a)
El tiempo de ejecución para un algoritmo recursivo está más fácilmente
expresado por una expresión recursiva.
Una relación de recurrencia define una función mediante una expresión
que incluye una o más instancias (más pequeñas) de si misma. Por ejemplo:
Página 16
n! = (n-1)! n , 1! = 0! = 1
La secuencia de Fibonacci:
• Fib(n)=Fib(n-1)+Fib(n-2); Fib(1)=Fib(2)=1
• 1,1,2,3,5,8,13,...
Técnicas de Demostración Matemática
Prueba por contradicción
Es la forma más fácil de refutar un teorema o enunciado, es mediante un
contra-ejemplo. Desafortunadamente, no importa el número de ejemplos
que soporte un teorema, esto no es suficiente para probar que es correcto.
Para probar un teorema por contradicción, primero suponemos que el
teorema es falso. Luego encontramos una contradicción lógica que surja de
esta suposición. Si la lógica usada para encontrar la contradicción es
correcta, entonces la única forma de resolver la contradicción es suponer que
la suposición hecha fue incorrecta, esto es, concluir que el teorema debe ser
verdad.
Prueba por inducción matemática
La inducción matemática es como recursión y es aplicable a una variedad de
problemas.
La inducción proporciona una forma útil de pensar en diseño de algoritmos,
ya que lo estimula a pensar en resolver un problema, construyendo a partir
de pequeños subproblemas.
Sea T un teorema a probar, y expresemos T en términos de un parámetro
entero positivo n. La inducción matemática expresa que T es verdad para
cualquier valor de n, si las siguientes condiciones se cumplen:
• Caso base. T es verdad para n = 1
• Paso inductivo. Si T es verdad para n-1, => T es verdad para n.
Ejemplo de demostración del teorema:
La suma de los primeros n números enteros es n(n+1)/2.
Página 17
Estimación
Consiste en hacer estimaciones rápidas para resolver un problema. Puede
formalizarse en tres pasos:
• Determine los parámetros principales que afectan el problema.
• Derive una ecuación que relacione los parámetros al problema.
• Seleccione valores para los parámetros, y aplique la ecuación para
obtener una solución estimada.
Ejemplo: ¿Cuántos libreros se necesitan para guardar libros que contienen
en total un millón de páginas?
Se estiman que 500 páginas de un libro requieren cerca de una pulgada en la
repisa del librero, con lo cual da 2000 pulgadas de repisa. Lo cual da 167
pies de repisa (aprox. 200 pies). Si una repisa es alrededor de 4 pies de
ancho, entonces se necesitan 50 repisas. Si un librero contiene 5 repisas,
entonces se necesitan 10 libreros.
Página 18
Capítulo 2
Algoritmos y Problemas
2.1 Definición de Algoritmo
El concepto intuitivo de algoritmo, lo tenemos prácticamente todos: Un
algoritmo es una serie finita de pasos para resolver un problema.
Hay que hacer énfasis en dos aspectos para que un algoritmo exista:
1. El número de pasos debe ser finito. De esta manera el algoritmo debe
terminar en un tiempo finito con la solución del problema,
2. El algoritmo debe ser capaz de determinar la solución del problema.
De este modo, podemos definir algoritmo como un "conjunto de reglas
operacionales inherentes a un cómputo". Se trata de un método sistemático,
susceptible de ser realizado mecánicamente, para resolver un problema
dado.
Sería un error creer que los algoritmos son exclusivos de la informática.
También son algoritmos los que aprendemos en la escuela para multiplicar y
dividir números de varias cifras. De hecho, el algoritmo más famoso de la
historia se remonta a la antigüedad: se trata del algoritmo de Euclides para
calcular el máximo común divisor.
Siempre que se desee resolver un problema hay que plantearse qué
algoritmo utilizar. La respuesta a esta cuestión puede depender de
numerosos factores, a saber, el tamaño del problema, el modo en que está
planteado y el tipo y la potencia del equipo disponible para su resolución.
Características de un algoritmo
1. Entrada: definir lo que necesita el algoritmo
2. Salida: definir lo que produce.
3. No ambiguo: explícito, siempre sabe qué comando ejecutar.
4. Finito: El algoritmo termina en un número finito de pasos.
5. Correcto: Hace lo que se supone que debe hacer. La solución es
correcta
6. Efectividad: Cada instrucción se completa en tiempo finito. Cada
instrucción debe ser lo suficientemente básica como para que en
principio pueda ser ejecutada por cualquier persona usando papel y
lápiz.
Página 19
7. General: Debe ser lo suficientemente general como para contemplar
todos los casos de entrada.
Así podemos, decir que un Algoritmo es un conjunto finito de
instrucciones precisas para resolver un problema.
Un algoritmo es un método o proceso seguido para resolver un problema.
Si el problema es visto como una función, entonces el algoritmo toma una
entrada y la transforma en la salida.
Un problema es una función o asociación de entradas con salidas. Un
problema puede tener muchos algoritmos.
Por tanto, un algoritmo es un procedimiento para resolver un problema
cuyos pasos son concretos y no ambiguos. El algoritmo debe ser correcto, de
longitud finita y debe terminar para todas las entradas. Un programa es
una instanciación de un algoritmo en un lenguaje de programación.
2.2 Formulación y Resolución de Problemas
Los algoritmos son los procedimientos que se construyen para la resolución
de cualquier problema. De este modo, cuando se refiere a la construcción de
un programa, nos estamos refiriéndo a la construcción de un algoritmo. El
algoritmo no es un concepto proveniente del campo de la computación, sino
que es un término matemático.
Los algoritmos los encontramos, o mejor, los ejecutamos a lo largo de
nuestras actividades diarias; por ejemplo, cuando hacemos una llamada
telefónica, tenemos en cuenta un conjunto de instrucciones mínimas y el
orden en el cual debemos ejecutarlas para conseguir comunicarnos con
alguien en particular; o cuando consultamos un diccionario, cuando se
prepara un menú, etc.
Podemos conceptuar que un algoritmo es un procedimiento que contiene un
conjunto finito de pasos que se deben ejecutar en un orden específico y
lógico, para solucionar los problemas.
Un algoritmo puede ser caracterizado por una función lo cual asocia una
salida: s= f (E) a cada entrada E.
Se dice entonces que un algoritmo calcula una función f. Entonces la entrada
es una variable independiente básica en relación a la que se producen las
salidas del algoritmo, y también los análisis de tiempo y espacio.
Página 20
Cuando se tiene un problema para el cual debemos especificar un algoritmo
solución, tendremos en cuenta varios puntos:
o Si no se conoce un método para solucionar el problema en cuestión,
debemos hacer un análisis del mismo para llegar a una solución,
después de evaluar alternativas, exigencias y excepciones.
o Si se conoce un "buen" método de solución al problema, se debe
especificar exacta y completamente el método o procedimiento de
solución en un lenguaje que se pueda interpretar fácilmente.
o Los problemas pueden agruparse en conjunto de problemas que son
semejantes.
o En algún sentido, en general, un método para solucionar todos los
problemas de un conjunto dado, se considera superior a un método
para solucionar solamente un problema del conjunto.
o Hay criterios para determinar que tan "buena" es una solución,
distintos de ver si trabaja o no, o hasta qué punto es general la
aplicabilidad del método. Estos criterios involucran aspectos tales
como: eficiencia, elegancia, velocidad, etc.
Al definir con exactitud un método de solución para un problema, este debe
estar en capacidad de encontrarla si existe; en caso de que no exista, el
método debe reconocer esta situación y suspender cualquier acción.
Formular y resolver problemas constituye una actividad esencial de la vida.
Los modelos educativos se han dedicado a plantear problemas y enseñar
como solucionarlos. Sin embargo, no se enseña nunca técnicas de cómo
resolver problemas en general.
La formulación y resolución de problemas ha sido preocupación de los
psicólogos cuando hablan de la inteligencia del hombre. Ellos han concebido
esta capacidad como el concurso de ciertas destrezas mentales relacionadas
con lo que ya se ha aprendido y que incluyen:
o Capacidad de analizar los problemas.
o La rapidez y precisión con que acude al pensamiento.
o Una organización de ideas para garantizar que se posee la
información esencial que asegura el aprendizaje.
o Una retención clara del incremento de conocimiento.
No se trata de almacenar problemas y sus correspondientes soluciones, sino
de desarrollar una capacidad para hacer frente con éxito a situaciones
nuevas o desconocidas en la vida del hombre. Ante situaciones nuevas, el
que no sabe buscar soluciones se sentirá confuso y angustiado y entonces no
busca una estrategia y dará una primera solución para poner punto final a su
agonía.
Página 21
El que sabe buscar soluciones, selecciona la estrategia que le parece más
cercana a la requerida y hace una hábil adaptación que se ajusta a la nueva
demanda.
Al movernos dentro de la informática no siempre encontramos los
problemas a punto de resolverlos, es necesario empezar por hacer su
formulación. Se exige hacerlo en términos concisos y claros partiendo de las
bases o supuestos que se dispone para especificar sus requerimientos.
Sólo a partir de una buena formulación será posible diseñar una estrategia
de solución. Es necesario aprender a desligar estos dos procesos. No se
deben hacer formulaciones pensando paralelamente en posibles soluciones.
Es necesario darle consistencia e independencia para determinar con
precisión a qué se quiere dar solución y luego canalizar una gama de
alternativas posibles.
Si ya se ha realizado la formulación del problema podemos cuestionarla con
el fin de entender bien la naturaleza del problema.
En nuestra área, el análisis de un problema tiene dos etapas claramente
definidas y relacionadas:
o Formulación o planteamiento del problema.
o Resolución del problema.
A su vez, la formulación la podemos descomponer en tres etapas:
o Definición del problema.
o Supuestos: aserciones y limitaciones suministradas.
o Resultados esperados.
La fase de planteamiento del problema lo que pretende un algoritmo es
sintetizar de alguna forma una tarea, cálculo o mecanismo antes de ser
transcrito al computador. Los pasos que hay que seguir son los siguientes:
o Análisis previo del problema.
o Primera visión del método de resolución.
o Descomposición en módulos.
o Programación estructurada.
o Búsqueda de soluciones parciales.
o Ensamblaje de soluciones finales.
La fase de resolución del problema se puede descomponer en tres
etapas:
o Análisis de alternativas y selección de la solución.
o Especificación detallada del procedimiento solución.
Página 22
o Adopción o utilización de una herramienta para su
implementación, si es necesaria.
Hay que notar que el computador es un medio y no es el fin en la solución de
problemas.
En otras palabras, no es el computador el que soluciona los problemas,
somos nosotros quienes lo hacemos y de alguna manera le contamos como
es la cosa para que él con su velocidad y exactitud trabaje con grandes
volúmenes de datos.
En el campo de las ciencias de la computación la solución de problemas se
describe mediante el diseño de procedimientos llamados algoritmos, los
cuales posteriormente se implementan como programas. Los
programas son procedimientos que solucionan problemas y que se
expresan en un lenguaje conocido por el computador.
Se pueden dar problemas que por su tamaño es necesario subdividirlos en
problemas más simples para solucionarlos, utilizando la filosofía de "Dividir
para conquistar". Se parte del principio de que es más fácil solucionar varios
problemas simples como partes de un todo que seguir una implantación de
"Todo o Nada". Desarrollar la capacidad de formular y resolver problemas
nos prepara para enfrentar situaciones desconocidas.
2.3 Razones para Estudiar los Algoritmos
Con el logro de computadores cada vez más rápidos se podría caer en la
tentación de preguntarse si vale la pena preocuparse por aumentar la
eficiencia de los algoritmos. ¿No sería más sencillo aguardar a la siguiente
generación de computadores?. Vamos a demostrar que esto no es así.
Supongamos que se dispone, para resolver un problema dado, de un
algoritmo que necesita un tiempo exponencial y que, en un cierto
computador, una implementación del mismo emplea 10-4 x 2n segundos.
Este programa podrá resolver un ejemplar de tamaño n=10 en una décima
de segundo. Necesitará casi 10 minutos para resolver un ejemplar de tamaño
20. Un día entero no bastará para resolver uno de tamaño 30. En un año de
cálculo ininterrumpido, a duras penas se resolverá uno de tamaño 38.
Imaginemos que necesitamos resolver ejemplares más grandes y
compramos para ello un computador cien veces más rápido. El mismo
algoritmo conseguirá resolver ahora un ejemplar de tamaño n en sólo 10-6 2n
segundos. ¡Qué decepción al constatar que, en un año, apenas se consigue
resolver un ejemplar de tamaño 45!
En general, si en un tiempo dado se podía resolver un ejemplar de tamaño n,
con el nuevo computador se resolverá uno de tamaño n+7 en ese mismo
tiempo.
Página 23
Imaginemos, en cambio, que investigamos en algorítmica y encontramos un
algoritmo capaz de resolver el mismo problema en un tiempo cúbico. La
implementación de este algoritmo en el computador inicial podría necesitar,
por ejemplo, 10-2 n3 segundos. Ahora se podría resolver en un día un
ejemplar de un tamaño superior a 200. Un año permitiría alcanzar casi el
tamaño 1500.
Por tanto, el nuevo algoritmo no sólo permite una aceleración más
espectacular que la compra de un equipo más rápido, sino que hace dicha
compra más rentable.
Dado estos argumentos, podemos resumir las siguientes razones para
justificar el estudiar los algoritmos:
1. Evitar reinventar la rueda.
Para algunos problemas de programación ya existen buenos algoritmos
para solucionarlos. Para esos algoritmos ya fueron analizadas sus
propiedades. Por ejemplo, confianza en su correctitud y eficiencia.
2. Para ayudar cuando desarrollen sus propios algoritmos.
No siempre existe un algoritmo desarrollado para resolver un problema.
No existe regla general de creación de algoritmos. Muchos de los
principios de proyecto de algoritmos ilustrados por algunos de los
algoritmos que estudiaremos son importantes en todos los problemas de
programación. El conocimiento de los algoritmos bien definidos provee
una fuente de ideas que pueden ser aplicadas a nuevos algoritmos.
3. Ayudar a entender herramientas que usan algoritmos particulares. Por
ejemplo, herramientas de compresión de datos:
• Pack usa Códigos Huffman.
• Compress usa LZW.
• Gzip usa Lempel-Ziv.
4. Útil conocer técnicas empleadas para resolver problemas de
determinados tipos.
2.4 Formas de Representación de Algoritmos
Existen diversas formas de representación de algoritmos, pero no hay un
consenso con relación a cuál de ellas es mejor.
Algunas formas de representación de algoritmos tratan los problemas a un
nivel lógico, abstrayéndose de detalles de implementación, muchas veces
relacionados con un lenguaje de programación específico. Por otro lado,
existen formas de representación de algoritmos que poseen una mayor
Página 24
riqueza de detalles y muchas veces acaban por oscurecer la idea principal, el
algoritmo, dificultando su entendimiento.
Dentro de las formas de representación de algoritmos más conocidas,
sobresalen:
• La descripción narrativa
• El Flujograma convencional
• El diagrama Chapin
• El pseudocódigo, o también conocido como lenguaje estructurado.
2.5 La Máquina de Turing
Alan Turing, en 1936 desarrolló su Máquina de Turing (la cual se cubre
en los cursos denominados Teoría de la Computación o Teoría de
Automátas), estableciendo que cualquier algoritmo puede ser representado
por ella.
Turing mostró también que existen problemas matemáticos bien definidos
para los cuales no hay un algoritmo. Hay muchos ejemplos de problemas
para los cuales no existe un algoritmo. Un problema de este tipo es el
llamado problema de paro (halting problem):
Dado un programa de computadora con sus entradas, ¿parará este
alguna vez?
Turing probó que no hay un algoritmo que pueda resolver correctamente
todas las instancias de este problema.
Alguien podría pensar en encontrar algunos métodos para detectar patrones
que permitan examinar el programa para cualquier entrada. Sin embargo,
siempre habrá sutilezas que escapen al análisis correspondiente.
Alguna persona más suspicaz, podría proponer simplemente correr el
programa y reportar éxito si se alcanza una declaración de fin.
Desgraciadamente, este esquema no garantiza por sí mismo un paro y en
consecuencia el problema no puede ser resuelto con los pasos propuestos.
Como consecuencia de acuerdo con la definición anterior, ese último
procedimiento no es un algoritmo, pues no se llega a una solución.
Muchas veces aunque exista un algoritmo que pueda solucionar
correctamente cualquier instancia de un problema dado, no siempre dicho
algoritmo es satisfactorio porque puede requerir de tiempos exageradamente
excesivos para llegar a la solución.
Página 25
Capítulo 3
Eficiencia de Algoritmos
3.1 Introducción
Un objetivo natural en el desarrollo de un programa computacional es
mantener tan bajo como sea posible el consumo de los diversos recursos,
aprovechándolos de la mejor manera que se encuentre. Se desea un buen
uso, eficiente, de los recursos disponibles, sin desperdiciarlos.
Para que un programa sea práctico, en términos de requerimientos de
almacenamiento y tiempo de ejecución, debe organizar sus datos en una
forma que apoye el procesamiento eficiente.
Siempre que se trata de resolver un problema, puede interesar considerar
distintos algoritmos, con el fin de utilizar el más eficiente. Pero, ¿cómo
determinar cuál es "el mejor"?. La estrategia empírica consiste en
programar los algoritmos y ejecutarlos en un computador sobre algunos
ejemplares de prueba. La estrategia teórica consiste en determinar
matemáticamente la cantidad de recursos (tiempo, espacio, etc.) que
necesitará el algoritmo en función del tamaño del ejemplar considerado.
El tamaño de un ejemplar x corresponde formalmente al número de dígitos
binarios necesarios para representarlo en el computador. Pero a nivel
algorítmico consideraremos el tamaño como el número de elementos lógicos
contenidos en el ejemplar.
3.2 Concepto de Eficiencia
Un algoritmo es eficiente cuando logra llegar a sus objetivos planteados
utilizando la menor cantidad de recursos posibles, es decir, minimizando el
uso memoria, de pasos y de esfuerzo humano.
Un algoritmo es eficaz cuando alcanza el objetivo primordial, el análisis de
resolución del problema se lo realiza prioritariamente.
Puede darse el caso de que exista un algoritmo eficaz pero no eficiente, en lo
posible debemos de manejar estos dos conceptos conjuntamente.
La eficiencia de un programa tiene dos ingredientes fundamentales:
espacio y tiempo.
• La eficiencia en espacio es una medida de la cantidad de memoria
requerida por un programa.
Página 26
• La eficiencia en tiempo se mide en términos de la cantidad de
tiempo de ejecución del programa.
Ambas dependen del tipo de computador y compilador, por lo que no se
estudiará aquí la eficiencia de los programas, sino la eficiencia de los
algoritmos. Asimismo, este análisis dependerá de si trabajamos con
máquinas de un solo procesador o de varios de ellos. Centraremos nuestra
atención en los algoritmos para máquinas de un solo procesador que
ejecutan una instruccióny luego otra.
3.3 Medidas de Eficiencia
Inventar algoritmos es relativamente fácil. En la práctica, sin embargo, no
se pretende sólo diseñar algoritmos, si no más bien que buenos algoritmos.
Así, el objetivo es inventar algoritmos y probar que ellos mismos son
buenos.
La calidad de un algoritmo puede ser avalada utilizando varios criterios.
Uno de los criterios más importantes es el tiempo utilizado en la ejecución
del algoritmos. Existen varios aspectos a considerar en cada criterio de
tiempo. Uno de ellos está relacionado con el tiempo de ejecución
requerido por los diferentes algoritmos, para encontrar la solución final de
un problema o cálculo particular.
Normalmente, un problema se puede resolver por métodos distintos, con
diferentes grados de eficiencia. Por ejemplo: búsqueda de un número en
una guía telefónica.
Cuando se usa un computador es importante limitar el consumo de
recursos.
Recurso Tiempo:
• Aplicaciones informáticas que trabajan “en tiempo real” requieren
que los cálculos se realicen en el menor tiempo posible.
• Aplicaciones que manejan un gran volumen de información si
no se tratan adecuadamente pueden necesitar tiempos
impracticables.
Recurso Memoria:
• Las máquinas tienen una memoria limitada.
Página 27
3.4 Análisis A Priori y Prueba A Posteriori
El análisis de la eficiencia de los algoritmos (memoria y tiempo de ejecución)
consta de dos fases: Análisis A Priori y Prueba A Posteriori.
El Análisis A Priori (o teórico) entrega una función que limita el tiempo
de cálculo de un algoritmo. Consiste en obtener una expresión que indique el
comportamiento del algoritmo en función de los parámetros que influyan.
Esto es interesante porque:
• La predicción del costo del algoritmo puede evitar una
implementación posiblemente laboriosa.
• Es aplicable en la etapa de diseño de los algoritmos, constituyendo
uno de los factores fundamentales a tener en cuenta.
En la Prueba A Posteriori (experimental o empírica) se recogen
estadísticas de tiempo y espacio consumidas por el algoritmo mientras se
ejecuta. La estrategia empírica consiste en programar los algoritmos y
ejecutarlos en un computador sobre algunos ejemplares de prueba, haciendo
medidas para:
• una máquina concreta,
• un lenguaje concreto,
• un compilador concreto y
• datos concretos
La estrategia teórica tiene como ventajas que no depende del computador ni
del lenguaje de programación, ni siquiera de la habilidad del programador.
Permite evitar el esfuerzo inútil de programar algoritmos ineficientes y de
despediciar tiempo de máquina para ejecutarlos. También permite conocer
la eficiencia de un algoritmo cualquiera que sea el tamaño del ejemplar al
que se aplique.
3.5 Concepto de Instancia
Un problema computacional consiste en una caracterización de un
conjunto de datos de entrada, junto con la especificación de la salida
deseada en base a cada entrada.
Un problema computacional tiene una o más instancias, que son valores
particulares para los datos de entrada, sobre los cuales se puede ejecutar el
algoritmo para resolver el problema.
Ejemplo: el problema computacional de multiplicar dos números enteros
tiene por ejemplo, las siguientes instancias: multiplicar 345 por 4653,
multiplicar 2637 por 10000, multiplicar -32341 por 12, etc.
Página 28
Un problema computacional abarca a otro problema computacional si las
instancias del segundo pueden ser resueltas como instancias del primero en
forma directa.
Ejemplo: Problema del Vendedor Viajero.
3.6 Tamaño de los Datos
Variable o expresión en función de la cual intentaremos medir la
complejidad del algoritmo.
Es claro que para cada algoritmo la cantidad de recurso (tiempo, memoria)
utilizados depende fuertemente de los datos de entrada. En general, la
cantidad de recursos crece a medida que crece el tamaño de la entrada.
El análisis de esta cantidad de recursos no es viable de ser realizado
instancia por instancia.
Se definen entonces las funciones de cantidad de recursos en base al
tamaño (o talla) de la entrada. Suele depender del número de datos del
problema. Este tamaño puede ser la cantidad de dígitos para un número, la
cantidad de elementos para un arreglo, la cantidad de caracteres de una
cadena, en problemas de ordenación es el número de elementos a ordenar,
en matrices puede ser el número de filas, columnas o elementos totales, en
algoritmos recursivos es el número de recursiones o llamadas propias que
hace la función.
En ocasiones es útil definir el tamaño de la entrada en base a dos o más
magnitudes. Por ejemplo, para un grafo es frecuente utilizar la cantidad de
nodos y de arcos.
En cualquier caso, se debe elegir la misma variable para comparar
algoritmos distintos aplicados a los mismos datos.
C1
C2
C3
C4
Una instancia de solución
sería:
<C1, C2 , C4, C3 >
con una longitud de 27.
10
5
6
9
3
9
Página 29
3.7 Cálculo de Costos de Algoritmos
Queremos saber la eficiencia de los algoritmos, no del computador. Por ello,
en lugar de medir el tiempo de ejecución en microsegundos o algo por el
estilo, nos preocuparemos del númerode veces que se ejecuta una operación
primitiva (de tiempo fijo).
Para estimar la eficiencia de este algoritmo, podemos preguntarnos, "si el
argumento es una frase de N números, ¿cuántas multiplicaciones
realizaremos?" La respuesta es que hacemos una multiplicación por cada
número en el argumento, por lo que hacemos N multiplicaciones. La
cantidad de tiempo que se necesitaría para el doble de números sería el
doble.
3.7.1 Cálculo de eficiencia en análisis iterativo
Cuando se analiza la eficiencia, en tiempo de ejecución, de un algoritmo son
posibles distintas aproximaciones: desde el cálculo detallado (que puede
complicarse en muchos algoritmos si se realiza un análisis para distintos
contenidos de los datos de entrada, casos más favorables, caso peor,
hipótesis de distribución probabilística para los contenidos de los datos de
entrada, etc.) hasta el análisis asintótico simplificado aplicando reglas
prácticas.
En estos apuntes se seguirá el criterio de análisis asintótico simplificado, si
bien nunca se ha de dejar de aplicar el sentido común. Como en todos los
modelos simplificados se ha mantener la alerta para no establecer hipótesis
simplificadoras que no se correspondan con la realidad.
En lo que sigue se realizará una exposición basada en el criterio de exponer
en un apartado inicial una serie de reglas y planteamientos básicos
aplicables al análisis de eficiencia en algoritmos iterativos, en un segundo
apartado se presenta una lista de ejemplos que permitan comprender
algunas de las aproximaciones y técnicas expuestas.
3.7.2 Cálculo de eficiencia en análisis recursivo
Retomando aquí el socorrido ejemplo del factorial, tratemos de analizar el
coste de dicho algoritmo, en su versión iterativa , se tiene:
PROCEDURE Factorial(n : CARDINAL) : CARDINAL
BEGIN
VAR Resultado,i : CARDINAL ;
Resultado :=1 ;
FOR i :=1 TO n DO
Resultado :=Resultado*i;
Página 30
END ;
RETURN Resultado
END Factorial ;
Aplicando las técnicas de análisis de coste en algoritmos iterativos de forma
rápida y mentalmente (es como se han de llegar a analizar algoritmos tan
simples como éste), se tiene: hay una inicialización antes de bucle, de coste
constante. El bucle se repite un número de veces n y en su interior se realiza
una operación de coste constante. Por tanto el algoritmo es de coste lineal o
expresado con algo más de detalle y rigor, si la función de coste del
algoritmo se expresa por T(n), se tiene que T(n) ? T.
Una versión recursiva del mismo algoritmo, es:
PROCEDURE Factorial(n: CARDINAL): CARDINAL;
BEGIN
IF n=0 THEN
RETURN 1
ELSE
RETURN ( n* Factorial(n-1) )
END
END Factorial;
Al aplicar el análisis de coste aprendido para análisis de algoritmos iterativos
se tiene: hay una instrucción de alternativa, en una de las alternativas
simplemente se devuelve un valor (operación de coste constante). En la otra
alternativa se realiza una operación de coste constante (multiplicación) con
dos operandos. El primer operando se obtiene por una operación de coste
constante (acceso a la variable n), el coste de la operación que permite
obtener el segundo operando es el coste que estamos calculando!, es decir es
el coste de la propia función factorial (solo que para parámetro n-1).
Por tanto, para conocer el orden de la función de coste de este algoritmo
¿debemos conocer previamente el orden de la función de coste de este
algoritmo?, entramos en una recurrencia.
Y efectivamente, el asunto está en saber resolver recurrencias. Si T(n) es la
función de coste de este algoritmo se puede decir que T(n) es igual a una
operación de coste constante c cuando n vale 0 y a una operación de coste
T(n-1) más una operación de coste constante (el acceso a n y la
multiplicación) cuando n es mayor que 0, es decir:
c si n = 0
T(n) =
T(n-1) + c si n > 0
Se trata entonces de encontrar soluciones a recurrencias como ésta.
Entendiendo por solución una función simple f(n) tal que se pueda asegurar
que T(n) es del orden de f(n).
Página 31
En este ejemplo puede comprobarse que T(n) es de orden lineal, es decir del
orden de la función f(n)=n, ya que cualquier función lineal T(n)= an+b
siendo a y b constantes, es solución de la recurrencia:
T(0)= b , es decir una constante
T(n)= a.n+b= an-a+ b+a= a(n-1)+b+a= T(n-1)+a, es decir el
coste de T(n) es igual al de T(n-1) más una constante.
3.8 Principio de Invarianza
Dado un algoritmo y dos implementaciones I1 y I2 (máquinas distintas o
códigos distintos) que tardan T1(n) y T2(n) respectivamente, el principio de
invarianza afirma que existe una constante real c>0 y un número natural n0
tales que para todo n>=n0 se verifica que T1(n)<=c·T2(n).
Es decir, el tiempo de ejecución de dos implementaciones distintas de un
algoritmo dado no va a diferir más que en una constante multiplicativa.
Asumimos que un algoritmo tarda un tiempo del orden de T(n) si existen
una constante real c>0 y una implementación I del algoritmo que tarda
menos que c·T(n), para todo n tamaño de entrada.
El comportamiento de un algoritmo puede variar notablemente para
diferentes secuencias de entrada. Suelen estudiarse tres casos para un
mismo algoritmo: caso mejor, caso peor, caso medio.
3.9 Análisis Peor Caso, Mejor Caso y Caso Promedio
Puede analizarse un algoritmo particular o una clase de ellos. Una clase de
algoritmo para un problema son aquellos algoritmos que se pueden
clasificar por el tipo de operación fundamental que realizan.
Ejemplo:
Problema: Ordenamiento
Clase: Ordenamiento por comparación
Para algunos algoritmos, diferentes entradas (inputs) para un tamaño dado
pueden requerir diferentes cantidades de tiempo.
Por ejemplo, consideremos el problema de encontrar la posición particular
de un valor K, dentro de un arreglo de n elementos. Suponiendo que sólo
ocurre una vez. Comentar sobre el mejor, peor y caso promedio.
¿Cuál es la ventaja de analizar cada caso? Si examinamos el peor de los
casos, sabemos que al menos el algoritmo se desempeñará de esa forma.
Página 32
En cambio, cuando un algoritmo se ejecuta muchas veces en muchos tipos
de entrada, estamos interesados en el comportamiento promedio o típico.
Desafortunadamente, esto supone que sabemos cómo están distribuidos los
datos.
Si conocemos la distribución de los datos, podemos sacar provecho de esto,
para un mejor análisis y diseño del algoritmo. Por otra parte, sino
conocemos la distribución, entonces lo mejor es considerar el peor de los
casos.
Tipos de análisis:
o Peor caso: indica el mayor tiempo obtenido, teniendo en
consideración todas las entradas pos ibles.
o Mejor caso: indica el menor tiempo obtenido, teniendo en
consideración todas las entradas posibles.
o Media: indica el tiempo medio obtenido, considerando todas las
entradas posibles.
Como no se puede analizar el comportamiento sobre todas las entradas posibles,
va a existir para cada problema particular un análisis en él:
- peor caso
- mejor caso
- caso promedio (o medio)
El caso promedio es la medida más realista de la performance, pero es más
difícil de calcular pues establece que todas las entradas son igualmente
probables, lo cual puede ser cierto o no. Trabajaremos específicamente con
el peor caso.
Página 33
Ejemplo
Sea A una lista de n elementos A1, A2 , A3, ... , An. Ordenar significa permutar
estos elementos de tal forma que los mismos queden de acuerdo con un
orden preestablecido.
Ascendente A1<=A2 <=A3 ..........<=An
Descendente A1 >=A2 >=........>=An
Caso peor: Que el vector esté ordenado en sentido inverso.
Caso mejor: Que el vector esté ordenado.
Caso medio: Cuando el vector esté desordenado aleatoriamente.
Página 34
Capítulo 4
Análisis de Algoritmos
4.1 Introducción
Como hemos visto, existen muchos enfoques para resolver un problema.
¿Cómo escogemos entre ellos? Generalmente hay dos metas en el diseño de
programas de cómputo:
• El diseño de un algoritmo que sea fácil de entender, codificar y
depurar (Ingeniería de Software).
• El diseño de un algoritmo que haga uso eficiente de los recursos de la
computadora (Análisis y Diseño de algoritmos).
El análisis de algoritmos nos permite medir la dificultad inherente de
un problema y evaluar la eficiencia de un algoritmo.
4.2 Tiempos de Ejecución
Una medida que suele ser útil conocer es el tiempo de ejecución de un
algoritmo en función de N, lo que denominaremos T(N). Esta función se
puede medir físicamente (ejecutando el programa, reloj en mano), o
calcularse sobre el código contando instrucciones a ejecutar y multiplicando
por el tiempo requerido por cada instrucción.
Así, un trozo sencillo de programa como:
S1; FOR i:= 1 TO N DO S2 END;
requiere:
T(N):= t1 + t2*N
siendo t1 el tiempo que lleve ejecutar la serie "S1" de sentencias, y t2 el que
lleve la serie "S2".
Prácticamente todos los programas reales incluyen alguna sentencia
condicional, haciendo que las sentencias efectivamente ejecutadas
dependan de los datos concretos que se le presenten. Esto hace que más que
un valor T(N) debamos hablar de un rango de valores:
Tmin(N) <= T(N) <= Tmax(N)
Página 35
los extremos son habitualmente conocidos como "caso peor" y "caso mejor".
Entre ambos se hallará algún "caso promedio" o más frecuente. Cualquier
fórmula T(N) incluye referencias al parámetro N y a una serie de constantes
"Ti" que dependen de factores externos al algoritmo como pueden ser la
calidad del código generado por el compilador y la velocidad de ejecución de
instrucciones del computador que lo ejecuta.
Dado que es fácil cambiar de compilador y que la potencia de los
computadores crece a un ritmo vertiginoso (en la actualidad, se duplica
anualmente), intentaremos analizar los algoritmos con algún nivel de
independencia de estos factores; es decir, buscaremos estimaciones
generales ampliamente válidas.
No se puede medir el tiempo en segundos porque no existe un computador
estándar de referencia, en su lugar medimos el número de operaciones
básicas o elementales.
Las operaciones básicas son las que realiza el computador en tiempo acotado
por una constante, por ejemplo:
• Operaciones aritméticas básicas
• Asignaciones de tipos predefinidos
• Saltos (llamadas a funciones, procedimientos y retorno)
• Comparaciones lógicas
• Acceso a estructuras indexadas básicas (vectores y matrices)
Es posible realizar el estudio de la complejidad de un algoritmo sólo en base
a un conjunto reducido de sentencias, por ejemplo, las que más influyen en
el tiempo de ejecución.
Para medir el tiempo de ejecución de un algoritmo existen varios métodos.
Veamos algunos de ellos:
a) Benchmarking
La técnica de benchmark considera una colección de entradas típicas
representativas de una carga de trabajo para un programa.
b) Profiling
Consiste en asociar a cada instrucción de un programa un número que
representa la fracción del tiempo total tomada para ejecutar esa
instrucción particular. Una de las técnicas más conocidas (e informal) es
la Regla 90-10, que afirma que el 90% del tiempo de ejecución se
invierte en el 10% del código.
Página 36
c) Análisis
Consiste en agrupar las entradas de acuerdo a su tamaño, y estimar el
tiempo de ejecución del programa en entradas de ese tamaño, T(n). Esta
es la técnica que se estudiará en el curso.
De este modo, el tiempo de ejecución puede ser definido como una
función de la entrada. Denotaremos T(n) como el tiempo de ejecución de un
algoritmo para una entrada de tamaño n.
4.3 Concepto de Complejidad
La complejidad (o costo) de un algoritmo es una medida de la cantidad de
recursos (tiempo, memoria) que el algoritmo necesita. La complejidad de un
algoritmo se expresa en función del tamaño (o talla) del problema.
La función de complejidad tiene como variable independiente el tamaño del
problema y sirve para medir la complejidad (espacial o temporal). Mide el
tiempo/espacio relativo en función del tamaño del problema.
El comportamiento de la función determina la eficiencia. No es única para
un algoritmo: depende de los datos. Para un mismo tamaño del problema,
las distintas presentaciones iniciales de los datos dan lugar a distintas
funciones de complejidad. Es el caso de una ordenación si los datos están
todos inicialmente desordenados, parcialmente ordenados o en orden
inverso.
Ejemplo: f(n)= 3n2+2n+1 , en donde n es el tamaño del problema y expresa
el tiempo en unidades de tiempo.
¿Una computadora más rápida o un algoritmo más rápido?
Si compramos una computadora diez veces más rápida, ¿en qué tiempo
podremos ahora ejecutar un algoritmo?
La respuesta depende del tamaño de la entrada de datos, así como de la
razón de crecimiento del algoritmo.
Si la razón de crecimiento es lineal (es decir, T(n)=cn) entonces por
ejemplo, 100.000 números serán procesados en la nueva máquina en el
mismo tiempo que 10.000 números en la antigua computadora.
¿De qué tamaño (valor de n) es el problema que podemos resolver con una
computadora X veces más rápida (en un intervalo de tiempo fijo)?
Por ejemplo, supongamos que una computadora resuelve un problema de
tamaño n en una hora. Ahora supongamos que tenemos una computadora
Página 37
10 veces más rápida, ¿de qué tamaño es el problema que podemos
resolver?
f(n) n n´ cambio n´/n
10n 1000 10000 n´=10n 10
20n 500 5000 n´=10n 10
5n log n 250 1842 √(10)n
<n´<10n
7.37
2n2 70 223 n´=√(10)n 3.16
2n 13 16 n´=n+3 ----
En la tabla de arriba, f(n) es la razón de crecimientode un algoritmo.
Supongamos que tenemos una computadora que puede ejecutar 10.000
operaciones básicas en una hora. La segunda columna muestra el máximo
valor de n que puede ejecutarse con 10.000 operaciones básicas en una
hora. Es decir f(n)=”total de operaciones básicas en un intervalo de tiempo”.
Por ejemplo, f(n)=10.000 operaciones básicas por hora.
Si suponemos que tenemos una computadora 10 veces más rápida, entonces
podremos ejecutar 100.000 operaciones básicas en una hora. Por lo cual
f(n’)=100.000 operaciones básicas por hora.
Ejercicio: Comentar sobre la razón n´/n según el incremento de velocidad
de la computadora y la razón de crecimiento del algoritmo en cuestión.
Nota: los factores constantes nunca afectan la mejora relativa obtenida por
una computadora más rápida.
4.4 Órdenes de Complejidad
Se dice que O(f(n)) define un "orden de complejidad". Escogeremos
como representante de este orden a la función f(n) más sencilla del mismo.
Así tendremos:
O(1) orden constante
O(log n) orden logarítmico
O(n) orden lineal
O(n2 ) orden cuadrático
O(na) orden polinomial (a > 2)
O(an) orden exponencial (a > 2)
O(n!) orden factorial
Es más, se puede identificar una jerarquía de órdenes de complejidad que
coincide con el orden de la tabla anterior; jerarquía en el sentido de que
cada orden de complejidad superior tiene a los inferiores como
Página 38
subconjuntos. Si un algoritmo A se puede demostrar de un cierto orden O1 ,
es cierto que también pertenece a todos los órdenes superiores (la relación
de orden cota superior es transitiva); pero en la práctica lo útil es encontrar
la "menor cota superior", es decir el menor orden de complejidad que lo
cubra.
Antes de realizar un programa conviene elegir un buen algoritmo, donde
por bueno entendemos que utilice pocos recursos, siendo usualmente los
más importantes el tiempo que lleve ejecutarse y la cantidad de espacio en
memoria que requiera. Es engañoso pensar que todos los algoritmos son
"más o menos iguales" y confiar en nuestra habilidad como programadores
para convertir un mal algoritmo en un producto eficaz. Es asimismo
engañoso confiar en la creciente potencia de las máquinas y el
abaratamiento de las mismas como remedio de todos los problemas que
puedan aparecer.
Un ejemplo de algunas de las funciones más comunes en análisis de
algoritmos son:
La mejor técnica para diferenciar la eficiencia de los algoritmos es el estudio
de los órdenes de complejidad. El orden de complejidad se expresa
generalmente en términos de la cantidad de datos procesados por el
programa, denominada n, que puede ser el tamaño dado o estimado.
En el análisis de algoritmos se considera usualmente el caso peor, si bien a
veces conviene analizar igualmente el caso mejor y hacer alguna estimación
sobre un caso promedio. Para independizarse de factores coyunturales, tales
como el lenguaje de programación, la habilidad del codificador, la máquina
de soporte, etc. se suele trabajar con un cálculo asintótico que indica
cómo se comporta el algoritmo para datos muy grandes y salvo algún
coeficiente multiplicativo. Para problemas pequeños es cierto que casi todos
los algoritmos son "más o menos iguales", primando otros aspectos como
esfuerzo de codificación, legibilidad, etc. Los órdenes de complejidad sólo
son importantes para grandes problemas.
Página 39
4.5 Notación Asintótica
El interés principal del análisis de algoritmos radica en saber cómo crece el
tiempo de ejecución, cuando el tamaño de la entrada crece. Esto es la
eficiencia asintóticadel algoritmo. Se denomina “asintótica” porque analiza
el comportamiento de las funciones en el límite, es decir, su tasa de
crecimiento.
La notación asintótica se describe por medio de una función cuyo dominio
es los números naturales (Ν ) estimado a partir de tiempo de ejecución o de
espacio de memoria de algoritmos en base a la longitud de la entrada. Se
consideran las funciones asintóticamente no negativas.
La notación asintótica captura el comportamiento de la función para
valores grandes de N.
Las notaciones no son dependientes de los tres casos anteriormente vistos,
es por eso que una notación que determine el peor caso puede estar
presente en una o en todas las situaciones.
4.5.1 La O Mayúscula
La notación O se utiliza para comparar funciones. Resulta particularmente
útil cuando se quiere analizar la complejidad de un algoritmo, en otras
palabras, la cantidad de tiempo que le toma a un computador ejecutar un
programa.
Definición: Sean f y g funciones con dominio en R ≤ 0 o N es imagen en
R. Si existen constantes C y k tales que:
∀ x > k, | f (x) | ≤ C | g (x) |
es decir, que para x > k, f es menor o igual a un multiplo de g, decimos que:
f (x) = O ( g (x) )
La definición formal es:
f (x) = O ( g (x) ) ∃ k , N | ∀ x > N, | f (x) | ≤ k| g (x) |
¿Qué quiere decir todo esto? Básicamente, que una función es siempre
menor que otra función (por ejemplo, el tiempo en ejecutar tu programa es
menor que x2 ) si no tenemos en cuenta los factores constantes (eso es lo que
significa la k) y si no tenemos en cuenta los valores pequeños (eso es lo que
significa la N).
Página 40
¿Por qué no tenemos en cuenta los valores pequeños de N? Porqué para
entradas pequeñas, el tiempo que tarda el programa no es significativo y
casi siempre el algoritmo será suficientemente rápido para lo que queremos.
Así 3N3 + 5N2 – 9 = O (N3) no significa que existe una función O(N3) que
es igual a 3N 3 + 5N 2 – 9.
Debe leerse como:
“3N 3+5N 2 –9 es O-Grande de N3”
que significa:
“3N 3+5N 2 –9 está asintóticamente dominada por N3”
La notación puede resultar un poco confusa. Veamos algunos ejemplos.
Ejemplo 1: Muestre que 3N 3 + 5N 2 – 9 = O (N 3).
De nuestra experiencia anterior pareciera tener sentido que C = 5.
Encontremos k tal que:
3N 3 + 5N 2 – 9 ≤ 5N 3 for N > k :
1. Agrupamos: 5N2 = 2N 3 + 9
2. Cuál k asegura que 5N2 = N3 para N > k?
3. k = 5
4. Así que para N > 5, 5N2 = N3 = 2N3 + 9.
5. C = 5, k = 5 (no es único!)
Ejemplo 2: Muestre que N 4≠ O (3N3 + 5N2 – 9) .
Hay que mostrar que no existen C y k tales que para N > k, C* (3N3 + 5N2 –
9) ≥ N4 es siempre cierto (usamos límites, recordando el curso de Cálculo).
lim x4 / C(3x3 + 5 x2 – 9) = lim x / C(3 + 5/x – 9/x3)
x à ∞ x à ∞
= lim x / C(3 + 0 – 0) = (1/3C) . lim x = ∞
x à ∞ x à ∞
Página 41
Así que sin importar cual sea el C que se elija, N4 siempre alcanzará y
rebasará C* (3N3 + 5N2 – 9).
Podemos considerarnos afortunados porque sabemos calcular límites!
Límites serán útiles para probar relaciones (como veremos en el próximo
teorema).
Lema: Si el límite cuando x à ∞ del cociente |f (x)/g (x)| existe (es finito)
entonces f (x) = O ( g (x) ).
Ejemplo 3: 3N3 + 5N2 – 9 = O (N3 ). Calculamos:
lim x3 / (3x3 + 5 x2 – 9) = lim 1 /(3 + 5/x – 9/x3) = 1 /3
x à ∞ x à ∞
Listo!
4.5.2 La o Minúscula
La cota superior asintótica dada por la notación O puede o no ser ajustada
asintóticamente. La cota 2n² = O(n²) es ajustada asintóticamente, pero la
cota 2n = O(n²) no lo es. Utilizaremos la notación o para denotar una cota
superior que no es ajustada asintóticamente.
Definimos formalmente o(g(n)) ("o pequeña") como el conjunto:
o(g(n)) = {f(n): para cualquier constante positiva c > 0, existe una constante
n0 > 0 tal que: 0 ≤ f(n) ≤ cg(n) para toda n ≥ n0 }.
Por ejemplo, 2n = o(n²), pero 2n² no pertenece a o(n²).
Las notaciones de O y o son similares. La diferencia principal es, que en f(n)
= O(g(n)), la cota 0 ≤ f(n) ≤ cg(n) se cumple para alguna constante c > 0,
pero en f(n) = o(g(n)), la cota 0 ≤ f(n) ≤ cg(n) se cumple para todas las
constantes c> 0. Intuitivamente en la notación o, la función f(n) se vuelve
insignificante con respecto a g(n) a medida que n se acerca a infinito, es
decir:
lim (f(n)/g(n)) = 0.
x à ∞
Página 42
4.5.3 Diferencia entre O y o
Para o la desigualdad se mantiene para todas las constantes positivas,
mientras que para O la desigualdad se mantiene sólo para algunas
constantes positivas.
4.5.4 Las Notaciones Ω y Θ
Ω Es el reverso de O.
f (x ) = Ω(g (x )) àß g (x ) = O (f (x ))
Ω Grande dice que asintóticamente f (x ) domina a g (x ).
Θ Grande dice que ambas funciones se dominan mutuamente, en otras
palabras, son asintóticamente equivalentes.
f (x ) = Θ(g (x ))
àß
f (x ) = O (g (x ))∧ f (x ) =Ω(g (x ))
f = Θ(g): “f es de ordeng ”
4.5.5 Propiedades y Cotas más Usuales
Propiedades de las notaciones asintóticas
Relaciones de orden
La notación asintótica nos permite definir relaciones de orden entre el
conjunto de las funciones sobre los enteros positivos:
• f ∈ O (g (x )) ↔ f ≤ g (se dice que f es asintóticamente menor o igual que g)
• f ∈ o (g (x )) ↔ f < g
• f ∈ Θ (g (x )) ↔ f = g
• f ∈ Ω (g (x )) ↔ f ≥ g
• f ∈ ω (g (x )) ↔ f > g
Página 43
Relaciones entre cotas
1. f(n) ∈ O(f (n))
2. f(n) ∈ O(f (n)) ∧ g(n) ∈ O(f (n )) ⇒ f(n) ∈ O(h (n ))
3. f(n) ∈ O(g (n)) ⇒ g(n) ∈ Ω(h(n ))
4. lim f(n)/g(n) = 0 ⇒ O(f (n)) ⊂ O(g (n))
n à ∞
5. O(f (n)) = O(g (n)) ⇔ f(n) ∈ O(g (n)) ∧ g(n) ∈ O(f (n ))
6. O(f (n)) ⊂ O(g (n)) ⇔ f(n) ∈ O(g (n))∧ g(n) ∉ O(f (n ))
7. Ω(f(n )) ⊂ Ω(g (n)) ⇔ f(n) ∈ Ω(g (n))∧ g(n) ∉ Ω(f (n ))
Relaciones de inclusión
Son muy útiles a la hora de comparar funciones de coste en el caso
asintótico.
∀ x, y, a, ε ∈ R >0
1. loga n ∈ O(logbn)
2. O(loga x n) ⊂ O(logax+δ
n)
3. O(loga x n) ⊂ O(n)
4. O(nx) ⊂ O(nx+δ
)
5. O(nx logay n) ⊂ O(nx+δ
)
6. O(nx) ⊂ O(2n )
Página 44
Propiedades de clausura
El conjunto de funciones del orden de f(n) es cerrado respecto de la suma y
la multiplicación de funciones:
1. f1(n) ∈ O(g1(n)) ∧ f2(n) ∈ O(g2(n)) ⇒ f1(n) + f2(n) ∈ O(g1(n) + g2(n))
2. f1(n) ∈ O(g1(n)) ∧ f2(n) ∈ O(g2(n)) ⇒ f1(n) * f2(n) ∈ O(g1(n) * g2(n))
3. f1(n) ∈ O(g1(n)) ∧ f2(n) ∈ O(g2(n)) ⇒ f1(n)+f2(n) ∈ O(max(g1(n), g2(n))
como consecuencia es que los polinomios de grado k en n son exactamente
del orden de nk
aknk + … + a1n + a0 ∈ Θ(nk)
Cotas Asintóticas Más Usuales
1. c ∈ Θ(1) ∀ c ∈ R ≥ 0
n
2. ∑ i = (n/2)(n+1) ∈ Θ(n2 )
i=1
n
3. ∑ i2 = (n/3)(n+1) (n+1/2) ∈ Θ(n3)
i=1
n
4. ∑ ik ∈ Θ(nk+1) ∀ k ∈ N
i=1
n
5. ∑ log i ∈ Θ(n log n)
i=1
n
6. ∑ (n- i)k ∈ Θ(nk+1) ) ∀ k ∈ N
i=1
Página 45
4.6 Ecuaciones de Recurrencias
4.6.1 Introducción
Como ya hemos indicado, el análisis del tiempo de ejecución de un
programa recursivo vendrá en función del tiempo requerido por la(s)
llamada(s) recursiva(s) que aparezcan en él. De la misma manera que la
verificación de programas recursivos requiere de razonar por inducción,
para tratar apropiadamente estas llamadas, el cálculo de su eficiencia
requiere un concepto análogo: el de ecuación de recurrencia.
Demostraciones por inducción y ecuaciones de recurrencia son por tanto los
conceptos básicos para tratar programas recursivos.
Supongamos que se está analizando el coste de un algoritmo recursivo,
intentando calcular una función que indique el uso de recursos, por ejemplo
el tiempo, en términos del tamaño de los datos; denominémosla T(n) para
datos de tamaño n. Nos encontramos con que este coste se define a su vez en
función del coste de las llamadas recursivas, es decir, de T(m) para otros
tamaños m (usualmente menores que n). Esta manera de expresar el coste T
en función de sí misma es lo que denominaremos una ecuación recurrente y
su resolución, es decir, la obtención para T de una fórmula cerrada
(independiente de T) puede ser dificultosa.
4.6.2 Resolución de Recurrencias
Las ecuaciones de recurrencia son utilizadas para determinar cotas
asintóticas en algoritmos que presentan recursividad.
Veremos dos técnicas básicas y una auxiliar que se aplican a diferentes
clases de recurrencias:
• Método del teorema maestro
• Método de la ecuación característica
• Cambio de variable
No analizaremos su demostración formal, sólo consideraremos su
aplicación para las recurrencias generadas a partir del análisis de
algoritmos.
4.6.3 Método del Teorema Maestro
Se aplica en casos como:
5 si n=0
T(n) =
9T(n/3) + n si n ≠ 0
Página 46
Teorema: Sean a = 1, b > 1 constantes, f(n) una función y T(n) una
recurrencia definida sobre los enteros no negativos de la forma T(n) =
aT(n/b) + f(n), donde n/b puede interpretarse como n/b o n/b.
Entonces valen:
1. Si f(n) ∈ O(mlogba - ε
) para algún ε > 0 entonces T(n) ∈ Θ(nlogba).
2. Si f(n) ∈ Θ(nlogba) entonces T(n) ∈ Θ(nlogba lgn).
3. Si f(n) ∈ Ω(nlogba + ε
) para algún ε > 0, y satisface af(n/b) ≤ cf(n) para
alguna constante c < 1, entonces T(n) ∈ Θ(f(n)).
Ejemplos:
1. Si T(n)=9T(n/3)+n entonces a=9, b=3, se aplica el caso 1 con ε=1 y
T(n) ∈ Θ(n2 ).
2. Si T(n)=T(2n/3)+1 entonces a=1, b=3/2, se aplica el caso 2 y T(n) =
Θ(lgn).
3. Si T(n)=3T(n/4)+nlgn entonces a=3, b=4, f(n) ∈ Ω(nlog43 + 0,2 ) y
3(n/4) lg(n/4) ≤ 3/4n lgn, por lo que se aplica el caso 3 y T(n) ∈ Θ(n
lgn)
4.6.4 Método de la Ecuación Característica
Se aplica a ciertas recurrencias lineales con coeficientes constantes como:
5 si n=0
T(n) = 10 si n=1
5T(n-1) + 8T(n-2)+2n si n > 0
En general, para recurrencias de la forma:
T(n) = a1T(n-1) + a2T(n-2) + … + akT(n-k) + bnp(n)
donde ai, 1 ≤ i ≤ k, b son constantes y p(n) es un polinomio en n de grado s.
Ejemplos:
1. En T(n)=2t(n-1)+3n, a1 =2, b=3, p(n)=1, s=0.
2. En T(n)=t(n-1)+ t(n-2)+n, a1=1, a2 =1, b=1, p(n)=n, s=1.
En general, para:
T(n) = a1T(n-1) + a2T(n-2) + … + akT(n-k) + bnp(n)
Página 47
♦ Paso 1: Encontrar las raíces no nulas de la ecuación característica:
(xk - a1xk-1 - a2xk-2 - … - ak)(x-b)s+1 = 0
Raíces: ri, 1 ≤ i ≤ l ≤ k, cada una con multiplicidad mi.
♦ Paso 2: Las soluciones son de la forma de combinaciones lineales de
estas raíces de acuerdo a su multiplicidad.
T(n) = -----
♦ Paso 3: Se encuentran valores para las constantes cij, tal que:
1 ≤ i ≤ l, 0 ≤ j ≤ mi - 1
y di, 0 ≤ i ≤ s – 1 según la recurrencia original y las condiciones
iniciales (valores de la recurrencia para n=0,1, …).
Ejemplo: Resolver la ecuación de recurrencia siguiente:
0 si n=0
T(n) =
2T(n-1) + 1 si n > 0
donde b=1 y p(n)=1 de grado 0.
La ecuación característica (x-2)(x-1)0+1 = 0, con raíces 2 y 1 de
multiplicidad 1.
La solución general es entonces de la forma: T(n)=c112n +c211n.
A partir de las condiciones iniciales se encuentra el siguiente sistema de
ecuaciones que sirve para hallar c11 yc21:
c11 +c21 = 0 de n = 0
2c11 +c21 = 1 de n = 1
de donde c11 = 1 y c21 =-1.
La solución es entonces: T(n) = 2n –1.
Página 48
4.6.5 Cambio de Variable
Dada la siguiente ecuación de recurrencia:
a si n=1
T(n) =
2T(n/2) + nlog2 n si n = 2k
No se puede aplicar el teorema maestro ni la ecuación característica.
Se define una nueva recurrencia S(i) = T(2i), con el objetivo de llevarla a una
forma en la que se pueda resolver siguiendo algún método anterior.
Entonces el caso general queda:
S(i) = T(2i) = 2T(2i /2) + 2ii = 2T(2i-1 ) + i2i = 2S(i-1) + i2i
Con b=2 y p(i) = i de grado 1.
La ecuación característica de esta recurrencia es:
(x - 2)(x - 2)i+1 = 0,
con raíz 2 de grado 3.
La solución es entonces S(i) = c112i + c12 i2i + c13i22i, con lo que volviendo a la
variable original queda:
T(n) - 2T(n/2) = nlog2 n = (c12 - c13)n + 2c13n(log2n).
Se pueden obtener los valores de las constantes sustituyendo esta solución
en la recurrencia original:
T(n) = c11n + c12(log2n)n + c13(log2n)2n.
de donde c12 =c13 y 2c12 = 1.
Por tanto T(n) ∈ Θ(nlog2 n | n es potencia de2).
Si se puede probar que T(n) es eventualmente no decreciente, por la regla
de las funciones de crecimiento suave se puede extender el resultado
a todos los n (dado que nlog2n es de crecimiento suave).
En este caso T(n) ∈ Θ(nlog2n).
Página 49
4.7 Ejemplos y Ejercicios
Ejemplos de cálculo del tiempo de ejecución de un programa
Veamos el análisis de un simple enunciado de asignación a una variable
entera:
a = b;
Como el enunciado de asignación toma tiempo constante, está en Θ(1).
Consideremos un simple ciclo “for”:
sum=0;
for (i=1; i<=n; i++)
sum += n;
La primera línea es Θ(1). El ciclo “for” es repetido n veces. La tercera línea
toma un tiempo constante también, el costo total por ejecutar las dos líneas
que forman el ciclo “for” es Θ(n). El costo por el entero fragmento de código
es también Θ(n).
Analicemos un fragmento de código con varios ciclos “for”, algunos de los
cuales están anidados.
sum=0;
for (j=1; j<=n; j++)
for (i=1; i<=j; i++)
sum++;
for (k=1; k<=n; k++)
A[k]= k-1;
Este código tiene tres partes: una asignación, y dos ciclos.
La asignación toma tiempo constante, llamémosla c1. El segundo ciclo es
similar al ejemplo anterior y toma c2n= Θ(n).
Analicemos ahora el primer ciclo, que es un doble ciclo anidado. En este
caso trabajemos de adentro hacia fuera. La expresión sum++ requiere
tiempo constante, llamemosle c3.
Como el ciclo interno es ejecutado j veces, tiene un costo de c3j. El ciclo
exterior es ejecutado n veces, pero cada vez el costo del ciclo interior es
diferente.
El costo total del ciclo es c3 veces la suma de los números 1 a n, es decir Σni=1 j
= n(n+1)/2, que es Θ(n2). Por tanto, Θ(c1 +c2n+c3n2) es simplemente Θ(n2 ).
Página 50
Comparemos el análisis asintótico de los siguientes fragmentos de código:
sum1=0;
for(i=1; i<=n; i++)
for(j=1; j<=n; j++)
sum1++;
sum2=0;
for(i=1; i<=n; i++)
for(j=1; j<=i; j++)
sum2++;
El primer fragmento de ejecuta el enunciado sum1++, precisamente n2
veces.
Por otra parte, el segundo fragmento de código tiene un costo aproximado
de ½ n2 . Así ambos códigos tienen un costo de Θ(n2).
Ejemplo, no todos los ciclos anidados son Θ(n2):
sum1=0;
for(k=1; k<=n; k*=2)
for(j=1; j<=n; j++)
sum1++;
El costo es Θ(n log n).
Página 51
Capítulo 5
Estrategias de Diseño de
Algoritmos
5.1 Introducción
A través de los años, los científicos de la computación han identificado
diversas técnicas generales que a menudo producen algoritmos eficientes
para la resolución de muchas clases de problemas. Este capítulo presenta
algunas de las técnicas más importantes como son: recursión, dividir para
conquistar, técnicas ávidas, el método de retroceso y programación
dinámica.
Se debe, sin embargo, destacar que hay algunos problemas, como los NP
completos, para los cuales ni éstas ni otras técnicas conocidas producirán
soluciones eficientes. Cuando se encuentra algún problema de este tipo,
suele ser útil determinar si las entradas al problema tienen características
especiales que se puedan explotar en la búsqueda de una solución, o si puede
usarse alguna solución aproximada sencilla, en vez de la solución exacta,
difícil de calcular.
5.2 Recursión
La recursividad es una técnica fundamental en el diseño de algoritmos
eficientes, que está basada en la solución de versiones más pequeñas del
problema, para obtener la solución general del mismo. Una instancia del
problema se soluciona según la solución de una o más instancias diferentes
y más pequeñas que ella.
Es una herramienta poderosa que sirve para resolver cierto tipo de
problemas reduciendo la complejidad y ocultando los detalles del problema.
Esta herramienta consiste en que una función o procedimiento se llama a sí
mismo.
Una gran cantidad de algoritmos pueden ser descritos con mayor claridad en
términos de recursividad, típicamente el resultado será que sus programas
serán más pequeños.
La recursividad es una alternativa a la iteración o repetición, y aunque en
tiempo de computadora y en ocupación en memoria es la solución recursiva
menos eficiente que la solución iterativa, existen numerosas situaciones en
las que la recursividad es una solución simple y natural a un problema que
en caso contrario ser difícil de resolver. Por esta razón se puede decir que la
Página 52
recursividad es una herramienta potente y útil en la resolución de problemas
que tengan naturaleza recursiva y, por ende, en la programación.
Existen numerosas definiciones de recursividad, algunas de las más
importantes o sencillas son éstas:
• Un objeto es recursivo si figura en su propia definición.
• Una definición recursiva es aquella en la que el objeto que se define
forma parte de la definición (recuerde la regla gramatical: lo definido
nunca debe formar parte de la definición)
La característica importante de la recursividad es que siempre existe un
medio de salir de la definición, mediante la cual se termina el proceso
recursivo.
Ventajas:
• Puede resolver problemas complejos.
• Solución más natural.
Desventajas:
• Se puede llegar a un ciclo infinito.
• Versión no recursiva más difícil de desarrollar.
• Para la gente sin experiencia es difícil de programar.
Tipos de Recursividad
• Directa o simple: un subprograma se llama a si mismo una o más
veces directamente.
Página 53
• Indirecta o mutua: un subprograma A llama a otro subprograma B
y éste a su vez llama al subprograma A.
a) Propiedades para un Procedimiento Recursivo
• Debe de existir cierto criterio (criterio base) en donde el
procedimiento no se llama a sí mismo. Debe existir al menos una
solución no recursiva.
• En cada llamada se debe de acercar al criterio base (reducir rango). El
problema debe reducirse en tamaño, expresando el nuevo problema
en términos del propio problema, pero más pequeño.
Los algoritmos de divide y vencerás pueden ser procedimientos
recursivos.
b) Propiedades para una Función Recursiva
• Debe de haber ciertos argumentos, llamados valores base para los que
la función no se refiera a sí misma.
• Cada vez que la función se refiera así misma el argumento de la
función debe de acercarse más al valor base.
Ejemplos:
Factorial
n! = 1 * 2 * 3 ... * (n-2) * (n-1) * n
0! = 1
1! = 1
2! = 1 * 2
3! = 1 * 2 * 3
...
n! = 1 * 2 * 3 ... * (n-2) * (n-1) * n
⇒ n! = n* (n-1)!
Página 54
si n = 0 entonces n! = 1
si n > 0 entonces n! = n * (n-1)!
Function factorial(n:integer):longint:
begin
if ( n = 0 ) then
factorial:=1
else
factorial:= n * factorial(n-1);
end;
Rastreo de ejecución:
Si n = 6
Nivel
1) Factorial(6)= 6 * factorial(5) = 720
2) Factorial(5)=5 * factorial(4) = 120
3) Factorial(4)=4 * factorial(3) = 24
4) Factorial(3)=3 * factorial(2) = 6
5) Factorial(2)=2 * factorial(1) = 2
6) Factorial(1)=1 * factorial(0) = 1
7) Factorial(0)=1
La profundidad de un procedimiento recursivo es el número de veces que se
llama a sí mismo.
Serie de Fibonacci
0, 1, 1, 2, 3, 5, 8, ...
F0 = 0
F1 = 1
F2 = F1 + F0 = 1
F3 = F2 + F1 = 2
F4 = F3 + F2 = 3
...
Fn = Fn-1 + Fn-2
si n= 0, 1 Fn = n
si n >1 Fn = Fn-1 + Fn-2
Página 55
Procedure fibo(var fib:longint; n:integer);
var
fibA, fibB : integer;
begin
if ( n = 0) or ( n = 1) then fib:=n
else begin
fibo(fibA,n-1);
fibo(fibB,n-2);
fib:=fibA + FibB;
end;
end;
function fibo ( n:integer) : integer;
begin
if ( n = 0) or ( n = 1) then
fibo:=n
else
fibo:=fibo(n-1) + fibo(n-2);
end;
end;
No todos los ambientes de programación proveen las facilidades necesarias
para la recursión y adicionalmente, a veces su uso es una fuente de
ineficiencia inaceptable. Por lo cual se prefiere eliminar la recursión. Para
ello, se sustituye la llamada recursiva por un lazo, donde se incluyen algunas
asignaciones para recolocar los parámetros dirigidos a la función.
Remover la recursión es complicado cuando existe más de una llamada
recursiva, pero una vez hecha ésta, la versión del algoritmo es siempre más
eficiente.
5.3 Dividir para Conquistar
Muchos algoritmos útiles tienen una estructura recursiva, de modo que para
resolver un problema se llaman recursivamente a sí mismos una o más veces
para solucionar subproblemas muy similares.
Esta estructura obedece a una estrategia dividir-y-conquistar, en que se
ejecuta tres pasos en cada nivel de la recursión:
• Dividir. Dividen el problema en varios subproblemas similares al
problema original pero de menor tamaño;
• Conquistar. Resuelven recursivamente los subproblemas si los
tamaños de los subproblemas son suficientemente pequeños, entonces
resuelven los subproblemas de manera directa; y luego,
Página 56
• Combinar. Combinan estas soluciones para crear una solución al
problema original.
La técnica Dividir para Conquistar (o Divide y Vencerás) consiste en
descomponer el caso que hay que resolver en subcasos más pequeños,
resolver independientemente los subcasos y por último combinar las
soluciones de los subcasos para obtener la solución del caso original.
Caso General
Consideremos un problema arbitrario, y sea A un algoritmo sencillo capaz de
resolver el problema. A debe ser eficiente para casos pequeños y lo
denominamos subalgoritmo básico.
El caso general de los algoritmos de Divide y Vencerás (DV) es como sigue:
función DV(x)
{
si x es suficientemente pequeño o sencillo entonces
devolver A(x)
descomponer x en casos más pequeños x1, x2, x3 , ... , xl
para i ← 1 hasta l hacer
yi ← DV(xi)
recombinar los yi para obtener una solución y de x
devolver y
}
El número de subejemplares l suele ser pequeño e independiente del caso
particular que haya que resolverse.
Para aplicar la estrategia Divide y Vencerás es necesario que se cumplan tres
condiciones:
• La decisión de utilizar el subalgoritmo básico en lugar de hacer
llamadas recursivas debe tomarse cuidadosamente.
• Tiene que ser posible descomponer el caso en subcasos y recomponer
las soluciones parciales de forma eficiente.
• Los subcasos deben ser en lo posible aproximadamente del mismo
tamaño.
En la mayoría de los algoritmos de Divide y Vencerás el tamaño de los l
subcasos es aproximadamente m/b, para alguna constante b, en donde m es
el tamaño del caso (o subcaso) original (cada subproblema es
aproximadamente del tamaño 1/b del problema original).
Página 57
El análisis de tiempos de ejecución para estos algoritmos es el siguiente:
Sea g(n) el tiempo requerido por DV en casos de tamaño n, sin contar el
tiempo necesario para llamadas recursivas. El tiempo total t(n) requerido
por este algoritmo de Divide y Vencerás es parecido a:
t(n) = l t(n/ b) + g(n) para l = 1 y b = 2
siempre que n sea suficientemente grande. Si existe un entero k = 0 tal que:
g(n) ∈ Θ (nk),
se puede concluir que:
T(nk) si l < bk
t(n) ∈ T(nk log n) si l = bk
T (nlogbl) si l > bk
Se deja propuesta la demostración de esta ecuación de recurrencia usando
análisis asintótico.
5.4 Programación Dinámica
Frecuentemente para resolver un problema complejo se tiende a dividir este
en subproblemas más pequeños, resolver estos últimos (recurriendo
posiblemente a nuevas subdivisiones) y combinar las soluciones obtenidas
para calcular la solución del problema inicial.
Puede ocurrir que la división natural del problema conduzca a un gran
número de subejemplares idénticos. Si se resuelve cada uno de ellos sin
tener en cuenta las posibles repeticiones, resulta un algoritmo ineficiente;
en cambio si se resuelve cada ejemplar distinto una sola vez y se conserva el
resultado, el algoritmo obtenido es mucho mejor.
Esta es la idea de la programación dinámica: no calcular dos veces lo mismo
y utilizar normalmente una tabla de resultados que se va rellenando a
medida que se resuelven los subejemplares.
La programación dinámica es un método ascendente. Se resuelven primero
los subejemplares más pequeños y por tanto más simples. Combinando las
soluciones se obtienen las soluciones de ejemplares sucesivamente más
grandes hasta llegar al ejemplar original.
Página 58
Ejemplo:
Consideremos el cálculo de números combinatorios. El algoritmo sería:
función C(n, k)
si k=0 o k=n entonces devolver 1
si no devolver C(n-1, k-1) + C(n-1, k)
Ocurre que muchos valores C(i, j), con i < n y j < k se calculan y recalculan
varias veces.
Un fenómeno similar ocurre con el algoritmo de Fibonacci.
La programación dinámica se emplea a menudo para resolver problemas de
optimización que satisfacen el principio de optimalidad: en una secuencia
óptima de decisiones toda subsecuencia ha de ser también óptima.
Ejemplo:
Si el camino más corto de Santiago a Copiapó pasa por La Serena, la parte
del camino de Santiago a La Serena ha de ser necesariamente el camino
mínimo entre estas dos ciudades.
Podemos aplicar esta técnica en:
• Camino mínimo en un grafo orientado
• Árboles de búsqueda óptimos
5.5 Algoritmos Ávidos
Los algoritmos ávidos o voraces (Greedy Algorithms) son algoritmos que
toman decisiones de corto alcance, basadas en información inmediatamente
disponible, sin importar consecuencias futuras.
Suelen ser bastante simples y se emplean sobre todo para resolver problemas
de optimización, como por ejemplo, encontrar la secuencia óptima para
procesar un conjunto de tareas por un computador, hallar el camino mínimo
de un grafo, etc.
Habitualmente, los elementos que intervienen son:
• un conjunto o lista de candidatos (tareas a procesar, vértices del
grafo, etc.);
• un conjunto de decisiones ya tomadas (candidatos ya escogidos);
• una función que determina si un conjunto de candidatos es una
solución al problema (aunque no tiene por qué ser la óptima);
Página 59
• una función que determina si un conjunto es completable, es
decir, si añadiendo a este conjunto nuevos candidatos es posible
alcanzar una solución al problema, suponiendo que esta exista;
• una función de selección que escoge el candidato aún no
seleccionado que es más prometedor;
• una función objetivo que da el valor/coste de una solución (tiempo
total del proceso, la longitud del camino, etc.) y que es la que se
pretende maximizar o minimizar;
Para resolver el problema de optimización hay que encontrar un conjunto de
candidatos que optimiza la función objetivo. Los algoritmos voraces
proceden por pasos.
Inicialmente el conjunto de candidatos es vacío. A continuación, en cada
paso, se intenta añadir al conjunto el mejor candidato de los aún no
escogidos, utilizando la función de selección. Si el conjunto resultante no es
completable, se rechaza el candidato y no se le vuelve a considerar en el
futuro. En caso contrario, se incorpora al conjunto de candidatos escogidos y
permanece siempre en él. Tras cada incorporación se comprueba si el
conjunto resultante es una solución del problema. Un algoritmo voraz es
correcto si la solución así encontrada es siempre óptima.
El esquema genérico del algoritmo voraz es:
funcionvoraz(C:conjunto):conjunto
{ C es el conjunto de todos los candidatos }
S <= vacío { S es el conjunto en el que se construye la solución
mientras ¬solución(S) y C <> vacío hacer
x ← el elemento de C que maximiza seleccionar(x)
C ← C  {x}
si completable(S U {x}) entonces S ← S U {x}
si solución(S)
entonces devolver S
si no devolver no hay solución
El nombre voraz proviene de que, en cada paso, el algoritmo escoge el mejor
"pedazo" que es capaz de "comer" sin preocuparse del futuro. Nunca deshace
una decisión ya tomada: una vez incorporado un candidato a la solución
permanece ahí hasta el final; y cada vez que un candidato es rechazado, lo es
para siempre.
Página 60
Ejemplo: Mínimo número de monedas
Se desea pagar una cantidad de dinero a un cliente empleando el menor
número posible de monedas. Los elementos del esquema anterior se
convierten en:
• candidato: conjunto finito de monedas de, por ejemplo, 1, 5, 10 y 25
unidades, con una moneda de cada tipo por lo menos;
• solución: conjunto de monedas cuya suma es la cantidad a pagar;
• completable: la suma de las monedas escogidas en un momento dado
no supera la cantidad a pagar;
• función de selección: la moneda de mayor valor en el conjunto de
candidatos aún no considerados;
• función objetivo: número de monedas utilizadas en la solución.
5.6 Método de Retroceso (backtracking)
El Backtracking o vuelta atrás es una técnica de resolución general de
problemas mediante una búsqueda sistemática de soluciones. El
procedimiento general se basa en la descomposición del proceso de
búsqueda en tareas parciales de tanteo de soluciones (trial and error).
Las tareas parciales se plantean de forma recursiva al construir
gradualmente las soluciones. Para resolver cada tarea, se descompone en
varias subtareas y se comprueba si alguna de ellas conduce a la solución del
problema. Las subtareas se prueban una a una, y si una subtarea no conduce
a la solución se prueba con la siguiente.
La descripción natural del proceso se representa por un árbol de búsqueda
en el que se muestra como cada tarea se ramifica en subtareas. El árbol de
búsqueda suele crecer rápidamente por lo que se buscan herramientas
eficientes para descartar algunas ramas de búsqueda produciéndose la poda
del árbol.
Diversas estrategias heurísticas, frecuentemente dependientes del
problema, establecen las reglas para decidir en que orden se tratan las tareas
mediante las que se realiza la ramificación del árbol de búsqueda, y qué
funciones se utilizan para provocar la poda del árbol.
El método de backtracking se ajusta a muchos famosos problemas de la
inteligencia artificial que admiten extensiones muy sencillas. Algunos de
estos problemas son el de las Torres de Hanoi, el del salto del caballo o el de
la colocación de las ocho reinas en el tablero de ajedrez, el problema del
laberinto.
Página 61
Un caso especialmente importante en optimización combinatoria es el
problema de la selección óptima. Se trata del problema de seleccionar una
solución por sus componentes, de forma que respetando una serie de
restricciones, de lugar a la solución que optimiza una función objetivo que se
evalúa al construirla. El árbol de búsqueda permite recorrer todas las
soluciones para quedarse con la mejor de entre las que sean factibles. Las
estrategias heurísticas orientan la exploración por las ramas más
prometedoras y la poda en aquellas que no permiten alcanzar una solución
factible o mejorar la mejor solución factible alcanzada hasta el momento.
El problema típico es el conocido como problema de la mochila. Se
dispone de una mochila en la que se soporta un peso máximo P en la que se
desean introducir objetos que le den el máximo valor. Se dispone de una
colección de n objetos de los que se conoce su peso y su valor;
(pi,vi); i = 1, 2, ..., n.
5.7 Método de Branch and Bound
Branch and bound (o también conocido como Ramifica y Poda) es una
técnica muy similar a la de Backtracking, pues basa su diseño en el análisis
del árbol de búsqueda de soluciones a un problema. Sin embargo, no utiliza
la búsqueda en profundidad (depth first), y solamente se aplica en
problemas de Optimización.
Los algoritmos generados por está técnica son normalmente de orden
exponencial o peor en su peor caso, pero su aplicación ante instancias muy
grandes, ha demostrado ser eficiente (incluso más que bactracking).
Se debe decidir de qué manera se conforma el árbol de búsqueda de
soluciones. Sobre el árbol, se aplicará una búsqueda en anchura (breadth-
first), pero considerando prioridades en los nodos que se visitan (best-
first). El criterio de selección de nodos, se basa en un valor óptimo posible
(bound), con el que se toman decisiones para hacer las podas en el árbol.
Modo de proceder de los algoritmos Branch and Bound:
• Nodo vivo: nodo con posibilidad de ser ramificado, es decir, no se
ha realizado una poda.
• No se pueden comenzar las podas hasta que no se haya
descendido a una hoja del árbol
• Se aplicará la poda a los nodos con una cota peor al valor de una
solución dada à a los nodos podados a los que se les ha aplicado
una poda se les conoce como nodos muertos
• Se ramificará hasta que no queden nodos vivos por expandir
• Los nodos vivos han de estar almacenados en algún sitio à lista
de nodos, de modo que sepamos qué nodo expandir
Página 62
Algoritmo General:
Funciónramipoda(P:problema): solucion
L={P} (lista de nodos vivos)
S= ∞± (según se aplique máximo o mínimo)
Mientras L ≠ 0
n=nodo de mejor cota en L
si solucion(n)
si (valor(n) mejor que s)
s=valor(n)
para todo m ∈ L y Cota(m) peor que S
borrar nodo m de L
sino
añadir a L los hijos de n con sus cotas
borrar n de L (tanto si es solución como si ha ramificado)
Fin_mientras
Devolver S
Página 63
Capítulo 6
Algoritmos de Ordenamiento
6.1 Concepto de Ordenamiento
DEFINICIÓN.
Entrada: Una secuencia de n números <a1, a2 , …, an>, usualmente en la
forma de un arreglo de n elementos.
Salida: Una permutación <a’1, a’2, …, a’n> de la secuencia de entrada tal
que a’1 = a’2 = … = a’n.
CONSIDERACIONES. Cada número es normalmente una clave que forma
parte de un registro; cada registro contiene además datos satélites que se
mueven junto con la clave; si cada registro incluye muchos datos satélites,
entonces movemos punteros a los registros (y no los registros).
Un método de ordenación se denomina estable si el orden relativo de los
elementos no se altera por el proceso de ordenamiento. (Importante cuanto
se ordena por varias claves).
Hay dos categorías importantes y disjuntas de algoritmos de ordenación:
• Ordenación interna: La cantidad de registros es suficientemente
pequeña y el proceso puede llevarse a cabo en memoria.
• Ordenación externa: Hay demasiados registros para permitir
ordenación interna; deben almacenarse en disco.
Por ahora nos ocuparemos sólo de ordenación interna.
Los algoritmos de ordenación interna se clasifican de acuerdo con la
cantidad de trabajo necesaria para ordenar una secuencia de n elementos:
¿Cuántas comparaciones de elementos y cuántos movimientos de
elementos de un lugar a otro son necesarios?
Empezaremos por los métodos tradicionales (inserción y selección). Son
fáciles de entender, pero ineficientes, especialmente para juegos de datos
grandes. Luego prestaremos más atención a los más eficientes: heapsort y
quicksort.
Página 64
6.2 Ordenamiento por Inserción
Este es uno de los métodos más sencillos. Consta de tomar uno por uno los
elementos de un arreglo y recorrerlo hacia su posición con respecto a los
anteriormente ordenados. Así empieza con el segundo elemento y lo ordena
con respecto al primero. Luego sigue con el tercero y lo coloca en su posición
ordenada con respecto a los dos anteriores, así sucesivamente hasta recorrer
todas las posiciones del arreglo.
Este es el algoritmo:
Sea n el número de elementos en el arreglo A.
INSERTION-SORT(A) :
{Para cada valor de j, inserta A[j] en la posición que le corresponde en la
secuencia ordenada A[1 .. j – 1]}
for j ← 2 to n do
k ← A[j]
i ← j – 1
whilei > 0 ∧ A[i] > k do
A[i + 1] ← A[i]
i ← i – 1
A[i + 1] ← k
Análisis del algoritmo:
Número de comparaciones: n(n-1)/2 lo que implica un T(n) = O(n2 ). La
ordenación por inserción utiliza aproximadamente n2/4 comparaciones y
n2/8 intercambios en el caso medio y dos veces más en el peor de los casos.
La ordenación por inserción es lineal para los archivos casi ordenados.
6.3 Ordenamiento por Selección
El método de ordenamiento por selección consiste en encontrar el menor de
todos los elementos del arreglo e intercambiarlo con el que está en la primera
posición. Luego el segundo más pequeño, y así sucesivamente hasta ordenar
todo el arreglo.
SELECTION-SORT(A) :
{Para cada valor de j, selecciona el menor elemento de la secuencia no
ordenada A[j .. n] y lo intercambia con A[j]}
for j ← 1 to n – 1 do
k ← j
for i ← j + 1 to n do
if A[i] < A[k] then k ← i
intercambie A[j] ↔ A[k]
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos

Mais conteúdo relacionado

Mais procurados

Cable directo,cruzado y rollover
Cable directo,cruzado y rolloverCable directo,cruzado y rollover
Cable directo,cruzado y rolloverIan Berzeker Tovar
 
Alfabetos-Lenguajes y Automatas 1
Alfabetos-Lenguajes y Automatas 1Alfabetos-Lenguajes y Automatas 1
Alfabetos-Lenguajes y Automatas 1Osiris Mirerus
 
Capitulo 3 arquitecturas_de_desarrollo_web
Capitulo 3 arquitecturas_de_desarrollo_webCapitulo 3 arquitecturas_de_desarrollo_web
Capitulo 3 arquitecturas_de_desarrollo_webgabiar1708
 
Los lenguajes aceptados para una maquina de turing
Los lenguajes aceptados para una maquina de turingLos lenguajes aceptados para una maquina de turing
Los lenguajes aceptados para una maquina de turingJonathan Bastidas
 
Metodología orientadas a objetos
Metodología orientadas a objetosMetodología orientadas a objetos
Metodología orientadas a objetosyolandacando1
 
Modelo jerarquico y modelo de red de base de datos
Modelo jerarquico y modelo de red de base de datosModelo jerarquico y modelo de red de base de datos
Modelo jerarquico y modelo de red de base de datosFernando Baculima
 
Diseño Conceptual de Base de Datos - Guia de Aprendizaje
Diseño Conceptual de Base de Datos - Guia de AprendizajeDiseño Conceptual de Base de Datos - Guia de Aprendizaje
Diseño Conceptual de Base de Datos - Guia de AprendizajeRobert Rodriguez
 
Algoritmos de busqueda - hash truncamiento
Algoritmos de busqueda - hash truncamientoAlgoritmos de busqueda - hash truncamiento
Algoritmos de busqueda - hash truncamientoLutzo Guzmán
 
Programación estructurada (2).pptx
Programación estructurada (2).pptxProgramación estructurada (2).pptx
Programación estructurada (2).pptxEduardoSaynes
 
Estructura de datos presentacion y sesion 1
Estructura de datos presentacion y sesion 1Estructura de datos presentacion y sesion 1
Estructura de datos presentacion y sesion 1Jesús Gómez Ávila
 
Cuadro sinóptico estructuras de datos y su clasificación
Cuadro sinóptico   estructuras de datos y su clasificaciónCuadro sinóptico   estructuras de datos y su clasificación
Cuadro sinóptico estructuras de datos y su clasificaciónAlex Uhu Colli
 
Componentes y evolucion del modelado de negocios(investigacion)
Componentes y evolucion del modelado de negocios(investigacion)Componentes y evolucion del modelado de negocios(investigacion)
Componentes y evolucion del modelado de negocios(investigacion)Anel Sosa
 
Estructura de Datos : Ordenamiento Externo
Estructura de Datos : Ordenamiento Externo Estructura de Datos : Ordenamiento Externo
Estructura de Datos : Ordenamiento Externo Carlos Criollo
 

Mais procurados (20)

Cable directo,cruzado y rollover
Cable directo,cruzado y rolloverCable directo,cruzado y rollover
Cable directo,cruzado y rollover
 
Alfabetos-Lenguajes y Automatas 1
Alfabetos-Lenguajes y Automatas 1Alfabetos-Lenguajes y Automatas 1
Alfabetos-Lenguajes y Automatas 1
 
Capitulo 3 arquitecturas_de_desarrollo_web
Capitulo 3 arquitecturas_de_desarrollo_webCapitulo 3 arquitecturas_de_desarrollo_web
Capitulo 3 arquitecturas_de_desarrollo_web
 
Cuadro sinoptico
Cuadro sinopticoCuadro sinoptico
Cuadro sinoptico
 
Los lenguajes aceptados para una maquina de turing
Los lenguajes aceptados para una maquina de turingLos lenguajes aceptados para una maquina de turing
Los lenguajes aceptados para una maquina de turing
 
Metodología orientadas a objetos
Metodología orientadas a objetosMetodología orientadas a objetos
Metodología orientadas a objetos
 
Modelo jerarquico y modelo de red de base de datos
Modelo jerarquico y modelo de red de base de datosModelo jerarquico y modelo de red de base de datos
Modelo jerarquico y modelo de red de base de datos
 
Diseño Conceptual de Base de Datos - Guia de Aprendizaje
Diseño Conceptual de Base de Datos - Guia de AprendizajeDiseño Conceptual de Base de Datos - Guia de Aprendizaje
Diseño Conceptual de Base de Datos - Guia de Aprendizaje
 
Algoritmos de busqueda - hash truncamiento
Algoritmos de busqueda - hash truncamientoAlgoritmos de busqueda - hash truncamiento
Algoritmos de busqueda - hash truncamiento
 
Programación estructurada (2).pptx
Programación estructurada (2).pptxProgramación estructurada (2).pptx
Programación estructurada (2).pptx
 
Modelos de red
Modelos de redModelos de red
Modelos de red
 
Aplicaciones de los árboles y grafos
Aplicaciones de los árboles y grafosAplicaciones de los árboles y grafos
Aplicaciones de los árboles y grafos
 
Estructura de datos presentacion y sesion 1
Estructura de datos presentacion y sesion 1Estructura de datos presentacion y sesion 1
Estructura de datos presentacion y sesion 1
 
Ordenamiento por insercion
Ordenamiento por insercionOrdenamiento por insercion
Ordenamiento por insercion
 
Pilas estáticas. IESIT
Pilas estáticas. IESITPilas estáticas. IESIT
Pilas estáticas. IESIT
 
Cuadro sinóptico estructuras de datos y su clasificación
Cuadro sinóptico   estructuras de datos y su clasificaciónCuadro sinóptico   estructuras de datos y su clasificación
Cuadro sinóptico estructuras de datos y su clasificación
 
Componentes y evolucion del modelado de negocios(investigacion)
Componentes y evolucion del modelado de negocios(investigacion)Componentes y evolucion del modelado de negocios(investigacion)
Componentes y evolucion del modelado de negocios(investigacion)
 
Estructura de Datos : Ordenamiento Externo
Estructura de Datos : Ordenamiento Externo Estructura de Datos : Ordenamiento Externo
Estructura de Datos : Ordenamiento Externo
 
Arboles multicamino
Arboles  multicaminoArboles  multicamino
Arboles multicamino
 
Ordenamiento parte 2
Ordenamiento parte 2Ordenamiento parte 2
Ordenamiento parte 2
 

Destaque

ejercicios resueltos análisis de algoritmos
ejercicios resueltos   análisis de algoritmosejercicios resueltos   análisis de algoritmos
ejercicios resueltos análisis de algoritmosJojo Jona
 
21 problemas de algoritmo resueltos
21 problemas de algoritmo resueltos21 problemas de algoritmo resueltos
21 problemas de algoritmo resueltosRoldan El Gato
 
ANALISIS DE ALGORITMOS
ANALISIS DE ALGORITMOSANALISIS DE ALGORITMOS
ANALISIS DE ALGORITMOSEvans Balcazar
 
R E L A C I O N E S D E R E C U R R E N C I A
R E L A C I O N E S  D E  R E C U R R E N C I AR E L A C I O N E S  D E  R E C U R R E N C I A
R E L A C I O N E S D E R E C U R R E N C I Ajhonricardo
 
Complejidad de los algoritmos | Análisis de algoritmos
Complejidad de los algoritmos | Análisis de algoritmosComplejidad de los algoritmos | Análisis de algoritmos
Complejidad de los algoritmos | Análisis de algoritmosSergio Ormeño
 
Series aritmeticas
Series aritmeticasSeries aritmeticas
Series aritmeticasAna Urbina
 
Trabajo Fibonacci (Sergio IlláN Bedmar B1 Ic)
Trabajo Fibonacci (Sergio IlláN Bedmar B1 Ic)Trabajo Fibonacci (Sergio IlláN Bedmar B1 Ic)
Trabajo Fibonacci (Sergio IlláN Bedmar B1 Ic)guest584b0
 
Metodo de Integracion por Recurrencia Y Ecuacion de Bernoulli
Metodo de Integracion por Recurrencia Y Ecuacion de BernoulliMetodo de Integracion por Recurrencia Y Ecuacion de Bernoulli
Metodo de Integracion por Recurrencia Y Ecuacion de BernoulliFrancisco Xavier
 
Sucesiones recurrencia induccion
Sucesiones recurrencia induccionSucesiones recurrencia induccion
Sucesiones recurrencia induccionPavel Aliaga
 
D eber 05 octubre 2010
D eber 05   octubre 2010D eber 05   octubre 2010
D eber 05 octubre 2010Cristopher
 
Recursos i Bibliografia - Presentacions Multimèdia Eficients
Recursos i Bibliografia - Presentacions Multimèdia EficientsRecursos i Bibliografia - Presentacions Multimèdia Eficients
Recursos i Bibliografia - Presentacions Multimèdia EficientsJuanfra Álvarez Herrero
 

Destaque (20)

ejercicios resueltos análisis de algoritmos
ejercicios resueltos   análisis de algoritmosejercicios resueltos   análisis de algoritmos
ejercicios resueltos análisis de algoritmos
 
21 problemas de algoritmo resueltos
21 problemas de algoritmo resueltos21 problemas de algoritmo resueltos
21 problemas de algoritmo resueltos
 
ANALISIS DE ALGORITMOS
ANALISIS DE ALGORITMOSANALISIS DE ALGORITMOS
ANALISIS DE ALGORITMOS
 
O(nlogn) Analisis
O(nlogn) AnalisisO(nlogn) Analisis
O(nlogn) Analisis
 
Recurrencias
RecurrenciasRecurrencias
Recurrencias
 
R E L A C I O N E S D E R E C U R R E N C I A
R E L A C I O N E S  D E  R E C U R R E N C I AR E L A C I O N E S  D E  R E C U R R E N C I A
R E L A C I O N E S D E R E C U R R E N C I A
 
AnáLisis De Algoritmos1
AnáLisis De Algoritmos1AnáLisis De Algoritmos1
AnáLisis De Algoritmos1
 
Complejidad de los algoritmos | Análisis de algoritmos
Complejidad de los algoritmos | Análisis de algoritmosComplejidad de los algoritmos | Análisis de algoritmos
Complejidad de los algoritmos | Análisis de algoritmos
 
Complejidad de Algoritmos
Complejidad de AlgoritmosComplejidad de Algoritmos
Complejidad de Algoritmos
 
Series aritmeticas
Series aritmeticasSeries aritmeticas
Series aritmeticas
 
La SucesióN De Fibonacci
La SucesióN De FibonacciLa SucesióN De Fibonacci
La SucesióN De Fibonacci
 
Trabajo Fibonacci (Sergio IlláN Bedmar B1 Ic)
Trabajo Fibonacci (Sergio IlláN Bedmar B1 Ic)Trabajo Fibonacci (Sergio IlláN Bedmar B1 Ic)
Trabajo Fibonacci (Sergio IlláN Bedmar B1 Ic)
 
Metodo de Integracion por Recurrencia Y Ecuacion de Bernoulli
Metodo de Integracion por Recurrencia Y Ecuacion de BernoulliMetodo de Integracion por Recurrencia Y Ecuacion de Bernoulli
Metodo de Integracion por Recurrencia Y Ecuacion de Bernoulli
 
Sucesiones
SucesionesSucesiones
Sucesiones
 
Sucesiones recurrencia induccion
Sucesiones recurrencia induccionSucesiones recurrencia induccion
Sucesiones recurrencia induccion
 
Memorable meal
Memorable mealMemorable meal
Memorable meal
 
D eber 05 octubre 2010
D eber 05   octubre 2010D eber 05   octubre 2010
D eber 05 octubre 2010
 
Portafolio de evaluación. evidencias
Portafolio de evaluación. evidenciasPortafolio de evaluación. evidencias
Portafolio de evaluación. evidencias
 
Recursos i Bibliografia - Presentacions Multimèdia Eficients
Recursos i Bibliografia - Presentacions Multimèdia EficientsRecursos i Bibliografia - Presentacions Multimèdia Eficients
Recursos i Bibliografia - Presentacions Multimèdia Eficients
 
Ensayo
EnsayoEnsayo
Ensayo
 

Semelhante a Manual de análisis y diseño de algoritmos

Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmosManual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmosSpacetoshare
 
Manual analisis de algoritmos v1
Manual analisis de algoritmos v1Manual analisis de algoritmos v1
Manual analisis de algoritmos v1reny_so
 
LI_1164_140518_A_Analisis_Diseno_Implantacion_Algoritmos_Plan2016.pdf
LI_1164_140518_A_Analisis_Diseno_Implantacion_Algoritmos_Plan2016.pdfLI_1164_140518_A_Analisis_Diseno_Implantacion_Algoritmos_Plan2016.pdf
LI_1164_140518_A_Analisis_Diseno_Implantacion_Algoritmos_Plan2016.pdfCESAR ROGELIO TEJADA CASTAÑEDA
 
Taller algoritmo
Taller  algoritmoTaller  algoritmo
Taller algoritmoleleAngie
 
Programación del curso - Estructura de Datos I
Programación del curso - Estructura de Datos IProgramación del curso - Estructura de Datos I
Programación del curso - Estructura de Datos IYessenia I. Martínez M.
 
Las ciencias de la Computación
Las ciencias de la ComputaciónLas ciencias de la Computación
Las ciencias de la ComputaciónCarlos Escobar
 
Silabo inteligencia artificia2012_1
Silabo inteligencia artificia2012_1Silabo inteligencia artificia2012_1
Silabo inteligencia artificia2012_1Hiper S.A.
 
Algoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptxAlgoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptxGerard Alba
 
Todas 101223091525-phpapp01
Todas 101223091525-phpapp01Todas 101223091525-phpapp01
Todas 101223091525-phpapp01Tomas Bradanovic
 
Taller algoritmo
Taller   algoritmoTaller   algoritmo
Taller algoritmoleleAngie
 
Trabajos unificados ingenieria de sistemas
Trabajos unificados ingenieria de sistemasTrabajos unificados ingenieria de sistemas
Trabajos unificados ingenieria de sistemasedissoncasas13
 
Trabajos unificados ingenieria de sistemas
Trabajos unificados ingenieria de sistemasTrabajos unificados ingenieria de sistemas
Trabajos unificados ingenieria de sistemasedissoncasas13
 

Semelhante a Manual de análisis y diseño de algoritmos (20)

Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmosManual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
 
Manual analisis de algoritmos v1
Manual analisis de algoritmos v1Manual analisis de algoritmos v1
Manual analisis de algoritmos v1
 
LI_1164_140518_A_Analisis_Diseno_Implantacion_Algoritmos_Plan2016.pdf
LI_1164_140518_A_Analisis_Diseno_Implantacion_Algoritmos_Plan2016.pdfLI_1164_140518_A_Analisis_Diseno_Implantacion_Algoritmos_Plan2016.pdf
LI_1164_140518_A_Analisis_Diseno_Implantacion_Algoritmos_Plan2016.pdf
 
Algoritmos
AlgoritmosAlgoritmos
Algoritmos
 
Taller algoritmo
Taller  algoritmoTaller  algoritmo
Taller algoritmo
 
Programación del curso - Estructura de Datos I
Programación del curso - Estructura de Datos IProgramación del curso - Estructura de Datos I
Programación del curso - Estructura de Datos I
 
Las ciencias de la Computación
Las ciencias de la ComputaciónLas ciencias de la Computación
Las ciencias de la Computación
 
Silabo inteligencia artificia2012_1
Silabo inteligencia artificia2012_1Silabo inteligencia artificia2012_1
Silabo inteligencia artificia2012_1
 
Guia informática
Guia informáticaGuia informática
Guia informática
 
Algoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptxAlgoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptx
 
Todas 101223091525-phpapp01
Todas 101223091525-phpapp01Todas 101223091525-phpapp01
Todas 101223091525-phpapp01
 
Taller algoritmo
Taller algoritmoTaller algoritmo
Taller algoritmo
 
Taller algoritmo
Taller   algoritmoTaller   algoritmo
Taller algoritmo
 
Proyecto de investigación AFRI
Proyecto de investigación AFRIProyecto de investigación AFRI
Proyecto de investigación AFRI
 
Proyecto de investigación afri
Proyecto de investigación afriProyecto de investigación afri
Proyecto de investigación afri
 
Guia examen adsi
Guia examen adsiGuia examen adsi
Guia examen adsi
 
Manual Teórico - Práctico C++
Manual Teórico -  Práctico C++Manual Teórico -  Práctico C++
Manual Teórico - Práctico C++
 
Manual ad av1
Manual ad av1Manual ad av1
Manual ad av1
 
Trabajos unificados ingenieria de sistemas
Trabajos unificados ingenieria de sistemasTrabajos unificados ingenieria de sistemas
Trabajos unificados ingenieria de sistemas
 
Trabajos unificados ingenieria de sistemas
Trabajos unificados ingenieria de sistemasTrabajos unificados ingenieria de sistemas
Trabajos unificados ingenieria de sistemas
 

Último

LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxdanalikcruz2000
 
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxJUANSIMONPACHIN
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
Técnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesTécnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesRaquel Martín Contreras
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docxAgustinaNuez21
 
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...YobanaZevallosSantil1
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Angélica Soledad Vega Ramírez
 
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfLA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfNataliaMalky1
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfsamyarrocha1
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxJUANCARLOSAPARCANARE
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxEribertoPerezRamirez
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfEDILIAGAMBOA
 
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)veganet
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicaGianninaValeskaContr
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptxJunkotantik
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfcoloncopias5
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialpatriciaines1993
 

Último (20)

LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
 
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
 
Earth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversaryEarth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversary
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
DIA INTERNACIONAL DAS FLORESTAS .
DIA INTERNACIONAL DAS FLORESTAS         .DIA INTERNACIONAL DAS FLORESTAS         .
DIA INTERNACIONAL DAS FLORESTAS .
 
Técnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesTécnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materiales
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docx
 
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...
 
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfLA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdf
 
Aedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptxAedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptx
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdf
 
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básica
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptx
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundial
 

Manual de análisis y diseño de algoritmos

  • 1. MMAANNUUAALL DDEE AANNÁÁLLIISSIISS YY DDIISSEEÑÑOO DDEE AALLGGOORRIITTMMOOSS VVeerrssiióónn 11..00 DDiirreecccciióónn ddee ÁÁrreeaa IInnffoorrmmááttiiccaa ww wwww ..iinnffoorrmmaattiiccaa..iinnaa ccaapp..ccll
  • 2. Página 1 Colaboraron en el presente manual: Víctor Valenzuela Ruz v_valenzuela@inacap.cl Docente Ingeniería en Gestión Informática INACAP Copiapó
  • 3. Página 2 Copyright © 2003 de Instituto Nacional de Capacitación. Todos los derechos reservados. Copiapó, Chile. Este documento puede ser distribuido libre y gratuitamente bajo cualquier soporte siempre y cuando se respete su integridad. Queda prohibida su venta y reproducción sin permiso expreso del autor.
  • 4. Página 3 PPrreeffaacciioo "Lo que debemos aprender a hacer lo aprendemos haciéndolo". Aristóteles, Ethica Nicomachea II (325 A.C.) El presente documento ha sido elaborado originalmente como apoyo a la asignatura de “Análisis y Diseño de Algoritmos” del séptimo semestre de la carrera de Ingeniería en Gestión Informática, del Instituto Nacional de Capacitación (INACAP). Este documento engloba la mayor parte de la materia de este curso troncal e incluye ejemplos resueltos y algunos ejercicios que serán desarrollados en clases. El manual ha sido concebido para ser leído en forma secuencial, pero también para ser de fácil consulta para verificar algún tema específico. No se pretende que estos apuntes sustituyan a la bibliografía de la asignatura ni a las clases teóricas, sino que sirvan más bien como complemento a las notas que el alumno debe tomar en clases. Asimismo, no debe considerarse un documento definitivo y exento de errores, si bien ha sido elaborado con detenimiento y revisado exhaustivamente. El autor pretende que sea mejorado, actualizado y ampliado con cierta frecuencia, lo que probablemente desembocará en sucesivas versiones, y para ello nadie mejor que los propios lectores para plantear dudas, buscar errores y sugerir mejoras. El Autor. Copiapó, Enero 2003
  • 5. Página 4 ÍÍnnddiiccee GGeenneerraall Página Presentación 7 1. Introducción 1.1. Motivación y Objetivos 8 1.2. Algunas Notas sobre la Historia de los Algoritmos 10 1.3. Fundamentos Matemáticos 11 2. Algoritmos y Problemas 2.1. Definición de Algoritmo 18 2.2. Formulación y Resolución de Problemas 19 2.3. Razones para Estudiar los Algoritmos 22 2.4. Formas de Representación de Algoritmos 23 2.5. La Máquina de Turing 24 3. Eficiencia de Algoritmos 3.1. Introducción 25 3.2. Concepto de Eficiencia 25 3.3. Medidas de Eficiencia 26 3.4. Análisis A Priori y Prueba A Posteriori 27 3.5. Concepto de Instancia 27 3.6. Tamaño de los Datos 28 3.7. Cálculo de Costos de Algoritmos 3.7.1. Cálculo de eficiencia en análisis iterativo 29 3.7.2. Cálculo de eficiencia en análisis recursivo 29 3.8. Principio de Invarianza 31 3.9. Análisis Peor Caso, Mejor Caso y Caso Promedio 31 4. Análisis de Algoritmos 4.1. Introducción 34 4.2. Tiempos de Ejecución 34 4.3. Concepto de Complejidad 36 4.4. Órdenes de Complejidad 37 4.5. Notación Asintótica 4.5.1. La O Mayúscula 39 4.5.2. La o Minúscula 39 4.5.3. Diferencias entre O y o 42 4.5.4. Las Notaciones Ω y Θ 42 4.5.5. Propiedades y Cotas más Usuales 42 4.6. Ecuaciones de Recurrencias 4.6.1. Introducción 45 4.6.2. Resolución de Recurrecias 45
  • 6. Página 5 4.6.3. Método del Teorema Maestro 45 4.6.4. Método de la Ecuación Característica 46 4.6.5. Cambio de Variable 48 4.7. Ejemplos y Ejercicios 49 5. Estrategias de Diseño de Algoritmos 5.1. Introducción 51 5.2. Recursión 51 5.3. Dividir para Conquistar 55 5.4. Programación Dinámica 57 5.5. Algoritmos Ávidos 58 5.6. Método de Retroceso (backtracking) 60 5.7. Método Branch and Bound 61 6. Algoritmos de Ordenamiento 6.1. Concepto de Ordenamiento 63 6.2. Ordenamiento por Inserción 63 6.3. Ordenamiento por Selección 64 6.4. Ordenamiento de la Burbuja (Bublesort) 65 6.5. Ordenamiento Rápido (Quicksort) 65 6.6. Ordenamiento por Montículo (Heapsort) 68 6.7. Otros Métodos de Ordenamiento 6.7.1. Ordenamiento por Incrementos Decrecientes 74 6.7.2. Ordenamiento por Mezclas Sucesivas 75 7. Algoritmos de Búsqueda 7.1. Introducción 78 7.2. Búsqueda Lineal 78 7.3. Búsqueda Binaria 80 7.4. Árboles de Búsqueda 81 7.5. Búsqueda por Transformación de Claves (Hashing) 81 7.6. Búsqueda en Textos 7.6.1. Algoritmo de Fuerza Bruta 88 7.6.2. Algoritmo de Knuth-Morris-Pratt 88 7.6.3. Algoritmo de Boyer-Moore 92 8. Teoría de Grafos 8.1. Definiciones Básicas 97 8.2. Representaciones de Grafos 8.2.1. Matriz y Lista de Adyacencia 101 8.2.2. Matriz y Lista de Incidencia 103 8.3. Recorridos de Grafos 8.3.1. Recorridos en Amplitud 104 8.3.2. Recorridos en Profundidad 106 8.4. Grafos con Pesos 108 8.5. Árboles 108
  • 7. Página 6 8.6. Árbol Cobertor Mínimo 8.6.1. Algoritmo de Kruskal 109 8.6.2. Algoritmo de Prim 111 8.7. Distancias Mínimas en un Grafo Dirigido 8.7.1. Algoritmo de Dijkstra 113 8.7.2. Algoritmo de Ford 114 8.7.3. Algoritmo de Floyd-Warshall 115 9. Complejidad Computacional 9.1. Introducción 118 9.2. Algoritmos y Complejidad 118 9.3. Problemas NP Completos 118 9.4. Problemas Intratables 121 9.5. Problemas de Decisión 123 9.6. Algoritmos No Determinísticos 124 Bibliografía 126
  • 8. Página 7 Presentación El curso de Análisis y Diseño de Algoritmos (ADA) tiene como propósito fundamental proporcionar al estudiante las estructuras y técnicas de manejo de datos más usuales y los criterios que le permitan decidir, ante un problema determinado, cuál es la estructura y los algoritmos óptimos para manipular los datos. El curso está diseñado para proporcionar al alumno la madurez y los conocimientos necesarios para enfrentar, tanto una gran variedad de los problemas que se le presentarán en su vida profesional futura, como aquellos que se le presentarán en los cursos más avanzados. El temario gira en torno a dos temas principales: estructuras de datos y análisis de algoritmos. Haciendo énfasis en la abstracción, se presentan las estructuras de datos más usuales (tanto en el sentido de útiles como en el de comunes), sus definiciones, sus especificaciones como tipos de datos abstractos (TDA's), su implantación, análisis de su complejidad en tiempo y espacio y finalmente algunas de sus aplicaciones. Se presentan también algunos algoritmos de ordenación, de búsqueda, de recorridos en gráficas y para resolver problemas mediante recursión y retroceso mínimo analizando también su complejidad, lo que constituye una primera experiencia del alumno con el análisis de algoritmos y le proporcionará herramientas y madurez que le serán útiles el resto de su carrera. Hay que enfatizar que el curso no es un curso de programación avanzada, su objetivo es preparar al estudiante brindándole una visión amplia de las herramientas y métodos más usuales para la solución de problemas y el análisis de la eficiencia de dichas soluciones. Al terminar el curso el alumno poseerá un nutrido "arsenal" de conocimientos de los que puede echar mano cuando lo requiera en su futura vida académica y profesional. Sin embargo, dadas estas características del curso, marca generalmente la frontera entre un programador principiante y uno maduro, capaz de analizar, entender y programar sistemas de software más o menos complejos. Para realizar las implantaciones de las distintas estructuras de datos y de los algoritmos que se presentan en el curso se hará uso del lenguaje de programación MODULA-2, C++ y Java.
  • 9. Página 8 Capítulo 1 Introducción 1.1 Motivación y Objetivos La representación de información es fundamental para las Ciencias de la Computación. La Ciencia de la Computación (Computer Science), es mucho más que el estudio de cómo usar o programar las computadoras. Se ocupa de algoritmos, métodos de calcular resultados y máquinas autómatas. Antes de las computadoras, existía la computación, que se refiere al uso de métodos sistemáticos para encontrar soluciones a problemas algebraicos o simbólicos. Los babilonios, egipcios y griegos, desarrollaron una gran variedad de métodos para calcular cosas, por ejemplo el área de un círculo o cómo calcular el máximo común divisor de dos números enteros (teorema de Euclides). En el siglo XIX, Charles Babbage describió una máquina que podía liberar a los hombres del tedio de los cálculos y al mismo tiempo realizar cálculos confiables. La motivación principal de la computación por muchos años fue la de desarrollar cómputo numérico más preciso. La Ciencia de la Computación creció del interés en sistemas formales para razonar y la mecanización de la lógica, así cómo también del procesamiento de datos de negocios. Sin embargo, el verdadero impacto de la computación vino de la habilidad de las computadoras de representar, almacenar y transformar la información. La computación ha creado muchas nuevas áreas como las de correo electrónico, publicación electrónica y multimedia. La solución de problemas del mundo real, ha requerido estudiar más de cerca cómo se realiza la computación. Este estudio ha ampliado la gama de problemas que pueden ser resueltos. Por otro lado, la construcción de algoritmos es una habilidad elegante de un gran significado práctico. Computadoras más poderosas no disminuyen el significado de algoritmos veloces. En la mayoría de las aplicaciones no es el hardware el cuello de botella sino más bien el software inefectivo.
  • 10. Página 9 Este curso trata de tres preguntas centrales que aparecen cuando uno quiere que un computador haga algo: ¿Es posible hacerlo? ¿Cómo se hace? y ¿Cuán rápido puede hacerse? El curso da conocimientos y métodos para responder estas preguntas, al mismo tiempo intenta aumentar la capacidad de encontrar algoritmos efectivos. Los problemas para resolver, son un entrenamiento en la solución algorítmica de problemas, y para estimular el aprendizaje de la materia. Objetivos Generales: 1. Introducir al alumno en el análisis de complejidad de los algoritmos, así como en el diseño e implementación de éstos con las técnicas y métodos más usados. 2. Desarrollar habilidades en el uso de las técnicas de análisis y diseño de algoritmos computacionales. 3. Analizar la eficiencia de diversos algoritmos para resolver una variedad de problemas, principalmente no numéricos. 4. Enseñar al alumno a diseñar y analizar nuevos algoritmos. 5. Reconocer y clasificar los problemas de complejidad polinómica y no polinómica. Metas del curso: Al finalizar este curso, el estudiante debe estar capacitado para: • analizar, diseñar e implementar algoritmos iterativos y recursivos correctos. • medir la eficiencia de algoritmos iterativos y recursivos, y de tipos o clases de datos orientados por objetos. • utilizar la técnica de diseño de algoritmos más adecuada para una aplicación en particular. • definir la aplicabilidad de las diferentes técnicas de búsqueda y ordenamiento, del procesamiento de cadenas de caracteres, de los métodos geométricos, del uso de los algoritmos de grafos, de los algoritmos paralelos y de los algoritmos de complejidad no polinómica. • diferenciar entre los algoritmos de complejidad polinómica y no polinómica.
  • 11. Página 10 1.2 Algunas Notas sobre la Historia de los Algoritmos El término proviene del matemático árabe Al'Khwarizmi, que escribió un tratado sobre los números. Este texto se perdió, pero su versión latina, Algoritmi de Numero Indorum, sí se conoce. El trabajo de Al'Khwarizmipermitió preservar y difundir el conocimiento de los griegos (con la notable excepción del trabajo de Diofanto) e indios, pilares de nuestra civilización. Rescató de los griegos la rigurosidad y de los indios la simplicidad (en vez de una larga demostración, usar un diagrama junto a la palabra Mira). Sus libros son intuitivos y prácticos y su principal contribución fue simplificar las matemáticas a un nivel entendible por no expertos. En particular muestran las ventajas de usar el sistema decimal indio, un atrevimiento para su época, dado lo tradicional de la cultura árabe. La exposición clara de cómo calcular de una manera sistemática a través de algoritmos diseñados para ser usados con algún tipo de dispositivo mecánico similar a un ábaco, más que con lápiz y papel, muestra la intuición y el poder de abstracción de Al'Khwarizmi. Hasta se preocupaba de reducir el número de operaciones necesarias en cada cálculo. Por esta razón, aunque no haya sido él el inventor del primer algoritmo, merece que este concepto esté asociado a su nombre. Los babilonios que habitaron en la antigua Mesopotania, empleaban unas pequeñas bolas hechas de semillas o pequeñas piedras, a manera de "cuentas" y que eran agrupadas en carriles de caña. Más aún, en 1.800 A.C. un matemático babilónico inventó los algoritmos que le permitieron resolver problemas de cálculo numérico. En 1850 A.C., un algoritmo de multiplicación similar al de expansión binaria es usado por los egipcios. La teoría de las ciencias de la computación trata cualquier objeto computacional para el cual se puede crear un buen modelo. La investigación en modelos formales de computación se inició en los 30's y 40's por Turing, Post, Kleene, Church y otros. En los 50's y 60's los lenguajes de programación, compiladores y sistemas operativos estaban en desarrollo, por lo tanto, se convirtieron tanto en el sujeto como la base para la mayoría del trabajo teórico. El poder de las computadoras en este período estaba limitado por procesadores lentos y por pequeñas cantidades de memoria. Así, se desarrollaron teorías (modelos, algoritmos y análisis) para hacer un uso eficiente de ellas. Esto dio origen al desarrollo del área que ahora se conoce como "Algoritmos y Estructuras de Datos". Al mismo tiempo se hicieron estudios para comprender la complejidad inherente en la solución de algunos problemas. Esto dió origen a lo que se conoce como la jerarquía de problemas computacionales y al área de "Complejidad Computacional".
  • 12. Página 11 1.3 Fundamentos Matemáticos Monotonicidad Una función f es monótona si es creciente o decreciente. Es creciente si rige la implicación siguiente: ∀ n0, n1 : (n1 = n2) è f(n1) = f(n2 ) Es decreciente si rige la implicación siguiente: ∀ n0, n1 : (n1 = n2) è f(n1) = f(n2 ) Una función f(n) es monotónicamente creciente si m ≤ n implica que f(m) ≤ f(n). Similarmente, es monotónicamente decreciente si m ≤ n implica que f(m) ≥ f(n). Una función f(n) es estrictamente crecientesi m < n implica que f(m) < f(n) y estrictamente decreciente si m < n implica que f(m) > f(n). Conjuntos Un conjunto es una colección de miembros o elementos distinguibles. Los miembros se toman típicamente de alguna población más grande conocida como tipo base. Cada miembro del conjunto es un elemento primitivo del tipo base o es un conjunto. No hay concepto de duplicación en un conjunto. Un orden lineal tiene las siguientes propiedades: • Para cualesquier elemento a y b en el conjunto S, exactamente uno de a < b, a = b, o a > b es verdadero. • Para todos los elementos a, b y c en el conjunto S, si a < b, y b < c, entonces a < c. Esto es conocido como la propiedad de transitividad. Permutación Una permutación de una secuencia es simplemente los elementos de la secuencia arreglados en cualquier orden. Si la secuencia contiene n elementos, existe n! permutaciones.
  • 13. Página 12 Funciones Piso y Techo Piso (floor) y techo (ceiling) de un número real x. Son respectivamente el mayor entero menor o igual que x, y el menor entero mayor o igual a x. Para cualquier número real x, denotamos al mayor entero, menor que o igual a x como floor(x), y al menor entero, mayor que o igual a x como ceiling(x); (floor=piso, ceiling=techo). Para toda x real, x - 1 < floor(x) ≤ x ≤ ceiling(x) < x + 1 Para cualquier entero n, ceiling(x/2) + floor(x/2) = n, y para cualquier entero n y enteros a ≠ 0 y b ≠ 0, ceiling(ceiling(n/a)/b) = ceiling(n/ab) y floor(floor(n/a)/b) = floor(n/ab). Las funciones floory ceiling son monótonas crecientes. Operador módulo Esta función regresa el residuo de una división entera. Generalmente se escribe n mod m, y el resultado es el entero r, tal que n= qm+r para q un entero y/0 menor o igual que r y r < m. Por ejemplo: 5 mod 3 = 2 y 25 mod 3 = 1 Polinomios Dado un entero positivo d, un polinomio en n de grado d es una función p(n) de la forma: p(n) = ∑ d*ai ni i=0 donde las constantes a0, a1,..., ad son los coeficientes del polinimio y ad ≠ 0. Un polinomio es asintóticamente positivo si y sólo si ad > 0. Para un polinomio asintóticamente positivo p(n) de grado d, tenemos que p(n) = O(nd). Para cualquier constante real a ≥ 0, la función na es monótona creciente, y para cualquier constante real a ≤ 0, la función na es monótona decreciente. Decimos que una función f(n) es polinomialmente acotada si f(n) = nO(1), que es equivalente en decir que f(n) = O(nk) para alguna constante k.
  • 14. Página 13 Exponenciales Para toda a ≠ 0, m y n, tenemos las siguientes identidades: aº = 1 a¹ = a a(-1) =1/a (a m) n = a m n (a m) n = (a n)m a m a n = a m +n Para todo n y a ≥ ,1 lim nà ∞ nb/an = 0 de lo que concluimos que nb=o(an). Entonces, cualquier función exponencial positiva crece más rápido que cualquier polinomio. i=0 exp(x) = ∑ x i /(i!) ∞ Logaritmos Un logaritmo de base b para el valor y, es la potencia al cual debe elevarse b para obtener y. Logb y = x ó bx =y. Usos para los logaritmos: • ¿Cuál es el número mínimo de bits necesarios para codificar una colección de objetos? La respuesta es techo(log2 n). • Por ejemplo, si se necesitan 1000 códigos que almacenar, se requerirán al menos techo(log2 1000) = 10 bits para tener 1000 códigos distintos. De hecho con 10 bits hay 1024 códigos distintos disponibles. • Análisis de algoritmos que trabajan rompiendo un problema en subproblemas más pequeños. Por ejemplo, la búsqueda binaria de un valor dado en una lista ordenada por valor. ¿Cuántas veces puede una lista de tamaño n ser divida a la mitad hasta que un sólo elemento quede en la lista final? La respuesta es log2 n.
  • 15. Página 14 Los logaritmos tienen las siguientes propiedades: • log nm = log n + log m • log n/m = log n – log m • log nr = r log n • loga n = logb n/ logb a (para a y b enteros) Esta última propiedad dice que el logaritmo de n en distintas bases, está relacionado por una constante (que es logaritmo de una base en la otra). Así que análisis de complejidad que se hacen en una base de logaritmos, pueden fácilmente traducirse en otra, simplemente con un factor de proporcionalidad. Factoriales La notación n! se define para los enteros n ≥ 0 como: 1 si n=0 n! = n·(n-1)! si n>0 Entonces, n!=1·2·3·4 ··· n. Una cota superior débil de la función factorial es n! ≤ nn, pues cada uno de los n términos en el producto factorial es a lo más n. La aproximación de Stirling, proporciona una cota superior ajustada, y también una cota inferior: n! = sqrt{2pn} (n/e)n (1 + Q(1/n)) donde e es la base del logaritmo natural. Usando la aproximación de Stirling, podemos demostrar que: n! = o(nn) n! = (2n) lg(n!) = Q(n lg n) Números de Fibonacci Los números de Fibonacci se definen por la siguiente recurrencia: F0 = 0 F1 = 1 Fi = Fi-1 + Fi-2 para i ≥ 2
  • 16. Página 15 Entonces cada número de Fibonacci es la suma de los números previos, produciendo la sucesión: 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, ... Recursión Un algoritmo es recursivo si se llama a sí mismo para hacer parte del trabajo. Para que este enfoque sea exitoso, la llamada debe ser en un problema menor que al originalmente intentado. En general, un algoritmo recursivo tiene dos partes: • El caso base, que maneja una entrada simple que puede ser resuelta sin una llamada recursiva • La parte recursiva, que contiene una o más llamadas recursivas al algoritmo, donde los parámetros están en un sentido más cercano al caso base, que la llamada original. Ejemplos de aplicación: cálculo del factorial, torres de Hanoi y función de Ackermann. Sumatorias y recurrencias Las sumatorias se usan mucho para el análisis de la complejidad de programas, en especial de ciclos, ya que realizan conteos de operaciones cada vez que se entra al ciclo. Cuando se conoce una ecuación que calcula el resultado de una sumatoria, se dice que esta ecuación representa una solución en forma cerrada. Ejemplos de soluciones en forma cerrada: • Σ i = n(n+1)/2 • Σ I 2 = (2n 3 +3n 2 + n)/6 • Σ 1 log n n = n log n • Σ∞ a i = 1/(1-a) El tiempo de ejecución para un algoritmo recursivo está más fácilmente expresado por una expresión recursiva. Una relación de recurrencia define una función mediante una expresión que incluye una o más instancias (más pequeñas) de si misma. Por ejemplo:
  • 17. Página 16 n! = (n-1)! n , 1! = 0! = 1 La secuencia de Fibonacci: • Fib(n)=Fib(n-1)+Fib(n-2); Fib(1)=Fib(2)=1 • 1,1,2,3,5,8,13,... Técnicas de Demostración Matemática Prueba por contradicción Es la forma más fácil de refutar un teorema o enunciado, es mediante un contra-ejemplo. Desafortunadamente, no importa el número de ejemplos que soporte un teorema, esto no es suficiente para probar que es correcto. Para probar un teorema por contradicción, primero suponemos que el teorema es falso. Luego encontramos una contradicción lógica que surja de esta suposición. Si la lógica usada para encontrar la contradicción es correcta, entonces la única forma de resolver la contradicción es suponer que la suposición hecha fue incorrecta, esto es, concluir que el teorema debe ser verdad. Prueba por inducción matemática La inducción matemática es como recursión y es aplicable a una variedad de problemas. La inducción proporciona una forma útil de pensar en diseño de algoritmos, ya que lo estimula a pensar en resolver un problema, construyendo a partir de pequeños subproblemas. Sea T un teorema a probar, y expresemos T en términos de un parámetro entero positivo n. La inducción matemática expresa que T es verdad para cualquier valor de n, si las siguientes condiciones se cumplen: • Caso base. T es verdad para n = 1 • Paso inductivo. Si T es verdad para n-1, => T es verdad para n. Ejemplo de demostración del teorema: La suma de los primeros n números enteros es n(n+1)/2.
  • 18. Página 17 Estimación Consiste en hacer estimaciones rápidas para resolver un problema. Puede formalizarse en tres pasos: • Determine los parámetros principales que afectan el problema. • Derive una ecuación que relacione los parámetros al problema. • Seleccione valores para los parámetros, y aplique la ecuación para obtener una solución estimada. Ejemplo: ¿Cuántos libreros se necesitan para guardar libros que contienen en total un millón de páginas? Se estiman que 500 páginas de un libro requieren cerca de una pulgada en la repisa del librero, con lo cual da 2000 pulgadas de repisa. Lo cual da 167 pies de repisa (aprox. 200 pies). Si una repisa es alrededor de 4 pies de ancho, entonces se necesitan 50 repisas. Si un librero contiene 5 repisas, entonces se necesitan 10 libreros.
  • 19. Página 18 Capítulo 2 Algoritmos y Problemas 2.1 Definición de Algoritmo El concepto intuitivo de algoritmo, lo tenemos prácticamente todos: Un algoritmo es una serie finita de pasos para resolver un problema. Hay que hacer énfasis en dos aspectos para que un algoritmo exista: 1. El número de pasos debe ser finito. De esta manera el algoritmo debe terminar en un tiempo finito con la solución del problema, 2. El algoritmo debe ser capaz de determinar la solución del problema. De este modo, podemos definir algoritmo como un "conjunto de reglas operacionales inherentes a un cómputo". Se trata de un método sistemático, susceptible de ser realizado mecánicamente, para resolver un problema dado. Sería un error creer que los algoritmos son exclusivos de la informática. También son algoritmos los que aprendemos en la escuela para multiplicar y dividir números de varias cifras. De hecho, el algoritmo más famoso de la historia se remonta a la antigüedad: se trata del algoritmo de Euclides para calcular el máximo común divisor. Siempre que se desee resolver un problema hay que plantearse qué algoritmo utilizar. La respuesta a esta cuestión puede depender de numerosos factores, a saber, el tamaño del problema, el modo en que está planteado y el tipo y la potencia del equipo disponible para su resolución. Características de un algoritmo 1. Entrada: definir lo que necesita el algoritmo 2. Salida: definir lo que produce. 3. No ambiguo: explícito, siempre sabe qué comando ejecutar. 4. Finito: El algoritmo termina en un número finito de pasos. 5. Correcto: Hace lo que se supone que debe hacer. La solución es correcta 6. Efectividad: Cada instrucción se completa en tiempo finito. Cada instrucción debe ser lo suficientemente básica como para que en principio pueda ser ejecutada por cualquier persona usando papel y lápiz.
  • 20. Página 19 7. General: Debe ser lo suficientemente general como para contemplar todos los casos de entrada. Así podemos, decir que un Algoritmo es un conjunto finito de instrucciones precisas para resolver un problema. Un algoritmo es un método o proceso seguido para resolver un problema. Si el problema es visto como una función, entonces el algoritmo toma una entrada y la transforma en la salida. Un problema es una función o asociación de entradas con salidas. Un problema puede tener muchos algoritmos. Por tanto, un algoritmo es un procedimiento para resolver un problema cuyos pasos son concretos y no ambiguos. El algoritmo debe ser correcto, de longitud finita y debe terminar para todas las entradas. Un programa es una instanciación de un algoritmo en un lenguaje de programación. 2.2 Formulación y Resolución de Problemas Los algoritmos son los procedimientos que se construyen para la resolución de cualquier problema. De este modo, cuando se refiere a la construcción de un programa, nos estamos refiriéndo a la construcción de un algoritmo. El algoritmo no es un concepto proveniente del campo de la computación, sino que es un término matemático. Los algoritmos los encontramos, o mejor, los ejecutamos a lo largo de nuestras actividades diarias; por ejemplo, cuando hacemos una llamada telefónica, tenemos en cuenta un conjunto de instrucciones mínimas y el orden en el cual debemos ejecutarlas para conseguir comunicarnos con alguien en particular; o cuando consultamos un diccionario, cuando se prepara un menú, etc. Podemos conceptuar que un algoritmo es un procedimiento que contiene un conjunto finito de pasos que se deben ejecutar en un orden específico y lógico, para solucionar los problemas. Un algoritmo puede ser caracterizado por una función lo cual asocia una salida: s= f (E) a cada entrada E. Se dice entonces que un algoritmo calcula una función f. Entonces la entrada es una variable independiente básica en relación a la que se producen las salidas del algoritmo, y también los análisis de tiempo y espacio.
  • 21. Página 20 Cuando se tiene un problema para el cual debemos especificar un algoritmo solución, tendremos en cuenta varios puntos: o Si no se conoce un método para solucionar el problema en cuestión, debemos hacer un análisis del mismo para llegar a una solución, después de evaluar alternativas, exigencias y excepciones. o Si se conoce un "buen" método de solución al problema, se debe especificar exacta y completamente el método o procedimiento de solución en un lenguaje que se pueda interpretar fácilmente. o Los problemas pueden agruparse en conjunto de problemas que son semejantes. o En algún sentido, en general, un método para solucionar todos los problemas de un conjunto dado, se considera superior a un método para solucionar solamente un problema del conjunto. o Hay criterios para determinar que tan "buena" es una solución, distintos de ver si trabaja o no, o hasta qué punto es general la aplicabilidad del método. Estos criterios involucran aspectos tales como: eficiencia, elegancia, velocidad, etc. Al definir con exactitud un método de solución para un problema, este debe estar en capacidad de encontrarla si existe; en caso de que no exista, el método debe reconocer esta situación y suspender cualquier acción. Formular y resolver problemas constituye una actividad esencial de la vida. Los modelos educativos se han dedicado a plantear problemas y enseñar como solucionarlos. Sin embargo, no se enseña nunca técnicas de cómo resolver problemas en general. La formulación y resolución de problemas ha sido preocupación de los psicólogos cuando hablan de la inteligencia del hombre. Ellos han concebido esta capacidad como el concurso de ciertas destrezas mentales relacionadas con lo que ya se ha aprendido y que incluyen: o Capacidad de analizar los problemas. o La rapidez y precisión con que acude al pensamiento. o Una organización de ideas para garantizar que se posee la información esencial que asegura el aprendizaje. o Una retención clara del incremento de conocimiento. No se trata de almacenar problemas y sus correspondientes soluciones, sino de desarrollar una capacidad para hacer frente con éxito a situaciones nuevas o desconocidas en la vida del hombre. Ante situaciones nuevas, el que no sabe buscar soluciones se sentirá confuso y angustiado y entonces no busca una estrategia y dará una primera solución para poner punto final a su agonía.
  • 22. Página 21 El que sabe buscar soluciones, selecciona la estrategia que le parece más cercana a la requerida y hace una hábil adaptación que se ajusta a la nueva demanda. Al movernos dentro de la informática no siempre encontramos los problemas a punto de resolverlos, es necesario empezar por hacer su formulación. Se exige hacerlo en términos concisos y claros partiendo de las bases o supuestos que se dispone para especificar sus requerimientos. Sólo a partir de una buena formulación será posible diseñar una estrategia de solución. Es necesario aprender a desligar estos dos procesos. No se deben hacer formulaciones pensando paralelamente en posibles soluciones. Es necesario darle consistencia e independencia para determinar con precisión a qué se quiere dar solución y luego canalizar una gama de alternativas posibles. Si ya se ha realizado la formulación del problema podemos cuestionarla con el fin de entender bien la naturaleza del problema. En nuestra área, el análisis de un problema tiene dos etapas claramente definidas y relacionadas: o Formulación o planteamiento del problema. o Resolución del problema. A su vez, la formulación la podemos descomponer en tres etapas: o Definición del problema. o Supuestos: aserciones y limitaciones suministradas. o Resultados esperados. La fase de planteamiento del problema lo que pretende un algoritmo es sintetizar de alguna forma una tarea, cálculo o mecanismo antes de ser transcrito al computador. Los pasos que hay que seguir son los siguientes: o Análisis previo del problema. o Primera visión del método de resolución. o Descomposición en módulos. o Programación estructurada. o Búsqueda de soluciones parciales. o Ensamblaje de soluciones finales. La fase de resolución del problema se puede descomponer en tres etapas: o Análisis de alternativas y selección de la solución. o Especificación detallada del procedimiento solución.
  • 23. Página 22 o Adopción o utilización de una herramienta para su implementación, si es necesaria. Hay que notar que el computador es un medio y no es el fin en la solución de problemas. En otras palabras, no es el computador el que soluciona los problemas, somos nosotros quienes lo hacemos y de alguna manera le contamos como es la cosa para que él con su velocidad y exactitud trabaje con grandes volúmenes de datos. En el campo de las ciencias de la computación la solución de problemas se describe mediante el diseño de procedimientos llamados algoritmos, los cuales posteriormente se implementan como programas. Los programas son procedimientos que solucionan problemas y que se expresan en un lenguaje conocido por el computador. Se pueden dar problemas que por su tamaño es necesario subdividirlos en problemas más simples para solucionarlos, utilizando la filosofía de "Dividir para conquistar". Se parte del principio de que es más fácil solucionar varios problemas simples como partes de un todo que seguir una implantación de "Todo o Nada". Desarrollar la capacidad de formular y resolver problemas nos prepara para enfrentar situaciones desconocidas. 2.3 Razones para Estudiar los Algoritmos Con el logro de computadores cada vez más rápidos se podría caer en la tentación de preguntarse si vale la pena preocuparse por aumentar la eficiencia de los algoritmos. ¿No sería más sencillo aguardar a la siguiente generación de computadores?. Vamos a demostrar que esto no es así. Supongamos que se dispone, para resolver un problema dado, de un algoritmo que necesita un tiempo exponencial y que, en un cierto computador, una implementación del mismo emplea 10-4 x 2n segundos. Este programa podrá resolver un ejemplar de tamaño n=10 en una décima de segundo. Necesitará casi 10 minutos para resolver un ejemplar de tamaño 20. Un día entero no bastará para resolver uno de tamaño 30. En un año de cálculo ininterrumpido, a duras penas se resolverá uno de tamaño 38. Imaginemos que necesitamos resolver ejemplares más grandes y compramos para ello un computador cien veces más rápido. El mismo algoritmo conseguirá resolver ahora un ejemplar de tamaño n en sólo 10-6 2n segundos. ¡Qué decepción al constatar que, en un año, apenas se consigue resolver un ejemplar de tamaño 45! En general, si en un tiempo dado se podía resolver un ejemplar de tamaño n, con el nuevo computador se resolverá uno de tamaño n+7 en ese mismo tiempo.
  • 24. Página 23 Imaginemos, en cambio, que investigamos en algorítmica y encontramos un algoritmo capaz de resolver el mismo problema en un tiempo cúbico. La implementación de este algoritmo en el computador inicial podría necesitar, por ejemplo, 10-2 n3 segundos. Ahora se podría resolver en un día un ejemplar de un tamaño superior a 200. Un año permitiría alcanzar casi el tamaño 1500. Por tanto, el nuevo algoritmo no sólo permite una aceleración más espectacular que la compra de un equipo más rápido, sino que hace dicha compra más rentable. Dado estos argumentos, podemos resumir las siguientes razones para justificar el estudiar los algoritmos: 1. Evitar reinventar la rueda. Para algunos problemas de programación ya existen buenos algoritmos para solucionarlos. Para esos algoritmos ya fueron analizadas sus propiedades. Por ejemplo, confianza en su correctitud y eficiencia. 2. Para ayudar cuando desarrollen sus propios algoritmos. No siempre existe un algoritmo desarrollado para resolver un problema. No existe regla general de creación de algoritmos. Muchos de los principios de proyecto de algoritmos ilustrados por algunos de los algoritmos que estudiaremos son importantes en todos los problemas de programación. El conocimiento de los algoritmos bien definidos provee una fuente de ideas que pueden ser aplicadas a nuevos algoritmos. 3. Ayudar a entender herramientas que usan algoritmos particulares. Por ejemplo, herramientas de compresión de datos: • Pack usa Códigos Huffman. • Compress usa LZW. • Gzip usa Lempel-Ziv. 4. Útil conocer técnicas empleadas para resolver problemas de determinados tipos. 2.4 Formas de Representación de Algoritmos Existen diversas formas de representación de algoritmos, pero no hay un consenso con relación a cuál de ellas es mejor. Algunas formas de representación de algoritmos tratan los problemas a un nivel lógico, abstrayéndose de detalles de implementación, muchas veces relacionados con un lenguaje de programación específico. Por otro lado, existen formas de representación de algoritmos que poseen una mayor
  • 25. Página 24 riqueza de detalles y muchas veces acaban por oscurecer la idea principal, el algoritmo, dificultando su entendimiento. Dentro de las formas de representación de algoritmos más conocidas, sobresalen: • La descripción narrativa • El Flujograma convencional • El diagrama Chapin • El pseudocódigo, o también conocido como lenguaje estructurado. 2.5 La Máquina de Turing Alan Turing, en 1936 desarrolló su Máquina de Turing (la cual se cubre en los cursos denominados Teoría de la Computación o Teoría de Automátas), estableciendo que cualquier algoritmo puede ser representado por ella. Turing mostró también que existen problemas matemáticos bien definidos para los cuales no hay un algoritmo. Hay muchos ejemplos de problemas para los cuales no existe un algoritmo. Un problema de este tipo es el llamado problema de paro (halting problem): Dado un programa de computadora con sus entradas, ¿parará este alguna vez? Turing probó que no hay un algoritmo que pueda resolver correctamente todas las instancias de este problema. Alguien podría pensar en encontrar algunos métodos para detectar patrones que permitan examinar el programa para cualquier entrada. Sin embargo, siempre habrá sutilezas que escapen al análisis correspondiente. Alguna persona más suspicaz, podría proponer simplemente correr el programa y reportar éxito si se alcanza una declaración de fin. Desgraciadamente, este esquema no garantiza por sí mismo un paro y en consecuencia el problema no puede ser resuelto con los pasos propuestos. Como consecuencia de acuerdo con la definición anterior, ese último procedimiento no es un algoritmo, pues no se llega a una solución. Muchas veces aunque exista un algoritmo que pueda solucionar correctamente cualquier instancia de un problema dado, no siempre dicho algoritmo es satisfactorio porque puede requerir de tiempos exageradamente excesivos para llegar a la solución.
  • 26. Página 25 Capítulo 3 Eficiencia de Algoritmos 3.1 Introducción Un objetivo natural en el desarrollo de un programa computacional es mantener tan bajo como sea posible el consumo de los diversos recursos, aprovechándolos de la mejor manera que se encuentre. Se desea un buen uso, eficiente, de los recursos disponibles, sin desperdiciarlos. Para que un programa sea práctico, en términos de requerimientos de almacenamiento y tiempo de ejecución, debe organizar sus datos en una forma que apoye el procesamiento eficiente. Siempre que se trata de resolver un problema, puede interesar considerar distintos algoritmos, con el fin de utilizar el más eficiente. Pero, ¿cómo determinar cuál es "el mejor"?. La estrategia empírica consiste en programar los algoritmos y ejecutarlos en un computador sobre algunos ejemplares de prueba. La estrategia teórica consiste en determinar matemáticamente la cantidad de recursos (tiempo, espacio, etc.) que necesitará el algoritmo en función del tamaño del ejemplar considerado. El tamaño de un ejemplar x corresponde formalmente al número de dígitos binarios necesarios para representarlo en el computador. Pero a nivel algorítmico consideraremos el tamaño como el número de elementos lógicos contenidos en el ejemplar. 3.2 Concepto de Eficiencia Un algoritmo es eficiente cuando logra llegar a sus objetivos planteados utilizando la menor cantidad de recursos posibles, es decir, minimizando el uso memoria, de pasos y de esfuerzo humano. Un algoritmo es eficaz cuando alcanza el objetivo primordial, el análisis de resolución del problema se lo realiza prioritariamente. Puede darse el caso de que exista un algoritmo eficaz pero no eficiente, en lo posible debemos de manejar estos dos conceptos conjuntamente. La eficiencia de un programa tiene dos ingredientes fundamentales: espacio y tiempo. • La eficiencia en espacio es una medida de la cantidad de memoria requerida por un programa.
  • 27. Página 26 • La eficiencia en tiempo se mide en términos de la cantidad de tiempo de ejecución del programa. Ambas dependen del tipo de computador y compilador, por lo que no se estudiará aquí la eficiencia de los programas, sino la eficiencia de los algoritmos. Asimismo, este análisis dependerá de si trabajamos con máquinas de un solo procesador o de varios de ellos. Centraremos nuestra atención en los algoritmos para máquinas de un solo procesador que ejecutan una instruccióny luego otra. 3.3 Medidas de Eficiencia Inventar algoritmos es relativamente fácil. En la práctica, sin embargo, no se pretende sólo diseñar algoritmos, si no más bien que buenos algoritmos. Así, el objetivo es inventar algoritmos y probar que ellos mismos son buenos. La calidad de un algoritmo puede ser avalada utilizando varios criterios. Uno de los criterios más importantes es el tiempo utilizado en la ejecución del algoritmos. Existen varios aspectos a considerar en cada criterio de tiempo. Uno de ellos está relacionado con el tiempo de ejecución requerido por los diferentes algoritmos, para encontrar la solución final de un problema o cálculo particular. Normalmente, un problema se puede resolver por métodos distintos, con diferentes grados de eficiencia. Por ejemplo: búsqueda de un número en una guía telefónica. Cuando se usa un computador es importante limitar el consumo de recursos. Recurso Tiempo: • Aplicaciones informáticas que trabajan “en tiempo real” requieren que los cálculos se realicen en el menor tiempo posible. • Aplicaciones que manejan un gran volumen de información si no se tratan adecuadamente pueden necesitar tiempos impracticables. Recurso Memoria: • Las máquinas tienen una memoria limitada.
  • 28. Página 27 3.4 Análisis A Priori y Prueba A Posteriori El análisis de la eficiencia de los algoritmos (memoria y tiempo de ejecución) consta de dos fases: Análisis A Priori y Prueba A Posteriori. El Análisis A Priori (o teórico) entrega una función que limita el tiempo de cálculo de un algoritmo. Consiste en obtener una expresión que indique el comportamiento del algoritmo en función de los parámetros que influyan. Esto es interesante porque: • La predicción del costo del algoritmo puede evitar una implementación posiblemente laboriosa. • Es aplicable en la etapa de diseño de los algoritmos, constituyendo uno de los factores fundamentales a tener en cuenta. En la Prueba A Posteriori (experimental o empírica) se recogen estadísticas de tiempo y espacio consumidas por el algoritmo mientras se ejecuta. La estrategia empírica consiste en programar los algoritmos y ejecutarlos en un computador sobre algunos ejemplares de prueba, haciendo medidas para: • una máquina concreta, • un lenguaje concreto, • un compilador concreto y • datos concretos La estrategia teórica tiene como ventajas que no depende del computador ni del lenguaje de programación, ni siquiera de la habilidad del programador. Permite evitar el esfuerzo inútil de programar algoritmos ineficientes y de despediciar tiempo de máquina para ejecutarlos. También permite conocer la eficiencia de un algoritmo cualquiera que sea el tamaño del ejemplar al que se aplique. 3.5 Concepto de Instancia Un problema computacional consiste en una caracterización de un conjunto de datos de entrada, junto con la especificación de la salida deseada en base a cada entrada. Un problema computacional tiene una o más instancias, que son valores particulares para los datos de entrada, sobre los cuales se puede ejecutar el algoritmo para resolver el problema. Ejemplo: el problema computacional de multiplicar dos números enteros tiene por ejemplo, las siguientes instancias: multiplicar 345 por 4653, multiplicar 2637 por 10000, multiplicar -32341 por 12, etc.
  • 29. Página 28 Un problema computacional abarca a otro problema computacional si las instancias del segundo pueden ser resueltas como instancias del primero en forma directa. Ejemplo: Problema del Vendedor Viajero. 3.6 Tamaño de los Datos Variable o expresión en función de la cual intentaremos medir la complejidad del algoritmo. Es claro que para cada algoritmo la cantidad de recurso (tiempo, memoria) utilizados depende fuertemente de los datos de entrada. En general, la cantidad de recursos crece a medida que crece el tamaño de la entrada. El análisis de esta cantidad de recursos no es viable de ser realizado instancia por instancia. Se definen entonces las funciones de cantidad de recursos en base al tamaño (o talla) de la entrada. Suele depender del número de datos del problema. Este tamaño puede ser la cantidad de dígitos para un número, la cantidad de elementos para un arreglo, la cantidad de caracteres de una cadena, en problemas de ordenación es el número de elementos a ordenar, en matrices puede ser el número de filas, columnas o elementos totales, en algoritmos recursivos es el número de recursiones o llamadas propias que hace la función. En ocasiones es útil definir el tamaño de la entrada en base a dos o más magnitudes. Por ejemplo, para un grafo es frecuente utilizar la cantidad de nodos y de arcos. En cualquier caso, se debe elegir la misma variable para comparar algoritmos distintos aplicados a los mismos datos. C1 C2 C3 C4 Una instancia de solución sería: <C1, C2 , C4, C3 > con una longitud de 27. 10 5 6 9 3 9
  • 30. Página 29 3.7 Cálculo de Costos de Algoritmos Queremos saber la eficiencia de los algoritmos, no del computador. Por ello, en lugar de medir el tiempo de ejecución en microsegundos o algo por el estilo, nos preocuparemos del númerode veces que se ejecuta una operación primitiva (de tiempo fijo). Para estimar la eficiencia de este algoritmo, podemos preguntarnos, "si el argumento es una frase de N números, ¿cuántas multiplicaciones realizaremos?" La respuesta es que hacemos una multiplicación por cada número en el argumento, por lo que hacemos N multiplicaciones. La cantidad de tiempo que se necesitaría para el doble de números sería el doble. 3.7.1 Cálculo de eficiencia en análisis iterativo Cuando se analiza la eficiencia, en tiempo de ejecución, de un algoritmo son posibles distintas aproximaciones: desde el cálculo detallado (que puede complicarse en muchos algoritmos si se realiza un análisis para distintos contenidos de los datos de entrada, casos más favorables, caso peor, hipótesis de distribución probabilística para los contenidos de los datos de entrada, etc.) hasta el análisis asintótico simplificado aplicando reglas prácticas. En estos apuntes se seguirá el criterio de análisis asintótico simplificado, si bien nunca se ha de dejar de aplicar el sentido común. Como en todos los modelos simplificados se ha mantener la alerta para no establecer hipótesis simplificadoras que no se correspondan con la realidad. En lo que sigue se realizará una exposición basada en el criterio de exponer en un apartado inicial una serie de reglas y planteamientos básicos aplicables al análisis de eficiencia en algoritmos iterativos, en un segundo apartado se presenta una lista de ejemplos que permitan comprender algunas de las aproximaciones y técnicas expuestas. 3.7.2 Cálculo de eficiencia en análisis recursivo Retomando aquí el socorrido ejemplo del factorial, tratemos de analizar el coste de dicho algoritmo, en su versión iterativa , se tiene: PROCEDURE Factorial(n : CARDINAL) : CARDINAL BEGIN VAR Resultado,i : CARDINAL ; Resultado :=1 ; FOR i :=1 TO n DO Resultado :=Resultado*i;
  • 31. Página 30 END ; RETURN Resultado END Factorial ; Aplicando las técnicas de análisis de coste en algoritmos iterativos de forma rápida y mentalmente (es como se han de llegar a analizar algoritmos tan simples como éste), se tiene: hay una inicialización antes de bucle, de coste constante. El bucle se repite un número de veces n y en su interior se realiza una operación de coste constante. Por tanto el algoritmo es de coste lineal o expresado con algo más de detalle y rigor, si la función de coste del algoritmo se expresa por T(n), se tiene que T(n) ? T. Una versión recursiva del mismo algoritmo, es: PROCEDURE Factorial(n: CARDINAL): CARDINAL; BEGIN IF n=0 THEN RETURN 1 ELSE RETURN ( n* Factorial(n-1) ) END END Factorial; Al aplicar el análisis de coste aprendido para análisis de algoritmos iterativos se tiene: hay una instrucción de alternativa, en una de las alternativas simplemente se devuelve un valor (operación de coste constante). En la otra alternativa se realiza una operación de coste constante (multiplicación) con dos operandos. El primer operando se obtiene por una operación de coste constante (acceso a la variable n), el coste de la operación que permite obtener el segundo operando es el coste que estamos calculando!, es decir es el coste de la propia función factorial (solo que para parámetro n-1). Por tanto, para conocer el orden de la función de coste de este algoritmo ¿debemos conocer previamente el orden de la función de coste de este algoritmo?, entramos en una recurrencia. Y efectivamente, el asunto está en saber resolver recurrencias. Si T(n) es la función de coste de este algoritmo se puede decir que T(n) es igual a una operación de coste constante c cuando n vale 0 y a una operación de coste T(n-1) más una operación de coste constante (el acceso a n y la multiplicación) cuando n es mayor que 0, es decir: c si n = 0 T(n) = T(n-1) + c si n > 0 Se trata entonces de encontrar soluciones a recurrencias como ésta. Entendiendo por solución una función simple f(n) tal que se pueda asegurar que T(n) es del orden de f(n).
  • 32. Página 31 En este ejemplo puede comprobarse que T(n) es de orden lineal, es decir del orden de la función f(n)=n, ya que cualquier función lineal T(n)= an+b siendo a y b constantes, es solución de la recurrencia: T(0)= b , es decir una constante T(n)= a.n+b= an-a+ b+a= a(n-1)+b+a= T(n-1)+a, es decir el coste de T(n) es igual al de T(n-1) más una constante. 3.8 Principio de Invarianza Dado un algoritmo y dos implementaciones I1 y I2 (máquinas distintas o códigos distintos) que tardan T1(n) y T2(n) respectivamente, el principio de invarianza afirma que existe una constante real c>0 y un número natural n0 tales que para todo n>=n0 se verifica que T1(n)<=c·T2(n). Es decir, el tiempo de ejecución de dos implementaciones distintas de un algoritmo dado no va a diferir más que en una constante multiplicativa. Asumimos que un algoritmo tarda un tiempo del orden de T(n) si existen una constante real c>0 y una implementación I del algoritmo que tarda menos que c·T(n), para todo n tamaño de entrada. El comportamiento de un algoritmo puede variar notablemente para diferentes secuencias de entrada. Suelen estudiarse tres casos para un mismo algoritmo: caso mejor, caso peor, caso medio. 3.9 Análisis Peor Caso, Mejor Caso y Caso Promedio Puede analizarse un algoritmo particular o una clase de ellos. Una clase de algoritmo para un problema son aquellos algoritmos que se pueden clasificar por el tipo de operación fundamental que realizan. Ejemplo: Problema: Ordenamiento Clase: Ordenamiento por comparación Para algunos algoritmos, diferentes entradas (inputs) para un tamaño dado pueden requerir diferentes cantidades de tiempo. Por ejemplo, consideremos el problema de encontrar la posición particular de un valor K, dentro de un arreglo de n elementos. Suponiendo que sólo ocurre una vez. Comentar sobre el mejor, peor y caso promedio. ¿Cuál es la ventaja de analizar cada caso? Si examinamos el peor de los casos, sabemos que al menos el algoritmo se desempeñará de esa forma.
  • 33. Página 32 En cambio, cuando un algoritmo se ejecuta muchas veces en muchos tipos de entrada, estamos interesados en el comportamiento promedio o típico. Desafortunadamente, esto supone que sabemos cómo están distribuidos los datos. Si conocemos la distribución de los datos, podemos sacar provecho de esto, para un mejor análisis y diseño del algoritmo. Por otra parte, sino conocemos la distribución, entonces lo mejor es considerar el peor de los casos. Tipos de análisis: o Peor caso: indica el mayor tiempo obtenido, teniendo en consideración todas las entradas pos ibles. o Mejor caso: indica el menor tiempo obtenido, teniendo en consideración todas las entradas posibles. o Media: indica el tiempo medio obtenido, considerando todas las entradas posibles. Como no se puede analizar el comportamiento sobre todas las entradas posibles, va a existir para cada problema particular un análisis en él: - peor caso - mejor caso - caso promedio (o medio) El caso promedio es la medida más realista de la performance, pero es más difícil de calcular pues establece que todas las entradas son igualmente probables, lo cual puede ser cierto o no. Trabajaremos específicamente con el peor caso.
  • 34. Página 33 Ejemplo Sea A una lista de n elementos A1, A2 , A3, ... , An. Ordenar significa permutar estos elementos de tal forma que los mismos queden de acuerdo con un orden preestablecido. Ascendente A1<=A2 <=A3 ..........<=An Descendente A1 >=A2 >=........>=An Caso peor: Que el vector esté ordenado en sentido inverso. Caso mejor: Que el vector esté ordenado. Caso medio: Cuando el vector esté desordenado aleatoriamente.
  • 35. Página 34 Capítulo 4 Análisis de Algoritmos 4.1 Introducción Como hemos visto, existen muchos enfoques para resolver un problema. ¿Cómo escogemos entre ellos? Generalmente hay dos metas en el diseño de programas de cómputo: • El diseño de un algoritmo que sea fácil de entender, codificar y depurar (Ingeniería de Software). • El diseño de un algoritmo que haga uso eficiente de los recursos de la computadora (Análisis y Diseño de algoritmos). El análisis de algoritmos nos permite medir la dificultad inherente de un problema y evaluar la eficiencia de un algoritmo. 4.2 Tiempos de Ejecución Una medida que suele ser útil conocer es el tiempo de ejecución de un algoritmo en función de N, lo que denominaremos T(N). Esta función se puede medir físicamente (ejecutando el programa, reloj en mano), o calcularse sobre el código contando instrucciones a ejecutar y multiplicando por el tiempo requerido por cada instrucción. Así, un trozo sencillo de programa como: S1; FOR i:= 1 TO N DO S2 END; requiere: T(N):= t1 + t2*N siendo t1 el tiempo que lleve ejecutar la serie "S1" de sentencias, y t2 el que lleve la serie "S2". Prácticamente todos los programas reales incluyen alguna sentencia condicional, haciendo que las sentencias efectivamente ejecutadas dependan de los datos concretos que se le presenten. Esto hace que más que un valor T(N) debamos hablar de un rango de valores: Tmin(N) <= T(N) <= Tmax(N)
  • 36. Página 35 los extremos son habitualmente conocidos como "caso peor" y "caso mejor". Entre ambos se hallará algún "caso promedio" o más frecuente. Cualquier fórmula T(N) incluye referencias al parámetro N y a una serie de constantes "Ti" que dependen de factores externos al algoritmo como pueden ser la calidad del código generado por el compilador y la velocidad de ejecución de instrucciones del computador que lo ejecuta. Dado que es fácil cambiar de compilador y que la potencia de los computadores crece a un ritmo vertiginoso (en la actualidad, se duplica anualmente), intentaremos analizar los algoritmos con algún nivel de independencia de estos factores; es decir, buscaremos estimaciones generales ampliamente válidas. No se puede medir el tiempo en segundos porque no existe un computador estándar de referencia, en su lugar medimos el número de operaciones básicas o elementales. Las operaciones básicas son las que realiza el computador en tiempo acotado por una constante, por ejemplo: • Operaciones aritméticas básicas • Asignaciones de tipos predefinidos • Saltos (llamadas a funciones, procedimientos y retorno) • Comparaciones lógicas • Acceso a estructuras indexadas básicas (vectores y matrices) Es posible realizar el estudio de la complejidad de un algoritmo sólo en base a un conjunto reducido de sentencias, por ejemplo, las que más influyen en el tiempo de ejecución. Para medir el tiempo de ejecución de un algoritmo existen varios métodos. Veamos algunos de ellos: a) Benchmarking La técnica de benchmark considera una colección de entradas típicas representativas de una carga de trabajo para un programa. b) Profiling Consiste en asociar a cada instrucción de un programa un número que representa la fracción del tiempo total tomada para ejecutar esa instrucción particular. Una de las técnicas más conocidas (e informal) es la Regla 90-10, que afirma que el 90% del tiempo de ejecución se invierte en el 10% del código.
  • 37. Página 36 c) Análisis Consiste en agrupar las entradas de acuerdo a su tamaño, y estimar el tiempo de ejecución del programa en entradas de ese tamaño, T(n). Esta es la técnica que se estudiará en el curso. De este modo, el tiempo de ejecución puede ser definido como una función de la entrada. Denotaremos T(n) como el tiempo de ejecución de un algoritmo para una entrada de tamaño n. 4.3 Concepto de Complejidad La complejidad (o costo) de un algoritmo es una medida de la cantidad de recursos (tiempo, memoria) que el algoritmo necesita. La complejidad de un algoritmo se expresa en función del tamaño (o talla) del problema. La función de complejidad tiene como variable independiente el tamaño del problema y sirve para medir la complejidad (espacial o temporal). Mide el tiempo/espacio relativo en función del tamaño del problema. El comportamiento de la función determina la eficiencia. No es única para un algoritmo: depende de los datos. Para un mismo tamaño del problema, las distintas presentaciones iniciales de los datos dan lugar a distintas funciones de complejidad. Es el caso de una ordenación si los datos están todos inicialmente desordenados, parcialmente ordenados o en orden inverso. Ejemplo: f(n)= 3n2+2n+1 , en donde n es el tamaño del problema y expresa el tiempo en unidades de tiempo. ¿Una computadora más rápida o un algoritmo más rápido? Si compramos una computadora diez veces más rápida, ¿en qué tiempo podremos ahora ejecutar un algoritmo? La respuesta depende del tamaño de la entrada de datos, así como de la razón de crecimiento del algoritmo. Si la razón de crecimiento es lineal (es decir, T(n)=cn) entonces por ejemplo, 100.000 números serán procesados en la nueva máquina en el mismo tiempo que 10.000 números en la antigua computadora. ¿De qué tamaño (valor de n) es el problema que podemos resolver con una computadora X veces más rápida (en un intervalo de tiempo fijo)? Por ejemplo, supongamos que una computadora resuelve un problema de tamaño n en una hora. Ahora supongamos que tenemos una computadora
  • 38. Página 37 10 veces más rápida, ¿de qué tamaño es el problema que podemos resolver? f(n) n n´ cambio n´/n 10n 1000 10000 n´=10n 10 20n 500 5000 n´=10n 10 5n log n 250 1842 √(10)n <n´<10n 7.37 2n2 70 223 n´=√(10)n 3.16 2n 13 16 n´=n+3 ---- En la tabla de arriba, f(n) es la razón de crecimientode un algoritmo. Supongamos que tenemos una computadora que puede ejecutar 10.000 operaciones básicas en una hora. La segunda columna muestra el máximo valor de n que puede ejecutarse con 10.000 operaciones básicas en una hora. Es decir f(n)=”total de operaciones básicas en un intervalo de tiempo”. Por ejemplo, f(n)=10.000 operaciones básicas por hora. Si suponemos que tenemos una computadora 10 veces más rápida, entonces podremos ejecutar 100.000 operaciones básicas en una hora. Por lo cual f(n’)=100.000 operaciones básicas por hora. Ejercicio: Comentar sobre la razón n´/n según el incremento de velocidad de la computadora y la razón de crecimiento del algoritmo en cuestión. Nota: los factores constantes nunca afectan la mejora relativa obtenida por una computadora más rápida. 4.4 Órdenes de Complejidad Se dice que O(f(n)) define un "orden de complejidad". Escogeremos como representante de este orden a la función f(n) más sencilla del mismo. Así tendremos: O(1) orden constante O(log n) orden logarítmico O(n) orden lineal O(n2 ) orden cuadrático O(na) orden polinomial (a > 2) O(an) orden exponencial (a > 2) O(n!) orden factorial Es más, se puede identificar una jerarquía de órdenes de complejidad que coincide con el orden de la tabla anterior; jerarquía en el sentido de que cada orden de complejidad superior tiene a los inferiores como
  • 39. Página 38 subconjuntos. Si un algoritmo A se puede demostrar de un cierto orden O1 , es cierto que también pertenece a todos los órdenes superiores (la relación de orden cota superior es transitiva); pero en la práctica lo útil es encontrar la "menor cota superior", es decir el menor orden de complejidad que lo cubra. Antes de realizar un programa conviene elegir un buen algoritmo, donde por bueno entendemos que utilice pocos recursos, siendo usualmente los más importantes el tiempo que lleve ejecutarse y la cantidad de espacio en memoria que requiera. Es engañoso pensar que todos los algoritmos son "más o menos iguales" y confiar en nuestra habilidad como programadores para convertir un mal algoritmo en un producto eficaz. Es asimismo engañoso confiar en la creciente potencia de las máquinas y el abaratamiento de las mismas como remedio de todos los problemas que puedan aparecer. Un ejemplo de algunas de las funciones más comunes en análisis de algoritmos son: La mejor técnica para diferenciar la eficiencia de los algoritmos es el estudio de los órdenes de complejidad. El orden de complejidad se expresa generalmente en términos de la cantidad de datos procesados por el programa, denominada n, que puede ser el tamaño dado o estimado. En el análisis de algoritmos se considera usualmente el caso peor, si bien a veces conviene analizar igualmente el caso mejor y hacer alguna estimación sobre un caso promedio. Para independizarse de factores coyunturales, tales como el lenguaje de programación, la habilidad del codificador, la máquina de soporte, etc. se suele trabajar con un cálculo asintótico que indica cómo se comporta el algoritmo para datos muy grandes y salvo algún coeficiente multiplicativo. Para problemas pequeños es cierto que casi todos los algoritmos son "más o menos iguales", primando otros aspectos como esfuerzo de codificación, legibilidad, etc. Los órdenes de complejidad sólo son importantes para grandes problemas.
  • 40. Página 39 4.5 Notación Asintótica El interés principal del análisis de algoritmos radica en saber cómo crece el tiempo de ejecución, cuando el tamaño de la entrada crece. Esto es la eficiencia asintóticadel algoritmo. Se denomina “asintótica” porque analiza el comportamiento de las funciones en el límite, es decir, su tasa de crecimiento. La notación asintótica se describe por medio de una función cuyo dominio es los números naturales (Ν ) estimado a partir de tiempo de ejecución o de espacio de memoria de algoritmos en base a la longitud de la entrada. Se consideran las funciones asintóticamente no negativas. La notación asintótica captura el comportamiento de la función para valores grandes de N. Las notaciones no son dependientes de los tres casos anteriormente vistos, es por eso que una notación que determine el peor caso puede estar presente en una o en todas las situaciones. 4.5.1 La O Mayúscula La notación O se utiliza para comparar funciones. Resulta particularmente útil cuando se quiere analizar la complejidad de un algoritmo, en otras palabras, la cantidad de tiempo que le toma a un computador ejecutar un programa. Definición: Sean f y g funciones con dominio en R ≤ 0 o N es imagen en R. Si existen constantes C y k tales que: ∀ x > k, | f (x) | ≤ C | g (x) | es decir, que para x > k, f es menor o igual a un multiplo de g, decimos que: f (x) = O ( g (x) ) La definición formal es: f (x) = O ( g (x) ) ∃ k , N | ∀ x > N, | f (x) | ≤ k| g (x) | ¿Qué quiere decir todo esto? Básicamente, que una función es siempre menor que otra función (por ejemplo, el tiempo en ejecutar tu programa es menor que x2 ) si no tenemos en cuenta los factores constantes (eso es lo que significa la k) y si no tenemos en cuenta los valores pequeños (eso es lo que significa la N).
  • 41. Página 40 ¿Por qué no tenemos en cuenta los valores pequeños de N? Porqué para entradas pequeñas, el tiempo que tarda el programa no es significativo y casi siempre el algoritmo será suficientemente rápido para lo que queremos. Así 3N3 + 5N2 – 9 = O (N3) no significa que existe una función O(N3) que es igual a 3N 3 + 5N 2 – 9. Debe leerse como: “3N 3+5N 2 –9 es O-Grande de N3” que significa: “3N 3+5N 2 –9 está asintóticamente dominada por N3” La notación puede resultar un poco confusa. Veamos algunos ejemplos. Ejemplo 1: Muestre que 3N 3 + 5N 2 – 9 = O (N 3). De nuestra experiencia anterior pareciera tener sentido que C = 5. Encontremos k tal que: 3N 3 + 5N 2 – 9 ≤ 5N 3 for N > k : 1. Agrupamos: 5N2 = 2N 3 + 9 2. Cuál k asegura que 5N2 = N3 para N > k? 3. k = 5 4. Así que para N > 5, 5N2 = N3 = 2N3 + 9. 5. C = 5, k = 5 (no es único!) Ejemplo 2: Muestre que N 4≠ O (3N3 + 5N2 – 9) . Hay que mostrar que no existen C y k tales que para N > k, C* (3N3 + 5N2 – 9) ≥ N4 es siempre cierto (usamos límites, recordando el curso de Cálculo). lim x4 / C(3x3 + 5 x2 – 9) = lim x / C(3 + 5/x – 9/x3) x à ∞ x à ∞ = lim x / C(3 + 0 – 0) = (1/3C) . lim x = ∞ x à ∞ x à ∞
  • 42. Página 41 Así que sin importar cual sea el C que se elija, N4 siempre alcanzará y rebasará C* (3N3 + 5N2 – 9). Podemos considerarnos afortunados porque sabemos calcular límites! Límites serán útiles para probar relaciones (como veremos en el próximo teorema). Lema: Si el límite cuando x à ∞ del cociente |f (x)/g (x)| existe (es finito) entonces f (x) = O ( g (x) ). Ejemplo 3: 3N3 + 5N2 – 9 = O (N3 ). Calculamos: lim x3 / (3x3 + 5 x2 – 9) = lim 1 /(3 + 5/x – 9/x3) = 1 /3 x à ∞ x à ∞ Listo! 4.5.2 La o Minúscula La cota superior asintótica dada por la notación O puede o no ser ajustada asintóticamente. La cota 2n² = O(n²) es ajustada asintóticamente, pero la cota 2n = O(n²) no lo es. Utilizaremos la notación o para denotar una cota superior que no es ajustada asintóticamente. Definimos formalmente o(g(n)) ("o pequeña") como el conjunto: o(g(n)) = {f(n): para cualquier constante positiva c > 0, existe una constante n0 > 0 tal que: 0 ≤ f(n) ≤ cg(n) para toda n ≥ n0 }. Por ejemplo, 2n = o(n²), pero 2n² no pertenece a o(n²). Las notaciones de O y o son similares. La diferencia principal es, que en f(n) = O(g(n)), la cota 0 ≤ f(n) ≤ cg(n) se cumple para alguna constante c > 0, pero en f(n) = o(g(n)), la cota 0 ≤ f(n) ≤ cg(n) se cumple para todas las constantes c> 0. Intuitivamente en la notación o, la función f(n) se vuelve insignificante con respecto a g(n) a medida que n se acerca a infinito, es decir: lim (f(n)/g(n)) = 0. x à ∞
  • 43. Página 42 4.5.3 Diferencia entre O y o Para o la desigualdad se mantiene para todas las constantes positivas, mientras que para O la desigualdad se mantiene sólo para algunas constantes positivas. 4.5.4 Las Notaciones Ω y Θ Ω Es el reverso de O. f (x ) = Ω(g (x )) àß g (x ) = O (f (x )) Ω Grande dice que asintóticamente f (x ) domina a g (x ). Θ Grande dice que ambas funciones se dominan mutuamente, en otras palabras, son asintóticamente equivalentes. f (x ) = Θ(g (x )) àß f (x ) = O (g (x ))∧ f (x ) =Ω(g (x )) f = Θ(g): “f es de ordeng ” 4.5.5 Propiedades y Cotas más Usuales Propiedades de las notaciones asintóticas Relaciones de orden La notación asintótica nos permite definir relaciones de orden entre el conjunto de las funciones sobre los enteros positivos: • f ∈ O (g (x )) ↔ f ≤ g (se dice que f es asintóticamente menor o igual que g) • f ∈ o (g (x )) ↔ f < g • f ∈ Θ (g (x )) ↔ f = g • f ∈ Ω (g (x )) ↔ f ≥ g • f ∈ ω (g (x )) ↔ f > g
  • 44. Página 43 Relaciones entre cotas 1. f(n) ∈ O(f (n)) 2. f(n) ∈ O(f (n)) ∧ g(n) ∈ O(f (n )) ⇒ f(n) ∈ O(h (n )) 3. f(n) ∈ O(g (n)) ⇒ g(n) ∈ Ω(h(n )) 4. lim f(n)/g(n) = 0 ⇒ O(f (n)) ⊂ O(g (n)) n à ∞ 5. O(f (n)) = O(g (n)) ⇔ f(n) ∈ O(g (n)) ∧ g(n) ∈ O(f (n )) 6. O(f (n)) ⊂ O(g (n)) ⇔ f(n) ∈ O(g (n))∧ g(n) ∉ O(f (n )) 7. Ω(f(n )) ⊂ Ω(g (n)) ⇔ f(n) ∈ Ω(g (n))∧ g(n) ∉ Ω(f (n )) Relaciones de inclusión Son muy útiles a la hora de comparar funciones de coste en el caso asintótico. ∀ x, y, a, ε ∈ R >0 1. loga n ∈ O(logbn) 2. O(loga x n) ⊂ O(logax+δ n) 3. O(loga x n) ⊂ O(n) 4. O(nx) ⊂ O(nx+δ ) 5. O(nx logay n) ⊂ O(nx+δ ) 6. O(nx) ⊂ O(2n )
  • 45. Página 44 Propiedades de clausura El conjunto de funciones del orden de f(n) es cerrado respecto de la suma y la multiplicación de funciones: 1. f1(n) ∈ O(g1(n)) ∧ f2(n) ∈ O(g2(n)) ⇒ f1(n) + f2(n) ∈ O(g1(n) + g2(n)) 2. f1(n) ∈ O(g1(n)) ∧ f2(n) ∈ O(g2(n)) ⇒ f1(n) * f2(n) ∈ O(g1(n) * g2(n)) 3. f1(n) ∈ O(g1(n)) ∧ f2(n) ∈ O(g2(n)) ⇒ f1(n)+f2(n) ∈ O(max(g1(n), g2(n)) como consecuencia es que los polinomios de grado k en n son exactamente del orden de nk aknk + … + a1n + a0 ∈ Θ(nk) Cotas Asintóticas Más Usuales 1. c ∈ Θ(1) ∀ c ∈ R ≥ 0 n 2. ∑ i = (n/2)(n+1) ∈ Θ(n2 ) i=1 n 3. ∑ i2 = (n/3)(n+1) (n+1/2) ∈ Θ(n3) i=1 n 4. ∑ ik ∈ Θ(nk+1) ∀ k ∈ N i=1 n 5. ∑ log i ∈ Θ(n log n) i=1 n 6. ∑ (n- i)k ∈ Θ(nk+1) ) ∀ k ∈ N i=1
  • 46. Página 45 4.6 Ecuaciones de Recurrencias 4.6.1 Introducción Como ya hemos indicado, el análisis del tiempo de ejecución de un programa recursivo vendrá en función del tiempo requerido por la(s) llamada(s) recursiva(s) que aparezcan en él. De la misma manera que la verificación de programas recursivos requiere de razonar por inducción, para tratar apropiadamente estas llamadas, el cálculo de su eficiencia requiere un concepto análogo: el de ecuación de recurrencia. Demostraciones por inducción y ecuaciones de recurrencia son por tanto los conceptos básicos para tratar programas recursivos. Supongamos que se está analizando el coste de un algoritmo recursivo, intentando calcular una función que indique el uso de recursos, por ejemplo el tiempo, en términos del tamaño de los datos; denominémosla T(n) para datos de tamaño n. Nos encontramos con que este coste se define a su vez en función del coste de las llamadas recursivas, es decir, de T(m) para otros tamaños m (usualmente menores que n). Esta manera de expresar el coste T en función de sí misma es lo que denominaremos una ecuación recurrente y su resolución, es decir, la obtención para T de una fórmula cerrada (independiente de T) puede ser dificultosa. 4.6.2 Resolución de Recurrencias Las ecuaciones de recurrencia son utilizadas para determinar cotas asintóticas en algoritmos que presentan recursividad. Veremos dos técnicas básicas y una auxiliar que se aplican a diferentes clases de recurrencias: • Método del teorema maestro • Método de la ecuación característica • Cambio de variable No analizaremos su demostración formal, sólo consideraremos su aplicación para las recurrencias generadas a partir del análisis de algoritmos. 4.6.3 Método del Teorema Maestro Se aplica en casos como: 5 si n=0 T(n) = 9T(n/3) + n si n ≠ 0
  • 47. Página 46 Teorema: Sean a = 1, b > 1 constantes, f(n) una función y T(n) una recurrencia definida sobre los enteros no negativos de la forma T(n) = aT(n/b) + f(n), donde n/b puede interpretarse como n/b o n/b. Entonces valen: 1. Si f(n) ∈ O(mlogba - ε ) para algún ε > 0 entonces T(n) ∈ Θ(nlogba). 2. Si f(n) ∈ Θ(nlogba) entonces T(n) ∈ Θ(nlogba lgn). 3. Si f(n) ∈ Ω(nlogba + ε ) para algún ε > 0, y satisface af(n/b) ≤ cf(n) para alguna constante c < 1, entonces T(n) ∈ Θ(f(n)). Ejemplos: 1. Si T(n)=9T(n/3)+n entonces a=9, b=3, se aplica el caso 1 con ε=1 y T(n) ∈ Θ(n2 ). 2. Si T(n)=T(2n/3)+1 entonces a=1, b=3/2, se aplica el caso 2 y T(n) = Θ(lgn). 3. Si T(n)=3T(n/4)+nlgn entonces a=3, b=4, f(n) ∈ Ω(nlog43 + 0,2 ) y 3(n/4) lg(n/4) ≤ 3/4n lgn, por lo que se aplica el caso 3 y T(n) ∈ Θ(n lgn) 4.6.4 Método de la Ecuación Característica Se aplica a ciertas recurrencias lineales con coeficientes constantes como: 5 si n=0 T(n) = 10 si n=1 5T(n-1) + 8T(n-2)+2n si n > 0 En general, para recurrencias de la forma: T(n) = a1T(n-1) + a2T(n-2) + … + akT(n-k) + bnp(n) donde ai, 1 ≤ i ≤ k, b son constantes y p(n) es un polinomio en n de grado s. Ejemplos: 1. En T(n)=2t(n-1)+3n, a1 =2, b=3, p(n)=1, s=0. 2. En T(n)=t(n-1)+ t(n-2)+n, a1=1, a2 =1, b=1, p(n)=n, s=1. En general, para: T(n) = a1T(n-1) + a2T(n-2) + … + akT(n-k) + bnp(n)
  • 48. Página 47 ♦ Paso 1: Encontrar las raíces no nulas de la ecuación característica: (xk - a1xk-1 - a2xk-2 - … - ak)(x-b)s+1 = 0 Raíces: ri, 1 ≤ i ≤ l ≤ k, cada una con multiplicidad mi. ♦ Paso 2: Las soluciones son de la forma de combinaciones lineales de estas raíces de acuerdo a su multiplicidad. T(n) = ----- ♦ Paso 3: Se encuentran valores para las constantes cij, tal que: 1 ≤ i ≤ l, 0 ≤ j ≤ mi - 1 y di, 0 ≤ i ≤ s – 1 según la recurrencia original y las condiciones iniciales (valores de la recurrencia para n=0,1, …). Ejemplo: Resolver la ecuación de recurrencia siguiente: 0 si n=0 T(n) = 2T(n-1) + 1 si n > 0 donde b=1 y p(n)=1 de grado 0. La ecuación característica (x-2)(x-1)0+1 = 0, con raíces 2 y 1 de multiplicidad 1. La solución general es entonces de la forma: T(n)=c112n +c211n. A partir de las condiciones iniciales se encuentra el siguiente sistema de ecuaciones que sirve para hallar c11 yc21: c11 +c21 = 0 de n = 0 2c11 +c21 = 1 de n = 1 de donde c11 = 1 y c21 =-1. La solución es entonces: T(n) = 2n –1.
  • 49. Página 48 4.6.5 Cambio de Variable Dada la siguiente ecuación de recurrencia: a si n=1 T(n) = 2T(n/2) + nlog2 n si n = 2k No se puede aplicar el teorema maestro ni la ecuación característica. Se define una nueva recurrencia S(i) = T(2i), con el objetivo de llevarla a una forma en la que se pueda resolver siguiendo algún método anterior. Entonces el caso general queda: S(i) = T(2i) = 2T(2i /2) + 2ii = 2T(2i-1 ) + i2i = 2S(i-1) + i2i Con b=2 y p(i) = i de grado 1. La ecuación característica de esta recurrencia es: (x - 2)(x - 2)i+1 = 0, con raíz 2 de grado 3. La solución es entonces S(i) = c112i + c12 i2i + c13i22i, con lo que volviendo a la variable original queda: T(n) - 2T(n/2) = nlog2 n = (c12 - c13)n + 2c13n(log2n). Se pueden obtener los valores de las constantes sustituyendo esta solución en la recurrencia original: T(n) = c11n + c12(log2n)n + c13(log2n)2n. de donde c12 =c13 y 2c12 = 1. Por tanto T(n) ∈ Θ(nlog2 n | n es potencia de2). Si se puede probar que T(n) es eventualmente no decreciente, por la regla de las funciones de crecimiento suave se puede extender el resultado a todos los n (dado que nlog2n es de crecimiento suave). En este caso T(n) ∈ Θ(nlog2n).
  • 50. Página 49 4.7 Ejemplos y Ejercicios Ejemplos de cálculo del tiempo de ejecución de un programa Veamos el análisis de un simple enunciado de asignación a una variable entera: a = b; Como el enunciado de asignación toma tiempo constante, está en Θ(1). Consideremos un simple ciclo “for”: sum=0; for (i=1; i<=n; i++) sum += n; La primera línea es Θ(1). El ciclo “for” es repetido n veces. La tercera línea toma un tiempo constante también, el costo total por ejecutar las dos líneas que forman el ciclo “for” es Θ(n). El costo por el entero fragmento de código es también Θ(n). Analicemos un fragmento de código con varios ciclos “for”, algunos de los cuales están anidados. sum=0; for (j=1; j<=n; j++) for (i=1; i<=j; i++) sum++; for (k=1; k<=n; k++) A[k]= k-1; Este código tiene tres partes: una asignación, y dos ciclos. La asignación toma tiempo constante, llamémosla c1. El segundo ciclo es similar al ejemplo anterior y toma c2n= Θ(n). Analicemos ahora el primer ciclo, que es un doble ciclo anidado. En este caso trabajemos de adentro hacia fuera. La expresión sum++ requiere tiempo constante, llamemosle c3. Como el ciclo interno es ejecutado j veces, tiene un costo de c3j. El ciclo exterior es ejecutado n veces, pero cada vez el costo del ciclo interior es diferente. El costo total del ciclo es c3 veces la suma de los números 1 a n, es decir Σni=1 j = n(n+1)/2, que es Θ(n2). Por tanto, Θ(c1 +c2n+c3n2) es simplemente Θ(n2 ).
  • 51. Página 50 Comparemos el análisis asintótico de los siguientes fragmentos de código: sum1=0; for(i=1; i<=n; i++) for(j=1; j<=n; j++) sum1++; sum2=0; for(i=1; i<=n; i++) for(j=1; j<=i; j++) sum2++; El primer fragmento de ejecuta el enunciado sum1++, precisamente n2 veces. Por otra parte, el segundo fragmento de código tiene un costo aproximado de ½ n2 . Así ambos códigos tienen un costo de Θ(n2). Ejemplo, no todos los ciclos anidados son Θ(n2): sum1=0; for(k=1; k<=n; k*=2) for(j=1; j<=n; j++) sum1++; El costo es Θ(n log n).
  • 52. Página 51 Capítulo 5 Estrategias de Diseño de Algoritmos 5.1 Introducción A través de los años, los científicos de la computación han identificado diversas técnicas generales que a menudo producen algoritmos eficientes para la resolución de muchas clases de problemas. Este capítulo presenta algunas de las técnicas más importantes como son: recursión, dividir para conquistar, técnicas ávidas, el método de retroceso y programación dinámica. Se debe, sin embargo, destacar que hay algunos problemas, como los NP completos, para los cuales ni éstas ni otras técnicas conocidas producirán soluciones eficientes. Cuando se encuentra algún problema de este tipo, suele ser útil determinar si las entradas al problema tienen características especiales que se puedan explotar en la búsqueda de una solución, o si puede usarse alguna solución aproximada sencilla, en vez de la solución exacta, difícil de calcular. 5.2 Recursión La recursividad es una técnica fundamental en el diseño de algoritmos eficientes, que está basada en la solución de versiones más pequeñas del problema, para obtener la solución general del mismo. Una instancia del problema se soluciona según la solución de una o más instancias diferentes y más pequeñas que ella. Es una herramienta poderosa que sirve para resolver cierto tipo de problemas reduciendo la complejidad y ocultando los detalles del problema. Esta herramienta consiste en que una función o procedimiento se llama a sí mismo. Una gran cantidad de algoritmos pueden ser descritos con mayor claridad en términos de recursividad, típicamente el resultado será que sus programas serán más pequeños. La recursividad es una alternativa a la iteración o repetición, y aunque en tiempo de computadora y en ocupación en memoria es la solución recursiva menos eficiente que la solución iterativa, existen numerosas situaciones en las que la recursividad es una solución simple y natural a un problema que en caso contrario ser difícil de resolver. Por esta razón se puede decir que la
  • 53. Página 52 recursividad es una herramienta potente y útil en la resolución de problemas que tengan naturaleza recursiva y, por ende, en la programación. Existen numerosas definiciones de recursividad, algunas de las más importantes o sencillas son éstas: • Un objeto es recursivo si figura en su propia definición. • Una definición recursiva es aquella en la que el objeto que se define forma parte de la definición (recuerde la regla gramatical: lo definido nunca debe formar parte de la definición) La característica importante de la recursividad es que siempre existe un medio de salir de la definición, mediante la cual se termina el proceso recursivo. Ventajas: • Puede resolver problemas complejos. • Solución más natural. Desventajas: • Se puede llegar a un ciclo infinito. • Versión no recursiva más difícil de desarrollar. • Para la gente sin experiencia es difícil de programar. Tipos de Recursividad • Directa o simple: un subprograma se llama a si mismo una o más veces directamente.
  • 54. Página 53 • Indirecta o mutua: un subprograma A llama a otro subprograma B y éste a su vez llama al subprograma A. a) Propiedades para un Procedimiento Recursivo • Debe de existir cierto criterio (criterio base) en donde el procedimiento no se llama a sí mismo. Debe existir al menos una solución no recursiva. • En cada llamada se debe de acercar al criterio base (reducir rango). El problema debe reducirse en tamaño, expresando el nuevo problema en términos del propio problema, pero más pequeño. Los algoritmos de divide y vencerás pueden ser procedimientos recursivos. b) Propiedades para una Función Recursiva • Debe de haber ciertos argumentos, llamados valores base para los que la función no se refiera a sí misma. • Cada vez que la función se refiera así misma el argumento de la función debe de acercarse más al valor base. Ejemplos: Factorial n! = 1 * 2 * 3 ... * (n-2) * (n-1) * n 0! = 1 1! = 1 2! = 1 * 2 3! = 1 * 2 * 3 ... n! = 1 * 2 * 3 ... * (n-2) * (n-1) * n ⇒ n! = n* (n-1)!
  • 55. Página 54 si n = 0 entonces n! = 1 si n > 0 entonces n! = n * (n-1)! Function factorial(n:integer):longint: begin if ( n = 0 ) then factorial:=1 else factorial:= n * factorial(n-1); end; Rastreo de ejecución: Si n = 6 Nivel 1) Factorial(6)= 6 * factorial(5) = 720 2) Factorial(5)=5 * factorial(4) = 120 3) Factorial(4)=4 * factorial(3) = 24 4) Factorial(3)=3 * factorial(2) = 6 5) Factorial(2)=2 * factorial(1) = 2 6) Factorial(1)=1 * factorial(0) = 1 7) Factorial(0)=1 La profundidad de un procedimiento recursivo es el número de veces que se llama a sí mismo. Serie de Fibonacci 0, 1, 1, 2, 3, 5, 8, ... F0 = 0 F1 = 1 F2 = F1 + F0 = 1 F3 = F2 + F1 = 2 F4 = F3 + F2 = 3 ... Fn = Fn-1 + Fn-2 si n= 0, 1 Fn = n si n >1 Fn = Fn-1 + Fn-2
  • 56. Página 55 Procedure fibo(var fib:longint; n:integer); var fibA, fibB : integer; begin if ( n = 0) or ( n = 1) then fib:=n else begin fibo(fibA,n-1); fibo(fibB,n-2); fib:=fibA + FibB; end; end; function fibo ( n:integer) : integer; begin if ( n = 0) or ( n = 1) then fibo:=n else fibo:=fibo(n-1) + fibo(n-2); end; end; No todos los ambientes de programación proveen las facilidades necesarias para la recursión y adicionalmente, a veces su uso es una fuente de ineficiencia inaceptable. Por lo cual se prefiere eliminar la recursión. Para ello, se sustituye la llamada recursiva por un lazo, donde se incluyen algunas asignaciones para recolocar los parámetros dirigidos a la función. Remover la recursión es complicado cuando existe más de una llamada recursiva, pero una vez hecha ésta, la versión del algoritmo es siempre más eficiente. 5.3 Dividir para Conquistar Muchos algoritmos útiles tienen una estructura recursiva, de modo que para resolver un problema se llaman recursivamente a sí mismos una o más veces para solucionar subproblemas muy similares. Esta estructura obedece a una estrategia dividir-y-conquistar, en que se ejecuta tres pasos en cada nivel de la recursión: • Dividir. Dividen el problema en varios subproblemas similares al problema original pero de menor tamaño; • Conquistar. Resuelven recursivamente los subproblemas si los tamaños de los subproblemas son suficientemente pequeños, entonces resuelven los subproblemas de manera directa; y luego,
  • 57. Página 56 • Combinar. Combinan estas soluciones para crear una solución al problema original. La técnica Dividir para Conquistar (o Divide y Vencerás) consiste en descomponer el caso que hay que resolver en subcasos más pequeños, resolver independientemente los subcasos y por último combinar las soluciones de los subcasos para obtener la solución del caso original. Caso General Consideremos un problema arbitrario, y sea A un algoritmo sencillo capaz de resolver el problema. A debe ser eficiente para casos pequeños y lo denominamos subalgoritmo básico. El caso general de los algoritmos de Divide y Vencerás (DV) es como sigue: función DV(x) { si x es suficientemente pequeño o sencillo entonces devolver A(x) descomponer x en casos más pequeños x1, x2, x3 , ... , xl para i ← 1 hasta l hacer yi ← DV(xi) recombinar los yi para obtener una solución y de x devolver y } El número de subejemplares l suele ser pequeño e independiente del caso particular que haya que resolverse. Para aplicar la estrategia Divide y Vencerás es necesario que se cumplan tres condiciones: • La decisión de utilizar el subalgoritmo básico en lugar de hacer llamadas recursivas debe tomarse cuidadosamente. • Tiene que ser posible descomponer el caso en subcasos y recomponer las soluciones parciales de forma eficiente. • Los subcasos deben ser en lo posible aproximadamente del mismo tamaño. En la mayoría de los algoritmos de Divide y Vencerás el tamaño de los l subcasos es aproximadamente m/b, para alguna constante b, en donde m es el tamaño del caso (o subcaso) original (cada subproblema es aproximadamente del tamaño 1/b del problema original).
  • 58. Página 57 El análisis de tiempos de ejecución para estos algoritmos es el siguiente: Sea g(n) el tiempo requerido por DV en casos de tamaño n, sin contar el tiempo necesario para llamadas recursivas. El tiempo total t(n) requerido por este algoritmo de Divide y Vencerás es parecido a: t(n) = l t(n/ b) + g(n) para l = 1 y b = 2 siempre que n sea suficientemente grande. Si existe un entero k = 0 tal que: g(n) ∈ Θ (nk), se puede concluir que: T(nk) si l < bk t(n) ∈ T(nk log n) si l = bk T (nlogbl) si l > bk Se deja propuesta la demostración de esta ecuación de recurrencia usando análisis asintótico. 5.4 Programación Dinámica Frecuentemente para resolver un problema complejo se tiende a dividir este en subproblemas más pequeños, resolver estos últimos (recurriendo posiblemente a nuevas subdivisiones) y combinar las soluciones obtenidas para calcular la solución del problema inicial. Puede ocurrir que la división natural del problema conduzca a un gran número de subejemplares idénticos. Si se resuelve cada uno de ellos sin tener en cuenta las posibles repeticiones, resulta un algoritmo ineficiente; en cambio si se resuelve cada ejemplar distinto una sola vez y se conserva el resultado, el algoritmo obtenido es mucho mejor. Esta es la idea de la programación dinámica: no calcular dos veces lo mismo y utilizar normalmente una tabla de resultados que se va rellenando a medida que se resuelven los subejemplares. La programación dinámica es un método ascendente. Se resuelven primero los subejemplares más pequeños y por tanto más simples. Combinando las soluciones se obtienen las soluciones de ejemplares sucesivamente más grandes hasta llegar al ejemplar original.
  • 59. Página 58 Ejemplo: Consideremos el cálculo de números combinatorios. El algoritmo sería: función C(n, k) si k=0 o k=n entonces devolver 1 si no devolver C(n-1, k-1) + C(n-1, k) Ocurre que muchos valores C(i, j), con i < n y j < k se calculan y recalculan varias veces. Un fenómeno similar ocurre con el algoritmo de Fibonacci. La programación dinámica se emplea a menudo para resolver problemas de optimización que satisfacen el principio de optimalidad: en una secuencia óptima de decisiones toda subsecuencia ha de ser también óptima. Ejemplo: Si el camino más corto de Santiago a Copiapó pasa por La Serena, la parte del camino de Santiago a La Serena ha de ser necesariamente el camino mínimo entre estas dos ciudades. Podemos aplicar esta técnica en: • Camino mínimo en un grafo orientado • Árboles de búsqueda óptimos 5.5 Algoritmos Ávidos Los algoritmos ávidos o voraces (Greedy Algorithms) son algoritmos que toman decisiones de corto alcance, basadas en información inmediatamente disponible, sin importar consecuencias futuras. Suelen ser bastante simples y se emplean sobre todo para resolver problemas de optimización, como por ejemplo, encontrar la secuencia óptima para procesar un conjunto de tareas por un computador, hallar el camino mínimo de un grafo, etc. Habitualmente, los elementos que intervienen son: • un conjunto o lista de candidatos (tareas a procesar, vértices del grafo, etc.); • un conjunto de decisiones ya tomadas (candidatos ya escogidos); • una función que determina si un conjunto de candidatos es una solución al problema (aunque no tiene por qué ser la óptima);
  • 60. Página 59 • una función que determina si un conjunto es completable, es decir, si añadiendo a este conjunto nuevos candidatos es posible alcanzar una solución al problema, suponiendo que esta exista; • una función de selección que escoge el candidato aún no seleccionado que es más prometedor; • una función objetivo que da el valor/coste de una solución (tiempo total del proceso, la longitud del camino, etc.) y que es la que se pretende maximizar o minimizar; Para resolver el problema de optimización hay que encontrar un conjunto de candidatos que optimiza la función objetivo. Los algoritmos voraces proceden por pasos. Inicialmente el conjunto de candidatos es vacío. A continuación, en cada paso, se intenta añadir al conjunto el mejor candidato de los aún no escogidos, utilizando la función de selección. Si el conjunto resultante no es completable, se rechaza el candidato y no se le vuelve a considerar en el futuro. En caso contrario, se incorpora al conjunto de candidatos escogidos y permanece siempre en él. Tras cada incorporación se comprueba si el conjunto resultante es una solución del problema. Un algoritmo voraz es correcto si la solución así encontrada es siempre óptima. El esquema genérico del algoritmo voraz es: funcionvoraz(C:conjunto):conjunto { C es el conjunto de todos los candidatos } S <= vacío { S es el conjunto en el que se construye la solución mientras ¬solución(S) y C <> vacío hacer x ← el elemento de C que maximiza seleccionar(x) C ← C {x} si completable(S U {x}) entonces S ← S U {x} si solución(S) entonces devolver S si no devolver no hay solución El nombre voraz proviene de que, en cada paso, el algoritmo escoge el mejor "pedazo" que es capaz de "comer" sin preocuparse del futuro. Nunca deshace una decisión ya tomada: una vez incorporado un candidato a la solución permanece ahí hasta el final; y cada vez que un candidato es rechazado, lo es para siempre.
  • 61. Página 60 Ejemplo: Mínimo número de monedas Se desea pagar una cantidad de dinero a un cliente empleando el menor número posible de monedas. Los elementos del esquema anterior se convierten en: • candidato: conjunto finito de monedas de, por ejemplo, 1, 5, 10 y 25 unidades, con una moneda de cada tipo por lo menos; • solución: conjunto de monedas cuya suma es la cantidad a pagar; • completable: la suma de las monedas escogidas en un momento dado no supera la cantidad a pagar; • función de selección: la moneda de mayor valor en el conjunto de candidatos aún no considerados; • función objetivo: número de monedas utilizadas en la solución. 5.6 Método de Retroceso (backtracking) El Backtracking o vuelta atrás es una técnica de resolución general de problemas mediante una búsqueda sistemática de soluciones. El procedimiento general se basa en la descomposición del proceso de búsqueda en tareas parciales de tanteo de soluciones (trial and error). Las tareas parciales se plantean de forma recursiva al construir gradualmente las soluciones. Para resolver cada tarea, se descompone en varias subtareas y se comprueba si alguna de ellas conduce a la solución del problema. Las subtareas se prueban una a una, y si una subtarea no conduce a la solución se prueba con la siguiente. La descripción natural del proceso se representa por un árbol de búsqueda en el que se muestra como cada tarea se ramifica en subtareas. El árbol de búsqueda suele crecer rápidamente por lo que se buscan herramientas eficientes para descartar algunas ramas de búsqueda produciéndose la poda del árbol. Diversas estrategias heurísticas, frecuentemente dependientes del problema, establecen las reglas para decidir en que orden se tratan las tareas mediante las que se realiza la ramificación del árbol de búsqueda, y qué funciones se utilizan para provocar la poda del árbol. El método de backtracking se ajusta a muchos famosos problemas de la inteligencia artificial que admiten extensiones muy sencillas. Algunos de estos problemas son el de las Torres de Hanoi, el del salto del caballo o el de la colocación de las ocho reinas en el tablero de ajedrez, el problema del laberinto.
  • 62. Página 61 Un caso especialmente importante en optimización combinatoria es el problema de la selección óptima. Se trata del problema de seleccionar una solución por sus componentes, de forma que respetando una serie de restricciones, de lugar a la solución que optimiza una función objetivo que se evalúa al construirla. El árbol de búsqueda permite recorrer todas las soluciones para quedarse con la mejor de entre las que sean factibles. Las estrategias heurísticas orientan la exploración por las ramas más prometedoras y la poda en aquellas que no permiten alcanzar una solución factible o mejorar la mejor solución factible alcanzada hasta el momento. El problema típico es el conocido como problema de la mochila. Se dispone de una mochila en la que se soporta un peso máximo P en la que se desean introducir objetos que le den el máximo valor. Se dispone de una colección de n objetos de los que se conoce su peso y su valor; (pi,vi); i = 1, 2, ..., n. 5.7 Método de Branch and Bound Branch and bound (o también conocido como Ramifica y Poda) es una técnica muy similar a la de Backtracking, pues basa su diseño en el análisis del árbol de búsqueda de soluciones a un problema. Sin embargo, no utiliza la búsqueda en profundidad (depth first), y solamente se aplica en problemas de Optimización. Los algoritmos generados por está técnica son normalmente de orden exponencial o peor en su peor caso, pero su aplicación ante instancias muy grandes, ha demostrado ser eficiente (incluso más que bactracking). Se debe decidir de qué manera se conforma el árbol de búsqueda de soluciones. Sobre el árbol, se aplicará una búsqueda en anchura (breadth- first), pero considerando prioridades en los nodos que se visitan (best- first). El criterio de selección de nodos, se basa en un valor óptimo posible (bound), con el que se toman decisiones para hacer las podas en el árbol. Modo de proceder de los algoritmos Branch and Bound: • Nodo vivo: nodo con posibilidad de ser ramificado, es decir, no se ha realizado una poda. • No se pueden comenzar las podas hasta que no se haya descendido a una hoja del árbol • Se aplicará la poda a los nodos con una cota peor al valor de una solución dada à a los nodos podados a los que se les ha aplicado una poda se les conoce como nodos muertos • Se ramificará hasta que no queden nodos vivos por expandir • Los nodos vivos han de estar almacenados en algún sitio à lista de nodos, de modo que sepamos qué nodo expandir
  • 63. Página 62 Algoritmo General: Funciónramipoda(P:problema): solucion L={P} (lista de nodos vivos) S= ∞± (según se aplique máximo o mínimo) Mientras L ≠ 0 n=nodo de mejor cota en L si solucion(n) si (valor(n) mejor que s) s=valor(n) para todo m ∈ L y Cota(m) peor que S borrar nodo m de L sino añadir a L los hijos de n con sus cotas borrar n de L (tanto si es solución como si ha ramificado) Fin_mientras Devolver S
  • 64. Página 63 Capítulo 6 Algoritmos de Ordenamiento 6.1 Concepto de Ordenamiento DEFINICIÓN. Entrada: Una secuencia de n números <a1, a2 , …, an>, usualmente en la forma de un arreglo de n elementos. Salida: Una permutación <a’1, a’2, …, a’n> de la secuencia de entrada tal que a’1 = a’2 = … = a’n. CONSIDERACIONES. Cada número es normalmente una clave que forma parte de un registro; cada registro contiene además datos satélites que se mueven junto con la clave; si cada registro incluye muchos datos satélites, entonces movemos punteros a los registros (y no los registros). Un método de ordenación se denomina estable si el orden relativo de los elementos no se altera por el proceso de ordenamiento. (Importante cuanto se ordena por varias claves). Hay dos categorías importantes y disjuntas de algoritmos de ordenación: • Ordenación interna: La cantidad de registros es suficientemente pequeña y el proceso puede llevarse a cabo en memoria. • Ordenación externa: Hay demasiados registros para permitir ordenación interna; deben almacenarse en disco. Por ahora nos ocuparemos sólo de ordenación interna. Los algoritmos de ordenación interna se clasifican de acuerdo con la cantidad de trabajo necesaria para ordenar una secuencia de n elementos: ¿Cuántas comparaciones de elementos y cuántos movimientos de elementos de un lugar a otro son necesarios? Empezaremos por los métodos tradicionales (inserción y selección). Son fáciles de entender, pero ineficientes, especialmente para juegos de datos grandes. Luego prestaremos más atención a los más eficientes: heapsort y quicksort.
  • 65. Página 64 6.2 Ordenamiento por Inserción Este es uno de los métodos más sencillos. Consta de tomar uno por uno los elementos de un arreglo y recorrerlo hacia su posición con respecto a los anteriormente ordenados. Así empieza con el segundo elemento y lo ordena con respecto al primero. Luego sigue con el tercero y lo coloca en su posición ordenada con respecto a los dos anteriores, así sucesivamente hasta recorrer todas las posiciones del arreglo. Este es el algoritmo: Sea n el número de elementos en el arreglo A. INSERTION-SORT(A) : {Para cada valor de j, inserta A[j] en la posición que le corresponde en la secuencia ordenada A[1 .. j – 1]} for j ← 2 to n do k ← A[j] i ← j – 1 whilei > 0 ∧ A[i] > k do A[i + 1] ← A[i] i ← i – 1 A[i + 1] ← k Análisis del algoritmo: Número de comparaciones: n(n-1)/2 lo que implica un T(n) = O(n2 ). La ordenación por inserción utiliza aproximadamente n2/4 comparaciones y n2/8 intercambios en el caso medio y dos veces más en el peor de los casos. La ordenación por inserción es lineal para los archivos casi ordenados. 6.3 Ordenamiento por Selección El método de ordenamiento por selección consiste en encontrar el menor de todos los elementos del arreglo e intercambiarlo con el que está en la primera posición. Luego el segundo más pequeño, y así sucesivamente hasta ordenar todo el arreglo. SELECTION-SORT(A) : {Para cada valor de j, selecciona el menor elemento de la secuencia no ordenada A[j .. n] y lo intercambia con A[j]} for j ← 1 to n – 1 do k ← j for i ← j + 1 to n do if A[i] < A[k] then k ← i intercambie A[j] ↔ A[k]