2. ¿Qué es un decompilador?
Es un programa que realiza la operación
inversa de un compilador: obtener el
código fuente de un programa compilado
3. ¿Por qué decompilar?
● Para arreglar bugs (errores)
● Para encontrar vulnerabilidades
● Para buscar malware
● Para aprender
● Por interoperabilidad
● Para optimizar el código
● Para mejorar el programa
● Por si has perdido el código
4. ¿Es legal?
La licencia de la mayoría de los programas
propietarios prohíben explícitamente la
decompilación, pero en algunos países hay leyes
que la permiten para los siguientes casos:
✔ Para propósitos de interoperabilidad con otro
software o hardware
✔ Para corregir errores en aquellos casos en el que
el propietario no pueda hacerlos
✔ Para saber si se están usando algoritmos
protegidos por patentes
5. ¿Es posible?
● Muchos creemos que de la misma forma que no se puede
obtener una vaca de una hamburguesa, tampoco se puede
obtener el código de un programa binario.
● Si bien es cierto que no todo programa se puede decompilar,
hay casos en los que podemos obtener un código útil.
● La verdad es que la mayoría de los decompiladores actuales sólo
son capaces de usarse en programas preparados y no en el
MundoReal(TM)
6. ¿Es posible?
Ensamblador
Código C Ensamblador
optimizado
;---- i = 10;
void main()
mov si, 10
{
;---- j = 20; ;---- k = i*j + 5;
int i, j, k;
mov di, 20 mov ax, 10
;---- k = i*j + 5; mov bx, 20
i = 10;
mov ax, si mul bx
j = 20;
mov bx, di add ax, 5
mul bx mov [bp+6], ax
k = i*j + 5;
add ax, 5
}
mov [bp+6], ax
8. ¿Cómo funciona?
binario
análisis sintáctico
análisis semántico
generación de código intermedio
generación del grafo del flujo de control
análisis del flujo de datos
análisis del flujo de control
generación de código
código de alto nivel
9. ¿Cómo funciona?
1º Averiguar el compilador
2º Encontrar el main()
3º Definir las funciones
4º Agrupar el código en asignaciones,
condiciones, saltos y llamadas a
funciones.
17. ¿Qué pasa con C/C++?
Los compiladores de Java, .NET y Flash no generan código binario, si
no bytecode, esto es, código para ser ejecutable sobre sus
máquinas virtuales. Por eso estos lenguajes son multiplataforma.
En cambio, los compiladores de C generan código optimizado en
binario para un procesador determinado (x86, AMD64, SPARC...)
De esta manera, es mucho más difícil decompilar programas en C.
La única documentación hoy día que he podido encontrar es una
tesis de Cristina Cifuentes (Universidad de Queensland) dedicada
exclusivamente a la decompilación en C en la arquitectura i386.
Los pocos decompiladores existentes para C no son automáticos, es
decir, necesitan la interacción del usuario y sólo funcionan con
programas pequeños.
19. ¿Cómo evitarlo?
● Ofuscar el código: convertir el programa en otro equivalente por
medio de transformaciones de forma que no se consiga código útil
al decompilar. Por ejemplo:
➔ Que todos los nombres de funciones y
variables carezcan de sentido
➔ Incluir ocasionalmente cálculos y bucles
sin sentido
➔ Esconder números pequeños en
cadenas de texto
➔ Crear métodos grandes, en vez de
utilizar subrutinas
➔ Distribuir los métodos entre las
subclases
● Tamperproofing: es una técnica para ocultar el código del
programa, añadiendo código extra de manera que sea
imposible reobtener el código original al decompilar.
20. Referencias
● Watermarking, Tamper-Proofing, and Obfuscation - Tools for Software Protection
http://www.cs.arizona.edu/~collberg/Research/Publications/CollbergThomborson2000a/index.html
● Program Transformation http://www.program-transformation.org
● Wikipedia http://en.wikipedia.org/wiki/Decompiler
● DebugMode http://www.debugmode.com/dcompile/
● Criptonomicón http://www.iec.csic.es/CRIPTONOMICON/java/ofuscacion.html
● Nolan, Godfrey - Decompiling Java
Imágenes
Tango Icons http://tango.freedesktop.org/ CC by-sa
Gray Cow http://openclipart.org/media/files/mairin/3076 PD