El documento describe el estado actual de varias herramientas para la extracción de metadatos de documentos, incluyendo Libextractor, Exiftool y Metagoofil. Luego describe el desarrollo de FOCA, una herramienta de código abierto para la extracción y análisis de metadatos de documentos encontrados en la web a través de motores de búsqueda como Google. La versión más reciente de FOCA (RC1) incluye nuevas características como soporte para proxy, dominios alternativos, escaneo de rangos IP y exportación de