SlideShare uma empresa Scribd logo
1 de 23
UTILIZACIÓN DE LA PLATAFORMA
HADOOP PARA IMPLEMENTAR UN
PROGRAMA DISTRIBUIDO QUE PERMITA
ENCONTRAR LAS PAREDES DE CÉLULAS
DE LA EPIDERMIS DE PLANTAS
MODIFICADAS GENÉTICAMENTE
GUSTAVO IRVING CALI MENA
ERICK ROGGER MORENO QUINDE
AGENDA
 Introducción
 Antecedentes
 El problema
 Objetivos
 Algoritmo de detección de paredes de las células.
 Hadoop (MapReduce)
 Amazon Web Services
 Diseño e Implementación
 Pruebas y Resultados
 Conclusiones y Recomendaciones
ANTECEDENTES (I)
Objeto
transparente
Desfase o
polarización
Interferencia
Ejemplo de Imagen
DIC
 Se tiene un conjunto de
imágenes DIC de las
células de plantas del
tipo Arabidopsis Thaiana
 Existe un algoritmo que
encuentra las paredes
de las células usando
este tipo de imágenes
implementado en
Matlab.
 El procesamiento digital de
imágenes en general es
costoso tanto en tiempo
como en recursos
(hardware).
 Una de las librerías de
mayor acogida actualmente
para procesamiento digital
de imágenes es OpenCV.
 Hadoop fue concebido
originalmente para el
procesamiento de texto.
ANTECEDENTES (II)
EL PROBLEMA
 Se necesita procesar una gran cantidad
de imágenes en el menor tiempo posible.
 Las imágenes capturadas tienen una
resolución de 2560 X 1920 píxeles.
 El algoritmo implementado en Matlab es
lento.
OBJETIVOS
1. Re codificar el algoritmo de Matlab a una
aplicación en C++.
2. Adaptar el código C++ que obedezca el
paradigma MapReduce para poder ser
ejecutado en Hadoop.
OBJETIVOS (II)
3. Adaptar las clases de entrada y salida de
Hadoop para el manejo de imágenes.
4. Realizar la comparación de los tiempos de
procesamiento entre los 2 lenguajes en que
se implementó la solución.
El Algoritmo de procesamiento para la detección de
las paredes celulares que se implementó se divide en
5 pasos:
1.- Filtros de coincidencias.
2.- Detección de las estructuras curvilíneas.
3.- Image Registration.
4.- Combinación de imágenes.
5.- Binarización de la imagen.
ALGORITMO DE DETECCIÓN DE
PAREDES DE LAS CÉLULAS (I)
ALGORITMO DE DETECCIÓN DE
PAREDES DE LAS CÉLULAS (II)
HADOOP
Es un framework open-source desarrollado en Java que
nació como proyecto de Apache para el procesamiento y
consulta de grandes cantidades de datos sobre un grupo
de computadores.
La programación en Hadoop implementa el modelo de
programación MapReduce desarrollado por Google.
Hadoop Pipes, es una solución a la ejecución de
aplicaciones desarrolladas en el lenguaje C++.
MAP REDUCE
AMAZON WEB SERVICES (I)
 Servicios de computación en la nube orientado a la
escalabilidad:
•Elastic Computing Cloud (EC2)
Permite levantar nodos bajo demanda proveyendo la
infraestructura.
•Simple Storage Service (S3)
Almacenamiento escalable de datos
•Elastic MapReduce (EMR)
Automatiza tarea de levantar un clúster Hadoop
sobre EC2
AMAZON WEB SERVICES (II)
DISEÑO
IMPLEMENTACIÓN (I)
• Implementación de las clases
SimpleFileInputFormat y SimpleFileOutputFormat
en java para la lectura y escritura de imágenes
completas en Hadoop.
• Implementación de la librería ImageOpenCV con
funciones de procesamiento de imágenes que
trabaja en conjunto con la librería Stira de Filip
Rooms.
• Modificación del algoritmo de detección de
líneas propuesto por Steger de la librería Stira.
• Implementación de funciones para leer y
escribir imágenes de punto flotante con la librería
OpenEXR.
IMPLEMENTACIÓN (II)
PRUEBAS Y RESULTADOS (I)
Resultado de usar un umbral de 0.0007.
Resultado de usar un umbral de 0.02. Resultado de usar un umbral de 0.005.
PRUEBAS Y RESULTADOS (II)
PRUEBAS Y RESULTADOS (III)
2:09:45
0:18:56 0:15:05
0:07:02 0:06:04
0:00:00
0:14:24
0:28:48
0:43:12
0:57:36
1:12:00
1:26:24
1:40:48
1:55:12
2:09:36
2:24:00
2 6 12 15 18
Tiempo vs Número de nodosTiempo
(hh:mm:ss)
Número de nodos
PRUEBAS Y RESULTADOS (IV)
Nodos Costo($) Duración
2 1.47 2:09:45
6 1.47 0:18:56
12 2.67 0:15:05
15 3.27 0:07:02
18 3.87 0:06:04
COSTO DE GRUPO = Σ COSTOS de TODAS LAS SESIONES
COSTO DE UNA SESIÓN = $0.20 * # nodos en cluster * # de
horas en que el cluster estuvo levantado (se redondean al entero
superior) + $ 0.10 por GB transferido hacia el cluster + $ 0.17 por
GB transferido desde el cluster.
CONCLUSIONES
• El valor de umbral que brinda información efectiva de las
paredes de las células se encuentra alrededor de 0.005.
• El algoritmo implementado en C++ es aproximadamente
3 veces más rápido que el algoritmo desarrollado en
Matlab.
• El número ideal de nodos para con un volumen de datos
a procesar mayor a 700 MB, es de 6 nodos.
RECOMENDACIONES
• Una de las posibles mejoras del proyecto es crear una
interfaz para la carga de las imágenes, ejecución del
algoritmo y descargar de las imágenes de salida.
• Es recomendable utilizar un AMI que tenga instalada la
misma distribución con la que se realizaron las pruebas
locales.
• Configurar Hadoop para que la salida de la aplicación sea
guarda directamente en un bucket de S3 para una mejor
accesibilidad a la información.
Gracias por su atención
¿PREGUNTAS?

Mais conteúdo relacionado

Semelhante a Presentación deteccion de_paredes_celulares_cali_moreno

Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Joseph Lopez
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Joseph Lopez
 
Plug&play:deploying big data_solutions
Plug&play:deploying big data_solutionsPlug&play:deploying big data_solutions
Plug&play:deploying big data_solutionsDavid Piris
 
Docker y todo eso... más o menos
Docker y todo eso... más o menosDocker y todo eso... más o menos
Docker y todo eso... más o menosEduard Tomàs
 
Docker: de principante a pro
Docker: de principante a proDocker: de principante a pro
Docker: de principante a proPlain Concepts
 
Big Data Mining with Mahout
Big Data Mining with MahoutBig Data Mining with Mahout
Big Data Mining with MahoutSolidQ
 
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) 11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) Luis Fernando Aguas Bucheli
 
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web ServicesLuis Fernando Aguas Bucheli
 
G te c sesion3b- mapreduce
G te c sesion3b- mapreduceG te c sesion3b- mapreduce
G te c sesion3b- mapreduceVictoria López
 
Cesnavarra 2009-boletín 2
Cesnavarra 2009-boletín 2Cesnavarra 2009-boletín 2
Cesnavarra 2009-boletín 2Cein
 
Aplicaciones escalables en la nube: mentiras y verdades
Aplicaciones escalables en la nube: mentiras y verdadesAplicaciones escalables en la nube: mentiras y verdades
Aplicaciones escalables en la nube: mentiras y verdadesEnrique Catala Bañuls
 
1 la arquitectura cloud computing
1 la arquitectura cloud computing1 la arquitectura cloud computing
1 la arquitectura cloud computingOmega Peripherals
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big DataStratebi
 
1 la arquitectura cloud computing
1   la arquitectura cloud computing1   la arquitectura cloud computing
1 la arquitectura cloud computingOmega Peripherals
 

Semelhante a Presentación deteccion de_paredes_celulares_cali_moreno (20)

Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
 
Plug&play:deploying big data_solutions
Plug&play:deploying big data_solutionsPlug&play:deploying big data_solutions
Plug&play:deploying big data_solutions
 
Docker y todo eso... más o menos
Docker y todo eso... más o menosDocker y todo eso... más o menos
Docker y todo eso... más o menos
 
Docker: de principante a pro
Docker: de principante a proDocker: de principante a pro
Docker: de principante a pro
 
Big data, Hadoop, HDInsight
Big data, Hadoop, HDInsightBig data, Hadoop, HDInsight
Big data, Hadoop, HDInsight
 
Big Data Mining with Mahout
Big Data Mining with MahoutBig Data Mining with Mahout
Big Data Mining with Mahout
 
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) 11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
 
Deep Learning Notes
Deep Learning NotesDeep Learning Notes
Deep Learning Notes
 
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
 
G te c sesion3b- mapreduce
G te c sesion3b- mapreduceG te c sesion3b- mapreduce
G te c sesion3b- mapreduce
 
Dockeriza tu SQL Server
Dockeriza tu SQL ServerDockeriza tu SQL Server
Dockeriza tu SQL Server
 
Devops episodio 1. devOpsTnf
Devops episodio 1. devOpsTnf Devops episodio 1. devOpsTnf
Devops episodio 1. devOpsTnf
 
Cesnavarra 2009-boletín 2
Cesnavarra 2009-boletín 2Cesnavarra 2009-boletín 2
Cesnavarra 2009-boletín 2
 
Descubriendo windows azure
Descubriendo windows azureDescubriendo windows azure
Descubriendo windows azure
 
Aplicaciones escalables en la nube: mentiras y verdades
Aplicaciones escalables en la nube: mentiras y verdadesAplicaciones escalables en la nube: mentiras y verdades
Aplicaciones escalables en la nube: mentiras y verdades
 
OpenAnalytics Madrid 2014: Spark
OpenAnalytics Madrid 2014: SparkOpenAnalytics Madrid 2014: Spark
OpenAnalytics Madrid 2014: Spark
 
1 la arquitectura cloud computing
1 la arquitectura cloud computing1 la arquitectura cloud computing
1 la arquitectura cloud computing
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
1 la arquitectura cloud computing
1   la arquitectura cloud computing1   la arquitectura cloud computing
1 la arquitectura cloud computing
 

Último

investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIhmpuellon
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21mariacbr99
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanamcerpam
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.FlorenciaCattelani
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...JohnRamos830530
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxFederico Castellari
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estossgonzalezp1
 
Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosJhonJairoRodriguezCe
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativanicho110
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxJorgeParada26
 

Último (10)

investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos Basicos
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 

Presentación deteccion de_paredes_celulares_cali_moreno

  • 1. UTILIZACIÓN DE LA PLATAFORMA HADOOP PARA IMPLEMENTAR UN PROGRAMA DISTRIBUIDO QUE PERMITA ENCONTRAR LAS PAREDES DE CÉLULAS DE LA EPIDERMIS DE PLANTAS MODIFICADAS GENÉTICAMENTE GUSTAVO IRVING CALI MENA ERICK ROGGER MORENO QUINDE
  • 2. AGENDA  Introducción  Antecedentes  El problema  Objetivos  Algoritmo de detección de paredes de las células.  Hadoop (MapReduce)  Amazon Web Services  Diseño e Implementación  Pruebas y Resultados  Conclusiones y Recomendaciones
  • 3. ANTECEDENTES (I) Objeto transparente Desfase o polarización Interferencia Ejemplo de Imagen DIC  Se tiene un conjunto de imágenes DIC de las células de plantas del tipo Arabidopsis Thaiana  Existe un algoritmo que encuentra las paredes de las células usando este tipo de imágenes implementado en Matlab.
  • 4.  El procesamiento digital de imágenes en general es costoso tanto en tiempo como en recursos (hardware).  Una de las librerías de mayor acogida actualmente para procesamiento digital de imágenes es OpenCV.  Hadoop fue concebido originalmente para el procesamiento de texto. ANTECEDENTES (II)
  • 5. EL PROBLEMA  Se necesita procesar una gran cantidad de imágenes en el menor tiempo posible.  Las imágenes capturadas tienen una resolución de 2560 X 1920 píxeles.  El algoritmo implementado en Matlab es lento.
  • 6. OBJETIVOS 1. Re codificar el algoritmo de Matlab a una aplicación en C++. 2. Adaptar el código C++ que obedezca el paradigma MapReduce para poder ser ejecutado en Hadoop.
  • 7. OBJETIVOS (II) 3. Adaptar las clases de entrada y salida de Hadoop para el manejo de imágenes. 4. Realizar la comparación de los tiempos de procesamiento entre los 2 lenguajes en que se implementó la solución.
  • 8. El Algoritmo de procesamiento para la detección de las paredes celulares que se implementó se divide en 5 pasos: 1.- Filtros de coincidencias. 2.- Detección de las estructuras curvilíneas. 3.- Image Registration. 4.- Combinación de imágenes. 5.- Binarización de la imagen. ALGORITMO DE DETECCIÓN DE PAREDES DE LAS CÉLULAS (I)
  • 9. ALGORITMO DE DETECCIÓN DE PAREDES DE LAS CÉLULAS (II)
  • 10. HADOOP Es un framework open-source desarrollado en Java que nació como proyecto de Apache para el procesamiento y consulta de grandes cantidades de datos sobre un grupo de computadores. La programación en Hadoop implementa el modelo de programación MapReduce desarrollado por Google. Hadoop Pipes, es una solución a la ejecución de aplicaciones desarrolladas en el lenguaje C++.
  • 12. AMAZON WEB SERVICES (I)  Servicios de computación en la nube orientado a la escalabilidad: •Elastic Computing Cloud (EC2) Permite levantar nodos bajo demanda proveyendo la infraestructura. •Simple Storage Service (S3) Almacenamiento escalable de datos •Elastic MapReduce (EMR) Automatiza tarea de levantar un clúster Hadoop sobre EC2
  • 15. IMPLEMENTACIÓN (I) • Implementación de las clases SimpleFileInputFormat y SimpleFileOutputFormat en java para la lectura y escritura de imágenes completas en Hadoop. • Implementación de la librería ImageOpenCV con funciones de procesamiento de imágenes que trabaja en conjunto con la librería Stira de Filip Rooms.
  • 16. • Modificación del algoritmo de detección de líneas propuesto por Steger de la librería Stira. • Implementación de funciones para leer y escribir imágenes de punto flotante con la librería OpenEXR. IMPLEMENTACIÓN (II)
  • 17. PRUEBAS Y RESULTADOS (I) Resultado de usar un umbral de 0.0007. Resultado de usar un umbral de 0.02. Resultado de usar un umbral de 0.005.
  • 19. PRUEBAS Y RESULTADOS (III) 2:09:45 0:18:56 0:15:05 0:07:02 0:06:04 0:00:00 0:14:24 0:28:48 0:43:12 0:57:36 1:12:00 1:26:24 1:40:48 1:55:12 2:09:36 2:24:00 2 6 12 15 18 Tiempo vs Número de nodosTiempo (hh:mm:ss) Número de nodos
  • 20. PRUEBAS Y RESULTADOS (IV) Nodos Costo($) Duración 2 1.47 2:09:45 6 1.47 0:18:56 12 2.67 0:15:05 15 3.27 0:07:02 18 3.87 0:06:04 COSTO DE GRUPO = Σ COSTOS de TODAS LAS SESIONES COSTO DE UNA SESIÓN = $0.20 * # nodos en cluster * # de horas en que el cluster estuvo levantado (se redondean al entero superior) + $ 0.10 por GB transferido hacia el cluster + $ 0.17 por GB transferido desde el cluster.
  • 21. CONCLUSIONES • El valor de umbral que brinda información efectiva de las paredes de las células se encuentra alrededor de 0.005. • El algoritmo implementado en C++ es aproximadamente 3 veces más rápido que el algoritmo desarrollado en Matlab. • El número ideal de nodos para con un volumen de datos a procesar mayor a 700 MB, es de 6 nodos.
  • 22. RECOMENDACIONES • Una de las posibles mejoras del proyecto es crear una interfaz para la carga de las imágenes, ejecución del algoritmo y descargar de las imágenes de salida. • Es recomendable utilizar un AMI que tenga instalada la misma distribución con la que se realizaron las pruebas locales. • Configurar Hadoop para que la salida de la aplicación sea guarda directamente en un bucket de S3 para una mejor accesibilidad a la información.
  • 23. Gracias por su atención ¿PREGUNTAS?

Notas do Editor

  1. Como antecedentes tenemos que DIP demanda de muchos recursos y tiempo. DIC es differential interface contrast. Imágenes falsas, se desfasa un delta pequeño y se restan, este procedimiento se realiza para poder hacer visibles superficies invisibles de las paredes Tambien debemos mencionar que se tuvo un algoritmo, el cual realizaba la detección de las paredes de las celulas implementado en MatlLab, el cual nos permite leer la imagen como un matriz, aplicar operaciones sobre el de forma sencilla como multiplicación, division, convoluciones, además ofrece un desarrollo rapido.
  2. Para tener 3 minutos y medio de animación se demoraban una semana. Esta optimizada para el procesamiento de imágenes, se puede usar con c++ y python, es facil de aprender y tiene un conjunto de funciones muy utiles a la hora de procesar imágenes, aparte de la variedad de formatos que soporta.
  3. Por cada muestra se generar varias imagenes que deben ser procesadas, como mitigación a la segmentación q producen las imágenes DIC, que para ser capturadas usan una iluminación direccional, la cual hace visibles solo ciertas partes de las paredes celulares que en ese momento se encuentren expuestas a la luz, se usó un microscopio DIC en el que fue necesario realizar 12 rotaciones y con 3 diferentes objetivos durante las captura, dando como resultado 36 imágenes por cada muestra. El primer inconveniente que encontramos fue que las imágenes fueron tomados con equipos de bioinformatica de gran precisión los cuales dieron como resultado imágenes de resolución muy grandes como lo son 2560X1920, los cuales al ser traducidos a un arreglo ocuparía 4’915.200 posiciones a ser procesadas por cada imagen. Matlab al estar desarrollada su interfaz grafica y funciones en JAVA genera un respuesta lenta, el manejo de los índices de las matrices además de no esta optimizado , Motivo para no usar Matlab.- tiene una extensión que le permite la ejecución en ambientes distribuidos como AWS, pero la desventaja principal es que se necesita una licencia por cada nodo levantado.
  4. Paralelización de tareas Control de trabajos Tolerancia a fallos Escalabilidad Detección de errores Sincronización
  5. Explicar la fase de orden y agrupamiento de los datos de salida de los mapper, y la creacion de un reducer por cada clave generada.
  6. La fase mapper realiza los filtros de coincidencia, la detección de lineas, el image resitratión, Por su naturaleza la fase combinatoria se realiza en el reducer y la funcion de umbral para la binarización.
  7. eficacia
  8. eficiencia
  9. Costos