Estima-se que em 2018 e 2019 surgirão mais de 1,2 milhão (um milhão e duzentos
mil) novos casos de câncer no Brasil, sendo 600 mil (seiscentos mil) novos casos por
ano. Desses, 59.000 (cinquenta e nove mil) serão de casos de câncer de mama
feminina. Isso representa 54,54 casos a cada 100 mil mulheres. Além disso, a
mortalidade aumenta quando a metástase se configura. Por isso é importante que ela
seja detectada o mais rápido possível para que o tratamento adequado seja iniciado.
No entanto, a detecção de metástase não é trivial, exige horas de um patologista
experiente e está sujeito a erros. Sendo assim, este trabalho irá implementar uma rede
neural (RNA) baseada em Deep Learning que é uma subárea do aprendizado de
máquina dentro da inteligência artificial, esta será utilizada para a detecção de câncer
de mama. Além disso, devido ao alto processamento exigido pelo treinamento de uma
rede neural, ela será treinada em uma arquitetura paralela (many-cores) conhecida
como GPU (Unidade de Processamento Gráfico), ou seja, uma placa gráfica que
contém centenas de núcleos de processamento. Para realizar o desenvolvimento do
algoritmo de treinamento de uma rede neural artificial dentro da arquitetura paralela,
será utilizada uma extensão da linguagem de programação Python conhecida como
KERAS, a qual possibilita o uso de computação paralela dentro de uma GPU
normalmente com chipset da Nvidia e o desenvolvimento de RNA de forma mais
prática e otimizada.
1. ENCONTRO DE PESQUISA, PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIA E EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
Auxílio na Detecção de Câncer
Usando Deep Learning em Redes
Neurais e GPU
Orientando: Israel Fernando Vieira
Orientador: Omar Andres Carmona Cortes (DAI)
2. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• Estima-se que em 2018 e 2019 surgirão mais de 1,2 milhão novos casos de câncer no Brasil, sendo
600 mil novos casos por ano. Desses, 59.000 serão de casos de câncer de mama feminina. (Dados
coletados do INCA – INSTITUTO NACIONAL DE CÂNCER).
• O processo de identificação do estágio de um câncer de mama requer um patologista experiente,
demanda tempo e é suscetível a erros, em especial quando se está lidando com linfo nodos
adjacentes sem câncer ou com pequenos tumores [2].
INTRODUÇÃO
Disponível em: wiki.cancerimagingarchive.net/display/Public/Wiki#collections-list/
Figura 1: Mamografia
3. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• A computação vem se mostrado bastante eficiente quando se trata de processamento e classificação
de imagens, em especial quando se refere a Redes Neurais Artificiais.
• Sabendo disso a utilização de uma RNA é uma forma de treinar um computador de forma eficiente
para auxiliar na detecção de câncer. No entanto esse tipo de aplicação é relativamente novo quando
se trata de Deep Learning (DL).
• Deep Learning, é um ramo de aprendizado de máquina baseado em um conjunto de algoritmos que
tentam modelar abstrações de alto nível de dados usando um grafo profundo com várias camadas de
processamento, compostas de várias transformações lineares e não lineares.
INTRODUÇÃO
Figura 2: Rede Neural Artificial
4. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• Apesar de sua utilidade prática, DL em RNA por possuírem muitos neurônios, fazem com que a tarefa
de treinamento seja computacionalmente intensa, pois realiza muitas operações com vetores e
matrizes.
• É nesse cenário que surge a computação paralela como alternativa viável para a aceleração do
processamento.
INTRODUÇÃO
Figura 3: programação paralela
Disponível em: https://www.devmedia.com.br/programacao-paralela-com-java/33062
5. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• A ideia central da programação paralela consiste em dividir um grande problema em problemas
menores para que possam ser resolvidos ao mesmo tempo por unidades de processamento
diferentes.
• É nesse cenário que surge a computação paralela em GPU, como alternativa viável para a aceleração
do processamento. Uma arquitetura conhecida como many-cores (muitos núcleos), onde núcleos
menos poderosos que uma CPU, porém em grande quantidade, pois, embora altamente versátil a
CPU é restrita a um número de núcleos (cores).
INTRODUÇÃO
Figura 4: CPU X GPU
Disponível em: https://www.youtube.com/watch?v=va5BQaPTO9U
6. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
Objetivo geral
Determinar uma RNA baseada em Deep Learning que consiga detectar câncer em uma base a ser
escolhida em GPGPU.
Objetivos específicos
Determinar a melhor arquitetura de um RNA baseada em DL;
Ajustar os parâmetros da RNA automaticamente;
Paralelizar o processo de ajuste em GPU.
OBJETIVO
7. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
1. Base de dados:
• A base de dados a ser utilizada é disponibilizada pelo site
https://wiki.cancerimagingarchive.net/display/Public/Wiki#collections-list que contém diversas bases
com o objetivo de serem usadas em algoritmos de detecção.
METODOLOGIA
8. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
2. Métricas de desempenho:
• As métricas a serem utilizadas são as tradicionais como matriz de confusão e acurácia.
METODOLOGIA
9. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
3. Implementação do modelo
• Para implementação foi utilizada a linguagem Python e uma extensão da linguagem (Framework) KERAS que nos
possibilita trabalhar com GPUs da NVIDIA.;
• Em seguida foram implementadas as RNAs em GPU, treinadas e aplicadas na detecção em exames de câncer de
mama;
METODOLOGIA
10. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• Ao realizar testes com duas arquiteturas de RNA comumente utilizadas na resolução de problemas
complexos, neste caso na classificação de imagem, uma em específica acabou mostrando melhor
desempenho para classificar as imagens de câncer de mama.
RESULTADOS & DISCUSSÃO
Figura 5: Gráfico de perda e acurácia na fase de treinamento e validação.
11. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• A arquitetura conhecida como Rede Neural Convolucional, que é uma classe de rede neural artificial
do tipo feed-forward. Nos possibilitou chegar a resultados razoáveis em relação as demais
arquiteturas testadas.
RESULTADOS & DISCUSSÃO
Figura 6: Modelo utilizado no treinamento da RNA.
12. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• O treinamento para o ajuste dos parâmetros consistiu em utilizar um modelo de RNA Convolucional
já treinado para a coleta de características das imagens com maior eficiência, nesse trabalho foi
utilizado o modelo RESNET-50.
RESULTADOS & DISCUSSÃO
Figura 7: Arquitetura RESNET-50.
Disponível em: https://medium.com/@pierre_guillou
13. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• As categorias utilizadas para a classificação foram Benigno que consistem em mamografias com
fibroses benignas, fibroadenoma benigno e hiperplasia estromal pseudo-angiomatosa, Maligno onde
foram apresentadas mamografias com carcinoma lobular infiltrativo, carcinoma ductal infiltrante,
carcinoma ductal invasiva e carcinoma lobular invasivo, e a última categoria foi Pré-maligno que
consistiu em mamografias que apresentavam carcinoma ductal in situ, também denominado
carcinoma intraductal, que é uma lesão cancerosa pré-maligna ou não invasiva da mama.
RESULTADOS & DISCUSSÃO
Figura 8: Matriz de confusão da classificação da RNA com os dados de teste.
14. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• Como observado na Fig. 8, o desempenho da RNA testada não foi dos melhores foi um pouco melhor
do que jogar uma moeda para cima e depender da sorte. Foram apresentadas 500 novas amostras
de cada categoria após o treinamento para teste, e a rede foi capaz de obter uma acurácia de 52.8%
como mostra a Fig. 9.
RESULTADOS & DISCUSSÃO
Figura 9: Valor da acurácia da RNA em teste.
15. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• O modelo RESNET-50 nos permite obter uma precisão de classificação de cerca de 52% no conjunto
de imagens até o momento. Isso é feito extraindo para as imagens do conjunto, todos os valores de
transferência do modelo RESNET-50 antes da camada de classificação final ser treinada. Estudos
precisam ser feitos para melhorar a taxa de acertos. O uso desta técnica de Transfer Learning otimiza
significativamente o tempo de treinamento necessário para treinar uma RNA diretamente para o
conjunto de dados escolhido, além de nos permitir alcançar uma precisão de classificação muito
maior.
• Sendo assim, utilizar a arquitetura de Redes Neurais Convolucionais aliada com a técnica de
transferência de aprendizado, é útil quando se está desenvolvendo com pouco poder computacional
e uma baixa quantidade de dados para serem utilizados. Futuros estudos incluem a melhoria da
acurácia da rede e o teste de outros tipos de aprendizagem.
CONCLUSÃO
16. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• [1] Apple, S.K., “Sentinel lymph node in breast cancer: Review article from a pathologists point of view”. Journal of
Pathology and Transl. Medicine 50 (2), 83, 2016.
• [2] Liu, Y. and Gadepalli, K. and Narouzi, M. and Dahl, G. E., Detecting Cancer Metas-tases on Gigapixel Pathology
Images, https://drive.google.com/file/d/0B1T58bZ5vYa-QlR0QlJTa2dPWVk/view, visitado em 12/03/2017.
• [3] Cheng, H. D. et al. Approaches for automated detection and classification of masses in mammograms. The
Journal of Pattern Recognition. v. 39, p. 646-668, 2006.
• [4] Ian Goodfellow, Yoshua Bengio, and Aaron Courville (2016). Deep Learning. MIT Press.
• [5] Ngiam, J.; Khosla, A.; Kim, M.; Nam, J.; Lee, H; Ng, A. Y., Multimodal deep learn-ing, International Conference on
Machine Learning, 2011.
• [6] Almasi, G.S. e A. Gottlieb (1989). Highly Parallel Computing. Benjamin-Cummings, Redwood City, CA.
• [7] Schmidhuber, J. “Deep Learning in Neural Networks: An Overview”, Neural Net-works, Volume 61, January 2015,
pp. 85–117.
• [8] Convolutional Neural Networks (LeNet) - DeepLearning 0.1 documentation». DeepLearning 0.1. LISA Lab.
Consultado em 31 de agosto de 2013.
• [9] West, Jeremy; Ventura, Dan; Warnick, Sean (2007). "Spring Research Presentation: A Theoretical Foundation for
Inductive Transfer". Brigham Young University, College of Physical and Mathematical Sciences. Archived from the
original on 2007-08-01. Re-trieved 2007-08-05.
• [10] Sinn, HP; Kreipe, H (maio de 2013). “A Brief Overview of the WHO Classification of Breast Tumors, 4th Edition,
Focusing on Issues and Updates from the 3rd Edition.”. Breast care (Basel, Switzerland). 8 (2): 149–154.
REFERÊNCIAS
17. ENCONTRO DE PESQUISA,PÓS-GRADUAÇÃO,
INOVAÇÃO, INICIAÇÃO À DOCÊNCIAE EXTENSÃO
DO IFMA, CAMPUS SÃO LUÍS MONTE CASTELO
• Agradecemos o Instituto Federal do Maranhão e FAPEMA pelo apoio financeiro através de bolsa
PIBIC.
AGRADECIMENTOS
Notas do Editor
proximidade entre o valor obtido experimentalmente e o valor verdadeiro na medição de uma grandeza física.
O conjunto de treinamento foi dividido .... A validação foi porque...
Mas, para chegar aos resultados que serão apresentados,
também foi utilizada uma técnica conhecida na área de Deep Learning como Transfer
Learning,