O documento fornece informações sobre o autor, incluindo sua formação acadêmica e experiência como professor. Também discute brevemente sobre câncer, imagens histopatológicas e aprendizado de máquina, mencionando a importância de bases de dados públicas e técnicas como redes neurais convolucionais para análise de imagens médicas.
"Mostrando a Cobra" - ou Breve Introdução a Linguagem Python. ed2
Classificação Automatizada de Câncer de Mama - Imagens Histopatológicas
1.
2. What we call chaos is just
patterns we haven’t
recognized.
What we call random
is just patterns
we can’t decipher.
Chuck Palahniuk
3. $whoami
Marido
Pai de um jovem universitário e atualmente 12 gatos
• Ok, 11 cães também...
Apaixonado por programação (desde os ≈ 12 anos)
Cinéfilo
Bacharel em Informática (Unioeste, 1999)
• GIS, Gerência de Redes
Mestre em Ciência da Computação (UFSC, 2002)
• Gerência de Redes
Doutor em Ciência da Computação (UFPR, 2018)
• Machine Learning Tdeep learning T imagens médicas
Professor na UTFPR-TD (desde 2009)
4. São esperados 27 milhões de novos casos de câncer até
2030 (World Cancer Research Fund - WCRF)
Em 2018, ocorreram 18 milhões de casos novos e 9,6 milhões
de óbitos!
• Em países desenvolvidos, predominam os tipos de câncer ligados à
urbanização e ao desenvolvimento (pulmão, próstata, mama, cólon e
reto) N envelhecimento populacional & hábitos
• nos países de baixo e médio desenvolvimentos, alta ocorrência de
tipos associados a infecções (colo do útero, estômago, esôfago,
fígado) N saneamento básico
7. Câncer é a designação comum de várias doenças
caracterizadas pela replicação celular anormal e
acelerada
Neoplasia N neoplasma (tumor)
• “benigno”
localizado e de crescimento lento
• maligno
agressivo, crescimento rápido, letal
invasivo (metastático)
Câncer é sinônimo de tumor maligno
8. Tipo de carcinoma: tumor maligno originado no tecido
mamário
principalmente mulheres
• pode acometer homens (≈ 1% dos casos)
carcinoma ductal > 80%
carcinoma lobular ≈ 10-15%
9.
10. Métodos não-invasivos (imagem)
Mamografia (raios X)
Ressonância magnética
Ultrassonografia
Termografia
Biópsia — único método confiável para detectar a
presença do câncer, tipo, estágio, etc.
Fine Needle Aspiration (FNA)
Core Needle Biopsy (CNB)
Vacuum-assisted
Cirúrgico
12. Amostras de células (citologia) ou tecidos (histologia)
são preparados em lâminas de microscopia para análise
patológica
O diagnóstico é feito através da análise do especialista humano
(médico patologista)
• Para o processamento automatizado, imagens cito (A) ou
histopatológicas (B) devem ser adquiridas
A B
21. Aprendizado de Máquina (Machine Learning)
provê aos sistemas computacionais habilidade de
aprender sem terem sido explicitamente
programados
Abarca de reconhecimento de padrões (pattern
recognition) até teoria do aprendizado (learning theory) na
“inteligência artificial” (artificial intelligence – AI)
22.
23. "A computer program is
said to learn from
experience E with respect to
some class of tasks T and
performance measure P if
its performance at tasks in
T, as measured by P,
improves with experience
E.“
Tom M. Mitchell (1997)
24. Termos cognitivos X operacionais
Algoritmos que podem aprender a partir de dados
e fazer previsões sobre dados
Construir um modelo tomar decisões ou fazer predições
Não segue instruções estáticas
25. Considerando entradas (input signal) e feedback
disponíveis ao sistema
(1) Aprendizado supervisionado
(2) Aprendizado não-supervisionado
(3) Aprendizado por reforço
**existem (muitas) variações
32. Uso de feedback sobre o resultado N recompensa
cumulativa
robótica
33. Tipos de problemas/tarefas típicas
Classificação
• qual a classe de um objeto?
• Ex.: A imagem é de um tumor maligno ou benigno? Qual é o estágio
desse tumor? A mensagem é spam ou conteúdo válido? De quem é
esse rosto?
Regressão
• Qual o próximo valor (contínuo) de um objeto/evento?
• Ex.: Qual será o valor das ações da empresa X no próximo pregão?
Qual o consumo de água no próximo mês? Qual será o valor médio
de venda desse terreno no próximo ano?
34. Tipos de problemas/tarefas típicas
Agrupamento (Clustering)
• Agrupar objetos similares
Redução de dimensionalidade
• “Compactar” dados de altas dimensões de representação para
dimensões menores
• Usado para visualização e como operação interna de certos
algoritmos
35. Tipos de problemas/tarefas típicas
Ranking
• Arranjar uma lista de objetos para maximizar/minimizar algum
critério
Recomendação
• Filtrar um pequeno subconjunto de um grande conjunto de objetos
36. A chave dos modelos está na representação dos
objetos Ncaracterísticas significativas (features)
Qual a melhor característica (mais discriminativa) de um
objeto?
Como extrair das entradas?
Definir características ótimas para um problema
(aplicação) pode levar décadas e demandar o esforço de
toda uma comunidade de pesquisadores!
47. Descritores de textura e identificador de pontos de interesse
CLBP (Completed LBP): Sign, Magnitude, Center
GLCM (Gray-Level Coocurrence Matrix)
LBP (Local Binary Pattern)
LPQ (Local Phase Quantization)
ORB (Oriented FAST and Rotated BRIEF)
PFTAS (Parameter Free TAS)
Classificadores “clássicos”
k-Nearest Neighbors (k-NN)
Quadratic Discriminant Analysis (QDA)
Random Forests (RF)
Support Vector Machine (SVM)
48.
49.
50. Confusões
( A) imagem original de um tumor benigno classificado
erroneamente como maligno
(B) tumor realmente maligno
A B
51.
52. Para aprender representações significativas diretamente dos
dados!
Características projetadas manualmente são muito específicas,
incompletas e consomem muito tempo de projeto e validação
dependem de um especialista
Características aprendidas são fáceis de adaptar, fáceis de aprender
Fornece um framework (quase?) universal e muito flexível para
representar informação visual, linguística, etc.
Aprender de forma supervisionada (usando rótulos) ou não-
supervisionada (texto/áudio/imagens/etc. puros)
53. O conceito-chave é a habilidade de aprender
representações hierárquicas de características (inspirado
no sistema visual dos mamíferos)
55. CNNs são similares a outras RN
são treinadas com uma versão de algoritmo back-propagation
O que difere é a arquitetura delas
São projetadas para reconhecer padrões visuais diretamente
dos pixels com nenhum (mínimo) preprocessamento
Podem reconhecer padrões com extrema variabilidade e
robustez a ruídos, distorções e transformações geométricas
simples
• Ex.: caracteres manuscritos
56.
57.
58. Célula especializada em conduzir impulsos elétricos
Tecido nervoso (H&E) e representação esquemática de um
neurônio
63. Treinar é aprender os pesos
Encontrar os pesos w da rede que minimizem o erro entre os
rótulos verdadeiros e os rótulos estimados
Minimização pode ser feita por “gradient descent” fornecida
uma diferenciável
O erro é usado para retornar e ajustar os pesos das camadas
anteriores
• Esse método de treinamento chama-se back-propagation
64. Na prática costuma-se usar Stochastic Gradient Descent
(SGD)
Uma aproximação estocástica do gradiente de custo
“verdadeiro”
65.
66. RN profunda é uma hierarquia de camadas
Cada camada transforma os dados de entrada em
representações mais abstratas
• Ex.: contornos N nariz N face
Camada final combina as representações N Predição
69. Uma CNN (Convolutional Neural Network) é
essencialmente um arranjo de camadas:
Convolucionais (Convolutional Layers)
ReLU (Rectfied Linear Units Layers)
Pooling Layers
Totalmente Conectadas (Fully-Connected Layers)
70. Deslizar espacialmente uma máscara (kernel ou
filtro) pela imagem, calculando o produto escalar
Stride = 1
71. A entrada é um volume
O filtro se estende por toda a profundidade
Imagem RGB = 3 canais
Imagem 32x32x3
Filtro 5x5x3
73. Os vários mapas de ativação são empilhados, para
gerar uma “nova imagem”
P.ex.: 6 filtros 5x5 geram 6 mapas 28x28, ou uma, nova
imagem de 28x28x6
74. Uma CNN é uma sequência de camadas convolucionais
intercaladas por funções de ativação (activation
functions)
Note a redução espacial dos volumes
75. Um mapa de ativação é uma camada de saída de
neurônios
Cada neurônio conecta-se a uma pequena região da entrada
Todos compartilham parâmetros
Os neurônios estão arranjados em uma grade 3D
76. Não-linearidades são necessárias para aprender
representações complexas dos dados (não-lineares)
Por elemento (independente)
max(0, x) é a mais usada
77. Torna a representação menor e mais “gerenciável”
Opera sobre cada mapa de ativação de forma
independente
79. A Fully Connected Layer (FC) contém neurônios
conectados a todo o volume de entrada, como uma RN
convencional
A última camada da CNN normalmente é uma FC
• O tamanho da saída é igual ao número de classes
85. Cada imagem é uma bag e suas subimagens (patches)
são instâncias
a imagem é positiva (patológica) se tem pelo menos um patch
(subimagem) maligno
a imagem será negativa (benigna) se não tiver nenhuma
subimagem maligna