Aprendizagem de máquina aplicada na neurociência

Aprendizagem de máquina
para Neurociência
Prof. Dr. Walter Hugo Lopez Pinaya
Seminário
28/02/2018

Estrutura da apresentação
• O que é aprendizagem de máquina?
• Categorias
• O que conseguimos fazer?
• Como?
• Considerações finais

O que é aprendizagem de máquina?

Escrever programas que
resolvem um problema

Escrever programas que
aprendem a
resolver um problema
a partir de exemplos

Sem aprendizagem de máquina
def tem_textura_certa()
...
def tem_formato_certo()
...
def tem_cor_certa()
...

Com aprendizagem de máquina
def tem_textura_certa()
...
def tem_formato_certo()
...
def tem_proporções_certas()
...

Usar dados
para
responder perguntas

Usar dados
para
responder perguntas
Campo de pesquisa que desenvolve algoritmos que dão aos
computadores a capacidade de aprender a partir dos dados, e
então fazer predições e decisões

Supervisionado
Problemas com dados que estão associados à uma variável de
interesse
COR PH MAÇÃ OU LARANJA?
660 nm 7.5 Maçã
656nm 7 Maçã
500nm 5.9 Laranja
... ... ...
490nm 5.7 Laranja

Supervisionado
A cada amostra apresentada ao modelo, podemos fornecer um
feedback sobre suas predições
O modelo aprende a mapear da entrada de dados para a saída
Dois tipos de tarefas:
• Classificação e Regressão

Saídas desejadas são classes
discretas (grupos)
Saídas desejadas são valores
contínuos
Classificação Regressão

Classificação e Regressão
Exemplo de aplicação em neurociência?

Não-Supervisionado
Problemas em que não são apresentadas saídas desejadas ao
modelo
COR PH
660 nm 7.5
656nm 7
500nm 5.9
... ...
490nm 5.7

Não-Supervisionado
Objetivo do modelo
• Explorar como os dados estão geometricamente e
estatisticamente organizados
• Aprender a estrutura latente aos dados para desempenhar
tarefas

Agrupamento
Objetivo
• Encontrar grupos de maneira que as amostras pertencentes a
um mesmo grupo possuem grande similaridade e amostras
de grupos diferentes possuem pouca similaridade

Agrupamento

Redução de Dimensionalidade
• O modelo tenta reduzir o número de dimensões em um
conjunto de dados
• Envolve transformar os dados de alta dimensionalidade em
representações mais simples que ainda preservam a maior
parte das informações relevantes dos dados
Exemplos de métodos
• Principal Components Analysis (PCA)
• Independent Component Analysis (ICA)

Redução de dimensionalidade

Aprendizado por reforço
O modelo não recebe o feedback diretamente.
Somente quando ele atinge o seu objetivo.
Exemplo
• Por reforço: quando ganhar o
jogo.
• Supervisionado: a cada
movimento, dizendo se o
movimento foi bom ou ruim.

Aprendizado por reforço
• Interage com o ambiente
• Aprende a partir da tentativa e erro

Outros tipos...
• Filtragem colaborativa
• Sistemas de recomendação
• Aprendizado semi-supervisionado
• Detecção de anomalias
• ....

O que conseguimos
fazer com isso?

Arte
Transferência de estilo artístico
• https://deepart.io/

Arte
Criação de músicas
• http://www.asimovinstitute.org/analyzing-deep-learning-
tools-music/

Reconhecimento de fala
Reconhecimento de fala
Conversão de texto em fala
• https://deepmind.com/blog/wavenet-generative-model-
raw-audio/

Análise de texto
• Tradução automática
• Reconhecimento de emoção

Análise de texto
• Resumo de textos

1º Coleta de Dados
• Coletamos vários exemplos para que o modelo consiga
aprender a relação entre entrada e saída desejada
• Escolhemos as características dos exemplos que me parecem
ser úteis para o classificador
Neste caso
• Ph da fruta
• Comprimento de onda da superfície da fruta

2º Preparação dos dados
• Objetivo: deixar nossos dados no formato correto para ser
utilizado em nosso modelo
COR PH MAÇÃ OU LARANJA?
660 nm 7.5 Maçã
656nm 7 Maçã
500nm 5.9 Laranja
... ... ...
490nm 5.7 Laranja

2º Preparação dos dados
• Nesse ponto também dividimos nossos dados em duas
partes
• Conjunto de treino
• Conjunto de teste
Dados
Treinamento Teste

3º Escolha do modelo
Existem vários tipos de modelos
• Regressão Logística
• Árvores de decisão
• Redes Neurais
• Suport Vector Machines
• Naive Bayes
• ...

3º Escolha do modelo
Regressão Logística

4o Treinamento
• Apresentamos os dados do conjunto de treino para o
modelo
• De pouco em pouco o modelo melhora a habilidade de
predizer nossos dados
• Nessa etapa são utilizados algoritmos de otimização para
achar os parâmetros do modelo que minimizam o erro no
nosso conjunto de teste
• http://playground.tensorflow.org

5º Avaliação
• Avaliação da performance do modelo treinado em novos
dados
• Nteste = 30
Acurácia do modelo = Acertos/Total
Acc ~ 70%
Maçã Laranja
Preditos como maçã 10 4
Preditos como laranja 5 11

5º Avaliação
Outras métricas de performance
• Sensibilidade: proporção de positivos que foram
corretamente identificados entre todos os positivos
(alta sensibilidade  raramente negligencia um positivo )
• Especificidade: proporção de negativos que foram
corretamente identificados entre os positivos
(alta especificidade  específico raramente registra um positivo para
qualquer coisa que não seja o alvo de testes)

5º Avaliação
• Acurácia = taxa de acertos=?
Paciente Saudável
Predito Paciente 90 50
Preditos Saudável 10 50

5º Avaliação
• Acurácia = taxa de acertos=70%
Paciente Saudável

5º Avaliação
• Sensibilidade=
𝑝𝑟𝑒𝑑𝑖𝑡𝑜𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠
𝑡𝑜𝑑𝑜𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠
=?
Paciente Saudável

5º Avaliação
• Sensibilidade=
=90%
Paciente Saudável

5º Avaliação
• Sensibilidade=
=90%
• Especificidade=
𝑝𝑟𝑒𝑑𝑖𝑡𝑜𝑠 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜
𝑡𝑜𝑑𝑜𝑠 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜𝑠
=?
Paciente Saudável

5º Avaliação
• Sensibilidade=
=90%
• Especificidade=
𝑝𝑟𝑒𝑑𝑖𝑡𝑜𝑠 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜
𝑡𝑜𝑑𝑜𝑠 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜𝑠
= 50%
Paciente Saudável

Podemos sofisticar nossas análises
Temos melhor estimativa da verdadeira performance do
modelo quando repetimos várias vezes o processo de treino e
teste
• Validação Cruzada
Podemos verificar quais foram as características que o modelo
achou ser mais discriminantes
Podemos verificar se essas características são estatisticamente
significativas

Recapitulando

Recapitulando
Usar dados para responder perguntas

Recapitulando
Categorias

Recapitulando
Categorias
• Supervisionado
• Não Supervisionado
• Aprendizagem por reforço

Etapas de desenvolvimento
• 1º Coleta de dados
• 2º Preparação dos dados
• 3º Escolha do modelo
• 4º Treinamento do modelo
• 5º Avaliação do modelo

Uso em neurociência
Normalmente não é fácil obter dados...
• Coleta de dados
• É cara...
• É trabalhosa...
• É demorada....

Dados públicos
Cada vez mais surgem bancos de dados públicos para serem
utilizados em pesquisas
• https://github.com/awesomedata/awesome-public-datasets

E a inferência estatística?
Ela também não aborda o apresentado nesse seminário???

Inferência estatística vs. AM
Diferença está na filosofia da finalidade de nossos modelos
• Inferência estatística tenta criar modelos voltados para
explicar os dados
• Aprendizagem de máquina já cria modelos voltados para
predição em novos dados

Inferência estatística vs. AM

Somente a Aprendizagem de Máquina contribui para
Neurociência?

Contribuição da neurociência
• Muitos modelos de aprendizagem de máquina tem como
inspiração sistemas biológicos
• Ferramentas de análise cognitiva começaram a serem
desenvolvidas para compreendermos melhor nossos
sistemas de inteligência artificial
• https://deepmind.com/blog/open-sourcing-psychlab/

Mais informações
• http://www.r2d3.us/uma-introducao-visual-ao-aprendizado-
de-maquina-1/
• https://deepmind.com/blog/ai-and-neuroscience-virtuous-
circle/

Aprendizagem de máquina aplicada na neurociência

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a Aprendizagem de máquina aplicada na neurociência

Semelhante a Aprendizagem de máquina aplicada na neurociência (20)

Aprendizagem de máquina aplicada na neurociência