"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
Aula sobre recompensa, reforço e dependência química
1. Aula 5
Recompensa, reforço, e prazer
Alcoolismo drogadição e práticas interdisciplinares
Prof. Dr. Caio Maximino – IESB/Unifesspa
2. 2 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Objetivos
● Discutir os conceitos de recompensa, reforço, e prazer
● Avaliar a ligação desses conceitos com as definições de tomada de
decisão e impulsividade
● Analisar a teoria comportamental da dependência como escolha, a
teoria da sensibilização do incentivo, e a teoria neurobiológica da
dependência como escolha
● Avaliar o papel da tomada de decisão e suas vulnerabilidades para o
uso de drogas
3. 3 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
O prazer
● Num sentido inclusivo, o termo prazer inclui a positividade afetiva de toda alegria,
gosto, e gozo
● Parece óbvio à introspecção que o prazer é um sentimento simples que conhecemos
diretamente na experiência consciente momentânea, e que é algo com o qual
frequentemente nos engajamos e buscamos
● É uma dimensão qualitativa de diferentes modalidades sensoriais, relativamente i-
mediata
● Essa visão simplista, entretanto, é complicada pelo fato de que diferentes coisas
produzem sensações diferentes de prazer
– Frederick Feldman: Será que “prazer” é uma atitude proposicional única, que muda de
qualidade por que é direcionada a conteúdos proposicionais diversos?
4. 4 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Distinção entre prazer e desejo
● Platão e outros gregos: distinção entre tipos de prazer conectados à ânsias/desejos
e aqueles que não envolvem desejo ou necessidade
● No Cânone Pali do budismo indiano, a concentração medidativa passa por estágios
progressivos nos quais primeiro se pára de iniciar e sustentar o pensamento, para
então parar de ativar o interesse prazeiroso (pīti), e finalmente se perde até mesmo
o sentimento (não-intencional) subjacente de prazer (sukha)
– A diferença entre p tiī e sukha é comumente descrita nos comentários como a
diferença entre o estado em que se encontra um viajante no deserto quente ao ouvir
falar e ao ver uma fonte de água, e o estado de prazer após consumir a água
–
● Distinção entre o “gostar” e o “querer”
5. 5 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Regiões hedônicas do encéfalo
● As regiões hedônicas que geram o prazer são
pequenas (~1 cm³), e contindas em estruturas
prosencefálicos límbicas, incluindo núcleo
acumbente, pálido ventral, e regiões límbicas do
córtex pré-frontal.
● Nessas regiões, o “verniz” hedônico é formado
por endorfinas e endocanabinóides
● Se essas regiões são ativadas artificialmente
(por estimulação optogenética ou microinjeção
de drogas), as reações hedônicas a um prazer
sensorial aumentam de duas a três vezes.
Kent Berridge
6. 6 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Regiões hedônicas do encéfalo
7. 7 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Reforço vs. recompensa
● Reforço: No comportamento operante, é uma consequência
do comportamento que aumenta a probabilidade futura
desse mesmo comportamento
● Recompensa: Estímulos associados ao desejo e ao prazer e
ao comportamento apetititvo, e que funcionam como
reforçadores positivos por causa dessa associação
● Saliência de incentivo: Processo cognitivo que confere um
atributo de desejo a um estímulo reforçador
8. 8 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Desejo vs. prazer
● O desejo (“querer”) é diferente do prazer (“gostar”); esse último é o
prazer que é imediatamente obtido da aquisição ou consumo de um
estímulo de recompensa
● O componente de desejo da saliência de incentivo serve como “ímã
motivacional”, fazendo com que o estímulo seja desejável e atraente,
transformando-o de mera experiência sensorial em algo que comanda a
atenção, induz aproximação, e seja ativamente procurado
● A saliência de incentivo é regulada pela concha do núcleo acumbente,
principalmente pela transmissão dopaminérgica da projeção mesolímbica
9. 9 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Tomada de decisão, recompensa, e incentivo
● Evidências convergentes da economia
comportamental, psicologia e neurociência, e
ciência da computação sugerem que as
decisões são baseadas na previsão do valor ou
utilidade esperada da decisão.
● O valor normalmente é definido como
recompensa futura total esperada, levando em
consideração a probabilidade de receber a
recompensa e o intervalo antes que a
recompensa seja recebida
10. 10 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Estratégias de tomada de decisão
● Redish et al. (2008): todas as teorias psicológicas sobre
tomada de decisão convergem em duas estratégias:
– Um sistema de planejamento cognitivo, flexível mas lento
● Envolve córtex entorrinal, hipocampo, e estriado ventral (n. acumbente) e
dorsomedial, córtex pré-frontal medial pré-límbico, córtex orbitofrontal
● Entrada dopaminérgica da VTA
● Apresenta desvalorização
– Um sistema baseado em hábito, inflexível (porque automático)
mas rápido
● Envolve estriado dorsolateral, córtex pré-frontal medial infralímbico, e córtex
parietal
● Entrada dopaminérgica da SNc
● Não apresenta desvalorização
11. 11 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Aprendizagem e tomada de decisão
Sistema Descrição Teoria da
aprendizagem
Relação entre
estímulos
Expectativa
Observação S → SR
Respondente /
Pavloviana
S – S E(SR
)
Planejamento S → R → SR
Controle de
estímulos
S – SR
E(SR
) → E(V)
Planejamento S → R → SR
Instrumental /
operante
R → SR
E(SR
) → E(V)
Hábito S → R Hábito S → R E(V)
12. 12 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
O sistema de planejamento
● Exige o reconhecimento de uma situação e/ou contexto S, identificação das consequências da ação R
no contexto S, e avaliação do valor alcançar o resultado S+
● Como o valor da ação R na situação S é calculado a partir do valor de alcançar o resultado esperado
SR
, que é calculado online a partir das necessidades atuais do agente, se o desejo pelo resultado
muda, o cálculo do valor pode refletir essa mudança
●
A arquitetura desse sistema exige 3 componentes em interação:
– Componente de reconhecimento da situação, que classifica a interação complexa
entre estímulos e contexto para identificar a situação na qual o sujeito se encontra córtex→
– Componente de previsão, que calcula as consequências das ações potenciais hipocampo,→
córtex frontal
– Componente de avaliação, que calcula o valor dessas consequências levando em
consideração tempo, esforço, e probabilidade de receber a recompensa amígdala, estriado ventral→
13. 13 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Hábitos, impulsividade, e compulsão
● Os hábitos constituem um tipo de compulsão e podem ser considerados como respostas
desencadeadas por estímulos ambientais, independentemente da vontade atual das
consequências dessa resposta
● Podem ser vistos como respostas condicionadas a um estímulo condicionado que foram
reforçadas e fortalecidas por experiências passadas com recompensa (reforço positivo)
ou com omissão de um evento aversivo (perda do reforço negativo)
● Tendo em vista que as ações dirigidas a metas são, em termos cognitivos, relativamente
exigentes, pode ser adaptativo, para as rotinas diárias, depender de hábitos que sejam
executados com mínima percepção consciente.
● Os hábitos também podem representar a perseveração gravemente não adaptativa de
comportamentos
14. 14 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Esses circuitos equivalem aos circuitos de
impulsividade e compulsividade
STAHL, S. M. Psicofarmacologia: Base neurocientifica e aplicações práticas. 2.ed. Rio de Janeiro: Guanabara Koogan, 2006
15. 15 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Transições entre os circuitos
● O comportamento normalmente se inicia com sistemas
flexíveis de planejamento, mas, para comportamentos
repetidos, pode passar a ser guiado pelo sistema de hábito,
menos flexível mas também menos intensivo
computacionalmente
– “Migração dorsal”
● O sistema de hábito também pode adquirir comportamentos
sem influência do sistema de planejamento
16. 16 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
“Migração dorsal” e drogadição
● O uso inicial de substâncias é voluntário e ligado ao traço de
impulsividade
● Os impulsos para o uso de substâncias ou a realização de
determinados comportamentos produzem reforçamento
sensu Thorndike
● Se isso ocorre com pouca frequência, não desencadeando
cascatas neuroplásticas da área ventral para a dorsal, o
comportamento permanece sob relativo controle
● A alta frequência pode evoluir para o uso compulsivo,
impulsionado pelo desejo de reduzir os sintomas incômodos
de abstinência que se desenvolvem com o passar do tempo,
conforme o uso de substância/comportamento é repetido
inúmeras vezes
● Tensão e ativação antecipadamente à realização do
comportamento, mas com humor disfórico (mas sem
abstinência fisiológica) quando impedidos de executar o
comportamento ou de usar a substância
STAHL, S. M. Psicofarmacologia: Base neurocientifica e aplicações práticas. 2.ed. Rio de Janeiro: Guanabara Koogan, 2006
17. 17 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Teoria comportamental da dependência como
escolha
● Esses sistemas de planejamento,
hábito, e tomada de decisão entram
em ação sempre que é preciso fazer
uma escolha
– Diferentes estratégias de escolha:
Melhoração (matching law),
maximização
● Heyman, G. M. (1996). Resolving
the contradictions of addiction.
Behavioral and Brain Sciences, 19,
561-610
George Heyman
18. 18 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Teoria comportamental da dependência como
escolha
● A dependência de drogas segue padrão previsto pela estratégia de melhoração
● O consumo repetido de uma substância ocasiona a diminuição progressiva do
valor de reforçadores alternativos
● “Dependentes são controlados pelo valor reforçador local, imediato, do consumo
da droga que, como foi colocado, é maior do que o valor reforçador local das
outras atividades. Dependentes, então, usam como estratégia a melhoração.
Usuários não dependentes, por outro lado, maximizam, pois são controlados pelo
valor reforçador combinado da droga e das atividades concorrentes, tanto local
quanto futuro.” (Garcia-Mijares & Silva, 2006, p. 222)
19. 19 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Teoria comportamental da dependência como
escolha
● O que determina qual estratégia assume controle?
– Quando as consequências do comportamento são mais remotas no
tempo, a eficácia da função de maximização aumenta, mas quando
o reforço é mais imediato, aumenta a eficácia da função de
melhoração
● O que faz com que as drogas, mas não outros reforçadores,
produzam esse efeito são características específicas:
– Diminuem o valor reforçador de outras atividades
– Efeitos imediatos
– Demora em produzir saciação e abstinência
– Produção de mudanças pronunciadas no SNC
20. 20 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
A teoria da sensibilização do incentivo (Kent
Berridge)
● Os sistemas de previsão / impulsividade e recompensa medeiam as funções básicas motiacionais do incentivo,
sendo responsáveis pela saliência dos estímulos
● A administração repetida de drogas causa mudanças nesses sistemas, e, como consequência disso, esses
ficam hipersensíveis a efeitos específicos da droga e a estímulos associados a eles
● A sensibilização neural produz mudanças psicológicas que fazem que as representações associadas à droga
tenham uma excessiva saliência, acarretando com isso um desejo patológico da droga
● A ativação desses sistemas sensibilizados, ou seja, dos sistemas que atribuem a saliência dos estímulos
associados à droga, pode se expressar em fi ssura pela droga e em comportamentos de procura da droga, sem
que a pessoa tenha emoções, desejos ou objetivos conscientes dessa procura
● Os sistemas sensibilizados responsáveis pela excessiva saliência dos estímulos são diferentes daqueles que
medeiam os efeitos hedônicos ou euforizantes das drogas
21. 21 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Vulnerabilidades no sistema de planejamento
David Redish
●
Diferentemente de Heyman e Berridge, Redish sugere que todo o
sistema de planejamento pode conter vulnerabilidades que, por sua vez,
tem importância clínica
Descrição Consequência
clínica
Vuln. 1 Desvio da homeostase Abstinência
Vuln. 2 Mudança de set-points alostáticosMudança de funções
fisiológicas, fissura
Vuln. 3 “Simulação” da recompensa Seleção de ação
incorreta, fissura
Vuln. 4 Sensibilização da motivação Seleção de ação
incorreta, fissura
Vuln. 5 Aumento na probabilidade de
escolher uma contingência
Obsessão
22. 22 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
Vulnerabilidades no sistema de reconhecimento de situações e
no sistema de hábito
Descrição Sistema envolvido Consequência clínica
Vuln. 6a Classificação inadequada das
situações: Super-categorização
Reconhecimento de
situações
Ilusão de controle, viés
de retrospectiva
Vuln. 6b Classificação inadequada das
situações: Super-generalização
Reconhecimento de
situações
Perseveração face a
perdas
Vuln. 7 Super-avaliação das ações Hábito Uso “automatizado”,
“robótico” da droga
Vuln. 8 Inibição seletiva do sistema de
planejamento
Interação entre sistemas Desenvolvimento rápido
de aprendizagem de
hábitos
Vuln. 9 Processo de desconto temporal
rápido demais
Interação entre sistemas Impulsividade
Vuln. 10 Mudanças na taxa de
aprendizagem
Interação entre sistemas Excesso de associações
entre pistas e droga(s)
23. 23 Alcoolismo drogadição e práticas interdisciplinares Prof. Caio Maximino
“Caminhando” pelas vulnerabilidades
● O uso experimental ou recreativo pode ser repetido devido ao efeito euforizante,
farmacológico, ou de reforçador social
– Efeitos euforizantes ou reforçamento social podem levar ao uso repetido pela associação
com sinais de recompensa (Vulnerabilidade 3)
– Efeitos farmacológicos podem levar ao uso repetido por mudanças rápidas no set-
point homeostático (Vulnerabilidade 1)
● O uso repetido pode levar à potencialização de relações S R S→ → R
no sistema de
planejamento (saliência de incentivo, Vulnerabilidade 4) e a mudanças em set-points
alostáticos (Vulnerabilidade 2), levando a forte desejo e fissura
● Com uso habitual suficiente, as ações levando ao uso de drogas podem se tornar
super-valorizadas no sistema de hábito (“Migração dorsal”, Vulnerabilidade 7)