SlideShare uma empresa Scribd logo
1 de 6
Baixar para ler offline
FUNDAMENTOS DA PSICOLOGIA EXPERIMENTAL
                            PASSO 10 – Esquemas Complexos de Reforçamento

Objetivos: 1) Definir, identificar e dar exemplos de esquemas complexos de reforçamento (DRL, DRH,
DRO, DRA e DRI); 2) Descrever a relação entre esquemas de tempo (FT e VT) e a produção de
comportamento supersticioso; 3) Comparar esquemas de reforçamento simples com esquemas de
reforçamento complexos.

          Esquemas de Reforçamento de Tempo (FT e VT) & Comportamento Supersticioso
        Você viu, no passo anterior, que nos esquemas de intervalo o reforço está disponível se ocorrer
uma resposta após a passagem de um certo tempo. Consideremos agora a possibilidade de o reforço ser
apresentado em função da mera passagem do tempo, ou seja, após a passagem de um determinado
intervalo de tempo, o reforçamento ocorre mesmo que nenhuma resposta tenha ocorrido. Nesse caso o
reforço seria apresentado, independente de qualquer resposta, após um tempo fixo (FT: Fixed Time) ou
variável (VT: Variable Time), digamos depois de 3 minutos fixos (FT3’) ou após em média 14 segundos
(VT14’’). Um fenômeno curioso gerado por esse esquema foi observado por Skinner (1948) após ele ter
programado a liberação de alimento em função da passagem de períodos fixos de tempo, 15 segundos.
Muitos pombos submetidos a esse esquema apresentaram o que Skinner chamou de “comportamento
supersticioso”. Não havia qualquer relação entre o que os pombos faziam e a produção do alimento (ou
seja, o alimento seria apresentado de qualquer forma após o tempo ter passado), mas, ainda assim, as
respostas que antecediam a apresentação do alimento eram pronta e momentaneamente fortalecidas.
Skinner observou que vários de seus sujeitos adquiriam padrões ritualísticos, como dar volta sobre seu
próprio eixo antes de se dirigirem ao comedouro. Os desempenhos específicos acabavam se
enfraquecendo com o passar do tempo e tendiam a desaparecer, sendo substituídos por outros que haviam
coincidido com a apresentação do alimento, sugerindo o caráter temporário do evento comportamental
supersticioso produzido dessa forma1. O mesmo fenômeno foi produzido em seres humanos (Ono, 1987).
Vinte participantes foram postos diante de 3 alavancas. Um mostrador de pontos ficava na frente deles e,
independente do que fizessem, um certo número de pontos foi programado para aparecer de tempos em
tempos. Quase todos os participantes apresentaram algum tipo de padrão supersticioso relacionado à
liberação não contingente de pontos durante a sessão, ou seja, respostas que foram seguidas pela
apresentação de pontos aumentavam pronta e momentaneamente de freqüência, mesmo não havendo uma
relação de contingência entre os dois eventos. Como no caso dos pombos, os comportamentos assim
estabelecidos eram idiossincráticos (variavam de indivíduo para indivíduo e de tempos em tempos no
mesmo indivíduo) e temporários (tendiam a desaparecer após algumas emissões não coincidentes com a
liberação dos pontos, sendo substituídos por outros padrões que igualmente haviam coincidido com a
liberação do reforço). Ao usar um computador podemos eventualmente ter respostas supersticiosas sendo
fortalecidas por reforçamento acidental (a ocorrência não contingente de algum evento reforçador, a
resolução de um problema qualquer, por exemplo). Isso já aconteceu com você ou com alguém que você
conhece?
        O fenômeno do comportamento superticioso registrado por Skinner é importante por várias razões
e uma delas é teórica: o reforço pode afetar o responder mesmo sem uma relação de contingência
(dependência) entre a conseqüência e as respostas imediatamente anteriores, ou seja, sem que o reforço
tenha sido produzido por alguma coisa que o organismo tenha feito antes. A mera contigüidade, uma
seqüência espaço-temporal entre dois eventos não relacionados de maneira causal, seria suficiente para
afetar, e talvez definir, um operante. Você lembra da definição inicial de operante? Nas palavras de
Skinner (1957/1978): “Os homens agem sobre o mundo, modificam-no e, por sua vez, são modificados
pelas conseqüências de sua ação.” (p. 15). A conseqüência precisa SER PRODUZIDA pela ação prévia
para que seja afetada por ela? Vimos no caso do comportamento supersticioso que não. A mera
contigüidade entre a resposta e o reforço pode tornar a resposta mais freqüente em ocesiões futuras.
Freqüentemente respostas e reforços contingentes um ao outro são também contiguos. Também com
freqüência, respostas e conseqüências reforçadoras não contingêntes são apenas ocasionalmente contíguas

1
  Para uma discussão mais ampla e atualizada sobre o comportamento supersticioso, ver Benvenuti (2001). Para uma revisão
crítica da área, ver Herrnstein (1975). E para uma expansão do uso do conceito para tentar entender a credulidade humana e a
facilidade com a qual somos enganados pelo misticismo, ver Dawkins (2000, cap. 7).
Fundamentos de Psicologia Experimental   Passo 10                            2
(de maneira que o evento reforçador pode acontecer na ausência da resposta inicialmente reforçada de
maneira acidental). Isso pode ser parte das razões pelas quais o comportamento supersticioso tende a ser
transitório. Por fim, é válido dizer que essa discussão nos permite concluir que contingências de
reforçamento tendem a ser mais efetivas quando é maior a contigüidade entre a resposta operante e suas
conseqüências reforçadoras.

                        Esquemas de Reforçamento Diferencial I: DRL e DRH.
        “Ao se considerar os efeitos de certos esquemas de reforçamento, recorre-se sempre ao fato
        de que taxas diferentes de resposta tornam-se diferencialmente correlacionadas com o
        reforçamento. Assim, esquemas de intervalo variável tendem a fornecer reforçamento
        diferencial após taxas baixas e esquemas de razão variável tendem a fornecer reforçamento
        diferencial depois de taxas altas. Uma vez que o efeito do reforçamento é fortalecer
        qualquer que seja o comportamento que vem antes dele, esses esquemas agem
        indiretamente no fortalecimento de certas taxas de comportamento. Se desejarmos,
        poderemos fazer surgir uma diferenciação mais direta e invariante pela especificação dos
        limites, condições ou restrições da taxa do operante que deve ser reforçado.
        No reforçamento diferencial de taxas baixas (drl), um operante R é primeiro especificado e
        fortalecido. Quando R tiver sido suficientemente fortalecido, ele é tornado um elemento de
        uma nova especificação de resposta de ordem superior: somente os elementos de resposta
        que estão separados entre si pelo mínimo de certa passagem de tempo são agora reforçados.
        Assim, o procedimento drl reforça um certo comportamento somente quando precedido de
        uma pausa.” (Millenson, 1975, p.176).
        A contingência em vigor força um padrão de responder lento, onde “esperar” é essencial para que
o reforço seja produzido. Se uma resposta ocorrer antes do tempo estabelecido, a conseqüência será o
adiamento do reforço e não o aumento de sua probabilidade, portanto, o responder no intervalo
especificado leva a um adiamento da possibilidade de reforçamento. Chamamos esse esquema de Reforço
Diferencial de Baixas Taxas ou de forma abreviada DRL (Differential Reinforcement Low Rates) e seu
principal efeito é, como seu próprio nome indica, a produção de taxas baixas de resposta. O esquema
DRL é amplamente adotado como um procedimento redutor da freqüência de uma classe de respostas,
podendo ser usado em certos contextos como uma alternativa à punição positiva (Holz & Azrin, 1963).
Exemplo: Quando a atenção dada pela professora parece estar mantendo o comportamento de “fazer
piadas em sala durante a aula” de um aluno e que cada piada feita acaba produzindo um comentário ou
um sorriso da professora (CRF), então você poderia reduzir a freqüência desse comportamento “alvo” a
partir da mudança nas contingências de reforçamento em vigor. Partindo da freqüência real desse
comportamento, digamos 60 ocorrências por hora, o reforço poderia ser arranjado para ser apresentado
somente se a resposta ficasse 10’ sem ocorrer, sendo esse valor gradualmente ampliado até que o critério
fosse uma resposta por hora no máximo. A taxa de respostas nesse esquema não é totalmente suprimida
(zerada). Ela é reduzida a níveis muito baixos, pois o ritmo de responder é desacelerado. Você consegue
imaginar o uso desse esquema para lidar com certos problemas comportamentais típicos de crianças
classificadas com “hiperativas”? É possível relacionar o resultado desse esquema com o que chamamos
tradicionalmente de “autocontrole”?
        No segundo exemplo, ao invés de desacelerar, o responder precisa ser acelerado para que o reforço
seja produzido. Se não ocorrer um número mínimo de resposta durante um determinado tempo, então, o
reforço não estará disponível para a próxima resposta. Também aqui um padrão de responder
incompatível com o esquema produz o adiamento da oportunidade de reforço. Chamamos esse esquema
de Reforço Diferencial de Altas Taxas ou DRH (Differential Reinforcement High Rates) e seu efeito é um
padrão de responder alto em intervalos relativamente curtos de tempo. No laboratório a exigência poderia
ser a emissão de 120 RPB’s a cada minuto para que uma gota de água seja apresentada e no dia a dia
podemos ver certos acordos de trabalho produtivistas que estabelecem um valor mínimo de respostas de
“atendimento aos pacientes” por experiente (em um consultório médico, por exemplo) para que um bônus
seja pago pelo Governo. Não há uma óbvia aplicação desse esquema no sistema de produção, seja na
indústria seja no comércio? Você consegue descrever de que forma isso poderia ser feito a pretexto de
aumentar a produtividade de um vendedor? Saiba, apenas, que o responder em altas taxas em curtos
períodos não pode ser mantido por muito tempo sem a deterioração do desempenho, o esquema é,
Fundamentos de Psicologia Experimental    Passo 10                            3
portanto, frágil na manutenção do seu desempenho tipicamente acelerado (Catania, 1999). Note que o
esquema não é útil apenas aos propósitos capitalistas, podendo ser úteis para tornar certas respostas
sociais ou verbais, por exemplo, mais prováveis. Diante de uma criança chamada de “tímida” que
apresenta uma freqüência quase nula de respostas sociais, um esquema de DRH poderia ser usado para
tornar tais respostas mais prováveis e com elas a produção de outros reforçadores sociais importantes.
Esse esquema pode também ser aplicado aos estudantes que demoram muito para responder as questões
dos passos. Nesse caso, o professor estabeleceria um DRH 30 minutos de acordo com o qual, haveria uma
exigência de que o estudante respondesse 5 questões de passo no tempo máximo de 30 minutos, caso
contrário ele deveria reiniciar um novo conjunto de 5 questões.

                     Esquemas de Reforçamento Diferencial II: DRO, DRA e DRI.
        Há alguns esquemas adicionais especialmente usados como alternativas ao uso da punição positiva
com o igual objetivo de reduzir a freqüência de certas classes de respostas identificadas como
problemáticas para o próprio indivíduo ou para os outros, por exemplo, um padrão autolesivo ou
agressivo. Tais esquemas programam o reforçamento a partir da especificação de um comportamento alvo
(ou problema) a ser suprimido e substituído por outro ou por outros. Veremos agora três desses esquemas
e suas variações mais comuns.
        DRO (Differential Reinforcement of Other Behaviors): A liberação do reforço pode ser
programada para ocorrer contingente a emissão de qualquer outro comportamento diferente do
comportamento alvo (colocado em extinção). Se a RPB fosse o comportamento alvo, então, qualquer
outro comportamento diferente se emitido, produziria o reforço. Em uma situação aplicada o
comportamento alvo poderia ser uma resposta autolesiva como “morder o próprio braço” ou “esfregar os
olhos continuamente”. Tendo sido definida a resposta ou as respostas que queremos enfraquecer e
identificado um reforçador poderoso para um conjunto de respostas naquele contexto, passamos a
apresentar o tal reforço contingente a apresentação de qualquer outra resposta que não a alvo. Uma
variação desse procedimento seria apresentar o reforço simplesmente após a passagem de um tempo
pré-definido (FT5´, por exemplo), desde que a resposta alvo não tenha ocorrido (esse esquema é
conhecido também como “reforçamento diferencial de comportamento zero”). Digamos que uma gota de
água seja liberada a cada 10 segundos, desde que não ocorram pressões a barra nesse intervalo. As RPB’s
apenas adiariam a possibilidade de reforçamento. Em um exemplo aplicado, o reforço social é
apresentado após 1 minuto somente se não forem registradas respostas autolesivas. Assim, o reforço é
apresentado de tempos em tempos, independente de qualquer resposta, desde que nenhuma ocorrência de
comportamento agressivo seja registrada no intervalo previamente definido.
        DRA (Differential Reinforcement of Alternative Behavior): Ao invés de ser liberado ou pela
emissão de qualquer resposta diferente da resposta alvo ou automaticamente após a passagem de um
tempo, desde que a resposta alvo não tenha ocorrido (como no DRO), podemos programar o reforçamento
contingente a emissão de uma resposta específica, diferente da resposta alvo, chamada aqui de
“alternativa”. No laboratório, ainda considerando a RPB como resposta alvo a ser enfraquecida (posta em
extinção), poderíamos programar a liberação da gota de água contingente a ocorrência da resposta
alternativa de “farejar a barra”. Na situação aplicada o reforço poderia ser contingente a emissão da
resposta de “tocar o braço com os lábios”, enquanto a resposta alvo, “morder o braço”, seria colocada em
extinção. A grande diferença para o DRO é que no DRA uma resposta diferente da resposta alvo é
previamente especificada.
        DRI (Differential Reinforcement of Incompatible Behavior): Trata-se de uma variação do DRA,
com a exigência adicional de que a resposta alternativa deveria ser física ou funcionalmente incompatível
com a resposta alvo. Ou seja, a emissão da resposta incompatível tornaria menos provável a emissão da
resposta alvo, a ser enfraquecida. No laboratório, então, poderíamos eleger a resposta de “erguer a barra”
como incompatível a de “pressionar a barra” (resposta alvo). Erguer a barra impede, fisicamente, a
emissão de pressionar, o que torna a resposta alvo, colocada em extinção, ainda menos provável. Em um
contexto aplicado, exigir para a liberação do reforço a apresentação da resposta de “colocar as mãos nos
bolsos” impediria fisicamente a apresentação da resposta alvo “morder o braço” (posta em extinção).
        Veja que todos esses esquemas envolvem o reforçamento diferencial, ou seja, o reforçamento está
disponível em um contexto e não em outro. Temos, então, reforçamento (para um grupo de respostas) e
extinção (para outro grupo de respostas) atuando em conjunto na modelagem de um determinado
Fundamentos de Psicologia Experimental    Passo 10                           4
repertório comportamental. Se a emissão da resposta alvo levar ao adiamento da oportunidade de
reforçamento, então, teremos não simplesmente extinção, suspensão não contingente do reforçamento,
mas uma contingência aversiva em vigor: punição negativa.
        O psicólogo será confrontado (na educação especial, na clínica, no hospital, por exemplo) com
problemas nos quais a emissão de certas respostas coloca em risco a integridade ou mesmo a vida de uma
pessoa ou/e das pessoas que o cercam. Reduzir a freqüência de tais comportamentos passa a ser essencial
e ele terá que planejar estratégias de redução ou supressão do responder. Além de enfraquecer certas
respostas, a função educativa do psicólogo envolverá a construção de repertórios mais saudáveis que
melhorem a qualidade de vida da pessoa atendida por ele. Os esquemas descritos aqui (DRL, DRO, DRA
e DRI) são parte de uma tecnologia comportamental importante para entender, planejar e conseguir a
ocorrência de comportamentos e que vêm se mostrando eficazes instrumentos de intervenção. Observe,
contudo, que a descrição aqui realizada é apenas um passo inicial na sua formação. Quando for necessário
trabalhar com manutenção de comportamentos, o aprofundamento nesse tópico é essencial. A leitura de
Le Blanc, Reuter, Miller e Schilmoeller (1977), Vollmer, Roane, Ringdahl e Marcus (1999), Corte, Wolf
e Locke (1971), Favell, Azrin, Baumeister, Carr, Dorsey, Forehand, Foxx, Lovaas, Rincover, Risley,
Romanczyk, Russo, Schroeder e Solnick (1982), Lerman, Iwata, e Wallace (1999) e Lerman e Vorndran
(2002) fica como sugestão.

                    Esquemas Múltiplo, Misto, Encadeado, Tandem e Concorrente
       O mundo real não é constituído de contingências estanques ou separadas, então, é mais provável
de encontrarmos os esquemas descritos de forma combinada. Algumas dessas combinações serão
exploradas aqui, principalmente os seus procedimentos. Você poderá obter uma descrição detalhada dos
processos e resultados particulares de cada esquema mencionado em Ferster & Skinner (1957) e Catania
(1999, caps. 10 e 11). Nosso objetivo aqui é apenas apresenta-lo ao tema.
       Podemos ver dois ou mais esquemas em ação no mesmo arranjo de contingências. Em um
esquema Múltiplo cada esquema diferente de um arranjo possui seu próprio SD. Assim, em um esquema
Múltiplo FI60” e FR10, os antecedentes são diferentes para cada um deles: Na presença da luz vermelha,
vigora o FI60”, mas na presença da luz verde vigora o esquema FR10. Uma característica importante
desse esquema é que a alternância ocorre de forma sinalizada diante do mesmo operando, ou seja, tanto as
respostas diante da luz azul quanto da luz vermelha ocorrem diante, por exemplo, de respostas de bicar
um disco. A figura abaixo mostra um esquema múltiplo VI60” (na presença de uma luz vermelha) e FR10
(na presença de uma luz verde). Observe que o desempenho, após algumas sessões, está plenamente
adaptado ao esquema: a taxa típica que produz o reforço é rapidamente apresentada diante de cada
discriminativo.
Fundamentos de Psicologia Experimental   Passo 10                          5
        Uma variação desse esquema complexo seria manter os dois esquemas componentes
mencionados, FI60” e FR10, mas sem sinalizar quando cada um estaria em vigor. Tal esquema é chamado
de Misto e nele dois ou mais esquemas componentes são alternados no mesmo operandun (ou seja, no
mesmo dispositivo de resposta, como por exemplo a barra na caixa de Skinner) sem qualquer sinalização
externa antecedente programada. Sem a presença de discriminativos claros, como você acha que seria a
aprendizagem nesse esquema?
        Um outro tipo de esquema seria o Encadeado. Nesse arranjo dois ou mais esquemas componentes
estariam postos em seqüência, por exemplo, FI60” (Esquema 1) e FR10 (Esquema 2), sendo que cumprir
os requisitos do primeiro conduziria ao segundo que, somente após finalizado, produziria o reforçador
final. A conseqüência para o engajamento do esquema 1 seria o acesso ao esquema 2 que por sua vez
poderia conduzir ao reforçador terminal. Cada um dos esquemas componentes é correlacionado com um
SD específico. Assim, diante de FI60” vigora uma luz verde. O cumprimento desse esquema produz uma
luz amarela que sinaliza a presença de uma nova contingência de reforçamento: o esquema FR10. Ao
completar o FR10 o reforçador final é aí sim produzido:




        Uma variação desse esquema seria produzida pela manutenção da cadeia exigida, mas com a
remoção dos estímulos discriminativos específicos para cada esquema componente. Imagine a mesma
seqüência FI60” FR10 sem qualquer evento antecedente sinalizando quando cada esquema particular
estaria em vigor. Esse esquema é chamado de Tandem. Sem os discriminativos claramente indicados,
como você imagina que ocorra a aprendizagem da seqüência?
        Mas os esquemas componentes podem ser dispostos em arranjos de escolha, onde dois ou mais
esquemas componentes estariam em vigor em diferentes operandos ao mesmo tempo. Assim, poderíamos
ter agora duas barras funcionando simultaneamente, uma a esquerda e outra a direita da concha, sendo
que em uma estaria em vigor um FR10 e na outra um VR10. Um esquema como esse é chamado de
Concorrente e é paradigmático para investigar contingências de escolha e tomada de decisão. Podemos,
inclusive, tentar entender certos padrões comportamentais envolvidos no chamado “autocontrole”. Uma
configuração clássica é arranjar dois esquemas componentes em situação de escolha, sendo que em um
estaria em vigor um esquema onde uma quantidade menor, mas imediata, de reforço estaria disponível e
em outro a quantidade de reforço seria maior, mas não estaria a disposição tão imediatamente quanto no
primeiro caso. Podemos ter variações manipulando também o custo da resposta (o número de respostas
exigidas pela contingência, por exemplo) para iguais quantidades de reforço em cada esquema
componente.
                Um esquema derivado do anteriormente descrito e também usado em estudos de escolha
seria o Conjugado. Nele dois ou mais esquemas também estariam em vigor de forma simultânea, mas no
mesmo operando. Se no Concorrente cada esquema ocorreria para respostas diferentes, aqui os esquemas
componentes teriam uma única possibilidade de resposta. Nosso rato poderia tanto produzir água tanto
Fundamentos de Psicologia Experimental   Passo 10                            6
atingindo as exigências do esquema de FR10 quanto do esquema de VR10 (o que ocorresse primeiro),
pressionando a mesma barra.
              Há muitas outras possibilidades de arranjar as contingências de reforçamento em situações
cada vez mais complexas, por exemplo, quando o próprio desempenho em um esquema serve como
parâmetro para definir o valor do outro esquema em vigor. Para esse momento nos bastaria que você
fosse capaz de identificar os esquemas aqui mencionados e soubesse onde pesquisar para obter mais
informações a respeito.

                                             REFERÊNCIAS
Benvenuti, M. F. (2001). Comportamento “supersticioso”: possíveis extensões para o comportamento
   humano. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre
   Comportamento e Cognição Vol. 8 (pp. 29-34). Santo André: ESETec.
Catania, C. A (1999). Aprendizagem: Comportamento, Linguagem e Cognição. Porto Alegre: ArtMed.
Corte, H. E. , Wolf, M. M. and Locke, B. J. (1971). A comparison of procedures for eliminating self-
   injurious behavior of retarded adolescents. Journal of Applied Behavior Analysis, 4 (3), 201-213.
Dawkins, R. (2000). Desvendando o arco-íris: ciência, ilusão e encantamento. São Paulo: Companhia das
   Letras.
Favell, J. E., Azrin, N. H., Baumeister, A. A., Carr, E. G., Dorsey, M. F., Forehand, R., Foxx, R. M.,
   Lovaas, O. I., Rincover, A., Risley, T. R., Romanczyk, R. G., Russo, D. C., Schroeder, S. R. and
   Solnick, J. V. (1982). The treatment of self-injurious behavior. Behavior Therapy, 13, 529-554.
Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-
   Crofts
Herrnstein, R. J. (1975). Supertición: un corolario de los principios del condicionamento operante. Em W.
   K. Honig (Ed.), Conducta operante: investigación y aplicaciones (pp. 50-71). México: Trillas.
Holz, W. C. & Azrin, N. H. (1963). A comparison of several procedures for eliminating behavior.
   Journal of the Experimental Analysis of Behavior, 6 (3), 399-406.
Le Blanc, J. M., Reuter, K. E., Miller, D. N e Schilmoeller, G. L. (1977). Laboratory investigations of
   applied behavior analysis techniques: procedures designed to decrease or eliminate responding. Em B.
   C. Etzel, J. M. Le Blanc and D. M. Baer (Eds.), New developments in behavioral research (p.180-
   229). Hilsdale, NJ: Lawrence Erlbaum Associates, Publishers.
Lerman, D. C. & Vorndran, C. M. (2002). On the status of Knowledge for using Punishment:
   Implications for treating behavior disorders. Journal of Applied Behavior Analysis, 35 (4), 431-464.
Lerman, D. C.; Iwata, B. A. & Wallace, M. D. (1999). Side effects of extinction: Prevalence of bursting
   and agression during treatment of self-injurius behavior. Journal of Applied Behavior Analysis, 35
   (4), 431-464.
Lundin, R. W. (1972). Personalidade: Uma análise do comportamento.São Paulo: Herder/EDUSP.
Machado, L M. C. M. (1986). Esquemas de reforçamento positivo I – esquemas simples. Psicologia, 12
   (2), 1-15.
Millenson, J. R. (1975). Princípios de análise do comportamento. Brasília: Coordenada.
Ono, K. (1987). Superstitious behavior in humans. Journal of the Experimental Analysis of Behavior,
   47, 261-271.
Skinner, B. F. (1948). "Superstition" in the pigeon. Journal of Experimental Psychology, 38 (2), 168-
   172.
Skinner, B. F. (1978). O comportamento verbal. São Paulo: Cultrix. Publicado originalmente em 1957.
Staddon, J. E. R. & Simmelhag, V. L. (1971). The superstition experiment. Psychological Review, 78, 3-
   43.
Vollmer, T. R., Roane, H. S., Ringdahl, J. E. and Marcus, B. A. (1999). Evaluating treatment challenges
   with differential reinforcement of alternative behavior. Journal of Applied Behavior Analysis, 32 (1),
   9-23.

Mais conteúdo relacionado

Mais procurados

Discriminação e controle de estímulos 1
Discriminação e controle de estímulos 1Discriminação e controle de estímulos 1
Discriminação e controle de estímulos 1Caio Maximino
 
Discriminação e controle de estímulos 2
Discriminação e controle de estímulos 2Discriminação e controle de estímulos 2
Discriminação e controle de estímulos 2Caio Maximino
 
Controle aversivo interação resp-oper
Controle aversivo   interação resp-operControle aversivo   interação resp-oper
Controle aversivo interação resp-operanogueiran
 
Discriminacao simples-e_generalizacao
Discriminacao simples-e_generalizacaoDiscriminacao simples-e_generalizacao
Discriminacao simples-e_generalizacaoNilson Dias Castelano
 
Aprendizagem no Condicionamento Operante
Aprendizagem no Condicionamento OperanteAprendizagem no Condicionamento Operante
Aprendizagem no Condicionamento OperanteCatarinaNeivas
 
Processos Mentais 3 - Aprendizagem
Processos Mentais 3 - AprendizagemProcessos Mentais 3 - Aprendizagem
Processos Mentais 3 - AprendizagemJorge Barbosa
 
Psicologia Experimental e Aprendiza
Psicologia Experimental e AprendizaPsicologia Experimental e Aprendiza
Psicologia Experimental e AprendizaMarcus Alves
 
Aula 2 os conceitos de discriminação e generalização
Aula 2 os conceitos de discriminação e generalizaçãoAula 2 os conceitos de discriminação e generalização
Aula 2 os conceitos de discriminação e generalizaçãoPsicologia_2015
 
Aula 7 aprendizagem sem errro
Aula 7 aprendizagem sem errroAula 7 aprendizagem sem errro
Aula 7 aprendizagem sem errroPsicologia_2015
 
Trabalho aec 1
Trabalho aec 1Trabalho aec 1
Trabalho aec 1unieubra
 
Operações estabelecedoras
Operações estabelecedorasOperações estabelecedoras
Operações estabelecedorasCaio Maximino
 

Mais procurados (20)

Discriminação e controle de estímulos 1
Discriminação e controle de estímulos 1Discriminação e controle de estímulos 1
Discriminação e controle de estímulos 1
 
Lei do efeito
Lei do efeitoLei do efeito
Lei do efeito
 
Punição positiva x negativa
Punição positiva x negativaPunição positiva x negativa
Punição positiva x negativa
 
Discriminação e controle de estímulos 2
Discriminação e controle de estímulos 2Discriminação e controle de estímulos 2
Discriminação e controle de estímulos 2
 
Controle aversivo interação resp-oper
Controle aversivo   interação resp-operControle aversivo   interação resp-oper
Controle aversivo interação resp-oper
 
Interação operante-respondente
Interação operante-respondenteInteração operante-respondente
Interação operante-respondente
 
Aprendizagem[1]
Aprendizagem[1]Aprendizagem[1]
Aprendizagem[1]
 
Aprendizagem operante
Aprendizagem operanteAprendizagem operante
Aprendizagem operante
 
Discriminacao simples-e_generalizacao
Discriminacao simples-e_generalizacaoDiscriminacao simples-e_generalizacao
Discriminacao simples-e_generalizacao
 
Aprendizagem no Condicionamento Operante
Aprendizagem no Condicionamento OperanteAprendizagem no Condicionamento Operante
Aprendizagem no Condicionamento Operante
 
Processos Mentais 3 - Aprendizagem
Processos Mentais 3 - AprendizagemProcessos Mentais 3 - Aprendizagem
Processos Mentais 3 - Aprendizagem
 
Psicologia Experimental e Aprendiza
Psicologia Experimental e AprendizaPsicologia Experimental e Aprendiza
Psicologia Experimental e Aprendiza
 
Aula 2 os conceitos de discriminação e generalização
Aula 2 os conceitos de discriminação e generalizaçãoAula 2 os conceitos de discriminação e generalização
Aula 2 os conceitos de discriminação e generalização
 
Aula 7 aprendizagem sem errro
Aula 7 aprendizagem sem errroAula 7 aprendizagem sem errro
Aula 7 aprendizagem sem errro
 
O reflexo inato
O reflexo inato O reflexo inato
O reflexo inato
 
Reflexos Inatos - conceitos básicos
Reflexos Inatos - conceitos básicosReflexos Inatos - conceitos básicos
Reflexos Inatos - conceitos básicos
 
Trabalho aec 1
Trabalho aec 1Trabalho aec 1
Trabalho aec 1
 
Mente Humana 3
Mente Humana 3Mente Humana 3
Mente Humana 3
 
Operações estabelecedoras
Operações estabelecedorasOperações estabelecedoras
Operações estabelecedoras
 
APRENDIZAGEM
APRENDIZAGEMAPRENDIZAGEM
APRENDIZAGEM
 

Semelhante a Passo 10 2007 1

Operantes e respondentes
Operantes e respondentesOperantes e respondentes
Operantes e respondentesCaio Maximino
 
Operantes respondenteskj
Operantes respondenteskjOperantes respondenteskj
Operantes respondenteskjMary caparotti
 
Gongora controle aversivo 2013
Gongora controle aversivo 2013Gongora controle aversivo 2013
Gongora controle aversivo 2013Rosana Musumeci
 
Relatório - Reforço contínuo e extinção de um comportamento
Relatório - Reforço contínuo e extinção de um comportamentoRelatório - Reforço contínuo e extinção de um comportamento
Relatório - Reforço contínuo e extinção de um comportamentoNarayane Farias
 
O ambientalismo e a abordagem behaviorista
O ambientalismo e a abordagem behavioristaO ambientalismo e a abordagem behaviorista
O ambientalismo e a abordagem behavioristaGLEYDSON ROCHA
 
Aula 01 - Skinner condicionamento e aprendizagem.pptx
Aula 01 - Skinner condicionamento e aprendizagem.pptxAula 01 - Skinner condicionamento e aprendizagem.pptx
Aula 01 - Skinner condicionamento e aprendizagem.pptxCndidaPsi
 
Aula 1 - Introdução à Psicologia Parte 2.pptx
Aula 1 -  Introdução à Psicologia Parte 2.pptxAula 1 -  Introdução à Psicologia Parte 2.pptx
Aula 1 - Introdução à Psicologia Parte 2.pptxCristianoDeOliveira20
 
4316578 (1).ppt
4316578 (1).ppt4316578 (1).ppt
4316578 (1).pptNcleoJoy
 
Método experimental - variáveis e função.pdf
Método experimental - variáveis e função.pdfMétodo experimental - variáveis e função.pdf
Método experimental - variáveis e função.pdfssuser0aa6c1
 
Como dar e receber feedbacks
Como dar e receber feedbacksComo dar e receber feedbacks
Como dar e receber feedbacksIsmael
 
Apostila 4º bimestre_Prof ª Sabrinna
Apostila 4º bimestre_Prof ª SabrinnaApostila 4º bimestre_Prof ª Sabrinna
Apostila 4º bimestre_Prof ª SabrinnaSabrinna Rezende
 
Objetivos Psicologia - Teste Nº4 (12ºAno)
Objetivos Psicologia - Teste Nº4 (12ºAno)Objetivos Psicologia - Teste Nº4 (12ºAno)
Objetivos Psicologia - Teste Nº4 (12ºAno)Maria Freitas
 
Lakatos projeto canoa
Lakatos projeto canoa Lakatos projeto canoa
Lakatos projeto canoa claramw
 

Semelhante a Passo 10 2007 1 (20)

Aprendizado.pdf
Aprendizado.pdfAprendizado.pdf
Aprendizado.pdf
 
Operantes e respondentes
Operantes e respondentesOperantes e respondentes
Operantes e respondentes
 
Operantes respondenteskj
Operantes respondenteskjOperantes respondenteskj
Operantes respondenteskj
 
Terapia Comportamental e Cognitiva
Terapia Comportamental e CognitivaTerapia Comportamental e Cognitiva
Terapia Comportamental e Cognitiva
 
Gongora controle aversivo 2013
Gongora controle aversivo 2013Gongora controle aversivo 2013
Gongora controle aversivo 2013
 
O behaviorismo.docx resumo
O behaviorismo.docx resumoO behaviorismo.docx resumo
O behaviorismo.docx resumo
 
discrimina__oesqref.ppt
discrimina__oesqref.pptdiscrimina__oesqref.ppt
discrimina__oesqref.ppt
 
Relatório - Reforço contínuo e extinção de um comportamento
Relatório - Reforço contínuo e extinção de um comportamentoRelatório - Reforço contínuo e extinção de um comportamento
Relatório - Reforço contínuo e extinção de um comportamento
 
Aula 6 curso básico cep fusco2
Aula 6 curso básico cep fusco2Aula 6 curso básico cep fusco2
Aula 6 curso básico cep fusco2
 
O ambientalismo e a abordagem behaviorista
O ambientalismo e a abordagem behavioristaO ambientalismo e a abordagem behaviorista
O ambientalismo e a abordagem behaviorista
 
Aula 01 - Skinner condicionamento e aprendizagem.pptx
Aula 01 - Skinner condicionamento e aprendizagem.pptxAula 01 - Skinner condicionamento e aprendizagem.pptx
Aula 01 - Skinner condicionamento e aprendizagem.pptx
 
Aula 1 - Introdução à Psicologia Parte 2.pptx
Aula 1 -  Introdução à Psicologia Parte 2.pptxAula 1 -  Introdução à Psicologia Parte 2.pptx
Aula 1 - Introdução à Psicologia Parte 2.pptx
 
4316578 (1).ppt
4316578 (1).ppt4316578 (1).ppt
4316578 (1).ppt
 
Método experimental - variáveis e função.pdf
Método experimental - variáveis e função.pdfMétodo experimental - variáveis e função.pdf
Método experimental - variáveis e função.pdf
 
5 stc 1_glossario_gonçalo_r
5 stc 1_glossario_gonçalo_r5 stc 1_glossario_gonçalo_r
5 stc 1_glossario_gonçalo_r
 
Caos
CaosCaos
Caos
 
Como dar e receber feedbacks
Como dar e receber feedbacksComo dar e receber feedbacks
Como dar e receber feedbacks
 
Apostila 4º bimestre_Prof ª Sabrinna
Apostila 4º bimestre_Prof ª SabrinnaApostila 4º bimestre_Prof ª Sabrinna
Apostila 4º bimestre_Prof ª Sabrinna
 
Objetivos Psicologia - Teste Nº4 (12ºAno)
Objetivos Psicologia - Teste Nº4 (12ºAno)Objetivos Psicologia - Teste Nº4 (12ºAno)
Objetivos Psicologia - Teste Nº4 (12ºAno)
 
Lakatos projeto canoa
Lakatos projeto canoa Lakatos projeto canoa
Lakatos projeto canoa
 

Mais de Ronaldo Moraes

Mais de Ronaldo Moraes (7)

Passo 1 2007 1
Passo 1 2007 1Passo 1 2007 1
Passo 1 2007 1
 
Passo 14 2007 1
Passo 14 2007 1Passo 14 2007 1
Passo 14 2007 1
 
Passo 13 2007 1
Passo 13 2007 1Passo 13 2007 1
Passo 13 2007 1
 
Passo 5 2007 1
Passo 5 2007 1Passo 5 2007 1
Passo 5 2007 1
 
Passo 4 2007 1
Passo 4 2007 1Passo 4 2007 1
Passo 4 2007 1
 
Passo 3 2007 1
Passo 3 2007 1Passo 3 2007 1
Passo 3 2007 1
 
Passo 2 2007 1
Passo 2 2007 1Passo 2 2007 1
Passo 2 2007 1
 

Passo 10 2007 1

  • 1. FUNDAMENTOS DA PSICOLOGIA EXPERIMENTAL PASSO 10 – Esquemas Complexos de Reforçamento Objetivos: 1) Definir, identificar e dar exemplos de esquemas complexos de reforçamento (DRL, DRH, DRO, DRA e DRI); 2) Descrever a relação entre esquemas de tempo (FT e VT) e a produção de comportamento supersticioso; 3) Comparar esquemas de reforçamento simples com esquemas de reforçamento complexos. Esquemas de Reforçamento de Tempo (FT e VT) & Comportamento Supersticioso Você viu, no passo anterior, que nos esquemas de intervalo o reforço está disponível se ocorrer uma resposta após a passagem de um certo tempo. Consideremos agora a possibilidade de o reforço ser apresentado em função da mera passagem do tempo, ou seja, após a passagem de um determinado intervalo de tempo, o reforçamento ocorre mesmo que nenhuma resposta tenha ocorrido. Nesse caso o reforço seria apresentado, independente de qualquer resposta, após um tempo fixo (FT: Fixed Time) ou variável (VT: Variable Time), digamos depois de 3 minutos fixos (FT3’) ou após em média 14 segundos (VT14’’). Um fenômeno curioso gerado por esse esquema foi observado por Skinner (1948) após ele ter programado a liberação de alimento em função da passagem de períodos fixos de tempo, 15 segundos. Muitos pombos submetidos a esse esquema apresentaram o que Skinner chamou de “comportamento supersticioso”. Não havia qualquer relação entre o que os pombos faziam e a produção do alimento (ou seja, o alimento seria apresentado de qualquer forma após o tempo ter passado), mas, ainda assim, as respostas que antecediam a apresentação do alimento eram pronta e momentaneamente fortalecidas. Skinner observou que vários de seus sujeitos adquiriam padrões ritualísticos, como dar volta sobre seu próprio eixo antes de se dirigirem ao comedouro. Os desempenhos específicos acabavam se enfraquecendo com o passar do tempo e tendiam a desaparecer, sendo substituídos por outros que haviam coincidido com a apresentação do alimento, sugerindo o caráter temporário do evento comportamental supersticioso produzido dessa forma1. O mesmo fenômeno foi produzido em seres humanos (Ono, 1987). Vinte participantes foram postos diante de 3 alavancas. Um mostrador de pontos ficava na frente deles e, independente do que fizessem, um certo número de pontos foi programado para aparecer de tempos em tempos. Quase todos os participantes apresentaram algum tipo de padrão supersticioso relacionado à liberação não contingente de pontos durante a sessão, ou seja, respostas que foram seguidas pela apresentação de pontos aumentavam pronta e momentaneamente de freqüência, mesmo não havendo uma relação de contingência entre os dois eventos. Como no caso dos pombos, os comportamentos assim estabelecidos eram idiossincráticos (variavam de indivíduo para indivíduo e de tempos em tempos no mesmo indivíduo) e temporários (tendiam a desaparecer após algumas emissões não coincidentes com a liberação dos pontos, sendo substituídos por outros padrões que igualmente haviam coincidido com a liberação do reforço). Ao usar um computador podemos eventualmente ter respostas supersticiosas sendo fortalecidas por reforçamento acidental (a ocorrência não contingente de algum evento reforçador, a resolução de um problema qualquer, por exemplo). Isso já aconteceu com você ou com alguém que você conhece? O fenômeno do comportamento superticioso registrado por Skinner é importante por várias razões e uma delas é teórica: o reforço pode afetar o responder mesmo sem uma relação de contingência (dependência) entre a conseqüência e as respostas imediatamente anteriores, ou seja, sem que o reforço tenha sido produzido por alguma coisa que o organismo tenha feito antes. A mera contigüidade, uma seqüência espaço-temporal entre dois eventos não relacionados de maneira causal, seria suficiente para afetar, e talvez definir, um operante. Você lembra da definição inicial de operante? Nas palavras de Skinner (1957/1978): “Os homens agem sobre o mundo, modificam-no e, por sua vez, são modificados pelas conseqüências de sua ação.” (p. 15). A conseqüência precisa SER PRODUZIDA pela ação prévia para que seja afetada por ela? Vimos no caso do comportamento supersticioso que não. A mera contigüidade entre a resposta e o reforço pode tornar a resposta mais freqüente em ocesiões futuras. Freqüentemente respostas e reforços contingentes um ao outro são também contiguos. Também com freqüência, respostas e conseqüências reforçadoras não contingêntes são apenas ocasionalmente contíguas 1 Para uma discussão mais ampla e atualizada sobre o comportamento supersticioso, ver Benvenuti (2001). Para uma revisão crítica da área, ver Herrnstein (1975). E para uma expansão do uso do conceito para tentar entender a credulidade humana e a facilidade com a qual somos enganados pelo misticismo, ver Dawkins (2000, cap. 7).
  • 2. Fundamentos de Psicologia Experimental Passo 10 2 (de maneira que o evento reforçador pode acontecer na ausência da resposta inicialmente reforçada de maneira acidental). Isso pode ser parte das razões pelas quais o comportamento supersticioso tende a ser transitório. Por fim, é válido dizer que essa discussão nos permite concluir que contingências de reforçamento tendem a ser mais efetivas quando é maior a contigüidade entre a resposta operante e suas conseqüências reforçadoras. Esquemas de Reforçamento Diferencial I: DRL e DRH. “Ao se considerar os efeitos de certos esquemas de reforçamento, recorre-se sempre ao fato de que taxas diferentes de resposta tornam-se diferencialmente correlacionadas com o reforçamento. Assim, esquemas de intervalo variável tendem a fornecer reforçamento diferencial após taxas baixas e esquemas de razão variável tendem a fornecer reforçamento diferencial depois de taxas altas. Uma vez que o efeito do reforçamento é fortalecer qualquer que seja o comportamento que vem antes dele, esses esquemas agem indiretamente no fortalecimento de certas taxas de comportamento. Se desejarmos, poderemos fazer surgir uma diferenciação mais direta e invariante pela especificação dos limites, condições ou restrições da taxa do operante que deve ser reforçado. No reforçamento diferencial de taxas baixas (drl), um operante R é primeiro especificado e fortalecido. Quando R tiver sido suficientemente fortalecido, ele é tornado um elemento de uma nova especificação de resposta de ordem superior: somente os elementos de resposta que estão separados entre si pelo mínimo de certa passagem de tempo são agora reforçados. Assim, o procedimento drl reforça um certo comportamento somente quando precedido de uma pausa.” (Millenson, 1975, p.176). A contingência em vigor força um padrão de responder lento, onde “esperar” é essencial para que o reforço seja produzido. Se uma resposta ocorrer antes do tempo estabelecido, a conseqüência será o adiamento do reforço e não o aumento de sua probabilidade, portanto, o responder no intervalo especificado leva a um adiamento da possibilidade de reforçamento. Chamamos esse esquema de Reforço Diferencial de Baixas Taxas ou de forma abreviada DRL (Differential Reinforcement Low Rates) e seu principal efeito é, como seu próprio nome indica, a produção de taxas baixas de resposta. O esquema DRL é amplamente adotado como um procedimento redutor da freqüência de uma classe de respostas, podendo ser usado em certos contextos como uma alternativa à punição positiva (Holz & Azrin, 1963). Exemplo: Quando a atenção dada pela professora parece estar mantendo o comportamento de “fazer piadas em sala durante a aula” de um aluno e que cada piada feita acaba produzindo um comentário ou um sorriso da professora (CRF), então você poderia reduzir a freqüência desse comportamento “alvo” a partir da mudança nas contingências de reforçamento em vigor. Partindo da freqüência real desse comportamento, digamos 60 ocorrências por hora, o reforço poderia ser arranjado para ser apresentado somente se a resposta ficasse 10’ sem ocorrer, sendo esse valor gradualmente ampliado até que o critério fosse uma resposta por hora no máximo. A taxa de respostas nesse esquema não é totalmente suprimida (zerada). Ela é reduzida a níveis muito baixos, pois o ritmo de responder é desacelerado. Você consegue imaginar o uso desse esquema para lidar com certos problemas comportamentais típicos de crianças classificadas com “hiperativas”? É possível relacionar o resultado desse esquema com o que chamamos tradicionalmente de “autocontrole”? No segundo exemplo, ao invés de desacelerar, o responder precisa ser acelerado para que o reforço seja produzido. Se não ocorrer um número mínimo de resposta durante um determinado tempo, então, o reforço não estará disponível para a próxima resposta. Também aqui um padrão de responder incompatível com o esquema produz o adiamento da oportunidade de reforço. Chamamos esse esquema de Reforço Diferencial de Altas Taxas ou DRH (Differential Reinforcement High Rates) e seu efeito é um padrão de responder alto em intervalos relativamente curtos de tempo. No laboratório a exigência poderia ser a emissão de 120 RPB’s a cada minuto para que uma gota de água seja apresentada e no dia a dia podemos ver certos acordos de trabalho produtivistas que estabelecem um valor mínimo de respostas de “atendimento aos pacientes” por experiente (em um consultório médico, por exemplo) para que um bônus seja pago pelo Governo. Não há uma óbvia aplicação desse esquema no sistema de produção, seja na indústria seja no comércio? Você consegue descrever de que forma isso poderia ser feito a pretexto de aumentar a produtividade de um vendedor? Saiba, apenas, que o responder em altas taxas em curtos períodos não pode ser mantido por muito tempo sem a deterioração do desempenho, o esquema é,
  • 3. Fundamentos de Psicologia Experimental Passo 10 3 portanto, frágil na manutenção do seu desempenho tipicamente acelerado (Catania, 1999). Note que o esquema não é útil apenas aos propósitos capitalistas, podendo ser úteis para tornar certas respostas sociais ou verbais, por exemplo, mais prováveis. Diante de uma criança chamada de “tímida” que apresenta uma freqüência quase nula de respostas sociais, um esquema de DRH poderia ser usado para tornar tais respostas mais prováveis e com elas a produção de outros reforçadores sociais importantes. Esse esquema pode também ser aplicado aos estudantes que demoram muito para responder as questões dos passos. Nesse caso, o professor estabeleceria um DRH 30 minutos de acordo com o qual, haveria uma exigência de que o estudante respondesse 5 questões de passo no tempo máximo de 30 minutos, caso contrário ele deveria reiniciar um novo conjunto de 5 questões. Esquemas de Reforçamento Diferencial II: DRO, DRA e DRI. Há alguns esquemas adicionais especialmente usados como alternativas ao uso da punição positiva com o igual objetivo de reduzir a freqüência de certas classes de respostas identificadas como problemáticas para o próprio indivíduo ou para os outros, por exemplo, um padrão autolesivo ou agressivo. Tais esquemas programam o reforçamento a partir da especificação de um comportamento alvo (ou problema) a ser suprimido e substituído por outro ou por outros. Veremos agora três desses esquemas e suas variações mais comuns. DRO (Differential Reinforcement of Other Behaviors): A liberação do reforço pode ser programada para ocorrer contingente a emissão de qualquer outro comportamento diferente do comportamento alvo (colocado em extinção). Se a RPB fosse o comportamento alvo, então, qualquer outro comportamento diferente se emitido, produziria o reforço. Em uma situação aplicada o comportamento alvo poderia ser uma resposta autolesiva como “morder o próprio braço” ou “esfregar os olhos continuamente”. Tendo sido definida a resposta ou as respostas que queremos enfraquecer e identificado um reforçador poderoso para um conjunto de respostas naquele contexto, passamos a apresentar o tal reforço contingente a apresentação de qualquer outra resposta que não a alvo. Uma variação desse procedimento seria apresentar o reforço simplesmente após a passagem de um tempo pré-definido (FT5´, por exemplo), desde que a resposta alvo não tenha ocorrido (esse esquema é conhecido também como “reforçamento diferencial de comportamento zero”). Digamos que uma gota de água seja liberada a cada 10 segundos, desde que não ocorram pressões a barra nesse intervalo. As RPB’s apenas adiariam a possibilidade de reforçamento. Em um exemplo aplicado, o reforço social é apresentado após 1 minuto somente se não forem registradas respostas autolesivas. Assim, o reforço é apresentado de tempos em tempos, independente de qualquer resposta, desde que nenhuma ocorrência de comportamento agressivo seja registrada no intervalo previamente definido. DRA (Differential Reinforcement of Alternative Behavior): Ao invés de ser liberado ou pela emissão de qualquer resposta diferente da resposta alvo ou automaticamente após a passagem de um tempo, desde que a resposta alvo não tenha ocorrido (como no DRO), podemos programar o reforçamento contingente a emissão de uma resposta específica, diferente da resposta alvo, chamada aqui de “alternativa”. No laboratório, ainda considerando a RPB como resposta alvo a ser enfraquecida (posta em extinção), poderíamos programar a liberação da gota de água contingente a ocorrência da resposta alternativa de “farejar a barra”. Na situação aplicada o reforço poderia ser contingente a emissão da resposta de “tocar o braço com os lábios”, enquanto a resposta alvo, “morder o braço”, seria colocada em extinção. A grande diferença para o DRO é que no DRA uma resposta diferente da resposta alvo é previamente especificada. DRI (Differential Reinforcement of Incompatible Behavior): Trata-se de uma variação do DRA, com a exigência adicional de que a resposta alternativa deveria ser física ou funcionalmente incompatível com a resposta alvo. Ou seja, a emissão da resposta incompatível tornaria menos provável a emissão da resposta alvo, a ser enfraquecida. No laboratório, então, poderíamos eleger a resposta de “erguer a barra” como incompatível a de “pressionar a barra” (resposta alvo). Erguer a barra impede, fisicamente, a emissão de pressionar, o que torna a resposta alvo, colocada em extinção, ainda menos provável. Em um contexto aplicado, exigir para a liberação do reforço a apresentação da resposta de “colocar as mãos nos bolsos” impediria fisicamente a apresentação da resposta alvo “morder o braço” (posta em extinção). Veja que todos esses esquemas envolvem o reforçamento diferencial, ou seja, o reforçamento está disponível em um contexto e não em outro. Temos, então, reforçamento (para um grupo de respostas) e extinção (para outro grupo de respostas) atuando em conjunto na modelagem de um determinado
  • 4. Fundamentos de Psicologia Experimental Passo 10 4 repertório comportamental. Se a emissão da resposta alvo levar ao adiamento da oportunidade de reforçamento, então, teremos não simplesmente extinção, suspensão não contingente do reforçamento, mas uma contingência aversiva em vigor: punição negativa. O psicólogo será confrontado (na educação especial, na clínica, no hospital, por exemplo) com problemas nos quais a emissão de certas respostas coloca em risco a integridade ou mesmo a vida de uma pessoa ou/e das pessoas que o cercam. Reduzir a freqüência de tais comportamentos passa a ser essencial e ele terá que planejar estratégias de redução ou supressão do responder. Além de enfraquecer certas respostas, a função educativa do psicólogo envolverá a construção de repertórios mais saudáveis que melhorem a qualidade de vida da pessoa atendida por ele. Os esquemas descritos aqui (DRL, DRO, DRA e DRI) são parte de uma tecnologia comportamental importante para entender, planejar e conseguir a ocorrência de comportamentos e que vêm se mostrando eficazes instrumentos de intervenção. Observe, contudo, que a descrição aqui realizada é apenas um passo inicial na sua formação. Quando for necessário trabalhar com manutenção de comportamentos, o aprofundamento nesse tópico é essencial. A leitura de Le Blanc, Reuter, Miller e Schilmoeller (1977), Vollmer, Roane, Ringdahl e Marcus (1999), Corte, Wolf e Locke (1971), Favell, Azrin, Baumeister, Carr, Dorsey, Forehand, Foxx, Lovaas, Rincover, Risley, Romanczyk, Russo, Schroeder e Solnick (1982), Lerman, Iwata, e Wallace (1999) e Lerman e Vorndran (2002) fica como sugestão. Esquemas Múltiplo, Misto, Encadeado, Tandem e Concorrente O mundo real não é constituído de contingências estanques ou separadas, então, é mais provável de encontrarmos os esquemas descritos de forma combinada. Algumas dessas combinações serão exploradas aqui, principalmente os seus procedimentos. Você poderá obter uma descrição detalhada dos processos e resultados particulares de cada esquema mencionado em Ferster & Skinner (1957) e Catania (1999, caps. 10 e 11). Nosso objetivo aqui é apenas apresenta-lo ao tema. Podemos ver dois ou mais esquemas em ação no mesmo arranjo de contingências. Em um esquema Múltiplo cada esquema diferente de um arranjo possui seu próprio SD. Assim, em um esquema Múltiplo FI60” e FR10, os antecedentes são diferentes para cada um deles: Na presença da luz vermelha, vigora o FI60”, mas na presença da luz verde vigora o esquema FR10. Uma característica importante desse esquema é que a alternância ocorre de forma sinalizada diante do mesmo operando, ou seja, tanto as respostas diante da luz azul quanto da luz vermelha ocorrem diante, por exemplo, de respostas de bicar um disco. A figura abaixo mostra um esquema múltiplo VI60” (na presença de uma luz vermelha) e FR10 (na presença de uma luz verde). Observe que o desempenho, após algumas sessões, está plenamente adaptado ao esquema: a taxa típica que produz o reforço é rapidamente apresentada diante de cada discriminativo.
  • 5. Fundamentos de Psicologia Experimental Passo 10 5 Uma variação desse esquema complexo seria manter os dois esquemas componentes mencionados, FI60” e FR10, mas sem sinalizar quando cada um estaria em vigor. Tal esquema é chamado de Misto e nele dois ou mais esquemas componentes são alternados no mesmo operandun (ou seja, no mesmo dispositivo de resposta, como por exemplo a barra na caixa de Skinner) sem qualquer sinalização externa antecedente programada. Sem a presença de discriminativos claros, como você acha que seria a aprendizagem nesse esquema? Um outro tipo de esquema seria o Encadeado. Nesse arranjo dois ou mais esquemas componentes estariam postos em seqüência, por exemplo, FI60” (Esquema 1) e FR10 (Esquema 2), sendo que cumprir os requisitos do primeiro conduziria ao segundo que, somente após finalizado, produziria o reforçador final. A conseqüência para o engajamento do esquema 1 seria o acesso ao esquema 2 que por sua vez poderia conduzir ao reforçador terminal. Cada um dos esquemas componentes é correlacionado com um SD específico. Assim, diante de FI60” vigora uma luz verde. O cumprimento desse esquema produz uma luz amarela que sinaliza a presença de uma nova contingência de reforçamento: o esquema FR10. Ao completar o FR10 o reforçador final é aí sim produzido: Uma variação desse esquema seria produzida pela manutenção da cadeia exigida, mas com a remoção dos estímulos discriminativos específicos para cada esquema componente. Imagine a mesma seqüência FI60” FR10 sem qualquer evento antecedente sinalizando quando cada esquema particular estaria em vigor. Esse esquema é chamado de Tandem. Sem os discriminativos claramente indicados, como você imagina que ocorra a aprendizagem da seqüência? Mas os esquemas componentes podem ser dispostos em arranjos de escolha, onde dois ou mais esquemas componentes estariam em vigor em diferentes operandos ao mesmo tempo. Assim, poderíamos ter agora duas barras funcionando simultaneamente, uma a esquerda e outra a direita da concha, sendo que em uma estaria em vigor um FR10 e na outra um VR10. Um esquema como esse é chamado de Concorrente e é paradigmático para investigar contingências de escolha e tomada de decisão. Podemos, inclusive, tentar entender certos padrões comportamentais envolvidos no chamado “autocontrole”. Uma configuração clássica é arranjar dois esquemas componentes em situação de escolha, sendo que em um estaria em vigor um esquema onde uma quantidade menor, mas imediata, de reforço estaria disponível e em outro a quantidade de reforço seria maior, mas não estaria a disposição tão imediatamente quanto no primeiro caso. Podemos ter variações manipulando também o custo da resposta (o número de respostas exigidas pela contingência, por exemplo) para iguais quantidades de reforço em cada esquema componente. Um esquema derivado do anteriormente descrito e também usado em estudos de escolha seria o Conjugado. Nele dois ou mais esquemas também estariam em vigor de forma simultânea, mas no mesmo operando. Se no Concorrente cada esquema ocorreria para respostas diferentes, aqui os esquemas componentes teriam uma única possibilidade de resposta. Nosso rato poderia tanto produzir água tanto
  • 6. Fundamentos de Psicologia Experimental Passo 10 6 atingindo as exigências do esquema de FR10 quanto do esquema de VR10 (o que ocorresse primeiro), pressionando a mesma barra. Há muitas outras possibilidades de arranjar as contingências de reforçamento em situações cada vez mais complexas, por exemplo, quando o próprio desempenho em um esquema serve como parâmetro para definir o valor do outro esquema em vigor. Para esse momento nos bastaria que você fosse capaz de identificar os esquemas aqui mencionados e soubesse onde pesquisar para obter mais informações a respeito. REFERÊNCIAS Benvenuti, M. F. (2001). Comportamento “supersticioso”: possíveis extensões para o comportamento humano. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre Comportamento e Cognição Vol. 8 (pp. 29-34). Santo André: ESETec. Catania, C. A (1999). Aprendizagem: Comportamento, Linguagem e Cognição. Porto Alegre: ArtMed. Corte, H. E. , Wolf, M. M. and Locke, B. J. (1971). A comparison of procedures for eliminating self- injurious behavior of retarded adolescents. Journal of Applied Behavior Analysis, 4 (3), 201-213. Dawkins, R. (2000). Desvendando o arco-íris: ciência, ilusão e encantamento. São Paulo: Companhia das Letras. Favell, J. E., Azrin, N. H., Baumeister, A. A., Carr, E. G., Dorsey, M. F., Forehand, R., Foxx, R. M., Lovaas, O. I., Rincover, A., Risley, T. R., Romanczyk, R. G., Russo, D. C., Schroeder, S. R. and Solnick, J. V. (1982). The treatment of self-injurious behavior. Behavior Therapy, 13, 529-554. Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century- Crofts Herrnstein, R. J. (1975). Supertición: un corolario de los principios del condicionamento operante. Em W. K. Honig (Ed.), Conducta operante: investigación y aplicaciones (pp. 50-71). México: Trillas. Holz, W. C. & Azrin, N. H. (1963). A comparison of several procedures for eliminating behavior. Journal of the Experimental Analysis of Behavior, 6 (3), 399-406. Le Blanc, J. M., Reuter, K. E., Miller, D. N e Schilmoeller, G. L. (1977). Laboratory investigations of applied behavior analysis techniques: procedures designed to decrease or eliminate responding. Em B. C. Etzel, J. M. Le Blanc and D. M. Baer (Eds.), New developments in behavioral research (p.180- 229). Hilsdale, NJ: Lawrence Erlbaum Associates, Publishers. Lerman, D. C. & Vorndran, C. M. (2002). On the status of Knowledge for using Punishment: Implications for treating behavior disorders. Journal of Applied Behavior Analysis, 35 (4), 431-464. Lerman, D. C.; Iwata, B. A. & Wallace, M. D. (1999). Side effects of extinction: Prevalence of bursting and agression during treatment of self-injurius behavior. Journal of Applied Behavior Analysis, 35 (4), 431-464. Lundin, R. W. (1972). Personalidade: Uma análise do comportamento.São Paulo: Herder/EDUSP. Machado, L M. C. M. (1986). Esquemas de reforçamento positivo I – esquemas simples. Psicologia, 12 (2), 1-15. Millenson, J. R. (1975). Princípios de análise do comportamento. Brasília: Coordenada. Ono, K. (1987). Superstitious behavior in humans. Journal of the Experimental Analysis of Behavior, 47, 261-271. Skinner, B. F. (1948). "Superstition" in the pigeon. Journal of Experimental Psychology, 38 (2), 168- 172. Skinner, B. F. (1978). O comportamento verbal. São Paulo: Cultrix. Publicado originalmente em 1957. Staddon, J. E. R. & Simmelhag, V. L. (1971). The superstition experiment. Psychological Review, 78, 3- 43. Vollmer, T. R., Roane, H. S., Ringdahl, J. E. and Marcus, B. A. (1999). Evaluating treatment challenges with differential reinforcement of alternative behavior. Journal of Applied Behavior Analysis, 32 (1), 9-23.