1) O documento discute esquemas complexos de reforçamento como DRL, DRH, DRO, DRA e DRI, que visam modificar taxas de respostas.
2) Esquemas de tempo fixo e variável (FT e VT) podem levar a comportamentos supersticiosos temporários.
3) DRL reforça taxas baixas de resposta, enquanto DRH reforça taxas altas, ambos podendo ser usados para modificar comportamentos.
1. FUNDAMENTOS DA PSICOLOGIA EXPERIMENTAL
PASSO 10 – Esquemas Complexos de Reforçamento
Objetivos: 1) Definir, identificar e dar exemplos de esquemas complexos de reforçamento (DRL, DRH,
DRO, DRA e DRI); 2) Descrever a relação entre esquemas de tempo (FT e VT) e a produção de
comportamento supersticioso; 3) Comparar esquemas de reforçamento simples com esquemas de
reforçamento complexos.
Esquemas de Reforçamento de Tempo (FT e VT) & Comportamento Supersticioso
Você viu, no passo anterior, que nos esquemas de intervalo o reforço está disponível se ocorrer
uma resposta após a passagem de um certo tempo. Consideremos agora a possibilidade de o reforço ser
apresentado em função da mera passagem do tempo, ou seja, após a passagem de um determinado
intervalo de tempo, o reforçamento ocorre mesmo que nenhuma resposta tenha ocorrido. Nesse caso o
reforço seria apresentado, independente de qualquer resposta, após um tempo fixo (FT: Fixed Time) ou
variável (VT: Variable Time), digamos depois de 3 minutos fixos (FT3’) ou após em média 14 segundos
(VT14’’). Um fenômeno curioso gerado por esse esquema foi observado por Skinner (1948) após ele ter
programado a liberação de alimento em função da passagem de períodos fixos de tempo, 15 segundos.
Muitos pombos submetidos a esse esquema apresentaram o que Skinner chamou de “comportamento
supersticioso”. Não havia qualquer relação entre o que os pombos faziam e a produção do alimento (ou
seja, o alimento seria apresentado de qualquer forma após o tempo ter passado), mas, ainda assim, as
respostas que antecediam a apresentação do alimento eram pronta e momentaneamente fortalecidas.
Skinner observou que vários de seus sujeitos adquiriam padrões ritualísticos, como dar volta sobre seu
próprio eixo antes de se dirigirem ao comedouro. Os desempenhos específicos acabavam se
enfraquecendo com o passar do tempo e tendiam a desaparecer, sendo substituídos por outros que haviam
coincidido com a apresentação do alimento, sugerindo o caráter temporário do evento comportamental
supersticioso produzido dessa forma1. O mesmo fenômeno foi produzido em seres humanos (Ono, 1987).
Vinte participantes foram postos diante de 3 alavancas. Um mostrador de pontos ficava na frente deles e,
independente do que fizessem, um certo número de pontos foi programado para aparecer de tempos em
tempos. Quase todos os participantes apresentaram algum tipo de padrão supersticioso relacionado à
liberação não contingente de pontos durante a sessão, ou seja, respostas que foram seguidas pela
apresentação de pontos aumentavam pronta e momentaneamente de freqüência, mesmo não havendo uma
relação de contingência entre os dois eventos. Como no caso dos pombos, os comportamentos assim
estabelecidos eram idiossincráticos (variavam de indivíduo para indivíduo e de tempos em tempos no
mesmo indivíduo) e temporários (tendiam a desaparecer após algumas emissões não coincidentes com a
liberação dos pontos, sendo substituídos por outros padrões que igualmente haviam coincidido com a
liberação do reforço). Ao usar um computador podemos eventualmente ter respostas supersticiosas sendo
fortalecidas por reforçamento acidental (a ocorrência não contingente de algum evento reforçador, a
resolução de um problema qualquer, por exemplo). Isso já aconteceu com você ou com alguém que você
conhece?
O fenômeno do comportamento superticioso registrado por Skinner é importante por várias razões
e uma delas é teórica: o reforço pode afetar o responder mesmo sem uma relação de contingência
(dependência) entre a conseqüência e as respostas imediatamente anteriores, ou seja, sem que o reforço
tenha sido produzido por alguma coisa que o organismo tenha feito antes. A mera contigüidade, uma
seqüência espaço-temporal entre dois eventos não relacionados de maneira causal, seria suficiente para
afetar, e talvez definir, um operante. Você lembra da definição inicial de operante? Nas palavras de
Skinner (1957/1978): “Os homens agem sobre o mundo, modificam-no e, por sua vez, são modificados
pelas conseqüências de sua ação.” (p. 15). A conseqüência precisa SER PRODUZIDA pela ação prévia
para que seja afetada por ela? Vimos no caso do comportamento supersticioso que não. A mera
contigüidade entre a resposta e o reforço pode tornar a resposta mais freqüente em ocesiões futuras.
Freqüentemente respostas e reforços contingentes um ao outro são também contiguos. Também com
freqüência, respostas e conseqüências reforçadoras não contingêntes são apenas ocasionalmente contíguas
1
Para uma discussão mais ampla e atualizada sobre o comportamento supersticioso, ver Benvenuti (2001). Para uma revisão
crítica da área, ver Herrnstein (1975). E para uma expansão do uso do conceito para tentar entender a credulidade humana e a
facilidade com a qual somos enganados pelo misticismo, ver Dawkins (2000, cap. 7).
2. Fundamentos de Psicologia Experimental Passo 10 2
(de maneira que o evento reforçador pode acontecer na ausência da resposta inicialmente reforçada de
maneira acidental). Isso pode ser parte das razões pelas quais o comportamento supersticioso tende a ser
transitório. Por fim, é válido dizer que essa discussão nos permite concluir que contingências de
reforçamento tendem a ser mais efetivas quando é maior a contigüidade entre a resposta operante e suas
conseqüências reforçadoras.
Esquemas de Reforçamento Diferencial I: DRL e DRH.
“Ao se considerar os efeitos de certos esquemas de reforçamento, recorre-se sempre ao fato
de que taxas diferentes de resposta tornam-se diferencialmente correlacionadas com o
reforçamento. Assim, esquemas de intervalo variável tendem a fornecer reforçamento
diferencial após taxas baixas e esquemas de razão variável tendem a fornecer reforçamento
diferencial depois de taxas altas. Uma vez que o efeito do reforçamento é fortalecer
qualquer que seja o comportamento que vem antes dele, esses esquemas agem
indiretamente no fortalecimento de certas taxas de comportamento. Se desejarmos,
poderemos fazer surgir uma diferenciação mais direta e invariante pela especificação dos
limites, condições ou restrições da taxa do operante que deve ser reforçado.
No reforçamento diferencial de taxas baixas (drl), um operante R é primeiro especificado e
fortalecido. Quando R tiver sido suficientemente fortalecido, ele é tornado um elemento de
uma nova especificação de resposta de ordem superior: somente os elementos de resposta
que estão separados entre si pelo mínimo de certa passagem de tempo são agora reforçados.
Assim, o procedimento drl reforça um certo comportamento somente quando precedido de
uma pausa.” (Millenson, 1975, p.176).
A contingência em vigor força um padrão de responder lento, onde “esperar” é essencial para que
o reforço seja produzido. Se uma resposta ocorrer antes do tempo estabelecido, a conseqüência será o
adiamento do reforço e não o aumento de sua probabilidade, portanto, o responder no intervalo
especificado leva a um adiamento da possibilidade de reforçamento. Chamamos esse esquema de Reforço
Diferencial de Baixas Taxas ou de forma abreviada DRL (Differential Reinforcement Low Rates) e seu
principal efeito é, como seu próprio nome indica, a produção de taxas baixas de resposta. O esquema
DRL é amplamente adotado como um procedimento redutor da freqüência de uma classe de respostas,
podendo ser usado em certos contextos como uma alternativa à punição positiva (Holz & Azrin, 1963).
Exemplo: Quando a atenção dada pela professora parece estar mantendo o comportamento de “fazer
piadas em sala durante a aula” de um aluno e que cada piada feita acaba produzindo um comentário ou
um sorriso da professora (CRF), então você poderia reduzir a freqüência desse comportamento “alvo” a
partir da mudança nas contingências de reforçamento em vigor. Partindo da freqüência real desse
comportamento, digamos 60 ocorrências por hora, o reforço poderia ser arranjado para ser apresentado
somente se a resposta ficasse 10’ sem ocorrer, sendo esse valor gradualmente ampliado até que o critério
fosse uma resposta por hora no máximo. A taxa de respostas nesse esquema não é totalmente suprimida
(zerada). Ela é reduzida a níveis muito baixos, pois o ritmo de responder é desacelerado. Você consegue
imaginar o uso desse esquema para lidar com certos problemas comportamentais típicos de crianças
classificadas com “hiperativas”? É possível relacionar o resultado desse esquema com o que chamamos
tradicionalmente de “autocontrole”?
No segundo exemplo, ao invés de desacelerar, o responder precisa ser acelerado para que o reforço
seja produzido. Se não ocorrer um número mínimo de resposta durante um determinado tempo, então, o
reforço não estará disponível para a próxima resposta. Também aqui um padrão de responder
incompatível com o esquema produz o adiamento da oportunidade de reforço. Chamamos esse esquema
de Reforço Diferencial de Altas Taxas ou DRH (Differential Reinforcement High Rates) e seu efeito é um
padrão de responder alto em intervalos relativamente curtos de tempo. No laboratório a exigência poderia
ser a emissão de 120 RPB’s a cada minuto para que uma gota de água seja apresentada e no dia a dia
podemos ver certos acordos de trabalho produtivistas que estabelecem um valor mínimo de respostas de
“atendimento aos pacientes” por experiente (em um consultório médico, por exemplo) para que um bônus
seja pago pelo Governo. Não há uma óbvia aplicação desse esquema no sistema de produção, seja na
indústria seja no comércio? Você consegue descrever de que forma isso poderia ser feito a pretexto de
aumentar a produtividade de um vendedor? Saiba, apenas, que o responder em altas taxas em curtos
períodos não pode ser mantido por muito tempo sem a deterioração do desempenho, o esquema é,
3. Fundamentos de Psicologia Experimental Passo 10 3
portanto, frágil na manutenção do seu desempenho tipicamente acelerado (Catania, 1999). Note que o
esquema não é útil apenas aos propósitos capitalistas, podendo ser úteis para tornar certas respostas
sociais ou verbais, por exemplo, mais prováveis. Diante de uma criança chamada de “tímida” que
apresenta uma freqüência quase nula de respostas sociais, um esquema de DRH poderia ser usado para
tornar tais respostas mais prováveis e com elas a produção de outros reforçadores sociais importantes.
Esse esquema pode também ser aplicado aos estudantes que demoram muito para responder as questões
dos passos. Nesse caso, o professor estabeleceria um DRH 30 minutos de acordo com o qual, haveria uma
exigência de que o estudante respondesse 5 questões de passo no tempo máximo de 30 minutos, caso
contrário ele deveria reiniciar um novo conjunto de 5 questões.
Esquemas de Reforçamento Diferencial II: DRO, DRA e DRI.
Há alguns esquemas adicionais especialmente usados como alternativas ao uso da punição positiva
com o igual objetivo de reduzir a freqüência de certas classes de respostas identificadas como
problemáticas para o próprio indivíduo ou para os outros, por exemplo, um padrão autolesivo ou
agressivo. Tais esquemas programam o reforçamento a partir da especificação de um comportamento alvo
(ou problema) a ser suprimido e substituído por outro ou por outros. Veremos agora três desses esquemas
e suas variações mais comuns.
DRO (Differential Reinforcement of Other Behaviors): A liberação do reforço pode ser
programada para ocorrer contingente a emissão de qualquer outro comportamento diferente do
comportamento alvo (colocado em extinção). Se a RPB fosse o comportamento alvo, então, qualquer
outro comportamento diferente se emitido, produziria o reforço. Em uma situação aplicada o
comportamento alvo poderia ser uma resposta autolesiva como “morder o próprio braço” ou “esfregar os
olhos continuamente”. Tendo sido definida a resposta ou as respostas que queremos enfraquecer e
identificado um reforçador poderoso para um conjunto de respostas naquele contexto, passamos a
apresentar o tal reforço contingente a apresentação de qualquer outra resposta que não a alvo. Uma
variação desse procedimento seria apresentar o reforço simplesmente após a passagem de um tempo
pré-definido (FT5´, por exemplo), desde que a resposta alvo não tenha ocorrido (esse esquema é
conhecido também como “reforçamento diferencial de comportamento zero”). Digamos que uma gota de
água seja liberada a cada 10 segundos, desde que não ocorram pressões a barra nesse intervalo. As RPB’s
apenas adiariam a possibilidade de reforçamento. Em um exemplo aplicado, o reforço social é
apresentado após 1 minuto somente se não forem registradas respostas autolesivas. Assim, o reforço é
apresentado de tempos em tempos, independente de qualquer resposta, desde que nenhuma ocorrência de
comportamento agressivo seja registrada no intervalo previamente definido.
DRA (Differential Reinforcement of Alternative Behavior): Ao invés de ser liberado ou pela
emissão de qualquer resposta diferente da resposta alvo ou automaticamente após a passagem de um
tempo, desde que a resposta alvo não tenha ocorrido (como no DRO), podemos programar o reforçamento
contingente a emissão de uma resposta específica, diferente da resposta alvo, chamada aqui de
“alternativa”. No laboratório, ainda considerando a RPB como resposta alvo a ser enfraquecida (posta em
extinção), poderíamos programar a liberação da gota de água contingente a ocorrência da resposta
alternativa de “farejar a barra”. Na situação aplicada o reforço poderia ser contingente a emissão da
resposta de “tocar o braço com os lábios”, enquanto a resposta alvo, “morder o braço”, seria colocada em
extinção. A grande diferença para o DRO é que no DRA uma resposta diferente da resposta alvo é
previamente especificada.
DRI (Differential Reinforcement of Incompatible Behavior): Trata-se de uma variação do DRA,
com a exigência adicional de que a resposta alternativa deveria ser física ou funcionalmente incompatível
com a resposta alvo. Ou seja, a emissão da resposta incompatível tornaria menos provável a emissão da
resposta alvo, a ser enfraquecida. No laboratório, então, poderíamos eleger a resposta de “erguer a barra”
como incompatível a de “pressionar a barra” (resposta alvo). Erguer a barra impede, fisicamente, a
emissão de pressionar, o que torna a resposta alvo, colocada em extinção, ainda menos provável. Em um
contexto aplicado, exigir para a liberação do reforço a apresentação da resposta de “colocar as mãos nos
bolsos” impediria fisicamente a apresentação da resposta alvo “morder o braço” (posta em extinção).
Veja que todos esses esquemas envolvem o reforçamento diferencial, ou seja, o reforçamento está
disponível em um contexto e não em outro. Temos, então, reforçamento (para um grupo de respostas) e
extinção (para outro grupo de respostas) atuando em conjunto na modelagem de um determinado
4. Fundamentos de Psicologia Experimental Passo 10 4
repertório comportamental. Se a emissão da resposta alvo levar ao adiamento da oportunidade de
reforçamento, então, teremos não simplesmente extinção, suspensão não contingente do reforçamento,
mas uma contingência aversiva em vigor: punição negativa.
O psicólogo será confrontado (na educação especial, na clínica, no hospital, por exemplo) com
problemas nos quais a emissão de certas respostas coloca em risco a integridade ou mesmo a vida de uma
pessoa ou/e das pessoas que o cercam. Reduzir a freqüência de tais comportamentos passa a ser essencial
e ele terá que planejar estratégias de redução ou supressão do responder. Além de enfraquecer certas
respostas, a função educativa do psicólogo envolverá a construção de repertórios mais saudáveis que
melhorem a qualidade de vida da pessoa atendida por ele. Os esquemas descritos aqui (DRL, DRO, DRA
e DRI) são parte de uma tecnologia comportamental importante para entender, planejar e conseguir a
ocorrência de comportamentos e que vêm se mostrando eficazes instrumentos de intervenção. Observe,
contudo, que a descrição aqui realizada é apenas um passo inicial na sua formação. Quando for necessário
trabalhar com manutenção de comportamentos, o aprofundamento nesse tópico é essencial. A leitura de
Le Blanc, Reuter, Miller e Schilmoeller (1977), Vollmer, Roane, Ringdahl e Marcus (1999), Corte, Wolf
e Locke (1971), Favell, Azrin, Baumeister, Carr, Dorsey, Forehand, Foxx, Lovaas, Rincover, Risley,
Romanczyk, Russo, Schroeder e Solnick (1982), Lerman, Iwata, e Wallace (1999) e Lerman e Vorndran
(2002) fica como sugestão.
Esquemas Múltiplo, Misto, Encadeado, Tandem e Concorrente
O mundo real não é constituído de contingências estanques ou separadas, então, é mais provável
de encontrarmos os esquemas descritos de forma combinada. Algumas dessas combinações serão
exploradas aqui, principalmente os seus procedimentos. Você poderá obter uma descrição detalhada dos
processos e resultados particulares de cada esquema mencionado em Ferster & Skinner (1957) e Catania
(1999, caps. 10 e 11). Nosso objetivo aqui é apenas apresenta-lo ao tema.
Podemos ver dois ou mais esquemas em ação no mesmo arranjo de contingências. Em um
esquema Múltiplo cada esquema diferente de um arranjo possui seu próprio SD. Assim, em um esquema
Múltiplo FI60” e FR10, os antecedentes são diferentes para cada um deles: Na presença da luz vermelha,
vigora o FI60”, mas na presença da luz verde vigora o esquema FR10. Uma característica importante
desse esquema é que a alternância ocorre de forma sinalizada diante do mesmo operando, ou seja, tanto as
respostas diante da luz azul quanto da luz vermelha ocorrem diante, por exemplo, de respostas de bicar
um disco. A figura abaixo mostra um esquema múltiplo VI60” (na presença de uma luz vermelha) e FR10
(na presença de uma luz verde). Observe que o desempenho, após algumas sessões, está plenamente
adaptado ao esquema: a taxa típica que produz o reforço é rapidamente apresentada diante de cada
discriminativo.
5. Fundamentos de Psicologia Experimental Passo 10 5
Uma variação desse esquema complexo seria manter os dois esquemas componentes
mencionados, FI60” e FR10, mas sem sinalizar quando cada um estaria em vigor. Tal esquema é chamado
de Misto e nele dois ou mais esquemas componentes são alternados no mesmo operandun (ou seja, no
mesmo dispositivo de resposta, como por exemplo a barra na caixa de Skinner) sem qualquer sinalização
externa antecedente programada. Sem a presença de discriminativos claros, como você acha que seria a
aprendizagem nesse esquema?
Um outro tipo de esquema seria o Encadeado. Nesse arranjo dois ou mais esquemas componentes
estariam postos em seqüência, por exemplo, FI60” (Esquema 1) e FR10 (Esquema 2), sendo que cumprir
os requisitos do primeiro conduziria ao segundo que, somente após finalizado, produziria o reforçador
final. A conseqüência para o engajamento do esquema 1 seria o acesso ao esquema 2 que por sua vez
poderia conduzir ao reforçador terminal. Cada um dos esquemas componentes é correlacionado com um
SD específico. Assim, diante de FI60” vigora uma luz verde. O cumprimento desse esquema produz uma
luz amarela que sinaliza a presença de uma nova contingência de reforçamento: o esquema FR10. Ao
completar o FR10 o reforçador final é aí sim produzido:
Uma variação desse esquema seria produzida pela manutenção da cadeia exigida, mas com a
remoção dos estímulos discriminativos específicos para cada esquema componente. Imagine a mesma
seqüência FI60” FR10 sem qualquer evento antecedente sinalizando quando cada esquema particular
estaria em vigor. Esse esquema é chamado de Tandem. Sem os discriminativos claramente indicados,
como você imagina que ocorra a aprendizagem da seqüência?
Mas os esquemas componentes podem ser dispostos em arranjos de escolha, onde dois ou mais
esquemas componentes estariam em vigor em diferentes operandos ao mesmo tempo. Assim, poderíamos
ter agora duas barras funcionando simultaneamente, uma a esquerda e outra a direita da concha, sendo
que em uma estaria em vigor um FR10 e na outra um VR10. Um esquema como esse é chamado de
Concorrente e é paradigmático para investigar contingências de escolha e tomada de decisão. Podemos,
inclusive, tentar entender certos padrões comportamentais envolvidos no chamado “autocontrole”. Uma
configuração clássica é arranjar dois esquemas componentes em situação de escolha, sendo que em um
estaria em vigor um esquema onde uma quantidade menor, mas imediata, de reforço estaria disponível e
em outro a quantidade de reforço seria maior, mas não estaria a disposição tão imediatamente quanto no
primeiro caso. Podemos ter variações manipulando também o custo da resposta (o número de respostas
exigidas pela contingência, por exemplo) para iguais quantidades de reforço em cada esquema
componente.
Um esquema derivado do anteriormente descrito e também usado em estudos de escolha
seria o Conjugado. Nele dois ou mais esquemas também estariam em vigor de forma simultânea, mas no
mesmo operando. Se no Concorrente cada esquema ocorreria para respostas diferentes, aqui os esquemas
componentes teriam uma única possibilidade de resposta. Nosso rato poderia tanto produzir água tanto
6. Fundamentos de Psicologia Experimental Passo 10 6
atingindo as exigências do esquema de FR10 quanto do esquema de VR10 (o que ocorresse primeiro),
pressionando a mesma barra.
Há muitas outras possibilidades de arranjar as contingências de reforçamento em situações
cada vez mais complexas, por exemplo, quando o próprio desempenho em um esquema serve como
parâmetro para definir o valor do outro esquema em vigor. Para esse momento nos bastaria que você
fosse capaz de identificar os esquemas aqui mencionados e soubesse onde pesquisar para obter mais
informações a respeito.
REFERÊNCIAS
Benvenuti, M. F. (2001). Comportamento “supersticioso”: possíveis extensões para o comportamento
humano. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz e M. C. Scoz (Orgs.), Sobre
Comportamento e Cognição Vol. 8 (pp. 29-34). Santo André: ESETec.
Catania, C. A (1999). Aprendizagem: Comportamento, Linguagem e Cognição. Porto Alegre: ArtMed.
Corte, H. E. , Wolf, M. M. and Locke, B. J. (1971). A comparison of procedures for eliminating self-
injurious behavior of retarded adolescents. Journal of Applied Behavior Analysis, 4 (3), 201-213.
Dawkins, R. (2000). Desvendando o arco-íris: ciência, ilusão e encantamento. São Paulo: Companhia das
Letras.
Favell, J. E., Azrin, N. H., Baumeister, A. A., Carr, E. G., Dorsey, M. F., Forehand, R., Foxx, R. M.,
Lovaas, O. I., Rincover, A., Risley, T. R., Romanczyk, R. G., Russo, D. C., Schroeder, S. R. and
Solnick, J. V. (1982). The treatment of self-injurious behavior. Behavior Therapy, 13, 529-554.
Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-
Crofts
Herrnstein, R. J. (1975). Supertición: un corolario de los principios del condicionamento operante. Em W.
K. Honig (Ed.), Conducta operante: investigación y aplicaciones (pp. 50-71). México: Trillas.
Holz, W. C. & Azrin, N. H. (1963). A comparison of several procedures for eliminating behavior.
Journal of the Experimental Analysis of Behavior, 6 (3), 399-406.
Le Blanc, J. M., Reuter, K. E., Miller, D. N e Schilmoeller, G. L. (1977). Laboratory investigations of
applied behavior analysis techniques: procedures designed to decrease or eliminate responding. Em B.
C. Etzel, J. M. Le Blanc and D. M. Baer (Eds.), New developments in behavioral research (p.180-
229). Hilsdale, NJ: Lawrence Erlbaum Associates, Publishers.
Lerman, D. C. & Vorndran, C. M. (2002). On the status of Knowledge for using Punishment:
Implications for treating behavior disorders. Journal of Applied Behavior Analysis, 35 (4), 431-464.
Lerman, D. C.; Iwata, B. A. & Wallace, M. D. (1999). Side effects of extinction: Prevalence of bursting
and agression during treatment of self-injurius behavior. Journal of Applied Behavior Analysis, 35
(4), 431-464.
Lundin, R. W. (1972). Personalidade: Uma análise do comportamento.São Paulo: Herder/EDUSP.
Machado, L M. C. M. (1986). Esquemas de reforçamento positivo I – esquemas simples. Psicologia, 12
(2), 1-15.
Millenson, J. R. (1975). Princípios de análise do comportamento. Brasília: Coordenada.
Ono, K. (1987). Superstitious behavior in humans. Journal of the Experimental Analysis of Behavior,
47, 261-271.
Skinner, B. F. (1948). "Superstition" in the pigeon. Journal of Experimental Psychology, 38 (2), 168-
172.
Skinner, B. F. (1978). O comportamento verbal. São Paulo: Cultrix. Publicado originalmente em 1957.
Staddon, J. E. R. & Simmelhag, V. L. (1971). The superstition experiment. Psychological Review, 78, 3-
43.
Vollmer, T. R., Roane, H. S., Ringdahl, J. E. and Marcus, B. A. (1999). Evaluating treatment challenges
with differential reinforcement of alternative behavior. Journal of Applied Behavior Analysis, 32 (1),
9-23.