Controle aversivo e reforçamento negativo

FUNDAMENTOS DA PSICOLOGIA EXPERIMENTAL
PASSO 11 - Controle aversivo

Objetivos: 1) Definir e dar exemplos de Controle Aversivo; 2) Definir e dar exemplos de Estímulos Aversivos ou
Punidores; 3) Definir e dar exemplos de Punidores Primários e Secundários; 4) Definir e dar exemplos de
Reforçamento Negativo (Fuga e Esquiva); 5) Definir e dar exemplos de Punição (Positiva e Negativa); 6) Descrever
os efeitos principal e secundários da Punição; 7) Descrever alguns parâmetros que modulam o efeito da Punição.

No que diz respeito ao comportamento operante, estudamos no Passo 6 a relação entre o organismo e o
ambiente, enfatizando o fortalecimento de uma classe de respostas através da apresentação contingente de um
estímulo reforçador (reforçamento positivo). Entretanto as relações mantidas com o mundo nem sempre envolvem
conseqüências reforçadoras positivas, ao contrário. Muitas vezes o que fazemos ocorre em função de um conjunto de
contingências envolvendo estímulos nocivos ou prejudiciais ou a perda de reforçadores positivos.
Também estudamos, no Passo 7, uma das maneiras de enfraquecer uma resposta operante: a extinção, ou
seja, estudamos o enfraquecimento de respostas através da suspensão de conseqüências reforçadoras. Muitas vezes,
entretanto, nosso ambiente físico, ou as instituições e as pessoas com quem convivemos, enfraquecem alguns de
nossos comportamentos, não através da suspensão de conseqüências reforçadoras, mas através de certas
conseqüências que chamamos cotidianamente de “prejudiciais” ou “desagradáveis”1 .
Existem, portanto, outras formas de fortalecer e enfraquecer respostas operantes, que não o reforçamento
positivo e a extinção: trata-se do CONTROLE AVERSIVO.
Conforme estudamos no Passo 6, algumas conseqüências funcionam de maneira a aumentar a freqüência de
certas classes de respostas. Chamamos esses estímulos de reforçadores. O estímulo reforçador é, por definição, o
estímulo que aumenta a freqüência das respostas que o produzem e reduz a freqüência das respostas que o
eliminam.
Quando dizemos que uma resposta operante foi reforçada, estamos nos referindo a um aumento na
probabilidade de membros de uma mesma classe de respostas voltarem a ocorrer na presença da mesma condição
antecedente (SD). Estamos falando, portanto, de uma contingência tríplice de REFORÇAMENTO POSITIVO2.
Uma resposta operante pode, entretanto, ser reforçada em uma contingência de REFORÇAMENTO
NEGATIVO. Nesse caso, o fortalecimento de uma classe de respostas não se dá pela produção de um estímulo
reforçador positivo, mas pela eliminação de um estímulo Aversivo ou Punidor. A conseqüência seria, então, a
interrupção ou evitação desse Estímulo Aversivo. Um estímulo aversivo é, por definição, qualquer estímulo que
reduz a freqüência das respostas que o produzem e aumenta a freqüência das respostas que o eliminam. Um
estímulo pode funcionar como estímulo aversivo de maneira primária (incondicionada, ou seja, sem a necessidade de
uma história de condicionamento) ou secundária (condicionada, ou seja, após uma história de condicionamento). Em
geral, os estímulos aversivos primários são prejudiciais ao organismo, colocando em risco a sua integridade física3
(como o contato com o fogo, choque elétrico, luz intensa, sons muito altos, frio e calor intensos, certas substâncias
que se ingeridas produzem náuseas e vomito, venenos, e qualquer evento relacionado a dor). Os estímulos aversivos
secundários adquirem sua função através do pareamento com estímulos aversivos primários ou secundários (como os
reforçadores positivos condicionados)4. O termo “controle aversivo” refere-se ao controle exercido sobre o
comportamento através de estímulos aversivos.
No reforçamento negativo, a tríplice contingência pode ser assim representada.
D
S • • • R  SAv
D
Onde, S é o estímulo discriminativo (a condição que antecedeu a apresentação de um estímulo aversivo), • •
• é a relação de controle (discriminativo), R a resposta examinada,  a interrupção ou adiamento da apresentação de
um estímulo e SAv o estímulo aversivo.

O Fortalecimento da Resposta Operante (Reforçamento) Através do Controle Aversivo

1
Um dos objetivos deste passo é introduzir o conceito de estímulo aversivo que substituirá o que aqui está sendo chamado de
“conseqüências prejudiciais ou desagradáveis”.
2
REFORÇAMENTO porque a freqüência da resposta aumenta; POSITIVO porque a resposta produz (soma, adiciona)
estímulo(s) no ambiente, neste caso, o estímulo reforçador.
3
Ao longo da nossa história evolutiva identificar e responder prontamente, evitando o contato com tais eventos, deve ter tido
valor de sobrevivência e por isso hoje nossos organismos estão prontos para reagir a certos eventos mesmo sem haver uma história
de aprendizagem prévia que explique essa sensibilidade (Baum, 1999, p. 77).
4
A aprendizagem indireta também é particularmente importante no caso dos serem humanos. Um estímulo inicialmente neutro
para uma dada resposta pode adquirir sua função aversiva através de aprendizagem observacional ou através de instruções. Posso
nunca ter tido uma história direta com tigres, mas ver filmes mostrando as conseqüências de uma interação com eles (colocar a
mão na jaula e perdê-la) ou ouvir descrições (regras) dos efeitos dessas interações (“se você chegar perto da jaula ele vai te
comer”), podem ser condições suficientes para torná-los estímulos aversivos.

Fundamentos de Psicologia Experimental Passo 11 2
Como já foi mencionado anteriormente, o reforçamento positivo consiste em apresentar um estímulo
reforçador contingentemente à emissão de uma dada resposta diante de um dado estímulo discriminativo. Uma
resposta operante pode também ser reforçada na seguinte situação: Diante de um determinado estímulo, se uma dada
resposta for emitida, um estímulo aversivo será eliminado ou evitado. Considere o seguinte exemplo: Quando Mara
está fazendo compras no comércio ela vê algumas nuvens negras no céu e sente um vento forte, mas continua sua
caminhada pelas ruas do comércio. Começa, então, a chover e ela sente os primeiros pingos em sua roupa (SD), ela se
dirige ao interior de uma loja (R), eliminando o contato com a chuva (eliminação do SAv). Em situação de
laboratório, podemos montar a seguinte condição: um choque elétrico ocorre em uma câmara experimental em escala
crescente (de 1 a 3) e uma luz antecede a apresentação do primeiro choque e fica presente enquanto o choque ocorre.
Se o animal diante da intensidade 1 pressionar uma barra (R), então isso desliga o choque elétrico (eliminação do
SAv) e apaga a luz. Do contrário, o choque irá aumentar de intensidade gradualmente. Respostas de pressão à barra
nesse caso são reforçadas negativamente. Estes são, portanto, exemplos de REFORÇAMENTO NEGATIVO.
Reforçamento porque a resposta é fortalecida, e negativo porque a resposta retira (subtrai, elimina, evita) um
estímulo (s).
A resposta reforçada através de um procedimento de reforçamento negativo é uma resposta de Fuga ou de
Esquiva. Existe uma importante distinção entre elas. As respostas de fuga eliminam, interrompem, terminam uma
estimulação aversiva. As respostas de esquiva evitam, impedem ou pospõem a ocorrência de um estímulo aversivo.
Desse modo, chamamos de esquiva se a resposta ocorre antes da apresentação do estímulo aversivo (evitando-o), e de
fuga, se a resposta ocorre quando o estímulo aversivo já está presente (interrompendo-o). Apesar de ocorrer antes
da presença do estímulo aversivo, a resposta de esquiva não acontece no vácuo. Ela ocorre na presença de
estímulos pré-aversivos, ou seja, estímulos que sinalizam a ocorrência de estímulos aversivos. Esses estímulos
podem ser considerados com estímulos aversivos condicionados.
Nos exemplos dados, tanto a chuva quanto o choque já estavam presentes quando as respostas ocorreram
(“entrar na loja” e “pressionar uma barra”). Tais respostas levaram a interrupção do estímulo aversivo (chuva e
choque elétrico). Observamos um aumento na freqüência de tais respostas diante dos mesmos estímulos, o que atesta
a função reforçadora negativa de tais eventos. Mas como poderíamos transformar os mesmos exemplos em casos de
esquiva?
No exemplo de fuga, a chuva já havia molhado Mara antes da resposta de entrar na loja. Mas podemos
conceber uma situação diferente na qual Mara, em uma segunda vez, observa a formação de nuvens negras e um forte
vento. Tais eventos na primeira vez antecederam a chuva. Dessa vez Mara, diante desses estímulos (pré-aversivos),
corre para uma loja e se abriga. Alguns segundos depois a chuva torrencial cai. Note que a resposta de entrar na loja
ocorreu antes que a chuva pudesse molhar Mara e ocorreu sob controle discriminativo (nuvens negras e vento forte).
Tal resposta agora evitou o contato com a chuva (Sav). E na situação de laboratório? Vimos que uma luz antecedia a
apresentação do choque na intensidade 1 e que a resposta de pressionar um barra desligava o choque. Agora, pela
segunda vez, o animal é posto na mesma situação experimental. Quando a luz acende (pré-aversivo), ele
imediatamente pressiona a barra, desligando a luz e evitando a apresentação do choque. Agora a resposta ocorreu
antes do aparecimento do choque e parece estar sob controle da presença do pré-aversivo “luz”. Tal resposta, diante
da luz, evitou o contato com o choque elétrico (Sav).
Nosso cotidiano está repleto de exemplos de fuga e esquiva. Na parada de ônibus, quando nossa pele está
sendo queimada pelo sol, vamos para uma sombra, eliminamos esse incômodo (fuga). Quando estamos saindo da
Universidade e nos dirigimos para um dos portões para pegar o ônibus, retiramos o relógio e/ou as jóias e diminuímos
a probabilidade de sermos assaltados.

O ENFRAQUECIMENTO DE UMA RESPOSTA OPERANTE ATRAVÉS DO CONTROLE AVERSIVO
Para Catania (1999), “o efeito da punição é simplesmente o oposto do efeito do reforço“ (p. 109). Ele explica
“a punição é paralela ao reforço, exceto pelo fato de que os efeitos diferem quanto ao sinal: o reforço aumenta o
responder reforçado, e a punição reduz o responder punido. Ambas as operações têm efeitos temporários; quando são
interrompidas, o responder retorna aos níveis prévios“ (p. 112).
Uma resposta operante pode ser enfraquecida através de procedimentos de punição. Há duas maneiras de
punir uma resposta: 1) através da apresentação do estímulo aversivo contingente à resposta (punição positiva ou
punição tipo 1: “punição” porque a resposta é enfraquecida; “positiva” porque a resposta produz - acrescenta,
adiciona - um estímulo no ambiente: o aversivo); 2) através da remoção do estímulo reforçador contingente à resposta
(punição negativa ou punição tipo 2: “punição porque a resposta é enfraquecida; negativa porque a resposta elimina -
subtrai - um estímulo: o reforçador positivo). Qualquer que seja o procedimento de punição adotado (positiva ou
negativa), o resultado é redução da freqüência de uma classe de respostas naquela situação.
Na punição positiva, a tríplice contingência pode ser assim representada.
Dp+ Av
S •••RS

2

Dp+
Onde, S é o estímulo discriminativo da punição (a condição que antecedeu a apresentação de um estímulo
aversivo), • • • é a relação de controle (discriminativo), R a resposta examinada,  a apresentação de um estímulo e
Av p+
S o próprio estímulo aversivo (ou punidor: S ).
Na punição negativa, a tríplice contingência pode ser assim representada.
Dp- R+
S •••RS
Dp-
Onde, S é o estímulo discriminativo da punição (a condição que antecedeu a retirada de um estímulo
reforçador positivo), • • • é a relação de controle (discriminativo), R a resposta examinada,  a interrupção da
R+
apresentação de um estímulo e S o próprio estímulo reforçador positivo.
Vamos a alguns exemplos.
1) Paulo é um pré-adolescente e ultimamente tem respondido com grosserias às ordens de Dona Laura, sua
mãe. Um dia, já impaciente, Dona Laura mandou que Paulo fosse tomar banho (SD). Ele xingou a mãe (R) e, como
conseqüência disso, levou uma surra. Observamos que após esse episódio, o xingar a mãe caiu de freqüência,
inferindo, então, que a surra funcionou como estímulo aversivo ou punidor (SAv ou Sp+) para a classe de respostas
“xingar”. Ao analisarmos a situação-exemplo acima podemos proceder da seguinte maneira: a) a probabilidade de
Paulo voltar a responder dessa maneira na presença daquele SD (mãe dando ordem pra tomar banho) aumentará ou
diminuirá após esse episódio? Se chegarmos à conclusão que diminuirá, podemos dizer, então, que a resposta foi
punida. b) a resposta de Paulo acrescentou ou subtraiu estímulo de seu ambiente? Observe que a conseqüência para o
comportamento de Paulo foi a surra, que não ocorreria se a resposta de xingar não tivesse sido emitida. Assim, a
resposta produziu (acrescentou) a surra. Então, estamos diante de um caso de PUNIÇÃO POSITIVA: “punição”
porque a resposta foi enfraquecida e “positiva” porque ela produziu um estímulo (a surra - estímulo aversivo, no
nosso exemplo particular5).
2) Considere a mesma situação antecedente descrita acima: Dona Laura mandou que Paulo fosse tomar banho
(SD) e ele a xingou (R). Considere entretanto que, como conseqüência, D. Laura tenha retirado do quarto de Paulo o
videogame que ele havia ganho de aniversário há um mês. Considera também que os jogos de videogame eram
comprovadamente um reforçador poderoso para muitas respostas apresentadas por Paulo. Ao analisarmos a situação-
exemplo acima podemos proceder da seguinte maneira: a) a probabilidade de Paulo voltar a responder dessa maneira
na presença daquele SD aumentará ou diminuirá após esse episódio? Se chegarmos à conclusão que diminuirá,
podemos dizer, então, que a resposta foi punida. b) a resposta de Paulo acrescentou ou subtraiu estímulo do ambiente
com o qual Paulo interage? Observe que a conseqüência para o comportamento de Paulo foi a retirada do videogame,
que era um reforçador poderoso e que permaneceria disponível no seu quarto, caso a resposta não fosse emitida.
Assim, a resposta eliminou (subtraiu) um estímulo, o videogame. Então, estamos diante de um caso de PUNIÇÃO
NEGATIVA: “punição” porque a resposta foi enfraquecida e “negativa” porque ela eliminou um estímulo (estímulo
reforçador, neste caso).
Não se deve confundir, contudo, a punição negativa com a extinção: apesar de ambos os procedimentos
produzirem um efeito semelhante sobre o comportamento (redução na freqüência) e ambos consistirem na remoção de
estímulos reforçadores. Na punição negativa, a remoção do estímulo reforçador é contingente à resposta, enquanto
que, na extinção, ela é não-contingente. Isso quer dizer que, no procedimento de punição negativa, a supressão do
estímulo reforçador depende da emissão da resposta a ser punida. No exemplo acima, o acesso ao videogame não
teria sido suspenso se a reposta de xingar a mãe não tivesse ocorrido. Assim, na punição negativa, a remoção do
estímulo reforçador é produzida por uma resposta emitida por um organismo. Isso seria diferente da supressão não-
contingente do acesso ao videogame, causado por uma pane provocada pelo desgaste natural do aparelho, por
exemplo. Nesse caso, a supressão não contingente do estímulo reforçador provocaria a redução na freqüência de uma
classe de respostas através da extinção (indisponibilidade do reforçador positivo). A supressão dos estímulos
reforçadores não seria produzida pela emissão de uma resposta do organismo.
EFEITOS E SUBPRODUTOS DA PUNIÇÃO
O principal efeito da punição é a redução na freqüência de uma classe de respostas. Esse efeito depende,
entretanto, de diversos parâmetros. Assim como o reforçador positivo, o efeito do punidor depende entre outras
coisas: (a) da natureza do estímulo (primário ou secundário), (b) da intensidade desse estímulo (magnitude), (c) do
intervalo entre a emissão de uma resposta e a apresentação do estímulo, (d) da freqüência de sua ocorrência (contínuo
ou intermitente), (e) da existência ou não de uma resposta alternativa disponível, etc. (Azrin & Holz, 1975). Assim,
um estímulo punidor é mais eficiente quando: (a) é primário, (b) é intenso desde a primeira ocorrência, (c) é
imediatamente apresentado após a resposta, (d) é apresentado todas as vezes que a resposta ocorre (1/1) e (e) se há
outra resposta disponível que produza os mesmos reforçadores positivos. Há outras variáveis importantes também,
5
Nunca perca de vista que classificação de um estímulo como “aversivo” ou “reforçador” depende exclusivamente do efeito que
ele tem sobre o comportamento. Se a freqüência do comportamento de Paulo tivesse aumentado, teríamos que considerar a surra
como um estímulo reforçador e, então, estaríamos diante de um exemplo de reforçamento positivo.

3

como a história de fortalecimento prévio da resposta. Se a classe de respostas punida tiver sido fortalecida através de
reforçamento intermitente isso tornará o enfraquecimento dessa classe mais difícil.
Na figura abaixo temos os valores médios da resposta de pressão à barra (RPB) emitidas por 3 ratas Wistar
submetidas à sessões de fortalecimento dessa classe em CRF (água como SR) e sessões de punição positiva contínua
(CRF) e intermitente (FR3) dessa mesma classe de respostas:
Av
O S usado nesse estudo (Ribeiro & Carvalho Neto, 2004) foi um jato de ar quente apresentado por 5” após
cada RPB. Para evitar o efeito conjunto de extinção + punição, nas sessões de punição a água também estava
disponível, em CRF, contingente a mesma resposta. Note que: (a) para todos os sujeitos houve uma queda na
freqüência da RPB durante as sessões tanto de punição contínua quanto nas sessões de punição intermitente (em
relação às médias de fortalecimento prévio); (b) a queda na freqüência da punição intermitente foi menos acentuada
que a queda na punição contínua; (c) A freqüência da RPB voltou aos patamares anteriores a punição tão logo essa foi
suspensa, no caso contínuo, e mesmo acima destes, no caso intermitente.
O efeito mais permanente de um estímulo punidor depende dos parâmetros anteriormente mencionados. Há
casos especiais em que uma única exposição ao evento aversivo é capaz de reduzir a zero a sua probabilidade de
ocorrência por longos períodos de tempo (Azrin & Holz, 1975). Em geral, contudo, o que ocorre é um retorno aos
patamares anteriores à ocorrência da punição.

A figura acima ilustra como a probabilidade do responder (durante e posterior a punição) depende do tipo de
evento punidor, aqui dividido em graus crescentes de intensidade: “moderado”, “severo” e “traumático”. Observe que
no nível moderado, a freqüência cai durante a punição, mas é recuperada após sua eliminação. Na fronteira do severo
com o moderado a queda é mais acentuada durante a punição e não há recuperação após a eliminação da punição.
Veja que não há até aqui qualquer avaliação moral ou recomendação do uso da punição. Estamos tentando
entender todas as sutilezas das contingências aversivas e a complexidade de seus efeitos sobre o comportamento. Até
que venhamos a entender com precisão como a punição funciona, pouco poderemos avançar em termos de
planejamento de práticas culturais efetivas, até mesmo na remediação de alguns dos efeitos do controle aversivo6
(como os chamados “traumas” de guerra e nas fobias). Conhecer de forma mais ampla e minuciosa os efeitos da
punição é o melhor antídoto para lidar com um mundo, natural e cultural, essencialmente, coercitivo (Sidman, 1995).
Não falar de punição ou não estudá-la não irá alterar esse fato. As contingências aversivas permanecerão lá, ao nosso
redor, o tempo todo (Todorov, 2001). Os organismos de maneira geral nascem preparados para lidar com tais
contingências, o que sugere que a punição seja um traço bastante estável desse mundo. Sermos capazes de fugir e
evitar o contato com estímulos aversivos foi e é essencial para a nossa sobrevivência. Tocar um objeto em brasa ou
comer alimentos estragados são respostas que precisam diminuir de freqüência, pois, do contrário, colocariam em
risco a vida do próprio organismo. Os mecanismos que preservariam o organismo longe dos aspectos do mundo
capazes de destruí-lo seriam exatamente os envolvidos no chamado controle aversivo (Perone, 2003).
Um evento não é “aversivo” ou “reforçador” por qualquer propriedade estrutural intrínseca. Ele não “é”
aversivo ou reforçador. Ele “está” ou “funciona” como tal. Uma fatia de bolo de chocolate pode funcionar como um
evento reforçador positivo para a resposta de comer e para as demais que conduzem ao comer (trata-se, portanto, de
uma cadeia ampla onde o elo final é a fatia de bolo). Mas após a vigésima fatia, o bolo possivelmente perderá sua
função reforçadora para a resposta de comer e produzirá o efeito inverso: reduzirá de freqüência essa classe de

6
Para uma revisão do conhecimento atual sobre os efeitos da punição tanto na pesquisa básica quanto na aplicada, veja Lerman e
Vorndran (2003). Há situações práticas nas quais uma freqüência de uma resposta, autolesiva, por exemplo, não pode cair
gradualmente e nem pode ser retomada sem que isso coloque em risco a integridade física (ficar cego ou surdo) ou a própria vida
de uma pessoa. É importante saber, então, como o arranjo de contingências aversivas poderia suprimir permanentemente tais
respostas. No mesmo artigo citado você encontrará um panorama amplo dessa área aplicada e a justificativa para sua existência
(veja também Iwata, 1987).
4

respostas. Por que dizemos que o bolo é reforçador ou aversivo para uma resposta e não para o indivíduo? No nosso
exemplo o bolo de chocolate após a vigésima fatia passou a funcionar como um estímulo aversivo para a resposta de
comer, mas se o mesmo bolo for arremessado contra o rosto da pessoa que estaria lhe obrigando a comer a vigésima
primeira fatia e isso levasse a suspensão da apresentação da comida, a resposta de arremessar o bolo teria sido
reforçada pelo uso do bolo como arma (e não como comida). Lembre-se que o mesmo bolo para a resposta de comer
funcionava como um reforço positivo até a décima nona fatia, mas tornou-se um aversivo para a mesma resposta após
a vigésima fatia. Mas, o bolo, após a vigésima fatia, usado como uma arma, permanecia um reforçador para a resposta
de “arremessar” (reforçador negativo, pois eliminava o contato com o estímulo aversivo: o bolo para a resposta de
comer). Note que a fatia de bolo não “era” um reforçador para a resposta de comer, mas apenas funcionava como um
em determinado contexto. Além disso, para outras respostas o estímulo poderia guardar diferentes funções (“comer”
ou “arremessar”). Se nós falássemos simplesmente que a fatia de chocolate “era” um reforçador “para o indivíduo”,
seria possível descrever com precisão todas as relações ilustradas anteriormente no exemplo?
Em situações mais complexas, punidores e reforçadores positivos não ocorrem inteiramente separados. Um
estímulo que começa como um estímulo reforçador para uma classe de respostas pode adquirir uma função aversiva
para a mesma classe. A introdução gradual de estímulos que são normalmente aversivos, associados a estímulos
apetitivos (reforçadores positivos), pode fazer com que os estímulos inicialmente aversivos percam essa propriedade
aversiva e passem a funcionar como reforçadores positivos.
Imagine quais seriam os efeitos comportamentais obtidos em um experimento em que se aplicasse o seguinte
procedimento experimental. O objetivo seria colocar a resposta de pressão à barra de um rato de laboratório sob
controle de estímulo. A câmara de condicionamento operante seria equipada com um aparelho de eletrochoque de tal
maneira que seria possível apresentar descargas de choque elétrico na barra, quando o rato entrasse em contato com
ela. O procedimento consistiria em ligar os dispositivos elétricos do bebedouro e do eletrochoque juntos, de tal
maneira que a resposta de pressionar a barra seria reforçada sempre e tão somente quando a barra estivesse “dando
choque”. A presença de carga elétrica na barra seria o SD que sinalizaria a ocasião em que as respostas de pressão à
barra seriam reforçadas. A ausência de carga elétrica na barra seria a condição S na presença da qual as respostas de
pressão à barra jamais seriam reforçadas. A manutenção desse procedimento poderia tornar o choque elétrico (que
comprovadamente tinha efeito aversivo para a resposta pressão a barra no início) em um estímulo discriminativo.
Bom, mas como estímulo discriminativo, os choques seriam freqüentemente pareados com a água (estímulo
reforçador primário) e isso poderia resultar em uma função reforçadora condicionada para o estímulo “choque” após
alguns pareamentos. Isso quer dizer que, por algum tempo, as respostas de pressão à barra poderiam ser reforçadas
pela apresentação contingente de choques elétricos. Esse é um exemplo hipotético de uma situação em que a
concorrência entre contingências envolvendo estímulos aversivos e apetitivos pode alterar a função dos estímulos7.
Um exemplo também hipotético, mas envolvendo o comportamento humano fora do laboratório pode ser interessante.
João é um garotinho que chamaríamos cotidianamente de “muito carente”. Ele não tem pai e sua mãe trabalha
o dia inteiro fora. A atenção dada pela mãe funciona como um reforçador poderoso para muitas classes de respostas
apresentadas por João. Praticamente qualquer resposta emitida por João aumenta rapidamente de freqüência quando é
consequenciada com a atenção de sua mãe. Ela, entretanto, quando chega em casa, já está cansada e ainda tem muito
trabalho pela frente. João emite muitas respostas diferentes (chama o nome da mãe, leva um brinquedo até ela,
começa a contar um episódio que se passou durante a ausência da mãe etc) e todas elas são postas não produzem a
atenção. João, então, começa a “fazer travessuras” (puxar a toalha da mesa até que caia o prato, colocar o sapato da
mãe na boca, escalar perigosamente o fogão etc). Imediatamente a mãe dá atenção para João, repreendendo-o
verbalmente e em seguida lhe faz um carinho. Como as travessuras se tornaram mais freqüentes (elas foram
positivamente reforçadas com atenção e com o carinho da mãe), a mãe passou a dar pequenas surras freqüentes em
João (comparando esse exemplo com o anterior, é como se a resposta de pressão à barra, que produz água, também
produzisse choques). Será possível que o pareamento entre “atenção” e “surra” altere a função aversiva do estímulo
“surra”, inicialmente um aversivo para a resposta de fazer travessuras? Você conseguiria descrever um arranjo desse
tipo capaz de gerar padrões comportamentais que chamamos tradicionalmente de “masoquistas”? Tente fazer essa
relação.
Bom, mas vamos continuar acrescentando aspectos teóricos a respeito do controle aversivo.
De acordo com alguns autores (Millenson, 1975; Sidman, 1995; Skinner, 1965), o comportamento de quem
usa a punição acaba sendo fortalecido por seus efeitos imediatos, como a eliminação de um Sav ou mesmo a produção
de reforçadores positivos. A violência parece envolver em grande medida relações desse tipo (ver Amorim 1999;
Andery & Sério; 1997; Capelari, & Fazzio, 1999). Holland (1978/1983), falando da situação dos E.U.A. nos anos 70,
sugere que as razões econômicas parecem estar na base da quase maioria dos crimes:

"Tanto pobres quanto ricos cometem atos ilegais em busca de vantagens econômicas. Nossa
sociedade é acentuadamente estratificada e em qualquer nível há uma luta para aumentar a
7
Há, porém, experimentos reais que você poderia consultar sobre o assunto. O artigo clássico de Holz & Azrin (1961) seria um
deles.
5

posição social e a felicidade, através de esforços competitivos individuais (legais ou ilegais). A
posição social (status) define-se pela riqueza e por níveis de consumo. O sistema competitivo
valoriza aqueles que fazem aquisições, ainda que às expensas de outros. Há diferenças de
privação e de acessibilidade que explicam as diferenças de classes nos crimes. O pobre e o
desempregado não têm oportunidade de sonegar impostos ou de dar desfalques. O nível de suas
necessidades básicas força-os a cometer os crimes de rua, mais perigosos, porém acessíveis, que
são públicos e, consequentemente, resultam, com maior freqüência, em prisão. Pessoas com
melhores condições sócio-econômicas não precisam se envolver em pequenos furtos. Seus crimes
são mais seguros e podem ocorrer na privacidade de seus lares ou escritórios." (p. 66-67).
As discussões realizadas na imprensa escrita e televisiva gastam uma parte significativa do tempo
argumentando a necessidade de uma política eficiente de punição, como uma maior agilidade da justiça e uma polícia
mais numerosa, bem preparada e equipada para coagir os crimes. Durante o trágico episódio do seqüestro de um
ônibus no Rio de Janeiro em 2000 que acabou com a morte de uma professora e o assassinato por asfixia do
seqüestrador pelos policiais de elite, a chamada opinião pública centralizou a discussão na incompetência explícita das
forças policiais, mas poucos se perguntaram as razões que teriam levado aquele rapaz a seqüestrar o tal ônibus (uma
honrosa exceção foi o artigo "Guga poderia virar um assassino?" de Dimenstein, 2000). O rapaz foi satanizado e raras
foram as menções de que ele foi uma das crianças que sobreviveu à "Chacina da Candelária", alguns anos antes.
Apesar da repercussão internacional daquele crime, a criança pôde seguir tranqüilamente seu caminho de abandono
nas ruas para exercer seu último papel dessa lamentável, evitável e vergonhosa tragédia em horário nobre. Os
comportamentos violentos são gerados por ambientes coercitivos. A punição é usada para tentar, por definição, reduzir
a freqüência desses padrões. Mas tais padrões foram gerados previamente e continuam a ser gerados e mantidos por
um conjunto de contingências sociais, freqüentemente mais poderosas. O combate à violência apenas através do
aumento e eficiência das vias de repressão mascara o problema original: De onde vêm os marginais? Qual a gênese de
um crime? Qualquer combate sério ao problema deveria começar com um amplo e rigoroso diagnóstico dos diferentes
tipos de crime, suas fontes e suas variáveis ambientais imediatas de controle. Esse mapeamento funcional deveria ser
usado para uma política preventiva, na qual mudanças reais e profundas nos arranjos sociais e econômicos fossem
implementadas. Leia-se, melhores condições de saúde, educação, emprego, moradia, saneamento básico, lazer, etc
para todos. Funcionalmente, acesso aos reforçadores primários e condicionados disponíveis em um grupo.
Mas voltemos aos efeitos da punição. A literatura que trata dos efeitos da punição na supressão da resposta é
complexa e controvertida. A punição pode eliciar comportamentos respondentes que interferem com o
comportamento operante especificado pela contingência, e pode afetar também outros operantes que, pelos
propósitos, não deveriam estar sendo punidos. Skinner (1965) sugere que a punição de uma classe de respostas não
apenas suprime essa classe, mas outras classes relacionadas, em um efeito de transbordamento (o mesmo fenômeno é
observado no reforçamento positivo).
Imagine que o fazer perguntas em sala durante a aula foi extremamente punido. Como esse aluno se
comportaria na presença de um professor que ameaçasse reprová-lo, caso não apresentasse um seminário de qualidade
diante de uma turma de 50 alunos? A presença do “publico” elicia respostas emocionais incompatíveis com a resposta
operante “apresentar um bom seminário”, a qual seria a única maneira de evitar a estimulação aversiva final
(reprovação). Certamente a professora primária que puniu o comportamento inicial, um comentário grosseiro talvez,
não imaginou que, além de estar punindo a classe inadequada, também puniu, por extensão, respostas gerais de “falar
em sala diante do professor”. Os efeitos da punição podem ser também ser ampliados para situações fora daquela
situação estrita em que ocorreu. A "situação geral" associada ao estímulo aversivo torna-se estímulo aversivo
condicionado. Professores que aplicam contingências aversivas freqüentemente tornam-se, eles mesmos, estímulos
aversivos condicionados. Seria esse o motivo pelo qual os alunos comemoram o fim do semestre ou do ano letivo,
festejam um dia sem aula ou depredam suas escolas? Skinner (1968) discute o fracasso escolar em grande medida
como o uso inadequado e generalizado de contingências aversivas em sala de aula.
Contudo, tais efeitos secundários, chamados de subprodutos da punição, não ocorrem em qualquer arranjo de
contingências aversivas. Duas variáveis que parecem críticas para gerar tais efeitos seriam a natureza e a intensidade
do SAv. Nos casos de punidores severos e traumáticos, como o choque elétrico em intensidade elevada, observam-se
os dois efeitos. Mas quando há eventos aversivos mais brandos envolvidos, a punição parece ser mais seletiva em seu
efeito supressor. Magalhães & Carvalho Neto (2004), usando um jato de ar quente como SAv apresentado
contingentemente a RPB em ratas Wistar, verificaram que outras classes de respostas relacionadas à barra (como
farejar e tocar) não foram suprimidas durante as sessões de punição, ao contrário, aumentaram de freqüência. Em
relação aos padrões emocionais associados ao uso da punição, nesse caso foi observado o aumento de respostas como
o urinar, o defecar e o “congelar” diante do SAv:

6


400
400
350
350
300
Freqüência
300
250
250
Freqüências
200
200
150
150
100
100
50
50 RPBs
0
0 CBas

co ia
Pn ã o

un o
dªe Pnin o
de e un o
d e Pc o
o
M ge M ela ra te
ela -2 el em

d e Rc d..
de e eco nd..
de e Rco nd..
Rcon d.

Re éd d.
d.
dde RF.
e

dee F
1ª ª3ddeCRF
2ª 1 Pu RF
3ª P P o
4ª edPu içição
5ª edP inição
6ª edPu inição
1ª dP çição
2ª dRe çãão

de e eco çã.

de e on .

de Mcon .
1ª m- Se m

3ª2ª e CR F
F

F
e çãF
2ª1ª e CSes.

ia
3ª ªedR uond
nd
5ª 3ªedR eoo d
6ª 4ª dRe co d
d
e d
d 2ª s
od m o d g nt

CR

4 ª CR
CR

R

e çã

e çã
ã

4ª dRe con

n
ge ª a g e

éd
ela odOpran

iniç

cn
n
5ª R ec n
dªed dniC

ni
de 4 e C

dª un n

M
e

u

u
Pu

u
Pu

Re

Re
e
od MN. pe

d

ª

e
O

dª
dª

6ª
N.

2ª

6ª
2
3

4

5

1
Sessões
M

Sessões
Fig.64-Freqüência de RPBs, respostas de contato com a barra e "respostas emocionais" emitidas pelo sujeito
HCRFa 1 em todas as sessões.

Fig. -Gráfico comparativo entre freqüências de RPBs e respostas de
contato com a barra emitidas pelo sujeito HCRFa 1,ao longo de cada
sessão.
RPBs CBas Respostas emocionais

Contudo, haveria ainda o problema conceitual do que poderia ser considerado comportamento “emocional”.
Podemos considerar as respostas de “morder a barra” e “defecar” como sendo respostas necessariamente emocionais,
subprodutos de contingências aversivas? O que definiria o “emocional” em uma categoria comportamental qualquer?
Esses casos são apenas para ilustrar que as questões envolvendo contingências aversivas nunca são simples e
que há um enorme conjunto de variáveis, históricas e imediatas, em jogo. Você está agora, espera-se, um pouco mais
bem preparado(a) para entender essas relações.

Referências e Bibliografia Complementar
Amorim, C. (1999) A possibilidade de usar a análise do comportamento para analisar a violência na imprensa. Em R.
R. Kerbauy & R. C. Wielenska (Orgs) Sobre comportamento e cognição-vol. 4 (pp.184-191). Santo André, SP:
Arbytes.
Andery, M. A. P. A. & Sério, T. M. P. (1997) A violência urbana: aplica-se a análise da coerção? Em R. A. Banaco
(Org.) Sobre comportamento e cognição- vol. 1 (pp.433-444). Santo André, SP: Arbytes.
Azrin, N. & Holz, (1975). Castigo. Em W. K. Honig (Ed.), Conducta operante: investigación y aplicaciones (pp. 455-
531). México: Trillas.
Azrin, N. H. & Holz, W. C. (1976). Castigo. Em W. K. Honig, (Ed.), Conducta operante: investigación y aplicaciones
(pp. 455-531). México: Trillas.
Azrin, N. H. (1970). Punishment of elicited aggression. Journal of the Experimental Analysis of Behavior, 14, 7-10.
Azrin, N. H.; Hutchinson, R. R. & McLaughlin, R. (1972). The opportunity for aggression as an operant reinforcer
during aversive stimulation. Em R. Ulrich & P. Mountjoy (Eds.), The experimental analysis of social behavior
(pp. 220-231). New York: Appleton-Century-Crofts.
Azrin, N. H.; Hutchinson, R. R. & Sallery, R. D. (1964). Pain-Aggression toward inanimate objects. Journal of the
Experimental Analysis of Behavior, 7, 223-228.
Baum, W. M. (1999). Compreender o behaviorismo: ciência, comportamento e cultura. Porto Alegre: ARTMED.
Cameschi, C. E. (1997). Comportamento de esquiva: teorias e controvérsias. Psicologia: Teoria & Pesquisa, 13, 143-
152.
Capelari, A. & Fazzio, D. F. S. (1999) O estudo da violência no laboratório. Em R. R. Kerbauy & R. C. Wielenska
(Orgs) Sobre comportamento e cognição-vol. 4 (pp.177-183). Santo André, SP: Arbytes.
Catania, A. C. (1999). Aprendizagem: comportamento, linguagem e cognição. 4ª Edição. Porto Alegre: Artmed.
Chance, P. (1994). Learning and behavior. Pacific Grove, CA: Brooks.

7

Dimenstein, G. (2000c). Guga poderia virar um assassino? Folha de S. Paulo, São Paulo, 18 jun. Caderno Cotidiano,
p.C8.
Dinsmoor, J. A. (1977). Escape, avoidance, punishment: where do we stand? Journal of the Experimental Analysis of
Behavior, 28, 83-95.
Freitas, J. (2000). Descobertos os responsáveis. Folha de S. Paulo, São Paulo, 18 jun. p.A5.
Holland, J. G. (1983). Comportamentalismo- parte do problema ou parte da solução? Psicologia, 9(1), 59-75.
Originalmente publicado em 1978.
Holz, N. H. & Azrin, W. C. (1961). Discriminative properties of punishment. Journal of the Experimental Analysis of
Behavior, 4, 1009-1015.
Horner, R. H. (2002). On the status of knowledge for using punishment: A commentary. Journal of Applied Behavior
Analysis, 35, 465-467.
Iwata, B. A. (1987). Negative reinforcement in applied behavior analysis: na emerging technology. Journal of
Applied Behavior Analysis, 20, 361-378.
Lattal, K. A. & Perone, M. (Eds.) (1998). Handbook of research methods in human operant behavior. New York:
Plenum.
Lerman, D. C. & Vorndran, C. M. (2002). On the status of Knowledge for using Punishment: Implications for treating
behavior disorders. Journal of Applied Behavior Analysis, 35, 431-464.
Lerman, D. C.; Iwata, B. A. & Wallace, M. D. (1999). Side effects of extinction: Prevalence of bursting and agression
during treatment of self-injurius behavior. Journal of Applied Behavior Analysis, 35, 431-464.
Lundin, R. W. (1972). Personalidade: Uma análise do comportamento. São Paulo. Ed. Herdes.
Magalhães, P. G. S. & Carvalho Neto, M. B. (2004). O efeito de diferentes histórias de fortalecimento operante sobre
a sensibilidade a eventos punitivos contínuos (jatos de ar quente). Relatório Parcial de Bolsa de Iniciação
Científica (PIBIC/CNPq). Universidade Federal do Pará, Belém, PA.
Millenson, J. R. (1975). Princípios de análise do comportamento. Brasília: Coordenada.
Perone, M. (1995). Fundamental misconceptions about aversive control. Trabalho apresentado no Congresso da
Association for The Behavior Analysis, Washington, DC, Maio de 1995.
Perone, M. (2003). Negative effects of positive reinforcement. The Behavior Analyst, 26 (1), 1-14.
Ribeiro, T. C. & Carvalho Neto, M. B. (2004). Alguns efeitos da apresentação contínua e intermitente de um jato de
ar quente sobre a freqüência de pressão à barra em Rattus norvegicus. Relatório Parcial de Bolsa de Iniciação
Científica (PIBIC/CNPq). Universidade Federal do Pará, Belém, PA.
Sidman, M. (1995). Coerção e suas implicações. Campinas: Editorial Psy II.
Skinner, B. F. (1965) Science and human behavior. New York/London: Free Press/Collier MacMillan. Publicado
originalmente em 1953.
Skinner, B. F. (1968). The technology of teaching. New York Appleton-Century-Crofts.
Spradlin, J. E. (2002). Punishment: A primary process? Journal of Applied Behavior Analysis, 35, 475-477.
Todorov, J. C. (2001). Quem tem medo de punição? Revista Brasileira de Terapia Comportamental e Cognitiva, 3, 37-
40.
Ulrich, R.; Wolfe, M. & Dulaney, S. (1969). Punishment of shock-induced agression. Journal of the Experimental
Analysis of Behavior, 12, 1009-1015.
Vollmer, T. R. (2002). Punishment happens: Some comments on Lerman and Vorndran´s review. Journal of Applied
Behavior Analysis, 35, 469-473.
Whaley, D. L. & Malott, R. W. (1975). Princípios elementares do Comportamento. Vols. I e II. São Paulo: EPU.

8

Controle aversivo e reforçamento negativo

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Destaque

Destaque (15)

Semelhante a Controle aversivo e reforçamento negativo

Semelhante a Controle aversivo e reforçamento negativo (20)

Controle aversivo e reforçamento negativo