BF Skinner , um dos principais teóricos da orientação behaviorista, definiu reforço como um tipo de aprendizado baseado na associação de um comportamento com as consequências dele derivadas, o que aumenta ou diminui a probabilidade de ele ser executado novamente. Quando são negativos, falamos de punição, e quando são positivos de reforço.
No aprendizado por reforço, distinguimos dois tipos de conseqüências: reforço positivo e negativo . Embora o reforço positivo ocorra quando o comportamento implica a obtenção de um prêmio, o reforço negativo consiste em evitar ou retirar um estímulo aversivo. Vejamos as principais características dos dois procedimentos.
Reforço e condicionamento operante
Os conceitos “reforço positivo” e “reforço negativo” estão enquadrados no paradigma do condicionamento instrumental ou operante . Diferentemente do condicionamento clássico ou pavloviano, no qual a associação entre um estímulo e uma resposta é aprendida, no instrumental o sujeito associa o desempenho de um comportamento a certas consequências.
O condicionamento operante surgiu do trabalho dos behavioristas Edward Thorndike, que estudou o processo pelo qual os gatos conseguiram escapar das “caixas problemáticas”, e Burrhus F. Skinner, que descreveu sistematicamente as características desse procedimento de aprendizagem e quais aplicada a diversos campos, especialmente à educação.
Skinner distinguiu três tipos de aprendizado instrumental : o de punição, que consiste no aparecimento de um estímulo aversivo após a execução do comportamento, o de omissão, no qual a resposta está associada à ausência de recompensa e a de reforço, em que o comportamento é recompensado. Dentro deste procedimento, encontramos reforço positivo e negativo.
No contexto do condicionamento operante, as consequências do comportamento podem ser positivas ou negativas para o destinatário; No entanto, não é essa diferenciação que separa o reforço positivo do reforço negativo, mas quando o comportamento tem conseqüências apetitosas, falamos em reforço e punição quando são aversivos.
Quando nos referimos a reforço ou punição, os termos “positivo” e “negativo” não se referem à simpatia da consequência, mas ao aparecimento ou desaparecimento de um determinado estímulo : no reforço positivo, é aprendido que uma recompensa será obtida se algo é feito, e no negativo que um estímulo desagradável será evitado ou eliminado.
O que é reforço positivo?
No aprendizado por reforço positivo, o desempenho de um comportamento está associado à obtenção de uma conseqüência agradável. Isso não precisa ser um objeto, nem mesmo tangível ; Alimentos, substâncias, um sorriso, uma mensagem verbal ou a aparência de uma emoção agradável provavelmente serão entendidos como reforços positivos em muitos contextos.
Um pai que parabeniza sua filha toda vez que usa o banheiro corretamente fortalece um aprendizado positivo por reforço; O mesmo acontece quando uma empresa concede prêmios econômicos aos seus trabalhadores mais produtivos e mesmo quando recebemos um saco de batatas fritas depois de colocar uma moeda em uma máquina de venda automática.
O conceito de “reforço positivo” refere-se à recompensa que segue o comportamento , enquanto o reforço positivo é o procedimento pelo qual o sujeito de aprendizagem faz a associação. No entanto, os termos “reforço” e “reforço” são frequentemente usados de forma intercambiável, provavelmente porque essa distinção não existe em inglês.
Do ponto de vista técnico, podemos dizer que no reforço positivo existe uma contingência positiva entre uma resposta concreta e um estímulo apetitivo. A consciência dessa contingência motiva o sujeito a executar o comportamento, a fim de obter a recompensa (ou reforço).
Definindo o reforço negativo
Diferentemente do que acontece no positivo, no reforço negativo, a resposta instrumental implica o desaparecimento de um estímulo aversivo , ou seja, um objeto ou situação que motiva o sujeito a escapar ou tentar não entrar em contato com ele.
Em termos comportamentais, neste procedimento, o reforço é o desaparecimento ou a não ocorrência de estimulação aversiva. Como afirmamos anteriormente, a palavra “negativo” refere-se ao fato de que a recompensa não consiste em obter um estímulo, mas em sua ausência.
Esse tipo de aprendizado é dividido em dois procedimentos: treinamento de fuga e treinamento de prevenção. No reforço negativo da evitação, o comportamento impede o aparecimento do estímulo aversivo; Por exemplo, quando uma pessoa agorafóbica evita usar o transporte público para evitar a ansiedade que deveria estar sendo negativamente reforçada.
Por outro lado, a fuga consiste no desaparecimento de um estímulo aversivo que está presente antes que o sujeito execute o comportamento. Alguns exemplos de reforço de escape negativo são que um despertador é parado ao pressionar um botão, que uma mãe compra para seu filho o que ela pede para parar de chorar ou consumir um analgésico.