Condicionamento operante: características, programas, exemplos

Condicionamento operante: características, programas, exemplos

O condicionamento operante ou condicionamento  instrumental é um tipo de aprendizado em que o comportamento é controlado com as consequências. É baseado na ideia de que comportamentos reforçadores tendem a aparecer com mais frequência, enquanto comportamentos punitivos se extinguem.

Qual é a diferença entre condicionamento operante e condicionamento clássico? No condicionamento operante, uma resposta voluntária é seguida por um reforçador. Dessa forma, é mais provável que a resposta voluntária (por exemplo, estudar para um exame) seja feita no futuro.

Pelo contrário, no condicionamento clássico, um estímulo ativa automaticamente uma resposta involuntária. Por exemplo, a comida que um cão vê faz com que ele produza saliva.

O condicionamento operante pode ser descrito como um processo que tenta modificar o comportamento através do uso de reforços positivos e negativos. Através do condicionamento operante, um indivíduo faz uma associação entre um comportamento particular e uma conseqüência. Exemplos:

  • Os pais recompensam as notas boas de uma criança com doces ou algum outro prêmio.
  • Um professor recompensa os alunos que são calmos e educados. Os alunos percebem que, ao fazer isso, recebem mais pontos.
  • Um alimento é dado a um animal cada vez que ele pressiona uma alavanca.

BF Skinner (1938) cunhou o termo condicionamento operante. Skinner identificou três tipos de respostas ou operadores:

  • Operantes neutros : respostas do ambiente que não aumentam ou diminuem a probabilidade de repetição de um comportamento.
  • Reforçadores : respostas do ambiente que aumentam a probabilidade de repetir um comportamento. Os intensificadores podem ser positivos ou negativos.
  • Punições : respostas do ambiente que diminuem a probabilidade de um comportamento se repetir. O castigo enfraquece o comportamento.

Antecedentes do condicionamento operante

Thorndike foi o primeiro a reconhecer que o condicionamento inclui mais do que apenas uma resposta e um reforçador. A resposta ocorre na presença de certos estímulos, considerando três eventos: o estímulo, a resposta e a conseqüência da resposta ou reforçador.

Essa estrutura facilita a associação entre o estímulo e a resposta. Em sua lei de efeito, Thorndike afirmou que as respostas que são seguidas por conseqüências reforçadoras terão maior probabilidade de ocorrer quando o estímulo reaparecer.

Por outro lado, as respostas que são seguidas por consequências negativas terão uma menor probabilidade de ocorrência quando o estímulo reaparecer. A lei do efeito é o antecedente do condicionamento operante ou condicionamento instrumental, como foi nomeado por Thorndike.

Para Skinner, um psicólogo comportamental, o condicionamento era o fortalecimento de comportamentos de acordo com as consequências que anteriormente seriam obtidas.

Nesse sentido, existem duas formas de condicionamento:

– O clássico ou pavloviano: baseia-se na associação de estímulos não condicionados e condicionados, sendo as respostas controladas por estímulos antecedentes.

– Condicionamento operante: estímulos conseqüentes ou reforçadores fazem com que um determinado comportamento seja emitido. Skinner explica que, se o comportamento for seguido por um reforçador positivo, aumentaria a probabilidade de emitir o referido comportamento no futuro. Pelo contrário, se uma resposta não for seguida por um reforçador ou esse reforçador for negativo, a probabilidade de emitir esse comportamento no futuro será menor.

Relacionado:  Reforço positivo e reforço negativo: características

Conceitos básicos de condicionamento operante

– Reforço

É responsável pela emissão de respostas, ou seja, pela probabilidade de que elas ocorram, maiores ou menores no futuro. É um estímulo reforçador e consistente, uma vez que é dado quando a resposta ocorre.

É impossível saber se um reforçador específico influencia o comportamento até que seja apresentado contingentemente com uma resposta e o comportamento muda com o resultado do reforçador.

Existem dois tipos de reforço: positivo e negativo. Ambos têm o mesmo objetivo de aumentar a probabilidade de que a resposta seja emitida em situações futuras. Além disso, para Skinner, os reforços são definidos através de comportamentos observáveis ​​e mensuráveis.

Reforço positivo

O reforço positivo reforça um comportamento, fornecendo uma conseqüência que um indivíduo considera gratificante. Por exemplo, dar comida a um cachorro depois que ele se senta. Nesse caso, o comportamento sentado seria reforçado.

Reforço negativo

A remoção de um reforçador desagradável também pode fortalecer o comportamento. Isso é conhecido como reforço negativo, porque é a remoção de um estímulo adverso ao animal ou à pessoa que faz com que o comportamento seja condicionado.

O reforço negativo reforça o comportamento porque para ou elimina uma experiência desagradável.

Por exemplo, se uma criança é abusada em casa e quando sai, ela não sofre esse abuso, o comportamento de sair seria reforçado.

Aprimoradores primários

Eles seriam todos aqueles reforçadores básicos que não precisam de nenhum histórico prévio de condicionamento para funcionar como tal. Alguns exemplos seriam água, comida e sexo.

Aprimoradores secundários

Os reforços secundários seriam baseados em históricos de condicionamento anteriores, devido à associação com estímulos não condicionados. Alguns exemplos seriam dinheiro e notas.

– Contingência de três termos

É o modelo básico de condicionamento operante e é composto de três componentes: o estímulo discriminativo, a resposta e o estímulo de reforço.

Um estímulo discriminatório seria aquele que indicaria ao sujeito que o reforçador está disponível, indicando que, se ele realizar um determinado comportamento, poderá obter o referido reforçador. Em contraste, temos o estímulo delta ou estímulos que indicam que o comportamento não levará à obtenção de qualquer tipo de reforçador.

A resposta seria o comportamento que o sujeito executará, cuja execução levará ou não à obtenção do estímulo de reforço.

Um estímulo de reforço é responsável pela emissão do comportamento, pois, graças à sua aparência, a probabilidade de emitir uma resposta aumentará ou diminuirá no futuro.

Relacionado:  Aprendizagem significativa: teoria de Ausubel (com exemplo)

– punição

A punição também é medida por seus efeitos no comportamento do sujeito. Ao contrário, ao contrário do reforço, o que se pretende é a diminuição ou supressão de um determinado comportamento.

Uma punição reduz a probabilidade de emitir uma conduta em situações posteriores. No entanto, não elimina a resposta, pois, se a ameaça de punição diminuir, o comportamento poderá reaparecer.

Na punição, existem também dois tipos ou procedimentos diferentes: punição positiva e punição negativa.

Punição positiva

Isso implica na apresentação de um estímulo aversivo após a realização de um determinado comportamento. É dado contingentemente à resposta dada pelo sujeito.

Por exemplo, quando você coloca líquido nas unhas das crianças para prevenir a onicofagia. A criança saboreia o mau gosto do líquido (punição positiva) e a probabilidade de comer novamente as unhas é reduzida.

Punição negativa

Consiste na eliminação de um estímulo como conseqüência de um determinado comportamento, ou seja, consiste na retirada de um estímulo positivo após a realização de um determinado comportamento.

Por exemplo, se você retirar o uso do console de videogame de uma criança quando ela não passou no exame.

– Extinção

Em extinção, uma resposta não é mais emitida porque o reforçador não aparece mais. Esse processo é baseado na falha em fornecer o reforço correspondente que se espera que seja alcançado e que fez esse comportamento continuar com o tempo.

Quando uma resposta é extinta, o estímulo discriminativo se torna um estímulo de extinção. Esse processo não deve ser confundido com o esquecimento, que é dado quando a força de um comportamento diminui por não ter sido emitida em um período de tempo.

Por exemplo, se uma criança não receber dinheiro, apesar das reclamações constantes, o comportamento da reclamação será extinto.

– Generalização

Em resposta a uma determinada situação ou estímulo, uma resposta é condicionada, que pode aparecer antes de outros estímulos ou situações semelhantes.

– Discriminação

Esse processo é o oposto da generalização, em que é respondido de maneira diferente de acordo com o estímulo e o contexto.

Programas de reforço

Skinner também estabeleceu vários programas de reforço através de sua pesquisa, incluindo programas de reforço contínuo e programas de reforço intermitentes.

Programas de reforço contínuo

Eles se baseiam no reforço constante da resposta cada vez que ocorre, ou seja, cada vez que o sujeito executa o comportamento desejado, eles obtêm um estímulo de reforço ou positivo.

Programas de reforço intermitentes

Em vez disso, aqui o sujeito nem sempre recebe o reforço, realizando o comportamento desejado. Eles são definidos com base no número de respostas dadas ou no intervalo de tempo entre as respostas, levando a diferentes procedimentos.

Relacionado:  Método silábico de alfabetização: o que é, vantagens e desvantagens

Programas de taxa fixa

Nesses programas, o reforçador é fornecido quando o sujeito gera respostas constantes e fixas. Por exemplo, em um programa de proporção 10, a pessoa recebe o reforço depois de ter dado dez respostas quando o estímulo é apresentado.

Programas de taxa variável

Isso é construído da mesma forma que o anterior, mas, neste caso, o número de respostas que o sujeito deve dar para obter o reforçador é variável.

O reforçador continuaria a depender do número de respostas emitidas pelo sujeito, mas com uma proporção variável, o que impede o sujeito de prever quando obter o reforçador.

Programas com intervalo fixo

Em programas de intervalo, a obtenção do reforçador não depende do número de respostas que o sujeito fornece, mas é determinada pelo tempo decorrido. Consequentemente, a primeira resposta produzida após um certo período de tempo é reforçada.

Nos programas com intervalo fixo, o tempo entre o reforçador e o reforçador é sempre o mesmo.

Programas de intervalo variável

Nesses programas, o reforçador é obtido após um tempo, embora o tempo seja diferente para cada reforçador recebido.

Mudança comportamental

Abordagens sucessivas ou moldagem

A modelagem consiste em mudança comportamental através da modelagem comportamental ou reforço diferencial de abordagens sucessivas.

Para moldar um comportamento específico, uma série de etapas é seguida. Em primeiro lugar, identifica-se qual é o comportamento inicial que se pretende moldar para saber o que se deseja alcançar.

Em seguida, os possíveis reforçadores a serem utilizados são delimitados e o processo para atingir o comportamento final é separado em etapas ou estágios, reforçando cada estágio ou abordagem sucessiva até atingir o último.

Com este procedimento dinâmico, ambos os comportamentos e suas conseqüências são transformados. Nesse sentido, abordagens sucessivas em relação ao comportamento objetivo são reforçadas.

No entanto, para realizá-lo, é necessário partir de um comportamento anterior que o sujeito já exerce, a fim de reforçar gradualmente seus comportamentos até atingir a meta.

Encadeamento

Com ele, um novo comportamento é formado a partir da decomposição em etapas ou seqüências mais simples, reforçando cada resposta dada em cada uma das etapas, levando ao estabelecimento de uma resposta mais complexa no repertório comportamental do sujeito.

Longas cadeias de respostas podem ser formadas usando reforços condicionados, adotando uma unidade funcional e cujo estabelecimento leva à aquisição e definição de uma habilidade específica.

Referências

  1. Condicionamento operante. Recuperado de wikipedia.org
  2. Condicionamento operante. Recuperado de e-torredebabel.com.
  3. Recuperado de biblio3.url.
  4. Lei de efeito. Recuperado de wikipedia.org.
  5. Extinção. Recuperado de wikipedio.org.
  6. Domjan, M. Princípios de aprendizado e comportamento. Auditório. 5ª edição.

Deixe um comentário

Este site usa cookies para lhe proporcionar a melhor experiência de usuário. política de cookies, clique no link para obter mais informações.

ACEPTAR
Aviso de cookies