Condicionamento operante: teoria, princípios, programas, exemplos - Ciência - 2023


science
Condicionamento operante: teoria, princípios, programas, exemplos - Ciência
Condicionamento operante: teoria, princípios, programas, exemplos - Ciência

Contente

ocondicionamento operanteÉ um sistema de aprendizagem que se baseia na aplicação de reforços e punições contra certos comportamentos para tornar sua repetição mais ou menos provável no futuro. Por meio desses reforços e punições, o indivíduo cria uma associação entre uma forma de agir e suas consequências.

O condicionamento operante é uma das ferramentas mais importantes dentro da psicologia em geral e tem uma importância especial no behaviorismo. Foi descoberto no início do século 20 por B. F. Skinner, um psicólogo comportamental que expandiu as teorias propostas por seus colegas através do estudo animal.

Ao contrário de muitos outros defensores da psicologia comportamental, Skinner acreditava que as pessoas têm certo livre arbítrio e que podemos escolher nossos comportamentos até certo ponto. No entanto, pensei que o condicionamento operante era responsável pela maioria de nossas ações, portanto, usando esta técnica, todos os comportamentos de um indivíduo poderiam ser alterados.


Hoje, o condicionamento operante não é mais a ferramenta mais amplamente usada no mundo da psicologia, à medida que surgiram outras mais focadas em pensamentos e emoções. No entanto, mesmo agora, continua a ser de grande importância em áreas como terapêutica e educacional.

Características do condicionamento operante

Comportamentos de controle de consequências

O condicionamento operante é baseado na ideia de que a maioria de nossos comportamentos podem se tornar mais ou menos prováveis ​​dependendo das consequências que recebemos do meio ambiente quando os executamos.

Se a consequência for positiva, tenderemos a realizar essa ação com mais frequência no futuro; mas se for negativo, a frequência diminuirá.


Ocorre na vida diária

Para os psicólogos que defendem correntes como o behaviorismo, esse processo ocorreria automaticamente em nosso dia a dia. Assim, de acordo com essa teoria, nossos comportamentos são independentes de nossas crenças e formas de pensar, e têm a ver apenas com evitar punições e buscar recompensas.

O condicionamento operante é baseado na replicação desse mesmo processo de forma consciente para modificar o comportamento de um indivíduo. Sua eficácia foi comprovada em vários estudos e sabe-se que funciona tanto com humanos quanto com muitas espécies de animais.

Ferramentas básicas

Ao realizar uma intervenção baseada no condicionamento operante, o objetivo é modificar as consequências que são proporcionadas à pessoa ou animal para que mude o seu comportamento.

Para isso, basicamente, cinco ferramentas podem ser utilizadas: reforço positivo, reforço negativo, punição positiva, punição negativa e extinção. A seguir, veremos exatamente no que cada um deles consiste.


Teoria: conceitos básicos

- Reforço

O reforço é responsável por emitir respostas. Existem dois tipos de reforço: positivo e negativo. Ambos têm o mesmo propósito de aumentar a probabilidade de que a resposta seja emitida em situações futuras. Além disso, para Skinner, os reforçadores são definidos por comportamentos observáveis ​​e mensuráveis.

Reforço positivo

O reforço positivo ocorre sempre que um comportamento é seguido por uma consequência que o indivíduo percebe como positiva, por exemplo, proporcionando algum tipo de prazer. Desse modo, aumenta a probabilidade de que o comportamento inicial se repita com mais frequência no futuro.

Existem muitas maneiras de oferecer reforço positivo às pessoas. Alguns dos elementos que podem servir como reforçadores incluem comida, atenção, afeto, sexo ou diversão. Sempre que esses reforçadores estão presentes depois que um indivíduo executa uma determinada ação, ela tende a se repetir com mais frequência.

Reforço negativo

Como a técnica anterior, o reforço negativo é usado para aumentar a frequência com que ocorre um comportamento. No entanto, em vez de conseguir isso fornecendo uma recompensa ao indivíduo, ele o faz removendo um estímulo que é prejudicial a ele. É justamente dessa eliminação de um estímulo prejudicial que surge o nome dessa ferramenta.

Por exemplo, se depois de beber uma cerveja uma pessoa sentir menos ansiedade e insegurança, será muito mais provável que ela decida beber mais no futuro. Este seria um caso clássico de reforço negativo, que estaria por trás de muitos casos de dependência de álcool ou outras substâncias semelhantes.

Reforçadores primários

Eles seriam todos aqueles reforçadores básicos que não precisam de nenhuma história de condicionamento anterior para funcionar como tal. Alguns exemplos seriam água, comida e sexo.

Reforçadores secundários

Os reforçadores secundários seriam baseados em histórias anteriores de condicionamento graças à associação com estímulos não condicionados. Alguns exemplos seriam dinheiro e qualificações.

- Punição

A punição também é medida por seus efeitos no comportamento do alvo. Em vez disso, ao contrário do reforço, o que se pretende é a diminuição ou supressão de um certo comportamento.

Uma punição reduz a probabilidade de emitir um comportamento em situações subsequentes. Porém, não elimina a resposta, pois se a ameaça de punição diminuir, o comportamento pode reaparecer.

Na punição também existem dois tipos ou procedimentos diferentes; punição positiva e punição negativa.

Punição positiva

A punição positiva envolve a aplicação de um estímulo que o indivíduo percebe como prejudicial em decorrência de uma de suas ações. Desta forma, consegue-se o efeito oposto ao dos dois casos anteriores: tende a diminuir a frequência com que atuará da mesma forma no futuro.

O exemplo mais óbvio de punição positiva é a aplicação de violência física e dor para evitar que um comportamento se repita. No entanto, existem muitas outras formas de aplicar esta técnica que não envolvem o uso da força e, portanto, são mais aceitas em nível social.

Punição negativa

Tal como acontece com a punição positiva, esta ferramenta de condicionamento operante visa diminuir a frequência com que uma pessoa executará determinado comportamento no futuro. Para isso, elimina-se algo que o indivíduo percebe como positivo, de forma que ele sinta algum tipo de desconforto.

Uma das maneiras mais comuns de usar punição negativa com humanos é retirando a atenção. Devido à nossa natureza social, estamos constantemente à procura de outros que nos validem e prestem atenção. Quando isso não acontece, a dor emocional que sentimos nos leva a mudar a forma como agimos para recuperar a aprovação dos outros.

- Extinção

A extinção é um pouco diferente do resto das técnicas de condicionamento operante, pois serve para eliminar um comportamento que foi previamente reforçado (seja por acaso ou premeditado). Baseia-se na eliminação de todos os reforços e punições que fizeram com que a forma de agir fosse alterada a preferida do organismo.

Por exemplo, um experimentador poderia fazer um rato puxar uma alavanca aplicando reforço positivo na forma de comida. Porém, se esses impulsionadores fossem interrompidos repentinamente, o animal acabaria abandonando o comportamento.

- Generalização

Diante de uma determinada situação ou estímulo, é condicionada uma resposta, que pode surgir antes de outros estímulos ou situações semelhantes.

- Discriminação

Este processo é o oposto da generalização, ele responde de forma diferente dependendo do estímulo e do contexto.

Princípios de condicionamento operante

Contingência de três prazos

É o modelo básico de condicionamento operante e é composto de três componentes: o estímulo discriminativo, a resposta e o estímulo de reforço.

Um estímulo discriminativo seria aquele que indicasse ao sujeito que o reforçador está disponível, indicando que se ele realizar um determinado comportamento, poderá obter o referido reforçador. Por exemplo, se uma luz acender na caixa de Skinner, isso indica que pressionando a alavanca receberá comida.

Em contrapartida, temos o estímulo delta ou estímulos que indicam que o comportamento não levará à obtenção de nenhum tipo de reforçador.

A resposta seria o comportamento que o sujeito realizará, cuja execução levará ou não a obter o estímulo reforçador. Um estímulo reforçador é responsável pela emissão do comportamento, pois graças ao seu surgimento a probabilidade de emissão de uma resposta aumentará ou diminuirá no futuro.

Fatores que influenciam a eficácia do condicionamento operante

A eficácia do reforço e da punição na modificação do comportamento de um indivíduo pode variar com base em vários fatores. Os mais importantes são os seguintes:

- Imediato. Um reforço ou punição que ocorre imediatamente após o comportamento a ser modificado ter ocorrido será muito mais eficaz do que se for aplicado após algum tempo. Quanto maior a diferença de tempo entre os dois fenômenos, mais fraco é o condicionamento.

- Privação e saciedade. O reforço positivo é mais poderoso quando o indivíduo deseja fortemente a recompensa que ele oferece. Pelo contrário, o condicionamento será menos eficaz se o organismo estiver "saciado".

- Contingência.Se um comportamento for reforçado ou punido sempre que ocorrer, o condicionamento ocorrerá mais rapidamente, mas também será mais fácil de extinguir. O oposto ocorre se houver reforço ou punição intermitente.

- Força do estímulo. O tamanho ou força do estímulo de condicionamento também influencia a eficácia desta técnica. Por exemplo, receber $ 1000 após completar uma tarefa nos convida a repeti-la muito mais do que se tivéssemos recebido apenas 100.

Programas de reforço

Para usar o condicionamento operante corretamente, não é suficiente aplicar aleatoriamente as ferramentas que vimos anteriormente. Pelo contrário, na maioria dos casos são utilizados os chamados “programas de reforço”, que permitem que as técnicas deste tipo de condicionamento sejam utilizadas de forma sistemática e aumentem a sua eficácia.

Os programas de reforço variam principalmente de acordo com a frequência com que os reforços e punições são aplicados. Em geral, eles são divididos em programas de reforço contínuo e reforço parcial, e vários subtipos podem ser encontrados dentro da segunda categoria.

Programas de reforço contínuo

Nesse tipo de programa de reforço, o comportamento a ser modificado é sempre seguido de reforço ou punição.

Desse modo, o aprendizado ocorrerá muito mais rapidamente, mas a extinção também ocorrerá facilmente quando os estímulos condicionantes não estiverem mais presentes.

Programas de reforço intermitente ou parcial

Em programas de reforço parcial, nem todas as ocasiões em que ocorre o comportamento a ser manipulado são seguidas de recompensa ou punição.

Os programas de reforço parcial têm a desvantagem de demorar mais para fazer o indivíduo mudar seu comportamento. No entanto, se forem levantados e executados corretamente, seus resultados são muito mais duráveis. Em alguns casos, eles podem se tornar praticamente permanentes.

Dependendo do caso, opta-se por apresentar os estímulos de condicionamento cada vez que passa um determinado período de tempo (programas de intervalos fixos ou variáveis), ou sempre que o comportamento se repete um determinado número de vezes (razão fixa ou variável).

Programas de proporção fixa

Nestes programas, o reforçador é fornecido quando o sujeito gera respostas fixas e constantes. Por exemplo, em um programa de proporção 10, a pessoa obtém o reforçador após ter feito dez respostas quando o estímulo é apresentado.

Programas de razão variável

O reforçador ainda dependeria do número de respostas emitidas pelo sujeito, mas com uma proporção variável, graças à qual o sujeito é impedido de prever quando o reforçador será obtido. Por exemplo, um rato recebe comida após pressionar a alavanca 10 vezes, na próxima vez 5 vezes, nas próximas 15 vezes ...

Programas de intervalo fixo

Nos programas de intervalo, a obtenção do reforçador não depende do número de respostas que o sujeito dá, mas é determinada pelo tempo decorrido. Conseqüentemente, a primeira resposta produzida após um certo período de tempo é reforçada.

Em programas de intervalo fixo, o tempo entre o intensificador e o intensificador é sempre o mesmo.

Programas de intervalo variável

Nestes programas, o reforçador é obtido após um tempo, embora o tempo seja diferente para cada reforçador recebido.

Formulários

A seguir, veremos algumas das áreas nas quais é comum aplicar o condicionamento operante. Claro que existem muitos mais, mas estes são alguns dos mais importantes.


Vício e dependência

O condicionamento operante desempenha um papel central tanto no aparecimento de vícios de todos os tipos quanto em sua extinção. Por esse motivo, muitos dos tipos de terapia que lutam contra os vícios são baseados em técnicas operantes.

Treinamento animal

O condicionamento operante é especialmente útil para modificar o comportamento dos animais, uma vez que com eles não é possível usar técnicas educacionais baseadas na fala.

Por exemplo, para ensinar um cachorro a se comportar adequadamente em uma casa, a coisa mais simples é reforçar seus comportamentos desejáveis ​​e punir os que não o são.

Programas de intervenção

O condicionamento operante foi projetado com o objetivo de mudar o comportamento das pessoas para que pudessem levar uma vida melhor. Desta forma, esta técnica pode ser usada para reduzir a frequência com que aparecem comportamentos indesejados e aumentar a frequência de alternativas mais saudáveis ​​ou desejadas.


Por exemplo, se uma pessoa deseja perder peso, ela pode examinar quais estímulos estão reforçando os comportamentos que a levam a comer mais do que o necessário e criar um programa de reforço que então aplicaria a comportamentos alternativos mais benéficos.

Educação de crianças

As crianças (especialmente aquelas que ainda não falam) respondem melhor ao condicionamento operante do que a outras técnicas educacionais baseadas na linguagem. Apesar de as punições tradicionais não serem bem vistas hoje, somente com o uso de reforços é possível alcançar mudanças muito significativas de comportamento nessa área.

Exemplos de casos com condicionamento operante

Por meio do condicionamento operante, uma pessoa ou animal faz uma associação entre um comportamento particular e uma consequência. Vejamos vários exemplos:


- Os pais recompensam as boas notas de uma criança com doces ou alguma outra recompensa (reforço positivo).

- O professor recompensa os alunos calmos e educados. Os alunos descobrem que, ao se comportarem dessa forma, recebem mais pontos (reforço positivo).

- É dada comida a um animal cada vez que uma alavanca é pressionada (reforço positivo).

- Os pais de uma criança de dois anos batem palmas e sorriem sempre que ele vai ao banheiro em vez de usar fralda. Com o tempo, a criança aprende a ir ao banheiro sozinha graças a esse reforço positivo (reforço positivo).

- O uso de console de videogame é retirado da criança quando ela é reprovada em um exame (punição negativa).

- O líquido é colocado nas unhas das crianças para prevenir a onicofagia. A criança saboreia o gosto ruim do líquido e a probabilidade de roer as unhas é reduzida (punição positiva).

- Dê comida a um cachorro depois que ele se sentar. Nesse caso, o comportamento sentado está sendo reforçado (reforço positivo).

- Se uma criança é maltratada em casa e quando ela sai para a rua ela não sofre esse maltrato, o comportamento de sair para a rua estaria sendo reforçado (reforço negativo).

- Se não for dado dinheiro a uma criança, apesar das constantes reclamações, o comportamento reclamante será extinto (extinção).

- A pessoa descobre que, ao se exercitar, grande parte do cansaço e do desconforto emocional desaparece. Embora o treinamento tenha sido um grande esforço no início, esse reforço negativo o ajuda a praticar esportes com cada vez mais facilidade (reforço negativo).

- Um cão recém-adotado tem o hábito de urinar dentro da casa de seus donos; mas eles retiram sua atenção quando você faz isso e, em vez disso, lhe dão “recompensas” quando você espera para fazê-lo durante suas caminhadas diárias (reforço negativo e reforço positivo).

Qual é a diferença entre o condicionamento operante e o condicionamento clássico?

No condicionamento operante, uma resposta voluntária é seguida por um reforçador. Dessa forma, é mais provável que ocorra uma resposta voluntária (por exemplo, estudar para um exame) no futuro.

Em contraste, no condicionamento clássico, um estímulo dispara automaticamente uma resposta involuntária. Por exemplo, a comida que um cachorro vê faz com que ele produza saliva.

Referências

  1. "Skinner - Condicionamento Operante" em: Simply Psychology. Retirado em: 24 de maio de 2020 de Simply Psychology: simplypsychology.com.
  2. "O que é condicionamento operante e como funciona?" em: VeryWell Mind. Obtido em: 24 de maio de 2020 em VeryWell Mind: verywellmind.com.
  3. "Teoria do condicionamento operante" em: Psicologia Positiva. Retirado em: 24 de maio de 2020 de Positive Psychology: positivepsychology.com.
  4. "Exemplos de condicionamento operante" em: Seu dicionário. Obtido em: 24 de maio de 2020 em Seu dicionário: examples.yourdictionary.com.
  5. "Condicionamento operante" em: Wikipedia. Obtido em: 24 de maio de 2020 da Wikipedia: en.wikipedia.org.