コンテンツにスキップ

強化

出典: フリー百科事典『ウィキペディア(Wikipedia)』

行動主義心理学における強化(きょうか、reinforcement)とは、条件づけの学習過程において、刺激反応の結びつきを強め、その行動の生起頻度を増加させる働きのことである。

概要

[編集]

強化子は大きく以下の2種類に分類される。

  • 一次性強化子:食物や水、痛みや寒さなど、生存に直接関係する刺激。無条件性強化子とも呼ばれる。
  • 二次性強化子:経験や学習を通じて価値を獲得する刺激(例:お金、賞賛の言葉)。条件性強化子とも呼ばれる[1]

オペラント条件づけ

[編集]
 
 
 
 
 
 
オペラント条件づけ
 
 
 
 
消去
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
強化
 
 
 
 
弱化
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
正の強化負の強化
 
正の弱化負の弱化
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
逃避
 
回避

オペラント条件づけとは、アメリカの心理学者B.F.スキナーによって体系化された学習理論である。オペラント条件づけでは、生物が自らの行動を通して環境に働きかけ、その結果によって行動が起こる頻度が変化する。このときの行動は、環境に対して能動的に働きかけることから、オペラント行動と呼ばれる。

この理論においては、行動の後に快刺激が加わる、あるいは嫌悪刺激が取り除かれることで行動が強まることを強化と呼び、逆に行動の後に嫌悪刺激が加わる、または快刺激が取り除かれることで行動が弱まることを弱化と呼ぶ。また、強化や弱化が行われないことで行動が次第に減少することは消去と呼ばれる。

古典的条件づけでは、実験者が「無条件刺激」や「条件刺激」を提示することで反射的な反応を誘発する。一方、オペラント条件づけでは、実験者は特定の反応を直接引き起こすことはできず、対象が自発的に行動するのを待ち、その行動に対して「強化子」や「弱化子」を与えることで学習を成立させる。

正の強化

[編集]

正の強化(Positive reinforcement)とは、ある行動の後に好ましい刺激や事象が与えられることで、その行動の生起頻度が増加する現象である[2]。 正の強化子とは、生物がそれを得るために行動を行うような刺激を指す。典型的な例としては、言葉による賞賛や物理的な報酬があり、これらは非常に効果的な正の強化子とされる[3]

例:

  • 企業が販売数に応じて従業員に賞(好子)を与える制度を導入したところ、売上が増えた → 販売努力の行動が増える。
  • 授業中に手を挙げて発言したら、先生に「よくできたね」とほめられた(好子) → 手を挙げる行動が増える。
  • 宿題を全部終わらせたら、親からデザート(好子)をもらえた → 宿題をする行動が増える。
  • トイレで成功したら、シール(好子)をもらえた → トイレに行く行動が増える。
  • 店員さんに「ありがとう」と言ったら、笑顔で「どういたしまして」と返された(好子) → あいさつする行動が増える。

負の強化

[編集]

負の強化(Negative reinforcement)とは、ある行動の結果として不快な刺激や嫌悪的な事象が取り除かれたり回避されたりすることで、その行動の生起頻度が増加する現象である[2]。 このとき行動の後に取り除かれたり回避されたりする不快な刺激を嫌悪刺激という。

例:

  • 従業員が金曜日までに作業を終えると土曜日の出勤(嫌悪刺激)が免除される → 土曜日の労働を避けるために作業を早く終える行動が増える。
  • 宿題を早く終わらせたら、「もう勉強しなさい」という注意(嫌悪刺激)がなくなった → 宿題を早くやる行動が増える。
  • 雨が降ってきたとき、傘をさしたらぬれること(嫌悪刺激)がなくなった → 雨の日に傘をさす行動が増える。
  • アラームがうるさいので、止めるボタンを押したら音(嫌悪刺激)が消えた → ボタンを押す行動が増える。
  • 教室でイヤな雑音(嫌悪刺激)があったので、耳栓をつけたら静かになった → 耳栓をつける行動が増える。

逃避行動と回避行動の違い

[編集]

逃避行動と回避行動はいずれも負の強化の一種である。

逃避行動は、行動が生起した時点で既に存在している嫌悪刺激を、その行動によって停止させる行動である。すなわち、嫌悪刺激から逃れることによって強化される。

  • 例:映画館で10代の若者グループの近くに座ったところ、騒々しい状況(嫌悪刺激)に直面したため、その騒音から逃れる目的で離れた座席に移動した。

回避行動は、行動の結果として嫌悪刺激の提示そのものを未然に防ぐ行動である。多くの場合、予告刺激が嫌悪刺激の出現を知らせる信号となり、その提示をきっかけに回避行動が生起する。

  • 例:映画館に行く際、若者グループの近くに座ることをあらかじめ避けることで、騒音にさらされるのを防いだ[1]

強化と弱化

[編集]

行動分析学では、強化は行動の頻度を増やす操作を指し、弱化は行動の頻度を減らす操作を指す。正の強化子は、生物が獲得しようと働く刺激であり、負の強化子は、生物が回避しようとする刺激である[4]

報酬的(楽しい) 刺激 嫌悪(不快な)刺激
追加/実行 正の強化(Positive Reinforcement) 正の弱化(Positive Punishment)
除去/撤退 負の弱化(Negative Punishment) 負の強化(Negative Reinforcement)

強化子アセスメント

[編集]

強化子アセスメントは、個々の学習者にとって強化子として機能する可能性のある刺激を特定するために行われる手続きである。実際にいろいろな物を見せたり触らせたりして、どの刺激(おもちゃ・食べ物・音・活動など)が強化子として働くかを確認する。主な方法には、単一刺激提示法、対刺激提示法、多刺激提示法がある。

単一刺激提示法

[編集]

単一刺激提示法は、強化子になりそうな物を1つずつ順番に提示して、子どもがその物にどのように反応するかを観察する方法である。たとえば、ボールやおもちゃなどを1つずつ机の上に置き、子どもがそれに近づいたり手に取ったりするかを見て記録する。反応が多く見られた刺激ほど、強化子として働く可能性が高いと考えられる。

対刺激提示法

[編集]

2つの刺激を同時に提示して、どちらを選ぶかを観察する方法である。これは「二択選択法」とも呼ばれる。たとえば、ぬいぐるみとシャボン玉を出して、どちらに手を伸ばすかを記録する。これを何度も繰り返し、刺激の組み合わせを変えながら行うことで、子どもがどの刺激をより好むかを調べることができる。選ばれる回数が多い刺激ほど、強化子として働く可能性が高いと考えられる。

多刺激提示法

[編集]

多刺激提示法は、複数の刺激を一度に提示して、子どもがどれを選ぶかを調べる方法である。たとえば、6つのおもちゃを机の上に並べ、子どもに好きなものを1つ選ばせる。選ばれた刺激はその都度取り除き、残った5つの中からもう一度選んでもらう。この手続きを、すべての刺激を選び終えるまで繰り返す。選ばれた順番をもとに、好みの順位を記録する。

オペラント反応に基づく評価

[編集]

オペラント反応に基づく評価は、強化子の候補となる刺激を提示し、その刺激に対する反応の頻度や持続時間の変化から、強化子としての効果を確認する方法である。たとえば、スマートフォンや電車のおもちゃ、扇風機などのスイッチを子どもに操作させ、どのスイッチをどの程度の時間押すかを観察する。特定のスイッチを長時間、または繰り返し押す場合、その刺激は子どもにとって好ましいものであり、強化子として機能する可能性が高いと考えられる[1]

脚注

[編集]
  1. ^ a b c 行動変容法 第2版
  2. ^ a b Flora, Stephen (2004). The Power of Reinforcement. Albany: State University of New York Press 
  3. ^ Nikoletseas, Michael M. (2010). Behavioral and Neural Plasticity, p. 143. ISBN 978-1453789452
  4. ^ D'Amato, M. R. (1969). Melvin H. Marx. ed. Learning Processes: Instrumental Conditioning. Toronto: The Macmillan Company 

関連項目

[編集]