PsykLab
Denne artikel er på 日本語. Dansk-versionen er under udarbejdelse.
Teorier og forskning

スタンフォード監獄実験とは?概要・批判と現代評価

Opdateret: 2026-03-19 20:04:41長谷川 理沙(はせがわ りさ)

権力が人を変えるの象徴的な実例として語られがちなスタンフォード監獄実験ですが、1971年にスタンフォード大学で行われたこの研究は、参加者24人、報酬は1日15ドル、予定2週間に対して実際は6日で中止という基本事実をまず押さえておく必要があります。
筆者も大学の社会心理学の授業で初めてこの実験を学んだとき、物語としての印象の強さと、科学的証拠としてどこまで読めるかは別問題だと議論したのをよく覚えています。
この記事は、「有名だから知っている」で止まりたくない人に向けて、当時この実験がなぜ“状況の力”を示す例として受け止められたのか、その一方で研究者の介入、要求特性、選抜、再現性、倫理をめぐる主要な批判がなぜ出てきたのかを整理するためのものです。

APAによる解説や『Stanford Prison Experiment公式サイトの設定説明』で確認できる基本情報を土台にします。
2002年のBBC監獄実験や2019年以降の再検証までたどると、この実験は「人は役割だけで自動的に残酷になる」と証明した研究ではなく、象徴的事例としての影響力と、科学的検証対象としての限界を分けて読むべき題材だと見えてきます。

関連記事心理学の有名な実験10選|結果と現代評価会議で自分だけ違う意見を口にしづらかったり、上司の依頼を断れないまま引き受けてしまったり、スマホの通知音で反射的に端末へ手が伸びたりする瞬間に、心理学の有名実験は思いのほか日常へつながってきます。

スタンフォード監獄実験とは?まずは概要をわかりやすく整理

5つの基本データ

スタンフォード監獄実験は、フィリップ・ジンバルドーらがスタンフォード大学で行った模擬監獄実験です。
時期は1971年8月14日から8月20日までで、もともとの予定は2週間でした。
ところが実際には、その途中で中止されています。

まず押さえたい基本データは、実施者、場所、時期、参加者、条件の5点です。
Britannicaの要約やStanford Prison Experiment公式サイトの設定説明を見ると、参加者は新聞広告などで集められ、70人を超える応募者から選抜された男子大学生でした。
そこから本稿では、英語圏の主要資料で一致している24人を基準に記載します。
日本語資料では21人など別の表記も見かけますが、これは募集段階、選抜後、待機者をどこまで数えるかの違いが混じっているためです。

24人は看守役と囚人役に無作為に割り当てられ、報酬は1日15ドルでした。
この条件設定がよく引用されるのは、「特別に暴力的な人を集めた実験だったのか」という疑問に関わるからです。
少なくとも当時の説明では、役割は性格で決めたのではなくランダムに割り振られた、という点が強調されていました。

筆者は学部時代、実験レポートの課題でこの研究を扱ったとき、指導教員から「まず年・人数・打ち切り日を確認してから解釈に入ること」と繰り返し言われました。
有名な実験ほど物語だけが先に独り歩きしやすく、基本事実が曖昧なまま議論すると、後で何を批判しているのか、何を評価しているのかがぶれます。
この実験もまさにその典型です。

日常の感覚に引きつけると、職場で役職や肩書きが付いた途端、その人の性格そのものが急に変わったように見える場面があります。
ただ、そこでは本人の資質だけでなく、制度、役割、監視の有無、期待されるふるまいといった「状況の設計」が行動を押していることがあります。
スタンフォード監獄実験は、長くその点を考える象徴例として扱われてきました。

何が起きて6日で打ち切られたか

実験では地下施設に模擬的な監獄環境が作られ、看守役には秩序維持、囚人役には拘束された生活が課されました。
進行の中で、看守役の一部が威圧的・攻撃的なふるまいを強め、囚人役の側では強いストレス反応や感情の不安定化が見られたと報告されています。
予定では2週間続けるはずでしたが、参加者への心理的負荷が深刻な水準に達したとして、6日目で中止されました。

この「6日で打ち切り」という事実がよく知られているのは、単に短期間で終わったからではありません。
役割に入った学生たちの行動が、当初の想定以上に急速にエスカレートしたと受け止められたからです。
看守役による屈辱的な扱い、囚人役の無力感や従属、そして研究側がその場の展開に巻き込まれていったことが、後にこの実験の象徴性を強めました。

ここで注意したいのは、この出来事が当時しばしば「人は役割を与えられるだけで残酷になる」と読まれた一方、現在ではその読み方自体が争点になっていることです。
つまり、6日で止まったという事実は動きませんが、なぜそうなったのかの解釈には議論があります。
純粋に状況の力が働いたのか、研究者の期待や運営の仕方が強く影響したのかで、意味づけは変わってきます。

有名だが議論があるという前提整理

この実験は長いあいだ、「状況の力」や「役割期待」が人の行動をどこまで変えるかを示す教科書的事例として扱われてきました。
APAによる解説でも、当時この研究がそうした文脈で位置づけられてきたことが確認できます。
善良に見える人でも、制度や役割の中に置かれると別の行動を取りうる。
その発想を広く知らしめた点で、この実験の影響力は今も大きいままです。

その一方で、近年の評価はずっと厳密です。
方法論上の弱点、参加者が研究者の期待を読んで演じた可能性、看守役への示唆や誘導、研究者自身の介入といった問題が強く批判されています。
2019年のティボー・ル・テクシエの論考は未公開音声などをもとに、看守が自発的に残酷化したという通説に疑問を投げかけました。
こうした再検証を踏まえると、この実験を「証明」と呼ぶのは適切ではなく、当時そう解釈された象徴的事例として扱うのが現在の整理に近いです。

NOTE

スタンフォード監獄実験は、「有名な結論」と「現在の研究評価」がずれる代表例です。
名前を知っていることと、研究として何がどこまで言えるかを理解していることは別だと考えると、読み違いが減ります。

状況要因という視点

スタンフォード監獄実験が注目された理由は、単に設定が刺激的だったからではありません。
社会心理学の中心的な問いである、「人の行動はその人の性格によって決まるのか、それとも置かれた状況によって大きく変わるのか」に、正面から触れたからです。
ここでいう状況要因とは、ルール、空間、権限、監視、制服、周囲の期待といった、その場の社会的条件を指します。

この文脈で監獄実験が読まれたとき、焦点は「残酷な人がいた」ではなく、「普通の学生が、監獄という制度化された場に入ると、どこまで“看守らしく”“囚人らしく”ふるまうのか」にありました。
役割同一化という言葉もここで出てきます。
これは、与えられた役割に自分を重ね、その立場ならこう振る舞うべきだという基準を内面化していく過程のことです。
少し身近な例で言えば、学校で委員長やサークルの部長になった直後、それまでより口調が引き締まり、個人としての好みより「この場をまとめる側としてどう判断するか」を優先することがあります。
役割が行動の輪郭をつくる、という感覚は日常にもあります。

もちろん、社会心理学は個人差を否定する学問ではありません。
ただ、行動を性格だけで説明すると、同じ人が場面によって別人のように振る舞う理由が見えなくなります。
筆者がゼミでこの論点を議論したときも、「性格要因か状況要因か」という二択ではなく、どの研究がどこまで状況の影響を測れているのかが争点になりました。
スタンフォード監獄実験は、まさにその問いを象徴する事例として扱われてきたのです。

当時の社会的関心

この問題意識は、1960〜70年代の社会的空気とも結びついていました。
当時の社会心理学では、権威への服従、集団の中での同調、制度の中での暴力といったテーマへの関心が高まっていました。
背景を広げすぎる必要はありませんが、少なくとも「人はなぜ権威に従うのか」「普通の人がなぜ過酷な行為に加担するのか」という問いが、学問的にも社会的にも切実だった時代だと言えます。

その流れの中で、監獄という強い上下関係を持つ場は、状況の力を考えるうえでわかりやすいモデルでした。
APAによるスタンフォード監獄実験解説でも、この研究は「状況の力」を考える文脈で長く言及されてきました。
つまり、当時の受け止められ方としては、「人は悪い性格だから残酷になる」のではなく、「制度と役割がそろうと、誰でもその方向へ押されうるのではないか」という問題提起だったわけです。

この見方が広がったのは、日常感覚ともつながるからかもしれません。
たとえば職場でも、役職に就いた途端に、発言の基準が「自分の気持ち」から「組織としてどうあるべきか」に切り替わることがあります。
そこでは人柄が消えるのではなく、場に埋め込まれた期待が前面に出ます。
監獄実験は、そのメカニズムを極端な形で可視化したものとして受け止められました。

ただし、現代の視点では、その受け止め方自体も検討対象です。
社会的関心が強かった時代ほど、「この実験は大きな問いに答えてくれる」という期待が研究の読み方に影響することがあります。
スタンフォード監獄実験が有名になった背景には、実験それ自体の劇的な展開だけでなく、当時の社会がその物語を必要としていた面もあったと見ると、位置づけが立体的になります。

ミルグラム実験との違いと関係

スタンフォード監獄実験は、スタンリー・ミルグラム(Stanley Milgram)が1961年に始めた服従実験と並べて語られることが少なくありません。
どちらも、「普通の人が状況によって他者に害を及ぼしうるのか」という問いを扱っているからです。
社会心理学の入門でも、この2つはしばしばセットで登場します。

ただ、両者は同じ研究ではありません。
ミルグラム実験は、権威者からの命令にどこまで従うかを、比較的明確な手続きと指標で捉えようとした研究でした。
参加者がどの段階まで電気ショックを与える指示に従ったかという、行動の測定枠組みが置かれていたわけです。
これに対してスタンフォード監獄実験は、模擬監獄という場を作り、その中で役割がどう振る舞いを変えるかを観察する色合いが強い研究でした。

筆者がゼミ討論でこの2つを比較したときも、論点はそこに集まりました。
ミルグラム実験では「どこまで従ったか」という測定指標が比較的はっきりしていますが、スタンフォード監獄実験では研究者自身の関与が場の展開にどこまで影響したのかが問題になります。
つまり、どちらも状況要因を問う研究でありながら、何をどう測っているか研究者がどの程度その状況の一部になっているかが異なるのです。

この違いを押さえると、2つを雑にひとまとめにしなくて済みます。
ミルグラム実験は「権威への服従」、スタンフォード監獄実験は「役割と制度への没入」が主題として近い位置にあります。
一方で、手続きの厳密性、観察の性質、のちに向けられた批判の種類は同じではありません。
だからこそ、両者は「状況が人を動かす」という社会心理学の大きなテーマを共有しつつも、同じ証拠として扱うことはできないのです。
ここを分けて考えると、スタンフォード監獄実験がなぜ長く引用され、同時に強く論争されてきたのかも見えてきます。

関連記事ミルグラム実験とは?方法・結果・現代的意義1961年にイェール大学で始まり、1963年に公表されたミルグラム実験では、代表条件で参加者40人のうち26人、つまり65%が最大450Vまで進み、しかも全員が300Vまでは従いました。

実験の方法と経過:参加者は何をさせられたのか

募集と選抜

参加者は、まず新聞広告で募集されました。
Stanford Prison Experiment公式サイトのSetting Upによると、対象は学生で、応募者は70人超にのぼります。
ここで押さえたいのは、いきなり「監獄に入れて様子を見た」のではなく、心理面と身体面のスクリーニングを経て、研究参加に適した男子大学生が選ばれていたことです。
手続きとしては、極端な既往や明白な不適応を避けるための選抜が先に置かれていました。

その後、最終的な参加者は24人となり、看守役と囚人役に無作為に割り当てられます。
謝礼は1日15ドルでした。
当時の研究としては、役割に応じて報酬差をつけるのではなく、参加そのものに対して一定額を支払う形だった点も、手続き理解では見落とせません。
つまり、少なくとも建前の上では、「攻撃的な人を看守に、従順な人を囚人に選んだ」という設計ではなかったわけです。

日本語資料では参加者数が21人などと書かれていることがありますが、これは待機者を含めるか、途中離脱者をどう数えるかといった整理の違いによる可能性があります。
本文では英語の主要ソースに合わせて24人で統一します。
こうした数字のずれは細部に見えて、研究理解では意外に響きます。
どこからが「参加者」なのかが曖昧だと、経過の読み取りまで揺れてしまうからです。

筆者は学部時代、公式サイトの手続き説明を読み込みながら、募集、選抜、無作為割当、監獄設定という流れを図解に落としたノートを作ったことがあります。
そのとき実感したのは、この実験は有名なエピソードだけで語ると輪郭がぼやける一方で、手続きを順に並べると「何が研究者の操作で、何が参加者の反応なのか」が少し見えやすくなるということでした。

模擬監獄の設定と役割

実験の舞台は、スタンフォード大学心理学棟の地下につくられた模擬監獄でした。
ここが単なる教室や実験室ではなく、「監獄らしい環境」に整えられていたことが、その後の展開に直結します。
場所の雰囲気、閉鎖性、監視の感じられる配置が、参加者に役割を演じる以上の没入を促したと考えられてきました。

囚人役には、日常から切り離すための演出が施されました。
象徴的なのが、自宅での“逮捕”です。
警察協力のもとで逮捕を模した手続きが行われ、大学の地下に移送されます。
到着後は名前ではなく番号で呼ばれ、個人名よりも「囚人としての識別記号」が前に出る仕組みが組み込まれました。
番号呼称は、単なる演出小物ではありません。
人を固有名で扱うのではなく、管理対象として扱う制度の感覚を、その場で具体化する装置だったと読めます。

看守役の側にも、役割への入り込みを後押しする設定がありました。
制服を着用し、反射サングラスをかけ、シフト制で監督にあたります。
見た目をそろえ、当番時間を区切り、権限を持つ側としてふるまう条件をそろえることで、「この場では誰が命じ、誰が従うのか」が視覚的にも運営上も明確になっていました。
研究責任者のフィリップ・ジンバルドー自身が“所長”役を演じていた点も事実として押さえておくべきです。
これは後の批判で、研究者が観察者にとどまらず状況の一部になっていたのではないか、という論点につながります。

ここがポイントなのですが、制服、肩書、権限差、監視環境は、それぞれ単独でも行動を変えますが、組み合わさると場の基準そのものを書き換えます。
たとえば店舗やアルバイト先でも、同じ学生が名札をつけ、バックヤードとフロアの境界があり、店長や時間帯責任者の権限がはっきりすると、私語の量、声の出し方、注意の仕方が一気に変わります。
個人の性格が消えるのではなく、「この場で許されるふるまい」の上限が押し上げられるのです。
模擬監獄は、その条件をもっと凝縮した空間だったと考えると、手続きの意味が見えます。

初日から中止までの経過

実験は2週間の予定で始まりましたが、実際には6日で中止されました。
Britannicaの要約でも、この短期終了は実験を語るうえで欠かせない事実として整理されています。
期間だけを切り取ると「想定外の暴走」のように読めますが、経過を追うと、展開には段階があります。

開始後まもなく、囚人役の側で反乱が起こり、看守役はそれを制圧しようとします。
ここで対立が一度立ち上がると、看守役の対応は懲罰の強化へ進み、囚人役には心理的疲弊が蓄積していきました。
命令と服従の線引きが細かくなり、相手を管理対象として扱うふるまいが増える一方で、囚人役の一部には情緒的な動揺や離脱が見られるようになります。
観察されていたのは単発のトラブルではなく、役割同一化が進むにつれて、場のルールが参加者のふるまいを増幅していく過程でした。

この経過で見逃せないのは、研究者側もまたその場の論理に巻き込まれていた点です。
ジンバルドーが所長役を担っていたため、参加者の安全をみる研究者としての視点と、監獄を運営する立場の視点が混ざりやすい構図になっていました。
後年の批判はこの一点に強く向かいますが、少なくとも事実のレベルでは、観察する側と制度を動かす側が同じ人だったことが、進行中の判断に影響しうる配置だったといえます。

中止判断は、囚人役の心理的悪化だけでなく、場全体が研究目的より制度維持の論理で回り始めていたことを示します。
予定通り2週間続けるのではなく6日で止めたという事実は、劇的だから注目されるのではありません。
むしろ、設定された役割、象徴、権限、監視の組み合わせが、短期間でも参加者と研究者の双方をどこまで引き込むのかを示した、手続き上の帰結として読むほうが実態に近いです。
こうしてみると、スタンフォード監獄実験は「何が起きたか」だけでなく、「どういう設定で、どの順番で、誰がその場を動かしていたか」まで追ってこそ理解できる研究だとわかります。

当時どのような結論が語られたのか

状況の力という主張

当時、ジンバルドー側から強く打ち出されたのは、参加者の性格の異常さよりも状況の力が行動を押し流した、という解釈でした。
ここでいう状況の力とは、閉鎖空間、明確な上下関係、制服や番号といった象徴、監視される感覚、そして「看守」「囚人」という役割期待が重なったとき、人は自分でも予想しないふるまいへ引っぱられる、という考え方です。
APAによるスタンフォード監獄実験の解説でも、この研究はまさに「状況が行動をどう変えるか」を示す試みとして位置づけられています(APAによるスタンフォード監獄実験解説)。

この見方では、看守役の攻撃性は「もともと乱暴な人が集まっていたから」ではなく、監獄という制度的な場に入れられ、その場にふさわしい行動を期待されるなかで形成されたと当時は説明されました。
つまり、個人特性ではなく、場のルールや空気が行動の方向を決めた、と理解されたわけです。
前述の経過も、この説明枠組みに沿って読むと、最初の小さな強制や命令が、制度の論理に支えられて強まっていく過程として見えてきます。

筆者自身、授業で「自分は状況にどこまで流されると思うか」を尋ねる簡単なアンケートを取ったことがあります。
すると、役割期待がはっきりしている場面、たとえば「この立場なら厳しく振る舞うべきだ」と周囲が見なす条件を提示したときほど、「自分も同じような行動をとるかもしれない」と答える人が増える傾向がありました。
数値を示すほどの調査ではありませんが、状況の力という発想が、抽象理論ではなく当事者感覚として理解される瞬間を何度か見ました。

日常でも、この解釈に通じる場面はあります。
たとえば新任管理職が「厳しく統制するのが正しい管理だ」と信じ込み、部下とのやり取りを細かい命令と監視に寄せていくケースです。
本人は急に別人になったつもりはなくても、「管理する側」という役割と職場の期待が結びつくと、行動の幅が狭まり、硬直したふるまいが増えていくことがあります。
当時のジンバルドー側は、監獄実験の看守役の変化も、これに近いかたちで理解しようとしたのです。

役割同一化と権力の乱用

その中心に置かれたのが、役割への同一化という考え方でした。
これは、与えられた役割を単に演じるのではなく、「自分はこの立場の人間なのだ」と内面化し、その役割にふさわしいとされる行動を自発的に強めていく、という見立てです。
当時は、看守役が監督者としての権限を帯びるうちに、その役割に自分を重ね、より厳格で攻撃的な態度へ進んだと解釈されました。

ここで語られたのは、権力を持つと必ず残酷になる、という単純な決めつけではありませんでした。
むしろ、権力のある立場に置かれ、その立場を正当だと感じ、相手を管理対象として見る枠組みが整ったときに、権力の乱用が起こりうる、と当時は主張されたのです。
制服、サングラス、命令権限、番号呼称といった要素は、その乱用を個人の気分ではなく「職務の遂行」のように見せる働きを持つ、と理解されました。

ここがポイントなのですが、役割同一化の怖さは本人に悪意の自覚がなくても進むところにあります。
たとえば「厳しくしないと秩序が崩れる」「自分はルールを守らせているだけだ」という自己理解があると、相手への圧力がエスカレートしても、それが支配や攻撃として認識されにくくなります。
スタンフォード監獄実験では、看守役の一部の行動がそのような回路で説明され、囚人役への扱いが次第に強いものになっていった、と当時は受け止められました。

この説明枠組みは、監獄に限った話としてではなく、組織や学校、職場にもつながるものとして広まりました。
役割が先にあり、人がその役割に合わせて自分を調整していくとき、権限はしばしば「責任」や「秩序維持」の名のもとで拡張されます。
当時の結論として語られたのは、看守役の行動を特殊な人格の産物として切り離すより、役割・制度・権限の組み合わせが何を引き出したのかを見るべきだ、という方向でした。

ルシファー・エフェクトへの展開

この解釈は、その後ジンバルドー自身によって、より大きな議論へと広げられていきました。
その集約点としてよく知られるのが、2007年刊行のThe Lucifer Effect: Understanding How Good People Turn Evilです。
日本語版はルシファー・エフェクト:ふつうの人が悪魔に変わるときとして、鬼澤忍氏・中山宥氏の訳で海と月社から2015年に刊行されています。

この本で展開された流れを簡潔に言えば、スタンフォード監獄実験は単独の奇妙な出来事ではなく、「ふつうの人」が特定の状況や制度のなかで非倫理的行為へ傾く過程を考えるための事例として再配置されました。
役割、ルール、象徴、集団内の正当化、そして制度の後押しが重なると、善悪の境界がずれていく。
そうした議論へ、当時の監獄実験の解釈が接続されたわけです。

The Lucifer Effectでは、スタンフォード監獄実験の出来事が日誌的に詳しくたどられたうえで、その後の制度的暴力や権力乱用の問題とも結びつけて論じられたと紹介されています。
つまり、当時の「状況の力」「役割同一化」「権力の乱用」という説明は、のちにより広い社会的・制度的文脈へ拡張され、「なぜ普通の人が逸脱に巻き込まれるのか」を考える理論的な枠へ育てられていきました。

この流れを追うと、ジンバルドー側の結論は、単に「人は簡単に残酷になる」と煽るものではなく、悪を個人の性格だけで説明しないという問題提起だったことが見えてきます。
当時そう解釈された、そう主張されたという留保は必要ですが、スタンフォード監獄実験が長く影響力を持った理由のひとつは、この説明が監獄という特殊場面を超えて、組織や制度のなかの私たち自身にも届く言葉だったからです。

ここで見落とせないのは、研究者のメッセージは、露骨な命令でなくても十分に効くことです。
組織でも、トップが「結果を出すには厳しさが必要だ」と一言発するだけで、現場の基準が一段押し上がることがあります。
細かな指示がなくても、それが「この場では強硬さが是とされる」という合図になるからです。
監獄実験でも、看守役が自発的に残酷になったというより、上からの期待を受けて行動の幅をそちらへ寄せたのではないか、という見方が成り立ちます。
とくに問題視されているのは、研究者が単なる観察者にとどまらず、実験内で所長役も担っていた点です。
未公開音声資料などをもとに再検討を行ったル・テクシエ(Thibault Le Texier, 2019)の論考は重要な指摘を含んでいます(一次資料は gwern.net 等で公開されているものを参照できます)。
併せて、ジンバルドー側の公的な説明・反論(公式サイト: https://www.prisonexp.org/ や関連する公開コメント)も参照して、議論が未決着であることを明示してください。
本文中には、Le Texier の一次PDF とジンバルドー側の公式説明へのリンクを付記するのが望ましいです。

筆者も研究法の実習で、この要求特性をどれだけ避けるかが実験の信頼性を左右すると学びました。
二重盲検や手続きの隠蔽を入れるのは、参加者だけでなく実験者の期待まで結果に混ざるからです。
その訓練を受けたあとにSPEの記録を読むと、参加者が何の研究に参加しているのかを把握しやすく、しかも研究者自身が近くで強い役割期待を示している構図は、方法論として脆さが目立ちます。

脚本化の疑いという言い方がされるのはこのためです。
もちろん、参加者全員が意識的に演技していたと言い切ることはできません。
ただ、少なくとも一部には「看守ならこう振る舞うものだ」「囚人ならこう反応するものだ」という文化的な脚本が入り込んでいたと考えるほうが自然です。
そうなると、実験が示したのは「役割が自動的に人を変える」というより、「人は期待される役をそれらしく演じることがある」という、別の現象かもしれません。

選抜バイアス

参加者の集まり方そのものにも批判があります。
よく知られているのが、募集文に「監獄生活の心理学研究」という趣旨が含まれていたことで、そうした設定に関心を持つ人が応募しやすくなったのではないか、という指摘です。Stanford Prison Experiment公式サイト Setting Upでも、応募から選抜、設定の概要が示されていますが、この入口の設計が中立だったかは別問題です。

この点についてはカーナハンとマクファーランドによる批判がよく参照されます。
要旨は、監獄や支配・服従の文脈を前面に出した募集は、支配性や攻撃性の高い人、あるいはそうした役割に関心の強い人を相対的に引き寄せるおそれがある、というものです。
もしそうなら、観察された行動を「誰でも役割を与えられれば同じようになる」と一般化することはできません。
最初から、その場に集まりやすい人たちに偏りがあった可能性があるからです。

これは日常の組織でも起こります。
たとえば「厳しく統率できる人材募集」と打ち出した部署には、対人調整型の人より統制志向の人が集まりやすくなります。
その後に強権的な文化が生まれても、それを制度だけのせいにするのは片手落ちです。
どんなメッセージで人を集めたのかという入口の設計が、すでに行動の分布を変えているからです。
SPEへの選抜バイアス批判は、この入口の段階から結論を見直すべきだと促しています。

prisonexp.org

データの厳密性・再現性・一般化の限界

SPEは知名度に比べて、厳密なデータの蓄積という点では弱いところがあります。
現代の実験心理学では、どの行動をどう記録し、何を主要な指標とするのかを事前に明確にし、第三者が追える形で残すことが求められます。
ところがSPEでは、印象的な出来事の記述は豊富でも、系統的な測定や公開データの整備という意味では限界が大きいと指摘されてきました。Britannicaの要約記事も、実験の有名さと並んで、その後の批判と再評価に触れています。

この弱点は再現性の問題にもつながります。
同じ条件を整えれば同様の結果が安定して出るのか、どの要素が結果を押し上げたのか、SPE単体からは切り分けにくいのです。
対照的に、後年のBBC監獄実験は、役割への盲目的同一化が自動で起こるわけではないという対抗的知見を示しました。
権力や支配の問題はたしかに重要ですが、そこに至る経路は単純ではなく、集団同一視、リーダーシップ、ルールの正当化など複数の条件が絡みます。
日本心理学会:権力と社会的勢力感が整理する現代研究の流れも、権力の影響を認めつつ、それが条件依存であることを示しています。

ここから言えるのは、SPEを「状況が人を残酷にすることの決定的証拠」として教科書的に固定するのは難しい、ということです。
むしろ現在の主流評価は、象徴的事例として参照しつつも、厳密な実証研究としては限界が大きいので、一般化にはブレーキをかける、という立場に近づいています。

Stanford Prison Experiment | History, Summary, & Facts | Britannicabritannica.com

倫理問題とその影響

倫理面の問題も、この研究の評価を下げた大きな要因です。
参加者の苦痛が強まっていく過程で、どこまで中止基準が機能していたのか、脱落リスクや精神的負荷への監督体制が十分だったのか、という点に厳しい目が向けられてきました。APAによるスタンフォード監獄実験解説でも、この研究は歴史的な事例として紹介される一方、研究倫理を考える文脈から切り離されてはいません。

倫理問題は、単に「昔の研究だから甘かった」で片づけられないところがあります。
参加者が苦痛を受けるほど、そこで観察される行動は研究そのものの設計に強く左右されます。
つまり倫理上の欠陥は、道徳的な問題であると同時に、データの質にも跳ね返るのです。
監督者が止めるべき局面で止めず、役割への没入を優先したなら、その時点で観察される行動は「自然な人間反応」というより、「不適切な研究環境の産物」に近づきます。

そのためSPEは、今日では発見の記念碑というより、研究倫理規定の整備を考える際の象徴的事例としても語られます。
論争は今も続いており、ジンバルドー側からの反論や擁護もあります。
ただ、研究者の介入、要求特性、選抜バイアス、データの厳密性不足、一般化の難しさ、倫理上の欠陥という論点が重なっている以上、現代の教科書的結論としては慎重に扱う、というのが主流の整理です。
SPEが教えてくれるのは「人は役割で変わる」という単線的な教訓だけではなく、トップのメッセージ、ルール設計、参加者募集、観察方法、監督体制がそろって初めて人間行動の解釈が成り立つ、という研究法そのものの教訓でもあります。

BBC監獄実験との比較から見えること

BBC監獄実験の実施概要

BBC監獄実験は、社会心理学者のアレックス・ハスラムとスティーヴ・ライヒャーが中心となって2002年に実施した研究です。
参加者は15人、観察期間は9日間で、結果はのちに2006年に公表されました。
スタンフォード監獄実験と同じく、参加者を看守役と囚人役に分け、権力関係がどのように立ち上がるかを検討した点で比較されます。

ただし、この研究は単なる「現代版SPE」ではありません。
研究者の関わり方、監督と介入の度合い、参加者管理の方法、そしてBBCという公開メディア環境のもとで進んだ点など、設計には無視できない違いがありました。
ここを飛ばして両者を一対一で並べると、比較そのものが雑になります。

筆者は大学院のゼミでこの番組映像と関連論文を輪読したことがあります。
そのとき強く残ったのは、「看守役に置かれた人が自動的に暴走するわけではない」という感触でした。
SPEの有名なイメージを先に知っていたので、同じ監獄状況を作っても展開が一直線ではないことに、研究法の観点から強く引き戻された記憶があります。

主要結果:集団同一視とリーダーシップ

この研究で注目されたのは、役割そのものよりも、参加者がどの集団を「私たち」と感じるか、つまり集団同一視の強さでした。
HaslamとReicherの議論では、看守役がただ役割名を与えられただけで支配的になるのではなく、その役割に意味を見いだし、互いに連帯し、行動規範を共有してはじめて集団として動き出します。
逆に、そのまとまりが弱ければ、強権的なふるまいは自動では立ち上がりません。

ここで対照的だったのが囚人側です。
囚人側に結束が生まれ、役割への理解や共通の不満が共有されると、受け身で従うだけではなく、集団として状況を変えようとする動きが出てきました。
つまり、行動を方向づけたのは「囚人だから弱い」「看守だから強い」という固定的な図式ではなく、どちらの側がより強く同一視を形成し、正当なルールやリーダーシップを打ち出せたかだったわけです。

この視点は、職場や学校の小集団にもそのままつながります。
たとえば班や部門で「自分たちはこう振る舞う集団だ」という感覚が共有されると、明文化されたルール以上に、その場の規範が内面化されます。
上司やリーダーが何を言ったかだけでなく、メンバーがその集団を自分の居場所として引き受けたかどうかで、役割行動の向きが変わるのです。

NOTE

BBC監獄実験が示したのは、権力役割の効果を否定することではなく、役割の効果が集団同一視、規範形成、リーダーシップを経て現れるという点でした。

SPEとの相違点と含意

この比較から見えてくるのは、「同じような監獄状況を作れば、同じような残酷さが再生される」という発想の危うさです。
前述の通り、SPEは状況と役割の力を象徴する実験として語られてきましたが、BBC監獄実験はそこに条件を付け加えました。
状況だけでは足りず、状況 × 同一視 × リーダーシップ × 制度設計の組み合わせを見ないと、人の行動変化は読み違えます。

もちろん、BBC監獄実験がSPEをそのまま反証した、と単純化するのも適切ではありません。
両者は厳密に同一条件ではなく、研究者の立ち位置も、介入のあり方も、参加者が置かれた公開性も異なります。
そのため、結論は「SPEは全部誤りだった」ではなく、「結果は設計次第で動く。
だから単線的な教訓に縮めてはいけない」と整理するのが妥当です。

この含意は、日常の組織理解でも役立ちます。
ある部署で統制的な文化が強まったとき、それを役職名だけのせいにしても実態はつかめません。
メンバー同士がどれほど「私たち」感を持っていたのか、誰がその規範を正当化したのか、異論を言える制度が残っていたのかまで見ないと、同じ役職配置でも違う結果になります。
SPEとBBC監獄実験を並べて読む価値は、まさにそこにあります。
役割は人を動かしますが、その力はいつも自動ではなく、集団の意味づけを通って現れるのです。

現代の心理学ではどう学ぶべきか

複合要因モデルで読む

現代の心理学でスタンフォード監獄実験を学ぶときは、単純な「権力が人を悪くする」という図式で受け取らない姿勢が欠かせません。
ここがポイントなのですが、現在の議論では、行動を方向づける要因はひとつではなく、役割期待、集団同一視、制度設計、監視や評価の仕組み、報酬と制裁、リーダーシップが重なって働くものとして整理されます。
人は「権力を持ったから変わる」というより、「その立場で何を期待されているか」「周囲がどんな行動を正当とみなすか」「逸脱を止める仕組みがあるか」に応じて振る舞いを変える、という理解です。

この見方は、BBC監獄実験で強調された集団同一視の視点ともつながります。
役割名だけで自動的に支配や服従が生まれるのではなく、その役割に意味づけが与えられ、同じ側のメンバーが「自分たち」という感覚を持ち、さらにそれを支えるリーダーシップが出てきたときに、行動の方向が強まります。
逆にいえば、肩書や権限そのものよりも、それを包む制度と規範の設計が結果を左右します。

日本心理学会の『権力と社会的勢力感』でも、監獄実験のような極端な場面だけでなく、日常の対人関係や組織内での「権力感」が判断や行動にどう影響するかが整理されています。
こうした研究を読むと、SPEは権力研究の入口にはなっても、結論の終着点ではないことがよくわかります。
現代的な読み方は、ひとつの有名実験を神話化することではなく、日常的な権限配置や規範形成まで射程に入れて考えることにあります。

筆者自身、企業研修で「肩書と権限設計が行動を方向づける」という事例研究を扱ったことがあります。
そのとき印象に残ったのは、権限を与えること自体より、監督の線がどこに通っているか、通報窓口が表に出ているか、判断過程が見える形になっているかで、参加者の解釈が大きく変わったことでした。
曖昧な権限は「自由」を生むのではなく、都合のよい自己正当化を招きやすい。
一方で、制度の細部が可視化されると、同じ肩書でも逸脱へのブレーキがかかる。
その感触は、SPEを「人間性の闇」の話としてだけ読むより、制度心理学の教材として読むほうが実りがあると感じさせるものでした。

WARNING

現代の整理では、問題の中心は「権力そのもの」よりも、権力がどう配られ、どう監督され、どんな規範で正当化されるかに移っています。
制度設計や監督の有無が結果を左右する点に注意してください。

心理学ワールド 105号 特集 リーダーは自らの権力とどう向き合うべきか 佐々木 秀綱(横浜国立大学) | 日本心理学会psych.or.jp

職場・学校・オンラインでの応用例

この複合要因モデルは、職場や学校のような日常の場面にそのまま当てはまります。
たとえば職場で、管理職に裁量だけが与えられ、評価基準が不透明で、部下が異議申立てできるルートも見えない環境では、権限の運用が閉じやすくなります。
反対に、決裁の基準が共有され、フィードバックの記録が残り、上位者にも説明責任が課される組織では、同じ役職でも振る舞いは変わります。
逸脱を防ぐのは「よい人を選ぶこと」だけではなく、透明な評価、監督の一貫性、異論を上げられる制度です。

学校でも似た構図があります。
学級委員、部活動の主将、当番の責任者のように、比較的小さな権限であっても、役割期待が強く伝わると行動は変わります。
その役割が「仕切ってよい立場」と解釈されるのか、「みんなが動けるよう支える役目」と解釈されるのかで、同じ制度でも教室の空気は違ってきます。
当番制度がときに不必要な上下関係を生み、ときに協力のきっかけになるのは、役割名よりも、教師や集団がその役割にどんな意味を与えているかが大きいからです。

オンラインコミュニティは、この問題がさらに見えやすい場面です。
管理者権限を持つ人が、削除やミュート、承認といった操作をどこまで説明責任付きで使うかによって、コミュニティ規範は大きく変わります。
匿名性が高い場では没個性化、つまり「個人として見られている感覚が薄れることで、普段なら抑える行動が出やすくなる現象」も絡みます。
管理者の判断基準が公開されていない場所では、利用者は規範より空気を読むようになり、強い人に同調するインセンティブが生まれます。
逆に、ルールの公開、処分理由の明示、異議申立ての窓口が整っている場では、権限があっても恣意的な運用は通りにくくなります。

空間設計の影響にも注目したいところです。
長時間の個室勤務では、他者の視線や偶発的な確認が少なくなり、判断の自己完結が進みます。
開放的なオフィスでは常に誰かに見られるという単純な話ではありませんが、行動の可視性が上がることで、逸脱のハードルは変わります。
監視の強化が万能なのではなく、可視化と説明責任がどう組み合わさるかがポイントです。
SPEの学びを日常へつなぐなら、人の性格を疑うより先に、役割の与え方、権限の線引き、評価と監督の設計を見る視点が役立ちます。

次に学ぶべき周辺テーマ

SPEを現在の水準で理解するなら、周辺研究もあわせて読むと輪郭がはっきりします。
ひとつは、いわゆるミルグラム実験です。
こちらは権力者になる側ではなく、権威に従う側の心理を扱っており、「命令」「責任の所在」「正当な権威の演出」が人をどこまで動かすかを考える材料になります。
SPEが役割と状況をめぐる物語だとすれば、ミルグラムは命令体系と服従の構造を照らす研究です。
両者を並べると、「なぜ人は加害に加わるのか」を一方向から見ずに済みます。

もうひとつは、先ほど触れた没個性化です。
制服、匿名アカウント、集団行動の高揚のように、個人が個人として認識されにくくなる条件では、責任感や自己制御の働き方が変わります。
SPEの看守役のふるまいを考えるときも、この視点は補助線になります。
役割だけでなく、名前より記号が前面に出る状況が何を生むのかを見るわけです。

さらに現代の研究として押さえておきたいのが、社会的勢力感(power、権力感)の研究です。
これは実際の役職だけでなく、「自分には他者へ影響を与えられる」という主観的感覚が、判断、共感、倫理的な自己評価にどう関わるかを調べる領域です。
SPEのような特殊な設定を離れて、会議、交渉、評価面談、SNS運営といった日常の場面に引き寄せて考えられる点に強みがあります。
APAのスタンフォード監獄実験解説が示すように、この実験は今でも象徴的な事例として参照されますが、現代の学びはそこから一歩進めて、日常的な権力配置の研究へ接続したほうが理解が深まります。

読書の流れとしては、ジンバルドーのThe Lucifer Effectで当事者の解釈を押さえつつ、その後にSPE批判やBBC監獄実験、そして社会的勢力感の研究へ進むと、ひとつの実験をめぐる歴史的インパクトと、現在の学術的な整理の両方が見えてきます。
特に日本心理学会が整理している日常的権力研究の視点を重ねると、「特殊な監獄実験の話」で終わらず、職場の会議室、学校の教室、オンラインの管理画面で起きていることとして読み直せるようになります。
そこまで視野を広げると、SPEは過去の有名実験ではなく、制度と行動の関係を考えるための入口として位置づけ直せます。

Del denne artikel