ひとことで言うと#
同じ情報を見ても判断がバラバラになる「ノイズ」を体系的に減らす手法。カーネマンらの研究によれば、バイアス(偏り)だけでなくノイズ(ばらつき)も判断の質を大きく損なっている。判断衛生は、このノイズを「仕組み」で抑え込む。
押さえておきたい用語#
- ノイズ(Noise)
- 同じ問題に対して、本来同じ判断をすべき人々の間で生じる望ましくないばらつきのこと。バイアスとは異なり、一方向ではなく散らばる。
- バイアス(Bias)
- 判断が特定の方向に系統的にずれる現象を指す。ノイズとバイアスは独立した問題で、両方を減らす必要がある。
- 場合ノイズ(Occasion Noise)
- 同じ人が同じ問題を異なるタイミングで判断すると結果が変わる現象。気分、疲労、直前に見た情報などが原因。
- 構造化判断
- 判断を複数の独立した評価項目に分解し、各項目を個別に採点してから総合する手法である。判断衛生の中核をなすテクニック。
判断衛生の全体像#
こんな悩みに効く#
- 人事評価が評価者によってバラバラで、社員から不満が出ている
- 同じ案件なのに、担当者が変わると判断結果が大きく変わる
- 会議で声の大きい人の意見に引きずられてしまう
基本の使い方#
1つの総合的な判断を、独立した複数の項目に分ける。
例: 採用面接の「この人を採用するか」を分解
- 技術スキル(5段階)
- コミュニケーション能力(5段階)
- カルチャーフィット(5段階)
- 成長ポテンシャル(5段階)
各項目に具体的な判定基準(アンカー)を明文化する。 「5=自走して技術選定できる」「3=指示があればタスクを遂行できる」「1=基礎知識が不足」のように。
重要なルール:
- 項目間の順序効果を避ける: 「技術スキルが高いから他も高いだろう」というハロー効果を防ぐため、1項目ずつ独立に評価する
- 他者の評価を見ない: 評価者同士が互いの採点を知らない状態で判定する
- 直感的な総合評価は後回し: 先に直感で「この人はA」と決めてから項目別に採点すると、結論に合わせた点数をつけてしまう
全員の採点が出揃ってから、初めて点数を共有する。
- 評価者間で2点以上の乖離がある項目を議論する
- 議論の後、各自の最終採点を(再度独立に)確定する
- 合計点の平均値で判断するか、あらかじめ決めた閾値で判断する
具体例#
問題: 担当コンサルタント8名が同じ求人に対して書類選考を行うが、通過率が担当者によって**18%〜62%**と大きくばらついている。同じ候補者の書類を2名の担当者が評価すると、判断の一致率はわずか55%。
判断衛生の導入:
- 書類選考の評価を5項目に分解: 業界経験(3段階)、職種スキル(3段階)、マネジメント経験(3段階)、転職回数(3段階)、志望動機の具体性(3段階)
- 各項目に具体的な判定基準を作成(例: 業界経験3=「同業界5年以上」、2=「関連業界3年以上」、1=「未経験」)
- 合計12点以上で通過、8〜11点は上位者レビュー、7点以下は不通過
導入3か月後、担当者間の通過率のばらつきは18%〜62% → **35%〜48%**に縮小。判断一致率は55% → **82%**に向上した。
状況: ベンチャーキャピタルの投資委員会(5名)。過去1年の投資判断を振り返ると、同じ案件に対する評価が委員によって最大3段階(5段階中)異なっていた。
ノイズ測定: 過去20件の案件を匿名化して各委員に再評価させたところ、同一案件への評価のばらつき(標準偏差)が平均1.3段階。さらに、同一委員が6か月前と異なる評価をしたケースが20件中7件(場合ノイズ)。
判断衛生の導入:
- 投資評価を6項目に分解: 市場規模、チーム、プロダクトの差別化、トラクション、ユニットエコノミクス、エグジット見通し
- 各項目を独立に1〜5の数値で採点。判定基準は「トラクション5=MRR 500万円以上で月次成長率15%以上」のように定量化
- 委員間で採点を共有するのは全員が提出した後
導入後、評価のばらつき(標準偏差)は1.3段階 → 0.6段階に半減。「声の大きい委員の意見に引きずられる」問題も解消し、議論の質が上がった。
状況: 全30店舗の飲食チェーン。衛生監査を担当するSV(スーパーバイザー)3名の評価が大きく異なり、同じ店舗を3名が同時に監査すると評価が最大30点差(100点満点中)。
ノイズの原因分析:
- SV-Aは清掃状態を重視し、SV-Bは食品保管温度を重視、SV-Cは従業員の手洗い頻度を重視 → 評価基準が人によって異なる
- 監査する時間帯(ランチ前 vs ディナー前)で店舗の状態が違う → 場合ノイズ
- SVが店長と親しいかどうかで採点が甘くなる → 対人ノイズ
判断衛生の導入:
- 監査シートを8カテゴリ42項目に細分化。各項目は「適合/不適合」の二択で判定(グレーゾーンを排除)
- 各項目に写真付きの判定基準を添付(「適合=このレベル」「不適合=このレベル」の写真比較)
- 監査時間を統一(ランチ営業終了後14:00〜15:00)
導入前の3名のSV間の平均点差は22点。導入後は5点以内に収束した。店舗側も「何をどう直せばいいか」が明確になり、改善スピードが上がった。
やりがちな失敗パターン#
- 「うちの判断にノイズはない」と思い込む — ほぼすべての組織に判断のノイズは存在する。まずは同じ案件を複数人で独立に評価し、どれだけばらつくかを測定するところから始める
- 評価項目を分解しただけで判定基準を作らない — 「コミュニケーション能力: 5段階」だけでは、各自が思い思いの基準で採点する。具体的な行動レベルで基準を定義しないとノイズは減らない
- 先に総合判断を出してから項目別評価をする — 結論に合わせた採点になるため意味がない。必ず項目別評価を先に行い、総合判断は最後に出す
- 判断衛生を「機械的な作業」として嫌がる — 確かに手間は増える。しかし、ノイズによる判断ミスのコスト(誤った採用、不公平な評価)は、手間のコストをはるかに上回る
まとめ#
判断衛生は、判断のばらつき(ノイズ)を「仕組み」で減らす手法。判断を項目に分解し、独立に評価し、複数の判断を集約する。バイアスだけでなくノイズにも目を向けることで、採用、評価、投資判断など、あらゆる意思決定の質が上がる。まずは「うちの判断にどれだけノイズがあるか」を測定することから始めてみるとよい。