ひとことで言うと#
「AとBが一緒に動いている(相関)」と「AがBを引き起こしている(因果)」を厳密に区別し、本当の原因を特定する思考法。ビジネスの意思決定で「相関を因果と誤解する」ことは最も高くつくミス。因果推論は、そのミスを防ぐための思考ツール。
押さえておきたい用語#
- 交絡因子(こうらくいんし / Confounding Variable)
- AとBの両方に影響を与える第三の変数のこと。交絡因子を見落とすと、AとBに因果関係があると誤って判断してしまう。
- ベースレート(Base Rate)
- ある事象が一般的にどのくらいの頻度で起きるかを示す基準確率のこと。個別の証拠に飛びつく前にベースレートを確認することで判断の精度が上がる。
- RCT(Randomized Controlled Trial)
- 対象をランダムに2群に分けて比較する実験手法のこと。因果関係を最も確実に検証できる方法で、ビジネスではA/Bテストとして広く使われる。
- 反事実(はんじじつ / Counterfactual)
- 「もし施策を実施していなかったら」という仮想の状態のこと。因果効果は「施策あり」と「施策なし(反事実)」の差として定義される。
因果推論の全体像#
こんな悩みに効く#
- 「この施策のおかげで売上が伸びた」と言っているが、本当にそうなのか疑問
- データは相関を示しているが、因果関係があるかどうか判断できない
- 効果のない施策に投資を続けてしまっている気がする
基本の使い方#
相関関係が因果関係でないケースを知っておく。
3つの罠:
- 逆因果: AがBを引き起こすのではなく、BがAを引き起こしている。例: 「病院に行く人ほど死亡率が高い」→ 病院が原因ではなく、重症だから病院に行く
- 交絡因子: 第三の変数Cが、AとBの両方に影響している。例: 「アイスクリームの売上と溺死者数は相関する」→ 共通の原因は「気温」
- 偶然の相関: たまたま一致しているだけ。例: 「ニコラス・ケイジの出演映画数とプール溺死者数は相関する」→ 完全に偶然
データが「AとBは一緒に動いている」と示したとき、必ず「なぜ?」を問う。
AとBの間にどんな因果構造があるかを図にする。
因果ダイアグラムを描く:
- A → B(AがBの原因)
- A ← B(BがAの原因:逆因果)
- A ← C → B(共通の原因C:交絡因子)
- A → C → B(Aが中間変数Cを通じてBに影響:媒介)
例: 「研修参加者は業績が良い」
- 研修 → 業績向上?(研修が効果あり)
- 業績が良い人 → 研修に参加する余裕がある?(逆因果)
- やる気が高い → 研修にも参加する AND 業績も良い?(交絡因子)
因果ダイアグラムを描くだけで、検証すべき仮説が明確になる。
因果関係を確かめる方法は、信頼性の高い順に以下の通り。
- ランダム化比較実験(RCT / A/Bテスト): 対象をランダムに分けて比較。最も信頼性が高い
- 回帰不連続デザイン: 閾値の前後で効果を比較。例: 「補助金の対象になるギリギリの企業」の前後比較
- 差分の差分法(DID): 施策前後×施策あり群なし群の2×2で比較
- 傾向スコアマッチング: 似た属性のグループ同士を比較する
- 操作変数法: 交絡因子を排除する外部要因を見つけて利用する
A/Bテストができるなら、迷わずA/Bテストを選ぶ。できない場合に他の方法を検討する。
検証結果を解釈する際のチェックポイント。
- 内的妥当性: この実験の結果は正しいか?(サンプルバイアス、測定誤差はないか)
- 外的妥当性: この結果は他の状況にも当てはまるか?(一般化できるか)
- 効果の大きさ: 統計的に有意でも、実務的に意味のある大きさか?
- メカニズム: なぜこの効果が生じるのか説明できるか?
「因果がある」と結論づけるには、複数の証拠が整合的であることが望ましい。
具体例#
状況: BtoC SaaS(月間新規登録3,000名)で「ウェルカムメールを受け取ったユーザーは7日後継続率が高い」というデータがある。マーケチームは「ウェルカムメールの効果だ」と主張し、メール改善に月額50万円の予算を要求。
因果推論的分析:
ステップ1: 相関の罠を疑う
- 逆因果の可能性: メールを受け取ったから継続したのか、そもそも継続するようなユーザーがメールを読んだのか?
- 交絡因子の可能性: メールを受け取った群と受け取っていない群で、登録経路や属性が異なるのでは?
ステップ2: 因果構造を描く
- メール受信 → 継続率向上?
- 登録経路(有料広告 vs オーガニック)→ メール開封率 AND 継続率?
実際に調べると、オーガニック流入のユーザーはメール開封率72%・継続率48%、広告流入は開封率31%・継続率22%。交絡因子の可能性が高い。
ステップ3: A/Bテストで検証 新規ユーザー6,000名をランダムに2群に分け、A群にはウェルカムメールを送り、B群には送らない。
結果: メールあり群の7日後継続率 = 42%、メールなし群 = 39%。差は3ポイント(p=0.04で統計的に有意だが限界的)。
解釈: ウェルカムメールには効果があるが、当初の相関データが示唆した「大きな効果(継続率+20pt)」ではなく「小さな効果(+3pt)」。月50万円の予算をメール改善に使うより、オーガニック流入を増やす施策に回す方がROIが高い。相関データを鵜呑みにしていたら、効果の薄い施策に年間600万円を投資するところだった。
状況: 従業員300名の法人営業会社。年間200万円の営業研修を導入したところ、「研修参加者の成約率は42%、不参加者は28%」というデータが出た。経営層は「研修の効果が証明された」と判断。
因果推論的分析:
交絡因子の疑い:
- 研修参加は任意。「成績の良い意欲的な営業マン」ほど参加しているのでは?
- 実際に確認すると、参加者の平均営業経験は6.2年、不参加者は3.8年。経験年数が交絡因子。
差分の差分法(DID)で検証:
| 研修前(1〜6月) | 研修後(7〜12月) | 差分 | |
|---|---|---|---|
| 参加者(50名) | 成約率38% | 成約率42% | +4pt |
| 不参加者(120名) | 成約率26% | 成約率28% | +2pt |
| 差分の差分 | +2pt |
解釈: 研修の純粋な効果は+2pt(当初の14ptの差のうち12ptは元々の実力差)。成約率+2ptは年間売上で約1,500万円の増加に相当し、研修費用200万円のROIは+650%で十分にペイする。
ただし、当初の「14ptの差がある」というデータに基づいて「もっと高額な研修に切り替えよう(年間800万円)」という議論も出ていた。因果推論で正確な効果を把握したことで、適正な投資判断ができた。
状況: 20店舗を展開する地方スーパー(年商80億円)。「手書きPOPを設置した商品は売上が平均35%高い」というデータがあり、全商品にPOPを設置するための専任スタッフ(月額30万円×3名)の採用を検討中。
因果推論的分析:
交絡因子の疑い:
- 「売れ筋商品」にPOPを設置している → 元々売れている商品だからPOPがある(逆因果)
- 「店長のイチオシ」にPOPがつく → 店長が売りたい商品は目立つ棚に置いている(棚位置が交絡因子)
A/Bテスト設計:
- 対象: 5店舗で、通常はPOPを設置しない定番商品40品を選定
- A群(20品): 手書きPOP設置
- B群(20品): POP設置なし
- 期間: 4週間
結果:
| POP設置(A群) | POP なし(B群) | |
|---|---|---|
| 平均売上増減率 | +12% | +1%(季節変動) |
| POP効果 | +11% | — |
解釈: POPの効果は+11%で、当初の+35%の約3分の1。年間の追加売上は約3,200万円と試算。スタッフ3名の人件費(年間1,080万円)を差し引いても約2,100万円のプラス。
ただし、全商品にPOPを設置すると「POP疲れ」で効果が薄れる可能性あり。まず売上上位30%の商品に絞ってPOPスタッフ1名(月30万円)で開始し、効果を測定しながら拡大する戦略を採用。因果推論なしに「+35%の効果」を信じて3名を即採用していたら、投資回収に想定の3倍の時間がかかっていた。
やりがちな失敗パターン#
- 「相関があるから因果がある」と飛躍する — 最も多いミス。データを見たら必ず「交絡因子はないか」「逆因果ではないか」を考える
- A/Bテストの結果を過信する — A/Bテストでも、実験期間が短い、サンプルが偏っている、外部環境の変化があるなどの問題が起き得る。結果の頑健性を確認する
- 因果推論の難しさを理由に何も検証しない — 完璧な因果推論ができなくても、交絡因子を意識するだけで意思決定の質は上がる。まずは「なぜこの相関が生じているか?」を考える習慣から
- 統計的に有意=実務的に重要と混同する — p値が0.05以下でも、効果の大きさが実務上意味のないレベルなら投資する価値はない。常に「効果の大きさ」と「投資対効果」をセットで判断する
まとめ#
因果推論は「相関と因果を区別する」ための思考法。データが「AとBは一緒に動く」と示したとき、それが「AがBを引き起こしている」のか、他の説明があるのかを慎重に検討する。A/Bテストが最善だが、できない場合でも因果ダイアグラムを描いて交絡因子を考えるだけで、意思決定の精度は大幅に向上する。