観察データから因果を推定したいときはどうすればいい？

「操作変数法」フレームワークが役立ちます。内生性問題を外生的操作変数で解決し因果効果を推定する手法

内生性バイアスを除去したいときはどうすればいい？

「操作変数法」フレームワークが役立ちます。内生性問題を外生的操作変数で解決し因果効果を推定する手法

ランダム化実験ができない状況で因果分析したいときはどうすればいい？

「操作変数法」フレームワークが役立ちます。内生性問題を外生的操作変数で解決し因果効果を推定する手法

操作変数法

ひとことで言うと
#

原因変数（X）と結果変数（Y）の間に観測されない交絡因子がある場合、Xに影響を与えるがYには直接影響しない**「操作変数（IV）」**を使って因果効果を推定する計量経済学の手法。ランダム化実験ができない観察データから、バイアスのない因果効果を推定するための代表的アプローチ。

押さえておきたい用語
#

押さえておきたい用語

内生性（Endogeneity）: 原因変数Xが誤差項と相関している状態。観測されない交絡因子や逆因果が原因で生じ、通常の回帰分析では因果効果を正しく推定できなくなる。
操作変数（Instrumental Variable / IV）: Xに影響を与えるが、Y には操作変数→X→Y の経路を通じてのみ影響する変数。「X を外生的に動かすスイッチ」のような役割を果たす。
関連性条件（Relevance Condition）: 操作変数が原因変数Xと十分に強い相関を持つという条件。この条件が弱い（弱い操作変数）と推定が不安定になる。
排除制約（Exclusion Restriction）: 操作変数が結果変数Yに対してXを経由する以外のルートでは影響しないという条件。この条件は検定できないため、理論的な根拠が必要。
二段階最小二乗法（2SLS）: IV推定の標準的な手法。第1段階で操作変数を使ってXの予測値を算出し、第2段階でその予測値を使ってYとの関係を推定する。

操作変数法の全体像
#

操作変数法：操作変数を使って内生性バイアスを除去する

操作変数法の実施フロー

内生性を特定する

XとYの間に未観測の交絡がないか検討

→

操作変数の候補を見つける

関連性と排除制約を満たす変数を探す

→

2SLSで因果効果を推定

第1段階・第2段階の回帰を実行

→

★

妥当性を検証する

弱操作変数テスト・過剰識別検定を実施

こんな悩みに効く
#

「Xが増えるとYが増える」という相関は見えるが、因果なのか交絡なのか判断できない
倫理的・実務的な理由でランダム化実験が実施できない
通常の回帰分析では内生性バイアスが避けられないとわかっている
観察データから政策やビジネス施策の真の効果を推定したい

基本の使い方
#

内生性の存在を特定する

原因変数Xと結果変数Yの間に**観測されない交絡因子（省略変数）**がないかを理論的に検討する。

「XとYの両方に影響する、データに含まれていない変数は何か」を列挙する
例: 「教育年数と賃金」の関係では、個人の能力・家庭環境・モチベーションなどが未観測の交絡因子
交絡が疑われるなら、通常の回帰分析の係数は因果効果として解釈できない
ハウスマン検定で内生性の存在を統計的に検定できる

操作変数の候補を見つける

以下の2つの条件を満たす変数Zを探す。これが操作変数法で最も難しいステップ。

関連性条件: ZがXと十分に強い相関を持つ（F統計量 > 10が目安）
排除制約: ZがYに対してXを経由する以外のルートで影響しない

良い操作変数の例:

教育年数の操作変数: 近隣の大学数、義務教育年数の法改正
喫煙量の操作変数: タバコ税の変動
ECサイト利用量の操作変数: サイトの技術障害（外生的なアクセス阻害）

操作変数は「自然実験」のように、Xをランダムに動かしてくれる外生的なショックであることが理想。

二段階最小二乗法（2SLS）で推定する

操作変数を使って因果効果を推定する。

第1段階（First Stage）: 操作変数ZでXを説明する回帰を実行し、Xの予測値（X̂）を算出

X = γ₀ + γ₁Z + ν
ここでF統計量が10以上あるか確認（弱操作変数テスト）

第2段階（Second Stage）: X̂を使ってYを説明する回帰を実行

Y = β₀ + β₁X̂ + ε
β₁が因果効果の推定値（LATE: 局所的平均処置効果）
統計ソフト（Stata: ivregress 2sls, R: ivreg, Python: linearmodels）を使えば2段階を自動で実行できる

推定結果の妥当性を検証する

操作変数法の結果が信頼できるか、複数の診断テストで確認する。

弱操作変数テスト: 第1段階のF統計量が10を大きく下回る場合、推定が不安定（バイアスが大きくなる）
過剰識別検定（Sargan/Hansen検定）: 操作変数が2つ以上ある場合、排除制約が成立しているかを検定できる
OLS推定値との比較: IV推定値とOLS推定値を比較し、バイアスの方向と大きさを議論する
頑健性チェック: 操作変数のセットを変えたり、コントロール変数を追加したりして、推定値の安定性を確認する

具体例
#

例1：広告支出がアプリダウンロード数に与える因果効果を推定する

モバイルアプリの月間広告支出とダウンロード数の関係を分析したい。しかし、「売上が好調な月ほど広告予算を増やす」という逆因果と、「季節的なアプリ需要」という交絡が疑われた。

問題の構造:

X: 月間広告支出（万円）
Y: 月間ダウンロード数
交絡: アプリの人気度（広告支出にもダウンロード数にも影響）
逆因果: ダウンロード数が多い月に広告支出を増やす経営判断

OLS回帰では広告支出1万円あたり**+52ダウンロード**と推定されたが、内生性バイアスで過大推定の疑いがあった。

操作変数の選定: 広告プラットフォーム側の「広告枠の供給量変動」を操作変数として利用。広告枠の供給量は競合他社の入札状況やプラットフォームのアルゴリズム変更に依存し、自社のアプリ人気とは無関係だが、自社の広告支出（入札が通るかどうか）には直接影響する。

2SLSの結果:

推定法	広告1万円あたりの効果	95%信頼区間
OLS	+52ダウンロード	[38, 66]
2SLS（IV）	+31ダウンロード	[18, 44]

第1段階のF統計量: 24.3（> 10、弱操作変数の懸念なし）
OLS推定が約40%過大推定していたことが判明

ビジネスインパクト: 月間広告予算500万円の場合、OLS推定では26,000ダウンロードだがIV推定では15,500ダウンロード。広告のROI計算を修正した結果、一部の低効率チャネルへの投資を見直し、全体のCPIが18%改善した。

例2：リモートワーク導入が生産性に与えた因果効果を推定する

従業員2,000名の企業。リモートワーク制度を導入したが、「生産性が上がったのか下がったのか」で経営層の意見が割れていた。問題は、リモートワークを積極的に利用する社員とオフィス勤務を選ぶ社員の間に、自己選択バイアスがあること。

問題の構造:

X: リモートワーク比率（月の出社日数に対するリモート日数の割合）
Y: 生産性指標（タスク完了数/月）
交絡: 自律性・デジタルスキル・職種特性（リモートワーク選択にも生産性にも影響）

OLS回帰ではリモートワーク比率10%増加あたり**+3.2%の生産性向上**と推定されたが、「もともと自律的で生産性が高い人がリモートを選んでいる」バイアスが疑われた。

操作変数の選定: 「自宅から最寄りオフィスまでの通勤時間」を操作変数として利用。通勤時間が長いほどリモートワークを選択しやすい（関連性条件）が、通勤時間自体は仕事の生産性に直接影響しない（排除制約）。

2SLSの結果:

推定法	リモート比率10%増の効果	p値
OLS	+3.2%	0.001
2SLS（IV）	+1.8%	0.03

第1段階: 通勤時間が10分増えるとリモート比率が6.2%上昇（F統計量=31.5）
OLS推定値の約**44%**が自己選択バイアスだった

結論: リモートワーク自体には**+1.8%/リモート比率10%増**の生産性向上効果があるが、OLS推定ほど大きくはない。経営判断として、「リモートワークには正の効果があるが、全員フルリモートにする必要はない。ハイブリッドが最適」という現実的な結論を得た。

例3：価格変更が需要に与える因果効果を推定する（需要の価格弾力性）

食品ECサイトで、商品の価格と販売数量の関係を分析したい。通常の回帰分析では、需要が高い商品ほど値上げされる（需要→価格の逆因果）ため、価格弾力性が過小推定されるリスクがあった。

問題の構造:

X: 商品価格（対数）
Y: 販売数量（対数）
交絡: 商品の品質・ブランド力（価格と販売数量の両方に影響）
逆因果: 販売好調な商品の値上げ

操作変数の選定: 「原材料の国際相場の変動」を操作変数として利用。原材料コストの変動は仕入れ価格を通じて販売価格に影響する（関連性条件）が、消費者の購買行動には原材料コスト自体は直接影響しない（排除制約）。

分析対象: オリーブオイル12品目×36か月のパネルデータ

2SLSの結果:

推定法	価格弾力性	95%信頼区間
OLS	-0.8	[-1.1, -0.5]
2SLS（IV）	-1.4	[-1.9, -0.9]

第1段階: 原材料価格10%上昇 → 販売価格4.2%上昇（F統計量=18.7）
OLSは弾力性を過小推定（-0.8）していた。IV推定では-1.4であり、価格弾力的（1%の値上げで1.4%の販売数量減少）

ビジネスへの示唆: 価格弾力性が-1.4ということは、値上げは売上総額を減らす。マーケティングチームが計画していた5%の値上げは、販売数量を約7%減少させ、売上総額を約2.4%減少させると予測。値上げではなくコスト削減にフォーカスする戦略に転換した。

やりがちな失敗パターン
#

排除制約を検証せずに使う — 排除制約は統計的に検定できない（過剰識別検定は必要条件のみ）。理論的な根拠を示し、「なぜこの操作変数はYに直接影響しないか」を論理的に説明する義務がある
弱い操作変数を使う — 第1段階のF統計量が10を下回る操作変数は、IV推定値を大きくバイアスさせる（場合によってはOLS推定値よりも悪い）。弱い操作変数を検出したら、別の操作変数を探すか、弱操作変数に頑健な推定法（LIML等）を使う
操作変数を「統計的に便利な変数」として探す — 操作変数は統計的テクニックではなく、因果の構造に基づいて選ぶもの。「相関があるから使える」のではなく、「因果メカニズムとして排除制約が成立する」ことが必要
LATEの解釈を間違える — IV推定値は「操作変数に反応してXが変化した人」の局所的な因果効果（LATE）であり、全員の平均的因果効果（ATE）ではない。一般化の範囲に注意する

まとめ
#

操作変数法は、未観測の交絡因子や逆因果によって通常の回帰分析では因果効果を推定できない場合に、外生的な変動源（操作変数）を利用してバイアスを除去する手法である。成否を分けるのは「良い操作変数を見つけられるか」に尽きる。関連性条件はデータで検証できるが、排除制約は理論的な根拠が必要であり、ここが操作変数法の最大の難所である。ランダム化実験ができない状況で因果に迫るための強力なツールだが、操作変数の質が分析の質を決めることを忘れてはならない。

操作変数法

ひとことで言うと#

押さえておきたい用語#

操作変数法の全体像#

こんな悩みに効く#

基本の使い方#

具体例#

やりがちな失敗パターン#

まとめ#

ひとことで言うと
#

押さえておきたい用語
#

操作変数法の全体像
#

こんな悩みに効く
#

基本の使い方
#

具体例
#

やりがちな失敗パターン
#

まとめ
#