ひとことで言うと#
加重スコアリングモデルは、複数の評価基準それぞれに重要度の重みを設定し、各選択肢をスコアリングして加重合計で比較することで、主観的な判断を構造化する意思決定手法です。
用語の定義#
押さえておきたい用語
- 評価基準(Criteria):選択肢を評価する軸。「ビジネスインパクト」「開発コスト」「リスク」など、判断に影響する要素を列挙する
- 重み(Weight):各評価基準の相対的な重要度。合計が100%になるよう配分する。重みの設定が結果を大きく左右する
- スコア(Score):各選択肢が各基準においてどの程度優れているかを数値化したもの。通常1〜5または1〜10で評価する
- 加重スコア(Weighted Score):スコア × 重みの積。全基準の加重スコアを合計したものが最終的な評価値になる
- 感度分析(Sensitivity Analysis):重みやスコアを変化させたとき、最終結果がどう変わるかを確認する検証プロセス
全体像#
評価基準を列挙
3〜7個に絞る
→3〜7個に絞る
重みを配分
合計100%で合意
→合計100%で合意
各選択肢をスコアリング
1〜5で評価
→1〜5で評価
加重合計で比較
感度分析で検証
感度分析で検証
こんな悩みに効く#
- プロダクトバックログの優先順位が「声の大きい人」の意見で決まってしまう
- 複数のベンダーやツールを比較する際、観点がバラバラで公平な比較ができない
- 「あれも大事、これも大事」で判断が堂々巡りになり、いつまでも意思決定できない
基本の使い方#
評価基準を3〜7個に絞る
判断に影響するすべての要素をブレストで洗い出し、重複を統合して3〜7個に絞ります。基準が多すぎると評価の労力が増え、各基準の重みが薄まります。「ビジネスインパクト」「技術的実現性」「ユーザー価値」「コスト」「リスク」あたりが汎用的な出発点です。
各基準に重みを配分する
基準の重要度を合計100%で配分します。重み付けはステークホルダー間で合意を取るプロセスが重要で、ここが曖昧だと結果に納得感が出ません。ペアワイズ比較(2つずつ比べてどちらが重要か判定)で重みを導出する方法もあります。
各選択肢を基準ごとにスコアリングする
各選択肢について、各基準を1〜5(または1〜10)で評価します。複数人で独立にスコアを付けて平均を取ると、個人のバイアスが緩和されます。スコアの定義(5は何を意味するか)を事前に明文化しておくと評価がブレにくくなります。
加重合計を算出し、感度分析で検証する
各選択肢の加重スコア(スコア×重み)を合計して順位をつけます。上位2つの差が小さい場合は、重みを±10%変えたときに順位が逆転しないか感度分析で確認します。逆転するなら「重みの設定次第」であることをステークホルダーに共有し、追加の議論を行います。
具体例#
SaaS企業のロードマップ優先順位付け
B2B SaaS企業が、次の四半期に開発する機能を15件の候補から5件に絞るためにスコアリングモデルを導入。評価基準はビジネスインパクト(35%)、顧客要望数(25%)、開発工数(20%)、戦略適合性(20%)の4つ。PM・エンジニアリードリード・CSリードの3名が独立にスコアリングし平均化。上位5件のうち、2位と3位の差がわずか0.2ポイントだったため感度分析を実施。ビジネスインパクトの重みを30%に下げると順位が逆転することが判明し、経営陣を含めて「今期はインパクト重視か、戦略適合性重視か」を議論した結果、戦略適合性を重視する判断に至った。
ERPベンダーの選定
製造業(従業員600名)が、基幹システムの刷新にあたり4社のERPベンダーを比較。評価基準は機能適合度(30%)、導入実績(20%)、カスタマイズ性(15%)、コスト(20%)、サポート体制(15%)の5つ。情報システム部門5名と現場代表3名の8名が独立スコアリングを行った。A社の加重合計が3.82で最高だったが、コスト基準のスコアが2.0と低く、予算超過のリスクがあった。2位のB社(加重合計3.65)はコスト基準が4.0で全体のバランスが良く、感度分析でコストの重みを25%に上げるとB社が逆転した。最終的にB社を選定し、導入費用を約2,000万円抑えた。
自治体のDXプロジェクト選定
人口25万人の地方自治体が、限られた予算(年間8,000万円)でDXプロジェクト9件の中から3件を選定。評価基準は住民サービス向上度(35%)、業務効率化効果(25%)、実現可能性(20%)、費用対効果(20%)。庁内のDX推進委員会(各部門の課長級7名)がスコアリング。上位3件は窓口オンライン化(加重合計4.12)、公共施設予約システム(3.87)、文書管理電子化(3.71)となった。4位の防災情報共有(3.68)は文書管理と僅差だったが、感度分析で住民サービスの重みを40%に上げると逆転。最終的には防災の優先度が政策的に高いと判断し、3位と入れ替えて採択した。
やりがちな失敗パターン#
| 失敗 | 原因 | 対策 |
|---|---|---|
| 重みを全基準均等にしてしまう | 「どれも重要」と重み付けの議論を避けた | 重みに差をつけることが目的。最低でも最重要基準と最低基準で2倍以上の差をつける |
| スコアの定義が曖昧で評価がブレる | 「5点は何を意味するか」を決めずに各自の感覚で採点した | 各スコアの定義(例: 5=年間売上10%以上向上、3=5%程度、1=影響なし)を事前に明文化する |
| 結果を盲目的に信じる | 加重合計の数字だけで判断し、定性的な考慮を省略する | スコアリングモデルは「議論の構造化ツール」であり、最終判断の唯一の根拠にしない |
| 感度分析を省略する | 上位の差が僅差でも「1位だから」で決定する | 上位2〜3件の差が10%以内なら必ず感度分析を行い、重みの変動に対するロバスト性を確認する |
まとめ#
加重スコアリングモデルの最大の価値は「何を重視するかの合意形成」を強制するところにあります。重みの配分をめぐる議論自体が、ステークホルダー間の優先度認識のズレを表面化させます。スコアの数値を絶対視するのではなく、「なぜこの重みか」「なぜこのスコアか」の対話を促すツールとして使うのが正しい活用法です。僅差の判断には感度分析を添え、定量と定性の両面で納得感のある意思決定を目指してください。