ひとことで言うと#
タスクの所要時間を「絶対値(○日)」ではなく**「相対的な大きさ(ストーリーポイント)」で見積もり**、チームのベロシティ(実績値)を使って計画を立てる手法。不確実性を前提とした現実的な予測を可能にする。
押さえておきたい用語#
- ストーリーポイント(Story Point)
- タスクの作業量・複雑さ・不確実性を総合した相対的な大きさのこと。時間ではなく「基準タスクと比べてどれくらいか」で測る。
- ベロシティ(Velocity)
- チームが1スプリントで完了できるストーリーポイントの合計値を指す。実績に基づく予測指標であり、目標やノルマにはしない。
- プランニングポーカー(Planning Poker)
- チーム全員が同時にカードを出して見積もりを行うセッション手法である。見積もり値のズレから認識の違いを引き出し、合意形成につなげる。
- フィボナッチ数列(Fibonacci Sequence)
- 1, 2, 3, 5, 8, 13, 21…のように前の2つの数を足してできる数列のこと。大きくなるほど精度が下がるため、粗い粒度で見積もるのに適している。
アジャイル見積もりの全体像#
こんな悩みに効く#
- 見積もりが毎回外れて、スケジュールの信頼性が低い
- 「○日で終わります」という約束が守られず、チームへの信頼が低下している
- 見積もりに時間がかかりすぎる
基本の使い方#
**チームが共通認識を持てる「基準ストーリー」**を設定する。
- 過去に完了した典型的なストーリーを1つ選ぶ
- そのストーリーのポイントを基準値(例: 3ポイント)とする
- 「これより大きいか小さいか」で相対的に他のストーリーを見積もる
ポイント: ストーリーポイントは作業量(労力)+ 複雑さ + 不確実性の総合値。時間ではない。
チーム全員でプランニングポーカーを実施する。
- フィボナッチ数列(1, 2, 3, 5, 8, 13, 21)のカードを使う
- ストーリーの説明を聞き、全員が同時にカードを出す
- 見積もりが大きく異なるメンバー同士で根拠を議論する
- 認識を合わせた後、再度カードを出して収束させる
ポイント: 議論こそがプランニングポーカーの本質。見積もり値より、認識のすり合わせが重要。
スプリントごとに完了したストーリーポイントの合計を記録する。
- 直近3〜5スプリントのベロシティの平均を「チームのベロシティ」とする
- 完了(Done)したストーリーのみカウントする。部分完了は含めない
- ベロシティは予測に使うもの。目標やノルマにしない
ポイント: ベロシティは実績ベースの予測ツール。チーム間で比較する指標ではない。
バックログの総ポイントとベロシティからリリース時期を予測する。
- 残りのバックログ合計ポイント ÷ ベロシティ = 必要スプリント数
- 楽観・悲観の幅を持たせる(例: ベロシティの±20%で計算)
- スプリントごとに計画を更新し、予測精度を上げていく
ポイント: 予測は「範囲」で伝える。「5〜7スプリントで完了見込み」のように幅を持たせる。
具体例#
状況: 従業員60名のモバイルアプリ開発企業。5名の開発チームが新機能15ストーリーのリリース計画を策定する。
基準ストーリー: 「ユーザープロフィール編集画面」を3ポイントと設定。
プランニングポーカー実施結果:
| ストーリー | 初回見積もり | 議論後 |
|---|---|---|
| ログイン機能改修 | 全員一致 2pt | 2pt |
| ダッシュボード新規作成 | 5ptと13ptに分裂 | 8pt(UI複雑さで合意) |
| 外部API連携 | 8ptと21ptに分裂 | 13pt(不確実性高) |
| バックログ合計 | — | 72pt |
ベロシティ実績: 直近5スプリント → 18, 22, 20, 16, 24 → 平均20pt/sprint
リリース予測:
- 楽観(24pt): 72 ÷ 24 = 3スプリント(6週間)
- 標準(20pt): 72 ÷ 20 = 3.6スプリント(7.2週間)
- 悲観(16pt): 72 ÷ 16 = 4.5スプリント(9週間)
「7〜9週間でリリース可能」と範囲で報告し、実際は5スプリント目前半で完了。当初予測の範囲内に着地でき、ステークホルダーの信頼度が大幅に向上した。
状況: 従業員200名のBtoB SaaS企業。8名の開発チームが次クォーター(3ヶ月・6スプリント)の開発計画を策定する。プロダクトオーナーは40ストーリーを候補として用意。
見積もりセッション: 40ストーリーを2時間のセッションで見積もり。合計218pt。
ベロシティ実績: 直近6スプリントの平均ベロシティは35pt。ただしメンバー1名の異動が決まっており、次クォーターは7名体制。補正後ベロシティ: 35 × (7/8) ≒ 30pt。
キャパシティとのすり合わせ:
- 6スプリント × 30pt = 180pt分を消化可能
- 218pt - 180pt = 38pt分は次クォーターに繰り越し
- 優先度の低い5ストーリー(計42pt)をスコープアウト
| 区分 | ストーリー数 | 合計ポイント |
|---|---|---|
| 今クォーター実施 | 35 | 176pt |
| 次クォーター繰り越し | 5 | 42pt |
ベロシティの補正とスコープ調整により、無理のないクォーター計画を策定できた。実際の消化は182ptで計画との誤差はわずか3.4%。「まず約束できる量を明確にする」姿勢が、営業チームとの連携をスムーズにした鍵だった。
状況: 人口12万人の地方自治体。DX推進室3名+外部ベンダー4名の混成チームで住民向けオンライン申請システムの改修(18ストーリー)を見積もる。チームはアジャイル初導入。
導入の工夫: アジャイル経験のないメンバーが多いため、最初の3スプリントは「お試し期間」として見積もり精度の変化を追跡。
見積もり精度の変化:
| スプリント | 計画ポイント | 完了ポイント | 達成率 |
|---|---|---|---|
| Sprint 1 | 25pt | 12pt | 48% |
| Sprint 2 | 18pt | 15pt | 83% |
| Sprint 3 | 16pt | 16pt | 100% |
| Sprint 4以降 | 17pt平均 | 16pt平均 | 94% |
スプリント1の振り返り: 「時間の見積もり」と混同していたことが原因。基準ストーリーを再設定し、「3ptは申請フォーム1画面の改修」と具体化。
最初のスプリントでは達成率48%だったが、3スプリント目には100%に到達。アジャイル未経験のチームでも、ベロシティの実績を活用することで3回のスプリントで見積もり精度を安定させることができた。
やりがちな失敗パターン#
- ストーリーポイントを時間に換算する — 「1pt = 1日」と定義した瞬間、相対見積もりのメリットが失われる。ポイントはあくまで相対的な大きさとして運用する
- ベロシティを目標値にする — 「ベロシティを毎スプリント上げよう」とすると、ポイントのインフレが起きる。ベロシティは計測値であって目標値ではない
- 大きすぎるストーリーをそのまま見積もる — 13pt以上のストーリーは不確実性が高く、見積もり精度が低い。8pt以上は分割を検討する
- 見積もりを1人で行う — 担当者だけの見積もりは視点が偏る。チーム全員で見積もることで、隠れた複雑さや依存関係が見つかる
まとめ#
アジャイル見積もりは「正確な予測」ではなく「継続的に精度を上げる予測」のアプローチ。相対見積もり(ストーリーポイント)で見積もりの労力を減らし、ベロシティの実績データで予測の根拠を客観化する。チームの実績に基づくため、使い続けるほど予測精度が向上していく点が最大の強みとなる。