見積もりの精度を上げたいときはどうすればいい？

「アジャイル見積もり」フレームワークが役立ちます。相対見積もりとチームの実績データに基づき、不確実性を前提とした現実的な見積もりを行う手法

不確実性を前提に計画を立てたいときはどうすればいい？

「アジャイル見積もり」フレームワークが役立ちます。相対見積もりとチームの実績データに基づき、不確実性を前提とした現実的な見積もりを行う手法

見積もりが当たらないときはどうすればいい？

「アジャイル見積もり」フレームワークが役立ちます。相対見積もりとチームの実績データに基づき、不確実性を前提とした現実的な見積もりを行う手法

アジャイル見積もり

ひとことで言うと
#

タスクの所要時間を「絶対値（○日）」ではなく**「相対的な大きさ（ストーリーポイント）」で見積もり**、チームのベロシティ（実績値）を使って計画を立てる手法。不確実性を前提とした現実的な予測を可能にする。

押さえておきたい用語
#

押さえておきたい用語

ストーリーポイント（Story Point）: タスクの作業量・複雑さ・不確実性を総合した相対的な大きさのこと。時間ではなく「基準タスクと比べてどれくらいか」で測る。
ベロシティ（Velocity）: チームが1スプリントで完了できるストーリーポイントの合計値を指す。実績に基づく予測指標であり、目標やノルマにはしない。
プランニングポーカー（Planning Poker）: チーム全員が同時にカードを出して見積もりを行うセッション手法である。見積もり値のズレから認識の違いを引き出し、合意形成につなげる。
フィボナッチ数列（Fibonacci Sequence）: 1, 2, 3, 5, 8, 13, 21…のように前の2つの数を足してできる数列のこと。大きくなるほど精度が下がるため、粗い粒度で見積もるのに適している。

アジャイル見積もりの全体像
#

相対見積もり × ベロシティ = 現実的な計画

アジャイル見積もりの進め方フロー

基準を決める

過去のストーリーを基準値に設定

→

ポーカーで見積もり

全員同時にカードを出して議論

→

ベロシティ計測

完了ポイントの実績を蓄積

→

★

リリース予測

範囲を持たせた現実的な計画

こんな悩みに効く
#

見積もりが毎回外れて、スケジュールの信頼性が低い
「○日で終わります」という約束が守られず、チームへの信頼が低下している
見積もりに時間がかかりすぎる

基本の使い方
#

ステップ1: 基準となるストーリーを決める

**チームが共通認識を持てる「基準ストーリー」**を設定する。

過去に完了した典型的なストーリーを1つ選ぶ
そのストーリーのポイントを基準値（例: 3ポイント）とする
「これより大きいか小さいか」で相対的に他のストーリーを見積もる

ポイント: ストーリーポイントは作業量（労力）+ 複雑さ + 不確実性の総合値。時間ではない。

ステップ2: プランニングポーカーで見積もる

チーム全員でプランニングポーカーを実施する。

フィボナッチ数列（1, 2, 3, 5, 8, 13, 21）のカードを使う
ストーリーの説明を聞き、全員が同時にカードを出す
見積もりが大きく異なるメンバー同士で根拠を議論する
認識を合わせた後、再度カードを出して収束させる

ポイント: 議論こそがプランニングポーカーの本質。見積もり値より、認識のすり合わせが重要。

ステップ3: ベロシティを計測する

スプリントごとに完了したストーリーポイントの合計を記録する。

直近3〜5スプリントのベロシティの平均を「チームのベロシティ」とする
完了（Done）したストーリーのみカウントする。部分完了は含めない
ベロシティは予測に使うもの。目標やノルマにしない

ポイント: ベロシティは実績ベースの予測ツール。チーム間で比較する指標ではない。

ステップ4: ベロシティを使ってリリース計画を立てる

バックログの総ポイントとベロシティからリリース時期を予測する。

残りのバックログ合計ポイント ÷ ベロシティ = 必要スプリント数
楽観・悲観の幅を持たせる（例: ベロシティの±20%で計算）
スプリントごとに計画を更新し、予測精度を上げていく

ポイント: 予測は「範囲」で伝える。「5〜7スプリントで完了見込み」のように幅を持たせる。

具体例
#

例1：モバイルアプリ開発チームが新機能リリースを計画する

状況: 従業員60名のモバイルアプリ開発企業。5名の開発チームが新機能15ストーリーのリリース計画を策定する。

基準ストーリー: 「ユーザープロフィール編集画面」を3ポイントと設定。

プランニングポーカー実施結果:

ストーリー	初回見積もり	議論後
ログイン機能改修	全員一致 2pt	2pt
ダッシュボード新規作成	5ptと13ptに分裂	8pt（UI複雑さで合意）
外部API連携	8ptと21ptに分裂	13pt（不確実性高）
バックログ合計	—	72pt

ベロシティ実績: 直近5スプリント → 18, 22, 20, 16, 24 → 平均20pt/sprint

リリース予測:

楽観（24pt）: 72 ÷ 24 = 3スプリント（6週間）
標準（20pt）: 72 ÷ 20 = 3.6スプリント（7.2週間）
悲観（16pt）: 72 ÷ 16 = 4.5スプリント（9週間）

「7〜9週間でリリース可能」と範囲で報告し、実際は5スプリント目前半で完了。当初予測の範囲内に着地でき、ステークホルダーの信頼度が大幅に向上した。

例2：BtoB SaaS企業がクォーター計画をアジャイル見積もりで立てる

状況: 従業員200名のBtoB SaaS企業。8名の開発チームが次クォーター（3ヶ月・6スプリント）の開発計画を策定する。プロダクトオーナーは40ストーリーを候補として用意。

見積もりセッション: 40ストーリーを2時間のセッションで見積もり。合計218pt。

ベロシティ実績: 直近6スプリントの平均ベロシティは35pt。ただしメンバー1名の異動が決まっており、次クォーターは7名体制。補正後ベロシティ: 35 × (7/8) ≒ 30pt。

キャパシティとのすり合わせ:

6スプリント × 30pt = 180pt分を消化可能
218pt - 180pt = 38pt分は次クォーターに繰り越し
優先度の低い5ストーリー（計42pt）をスコープアウト

区分	ストーリー数	合計ポイント
今クォーター実施	35	176pt
次クォーター繰り越し	5	42pt

ベロシティの補正とスコープ調整により、無理のないクォーター計画を策定できた。実際の消化は182ptで計画との誤差はわずか3.4%。「まず約束できる量を明確にする」姿勢が、営業チームとの連携をスムーズにした鍵だった。

例3：地方自治体のDX推進チームがシステム改修を見積もる

状況: 人口12万人の地方自治体。DX推進室3名＋外部ベンダー4名の混成チームで住民向けオンライン申請システムの改修（18ストーリー）を見積もる。チームはアジャイル初導入。

導入の工夫: アジャイル経験のないメンバーが多いため、最初の3スプリントは「お試し期間」として見積もり精度の変化を追跡。

見積もり精度の変化:

スプリント	計画ポイント	完了ポイント	達成率
Sprint 1	25pt	12pt	48%
Sprint 2	18pt	15pt	83%
Sprint 3	16pt	16pt	100%
Sprint 4以降	17pt平均	16pt平均	94%

スプリント1の振り返り: 「時間の見積もり」と混同していたことが原因。基準ストーリーを再設定し、「3ptは申請フォーム1画面の改修」と具体化。

最初のスプリントでは達成率48%だったが、3スプリント目には100%に到達。アジャイル未経験のチームでも、ベロシティの実績を活用することで3回のスプリントで見積もり精度を安定させることができた。

やりがちな失敗パターン
#

ストーリーポイントを時間に換算する — 「1pt = 1日」と定義した瞬間、相対見積もりのメリットが失われる。ポイントはあくまで相対的な大きさとして運用する
ベロシティを目標値にする — 「ベロシティを毎スプリント上げよう」とすると、ポイントのインフレが起きる。ベロシティは計測値であって目標値ではない
大きすぎるストーリーをそのまま見積もる — 13pt以上のストーリーは不確実性が高く、見積もり精度が低い。8pt以上は分割を検討する
見積もりを1人で行う — 担当者だけの見積もりは視点が偏る。チーム全員で見積もることで、隠れた複雑さや依存関係が見つかる

まとめ
#

アジャイル見積もりは「正確な予測」ではなく「継続的に精度を上げる予測」のアプローチ。相対見積もり（ストーリーポイント）で見積もりの労力を減らし、ベロシティの実績データで予測の根拠を客観化する。チームの実績に基づくため、使い続けるほど予測精度が向上していく点が最大の強みとなる。

アジャイル見積もり

ひとことで言うと#

押さえておきたい用語#

アジャイル見積もりの全体像#

こんな悩みに効く#

基本の使い方#

具体例#

やりがちな失敗パターン#

まとめ#

ひとことで言うと
#

押さえておきたい用語
#

アジャイル見積もりの全体像
#

こんな悩みに効く
#

基本の使い方
#

具体例
#

やりがちな失敗パターン
#

まとめ
#