エンジニアリング生産性メトリクス

英語名 Engineering Productivity Metrics
読み方 エンジニアリング プロダクティビティ メトリクス
難易度
所要時間 30分〜1時間
提唱者 Microsoft Research / DORA
目次

ひとことで言うと
#

DORAとSPACEフレームワークを組み合わせ、デリバリー速度だけでなく満足度・コミュニケーション・効率性を含めた「開発者の生産性」を包括的に測定する手法。

押さえておきたい用語
#

押さえておきたい用語
SPACE Framework
Satisfaction・Performance・Activity・Communication・Efficiencyの5次元で開発者生産性を測定するMicrosoft Research発のフレームワークを指す。
Satisfaction(満足度)
開発者が仕事・ツール・チームに対して感じる充実感や満足の度合い。サーベイで計測する。
Activity(アクティビティ)
コミット数・PR数・デプロイ数など、定量的に観測可能な行動量を指す。単独では生産性を測れない。
Developer Velocity(デベロッパー ベロシティ)
開発者が価値を生み出す速度と品質の掛け合わせ。McKinseyが提唱した概念である。
Perception Metrics(知覚メトリクス)
サーベイやインタビューで集める主観的な評価指標。客観指標では捉えられない問題を検出する手法。

エンジニアリング生産性メトリクスの全体像
#

SPACE × DORA:生産性の5次元+4指標
S: 満足度eNPSツール満足度仕事の充実感サーベイで計測P: パフォーマンス変更失敗率MTTR顧客影響度品質・信頼性A: アクティビティデプロイ頻度PR数・レビュー数コミット頻度定量的な行動量C: コミュニケーションレビュー応答時間ドキュメント充実度知識共有の頻度協働の質E: 効率性リードタイム手戻り率CI実行時間プロセスの効率5次元のうち最低3次元を同時に計測し、偏りを防ぐ客観指標(Activity・Efficiency)と主観指標(Satisfaction)の組み合わせが重要
生産性メトリクス導入の進め方フロー
1
目的の明確化
何のために測るかをチームと合意する
2
3次元以上を選定
SPACEから最低3次元+計測方法を決める
3
ベースライン計測
現状の数値を取得し改善目標を設定する
継続的な振り返り
月次で指標を確認しアクションにつなげる

こんな悩みに効く
#

  • 開発者のコミット数やPR数で生産性を測ろうとして現場から反発された
  • DORA指標だけでは「開発者が幸せに働けているか」が見えない
  • 施策を打っても生産性が上がったのかどうか判断できない

基本の使い方
#

計測の目的をチームと合意する
「個人の評価」ではなく「チームの改善」のために測ることを明確にする。目的が不明確なまま指標を導入すると、監視されていると感じた開発者のモチベーションが下がる。
SPACEの5次元から最低3つを選ぶ
Activity(行動量)だけ、Performance(品質)だけでは偏る。SatisfactionとEfficiencyなど、客観指標と主観指標を必ず組み合わせる。初期は3次元で始め、運用に慣れたら追加する。
四半期サーベイと自動計測を組み合わせる
客観指標(デプロイ頻度・リードタイム・CI時間)はCI/CDやGitHubから自動取得。主観指標(満足度・認知負荷・コミュニケーションの質)は四半期サーベイで収集。両方を同じダッシュボードに並べて分析する。

具体例
#

例1:SaaS企業がSPACE導入で隠れた生産性低下を発見する

エンジニア70名のBtoB SaaS。DORA指標は「High」レベルで問題なしだったが、エンジニアの退職が四半期で6名と増加傾向にあった。

SPACEの5次元で計測を開始。

次元指標
SatisfactioneNPS+8(前年+32)
Performance変更失敗率4%(良好)
Activityデプロイ頻度日2回(良好)
Communicationレビュー応答時間平均8時間
Efficiency手戻り率28%(高い)

手戻り率の高さとeNPSの低下に相関があった。原因を調査すると、要件定義フェーズの不足で「作ってからやり直し」が頻発していた。PdMとの設計レビューを必須にした結果、手戻り率が 28% → 11% に減少し、eNPSは +8 → +25 に回復した。

例2:ゲーム会社がActivity指標の誤用を修正する

エンジニア45名のゲーム会社。マネジメント層が「コミット数」をKPIに設定。その結果、1行だけの修正や不要なリファクタリングでコミットを水増しする開発者が出始めた。

コミット数KPIを廃止し、SPACEベースの複合指標に移行。

旧指標新指標(3次元)
コミット数/人Performance: バグ密度
Efficiency: 機能あたりリードタイム
Satisfaction: 開発者NPS

Activity単独ではなくPerformance・Efficiencyと組み合わせたことで、ゲーミングがなくなった。「機能あたりリードタイム」は四半期で 12日 → 8日 に改善し、品質を落とさずにスピードが上がった。

例3:金融機関がCommunication次元で組織の壁を可視化する

エンジニア150名の銀行系システム子会社。部門間の連携が悪く、API仕様の認識齟齬によるバグが月 15件 発生していた。

SPACE のCommunication次元に着目し、以下を計測。

指標計測値
部門間レビュー応答時間平均4.2日
共有ドキュメント更新頻度月1.3回
チーム横断ミーティング参加率38%

ドキュメント更新頻度と部門間バグ数に強い負の相関を発見。API仕様のライブドキュメント化 + 週次の15分シンクミーティングを導入した。6ヶ月後、部門間バグは 月15件 → 月3件 に減少。レビュー応答時間も 4.2日 → 1.1日 に改善している。

やりがちな失敗パターン
#

  1. Activity指標だけで生産性を語る — コミット数・PR数は行動量であって価値ではない。必ずPerformanceやSatisfactionと組み合わせる
  2. サーベイの頻度が高すぎる — 月次サーベイは回答疲れを招く。四半期が適切。パルスサーベイ(3問以内)なら月次でも可
  3. 計測開始と同時にKPI化する — 最初の四半期はベースライン取得に徹する。いきなり目標値を設定すると現実離れした数字になる
  4. チーム間で指標を横並びで比較する — 新規開発と保守運用では数値の意味が全く異なる。チームの成長トレンドを自分自身と比較する

まとめ
#

SPACEフレームワークの5次元(Satisfaction・Performance・Activity・Communication・Efficiency)から最低3次元を選び、DORA指標と組み合わせて開発者の生産性を包括的に測定する。客観指標と主観指標の両方を用い、Activity単独での評価を避けることがゲーミング防止の要になる。四半期サーベイと自動計測を組み合わせ、月次レビューで改善アクションに落とし込む運用が定着すれば、持続的な生産性向上が実現する