ひとことで言うと#
自社プロダクトのUXを定量指標(タスク成功率、完了時間、エラー率、満足度スコアなど)で計測し、過去の自社データや競合製品と比較することで、改善の優先順位と進捗を客観的に把握する手法。「UXが良くなった気がする」を「UXが数値でこれだけ改善した」に変える。
押さえておきたい用語#
- タスク成功率(Task Success Rate)
- ユーザーが指定されたタスクを正しく完了できた割合。UXベンチマークで最も基本的な指標。
- タスク完了時間(Time on Task)
- タスクの開始から完了までにかかった時間。短いほど効率的なUXを示す。
- エラー率(Error Rate)
- タスク遂行中にユーザーが犯した誤操作の割合。UIのわかりにくさを反映する。
- SUS(System Usability Scale)
- 10項目のアンケートで算出するユーザビリティの主観スコア。0〜100点で評価し、業界平均は68点。
- NPS(Net Promoter Score)
- 「この製品を他者に薦めるか」を0〜10で聞き、推奨者と批判者の差で算出するロイヤルティ指標。
UXベンチマーキングの全体像#
こんな悩みに効く#
- UX改善の成果を経営層に説明できない(「使いやすくなりました」だけでは通じない)
- 競合と比べて自社のUXがどの水準にあるか客観的に把握したい
- リデザイン前後でUXが本当に良くなったか、感覚ではなく数値で確認したい
- UX改善の優先順位を「声の大きい人の意見」ではなくデータで決めたい
基本の使い方#
何を測るかを先に決めないと、データが散漫になる。
- 行動指標(客観): タスク成功率、完了時間、エラー率、クリック数
- 態度指標(主観): SUS、NPS、CSAT(顧客満足度)、SEQ(Single Ease Question)
- タスクはユーザーの代表的な利用シナリオから選ぶ(例: 「商品を検索してカートに入れる」「設定画面でプランを変更する」)
- タスクは3〜5個が適切。多すぎると参加者が疲弊してデータの質が下がる
方法は2つ: モデレーテッド(司会者あり)とアンモデレーテッド(リモートで自動収集)。
- モデレーテッド: 深い気づきが得られるが、1セッション30〜60分かかる。参加者8〜12名が目安
- アンモデレーテッド: 大量のデータを短期間で収集できる。UserTesting、Mazeなどのツールを活用。参加者20〜50名以上で統計的に安定
- 競合比較の場合、同じ参加者に自社と競合の両方を使ってもらう(カウンターバランス法で順序効果を排除)
単体の数値に意味はない。比較して初めて価値が生まれる。
- 時系列比較: 前回計測と今回を比べて改善・悪化を確認
- 競合比較: 同じタスクを競合製品で実施し、差分を算出
- 業界平均比較: SUSの業界平均68点、タスク成功率の一般的な目安78%などと比較
- 差が統計的に有意かを確認する(t検定やMann-Whitney U検定)
数値を出して終わりではなく、具体的な改善に接続する。
- タスク成功率が低いタスク → UIの導線やラベリングに問題がある可能性
- 完了時間が長いタスク → ステップ数やページ遷移の多さを検討
- SUSが低い → ユーザビリティテストで定性的な原因を深掘り
- 改善後に同一条件で再計測し、スコアの変化を確認する
具体例#
従業員80名のBtoB SaaS企業。プロジェクト管理ツールを提供しているが、無料トライアルからの有料転換率が**8%**と業界平均(15%)を下回っていた。仮説は「オンボーディングのUXが悪い」。
ベンチマーク設計:
- 比較対象: 自社、競合A(業界最大手)、競合B(急成長中)
- タスク: (1)初回ログイン→プロジェクト作成、(2)タスクの追加と担当者アサイン、(3)ガントチャート表示
- 指標: タスク成功率、完了時間、SUS、SEQ
- 参加者: ターゲットユーザー層30名をリクルートし、各製品を10名ずつ割り当て
計測結果:
| 指標 | 自社 | 競合A | 競合B |
|---|---|---|---|
| タスク1 成功率 | 60% | 90% | 85% |
| タスク1 完了時間 | 4分32秒 | 1分48秒 | 2分15秒 |
| タスク2 成功率 | 80% | 85% | 90% |
| タスク3 成功率 | 50% | 80% | 75% |
| SUS | 52点 | 76点 | 72点 |
発見:
- タスク1(初回プロジェクト作成)の成功率が特に低い。原因は初回ログイン後に「空白の画面」が表示され、何をすればいいか分からないこと
- 競合Aはインタラクティブなチュートリアルでステップバイステップにガイドしていた
- タスク3(ガントチャート)は機能の場所が分かりにくいことがエラー率の高さに直結
改善施策:
- 初回ログイン時にインタラクティブウォークスルーを実装(3ステップでプロジェクト作成まで完了)
- ガントチャートへのショートカットをサイドバーの上位に移動
再計測結果(3か月後):
- タスク1 成功率: 60% → 88%
- SUS: 52点 → 71点
- 無料トライアルからの有料転換率: 8% → 14%
年商30億円のアパレルEC。デザインチームが6か月かけてサイト全体のリデザインを実施したが、経営層から「投資に見合う効果があったのか」と問われ、感覚的にしか答えられなかった。
ベンチマーク設計(リデザイン前に計測済み):
- タスク: (1)商品検索→カート投入、(2)サイズ絞り込み、(3)お気に入り登録→一覧確認、(4)注文履歴の確認
- 指標: タスク成功率、完了時間、エラー率、SUS
- 参加者: ターゲット顧客層24名(リデザイン前12名、リデザイン後12名)
Before / After 比較:
| 指標 | Before | After | 変化 |
|---|---|---|---|
| タスク1 成功率 | 82% | 95% | +13pt |
| タスク2 完了時間 | 38秒 | 18秒 | -53% |
| タスク3 エラー率 | 25% | 8% | -17pt |
| タスク4 成功率 | 70% | 88% | +18pt |
| SUS | 61点 | 78点 | +17点 |
経営層への報告:
- SUS 61点 → 78点: 業界平均(68点)を大きく上回る水準に到達
- タスク成功率の平均: 72% → 90%: 特に注文履歴の確認(+18pt)が大幅改善
- これらのUX改善がコンバージョン率に与えた影響: CVR 1.8% → 2.3%(売上換算で年間約1.5億円の増収に相当)
経営層は「UXの投資効果が初めて数値で見えた」と評価し、翌年度のデザインチームの予算が30%増で承認された。
従業員1,200名の保険会社。社内の契約管理システムのUXに不満が多く、ヘルプデスクへの問い合わせが月180件あった。しかし「どこが悪いか」が定量的に把握できておらず、改善の優先順位が決まらなかった。
四半期ベンチマークの設計:
- タスク: (1)新規契約の登録、(2)既存契約の検索と詳細確認、(3)契約変更の申請、(4)レポート出力
- 指標: タスク成功率、完了時間、エラー率、SUS
- 参加者: 実際のシステム利用者から毎四半期15名をランダム抽出
- 同一条件で四半期ごとに計測し、トレンドを追跡
Q1(初回計測)の結果:
| タスク | 成功率 | 完了時間 | エラー率 |
|---|---|---|---|
| 新規契約登録 | 65% | 8分20秒 | 32% |
| 契約検索 | 88% | 1分45秒 | 12% |
| 契約変更申請 | 55% | 6分50秒 | 40% |
| レポート出力 | 78% | 3分10秒 | 18% |
| SUS: 42点 |
優先順位の決定: エラー率とタスク成功率のワーストから順に改善。Q2は「契約変更申請」(成功率55%、エラー率40%)、Q3は「新規契約登録」に集中。
1年間の推移:
| 指標 | Q1 | Q2 | Q3 | Q4 |
|---|---|---|---|---|
| 契約変更 成功率 | 55% | 78% | 82% | 85% |
| 新規登録 成功率 | 65% | 68% | 82% | 88% |
| SUS | 42点 | 52点 | 63点 | 71点 |
成果:
- ヘルプデスク問い合わせ: 月180件 → 月65件(64%減)
- 契約処理の平均所要時間: 28%短縮
- 年間の業務効率化効果: 約2,400時間(人件費換算約1,200万円)
やりがちな失敗パターン#
- タスクの設計が曖昧 — 「サイトを自由に使ってください」ではベンチマークにならない。「○○を検索して△△をカートに入れてください」のように明確なゴールを設定する
- サンプルサイズが少なすぎる — 参加者3〜5名では統計的な比較ができない。定量ベンチマークには最低8〜12名(できれば20名以上)が必要
- 比較条件を揃えない — リデザイン前はPCで計測し、後はスマホで計測したら比較にならない。デバイス・タスク・参加者属性を統一する
- 計測を1回で終わらせる — UXベンチマークの真価は継続的な計測にある。四半期や半期ごとの定期計測で改善のトレンドを追跡してこそ意味がある
まとめ#
UXベンチマーキングは、タスク成功率・完了時間・SUSなどの定量指標でUXを「測定可能な数値」に変換し、過去・競合・業界平均と比較することで改善の方向性と効果を可視化する手法である。重要なのは同一条件で繰り返し計測すること。1回の計測はスナップショットに過ぎないが、継続することで改善のトレンドが見え、UXへの投資を数値で正当化できるようになる。