UXベンチマーキング

英語名 UX Benchmarking
読み方 ユーエックス ベンチマーキング
難易度
所要時間 1〜3週間
提唱者 ユーザビリティ工学とUXリサーチの定量手法
目次

ひとことで言うと
#

自社プロダクトのUXを定量指標(タスク成功率、完了時間、エラー率、満足度スコアなど)で計測し、過去の自社データや競合製品と比較することで、改善の優先順位と進捗を客観的に把握する手法。「UXが良くなった気がする」を「UXが数値でこれだけ改善した」に変える。

押さえておきたい用語
#

押さえておきたい用語
タスク成功率(Task Success Rate)
ユーザーが指定されたタスクを正しく完了できた割合。UXベンチマークで最も基本的な指標。
タスク完了時間(Time on Task)
タスクの開始から完了までにかかった時間。短いほど効率的なUXを示す。
エラー率(Error Rate)
タスク遂行中にユーザーが犯した誤操作の割合。UIのわかりにくさを反映する。
SUS(System Usability Scale)
10項目のアンケートで算出するユーザビリティの主観スコア。0〜100点で評価し、業界平均は68点。
NPS(Net Promoter Score)
「この製品を他者に薦めるか」を0〜10で聞き、推奨者と批判者の差で算出するロイヤルティ指標

UXベンチマーキングの全体像
#

UXベンチマーキング:定量指標で自社と競合のUXを比較する
UXベンチマーキングの構造計測指標タスク成功率タスク完了時間エラー率SUS スコアNPS行動データ+主観データ比較軸過去の自社(時系列比較)競合製品(横断比較)業界平均(標準比較)アウトプット改善の優先順位競合との差分改善効果の証明経営層への報告数値でUXの価値を示す計測のポイント同一タスク × 同一条件 × 十分なサンプル数 で比較の妥当性を担保する
UXベンチマーキングの実施フロー
1
指標とタスクを定義
何を測るか・どのタスクで測るかを決める
2
計測を実施する
ユーザーテストやアンケートでデータ収集
3
比較分析する
過去・競合・業界平均と比較して差分を把握
改善と再計測
施策実施後に同条件で再計測して効果を検証

こんな悩みに効く
#

  • UX改善の成果を経営層に説明できない(「使いやすくなりました」だけでは通じない)
  • 競合と比べて自社のUXがどの水準にあるか客観的に把握したい
  • リデザイン前後でUXが本当に良くなったか、感覚ではなく数値で確認したい
  • UX改善の優先順位を「声の大きい人の意見」ではなくデータで決めたい

基本の使い方
#

計測する指標とタスクを定義する

何を測るかを先に決めないと、データが散漫になる。

  • 行動指標(客観): タスク成功率、完了時間、エラー率、クリック数
  • 態度指標(主観): SUS、NPS、CSAT(顧客満足度)、SEQ(Single Ease Question)
  • タスクはユーザーの代表的な利用シナリオから選ぶ(例: 「商品を検索してカートに入れる」「設定画面でプランを変更する」)
  • タスクは3〜5個が適切。多すぎると参加者が疲弊してデータの質が下がる
計測を実施してデータを収集する

方法は2つ: モデレーテッド(司会者あり)とアンモデレーテッド(リモートで自動収集)。

  • モデレーテッド: 深い気づきが得られるが、1セッション30〜60分かかる。参加者8〜12名が目安
  • アンモデレーテッド: 大量のデータを短期間で収集できる。UserTesting、Mazeなどのツールを活用。参加者20〜50名以上で統計的に安定
  • 競合比較の場合、同じ参加者に自社と競合の両方を使ってもらう(カウンターバランス法で順序効果を排除)
過去・競合・業界平均と比較分析する

単体の数値に意味はない。比較して初めて価値が生まれる。

  • 時系列比較: 前回計測と今回を比べて改善・悪化を確認
  • 競合比較: 同じタスクを競合製品で実施し、差分を算出
  • 業界平均比較: SUSの業界平均68点、タスク成功率の一般的な目安78%などと比較
  • 差が統計的に有意かを確認する(t検定やMann-Whitney U検定)
結果を改善アクションに変換する

数値を出して終わりではなく、具体的な改善に接続する。

  • タスク成功率が低いタスク → UIの導線やラベリングに問題がある可能性
  • 完了時間が長いタスク → ステップ数やページ遷移の多さを検討
  • SUSが低い → ユーザビリティテストで定性的な原因を深掘り
  • 改善後に同一条件で再計測し、スコアの変化を確認する

具体例
#

例1:BtoB SaaSのオンボーディングUXを競合と比較する

従業員80名のBtoB SaaS企業。プロジェクト管理ツールを提供しているが、無料トライアルからの有料転換率が**8%**と業界平均(15%)を下回っていた。仮説は「オンボーディングのUXが悪い」。

ベンチマーク設計:

  • 比較対象: 自社、競合A(業界最大手)、競合B(急成長中)
  • タスク: (1)初回ログイン→プロジェクト作成、(2)タスクの追加と担当者アサイン、(3)ガントチャート表示
  • 指標: タスク成功率、完了時間、SUS、SEQ
  • 参加者: ターゲットユーザー層30名をリクルートし、各製品を10名ずつ割り当て

計測結果:

指標自社競合A競合B
タスク1 成功率60%90%85%
タスク1 完了時間4分32秒1分48秒2分15秒
タスク2 成功率80%85%90%
タスク3 成功率50%80%75%
SUS52点76点72点

発見:

  • タスク1(初回プロジェクト作成)の成功率が特に低い。原因は初回ログイン後に「空白の画面」が表示され、何をすればいいか分からないこと
  • 競合Aはインタラクティブなチュートリアルでステップバイステップにガイドしていた
  • タスク3(ガントチャート)は機能の場所が分かりにくいことがエラー率の高さに直結

改善施策:

  • 初回ログイン時にインタラクティブウォークスルーを実装(3ステップでプロジェクト作成まで完了)
  • ガントチャートへのショートカットをサイドバーの上位に移動

再計測結果(3か月後):

  • タスク1 成功率: 60% → 88%
  • SUS: 52点 → 71点
  • 無料トライアルからの有料転換率: 8% → 14%
例2:ECサイトのリデザイン効果を数値で証明する

年商30億円のアパレルEC。デザインチームが6か月かけてサイト全体のリデザインを実施したが、経営層から「投資に見合う効果があったのか」と問われ、感覚的にしか答えられなかった。

ベンチマーク設計(リデザイン前に計測済み):

  • タスク: (1)商品検索→カート投入、(2)サイズ絞り込み、(3)お気に入り登録→一覧確認、(4)注文履歴の確認
  • 指標: タスク成功率、完了時間、エラー率、SUS
  • 参加者: ターゲット顧客層24名(リデザイン前12名、リデザイン後12名)

Before / After 比較:

指標BeforeAfter変化
タスク1 成功率82%95%+13pt
タスク2 完了時間38秒18秒-53%
タスク3 エラー率25%8%-17pt
タスク4 成功率70%88%+18pt
SUS61点78点+17点

経営層への報告:

  • SUS 61点 → 78点: 業界平均(68点)を大きく上回る水準に到達
  • タスク成功率の平均: 72% → 90%: 特に注文履歴の確認(+18pt)が大幅改善
  • これらのUX改善がコンバージョン率に与えた影響: CVR 1.8% → 2.3%(売上換算で年間約1.5億円の増収に相当)

経営層は「UXの投資効果が初めて数値で見えた」と評価し、翌年度のデザインチームの予算が30%増で承認された。

例3:社内業務システムのUXを定期計測して改善サイクルを回す

従業員1,200名の保険会社。社内の契約管理システムのUXに不満が多く、ヘルプデスクへの問い合わせが月180件あった。しかし「どこが悪いか」が定量的に把握できておらず、改善の優先順位が決まらなかった。

四半期ベンチマークの設計:

  • タスク: (1)新規契約の登録、(2)既存契約の検索と詳細確認、(3)契約変更の申請、(4)レポート出力
  • 指標: タスク成功率、完了時間、エラー率、SUS
  • 参加者: 実際のシステム利用者から毎四半期15名をランダム抽出
  • 同一条件で四半期ごとに計測し、トレンドを追跡

Q1(初回計測)の結果:

タスク成功率完了時間エラー率
新規契約登録65%8分20秒32%
契約検索88%1分45秒12%
契約変更申請55%6分50秒40%
レポート出力78%3分10秒18%
SUS: 42点

優先順位の決定: エラー率とタスク成功率のワーストから順に改善。Q2は「契約変更申請」(成功率55%、エラー率40%)、Q3は「新規契約登録」に集中。

1年間の推移:

指標Q1Q2Q3Q4
契約変更 成功率55%78%82%85%
新規登録 成功率65%68%82%88%
SUS42点52点63点71点

成果:

  • ヘルプデスク問い合わせ: 月180件 → 月65件(64%減)
  • 契約処理の平均所要時間: 28%短縮
  • 年間の業務効率化効果: 約2,400時間(人件費換算約1,200万円

やりがちな失敗パターン
#

  1. タスクの設計が曖昧 — 「サイトを自由に使ってください」ではベンチマークにならない。「○○を検索して△△をカートに入れてください」のように明確なゴールを設定する
  2. サンプルサイズが少なすぎる — 参加者3〜5名では統計的な比較ができない。定量ベンチマークには最低8〜12名(できれば20名以上)が必要
  3. 比較条件を揃えない — リデザイン前はPCで計測し、後はスマホで計測したら比較にならない。デバイス・タスク・参加者属性を統一する
  4. 計測を1回で終わらせる — UXベンチマークの真価は継続的な計測にある。四半期や半期ごとの定期計測で改善のトレンドを追跡してこそ意味がある

まとめ
#

UXベンチマーキングは、タスク成功率・完了時間・SUSなどの定量指標でUXを「測定可能な数値」に変換し、過去・競合・業界平均と比較することで改善の方向性と効果を可視化する手法である。重要なのは同一条件で繰り返し計測すること。1回の計測はスナップショットに過ぎないが、継続することで改善のトレンドが見え、UXへの投資を数値で正当化できるようになる。