プロセスの安定性を確認したいときはどうすればいい？

「管理図（SPC）」フレームワークが役立ちます。時系列データに管理限界線を設定し、プロセスの異常を早期に検知する分析手法

異常を早期に検知したいときはどうすればいい？

「管理図（SPC）」フレームワークが役立ちます。時系列データに管理限界線を設定し、プロセスの異常を早期に検知する分析手法

管理図（SPC）

ひとことで言うと
#

時系列データの中心に平均線（CL）、その上下に**管理上限（UCL）と管理下限（LCL）を引き、データがこの範囲内に収まっているかを監視する手法。範囲を超えた点や不自然なパターンがあれば「プロセスに異常が発生している」**と判断でき、問題を早期に発見して対処できる。

押さえておきたい用語
#

押さえておきたい用語

CL（Center Line）: 管理図の中心に引かれるデータの平均値を示す線のこと。プロセスが正常なときのデータはこの線の周辺に分布する。
UCL / LCL（Upper / Lower Control Limit）: 平均値から**±3σ（標準偏差の3倍）**の位置に引かれる管理限界線のこと。正常な変動の99.7%がこの範囲に収まるため、超えた点は異常と判断する。
特殊原因変動（Assignable Cause）: 材料変更・設備故障・担当者交代など、特定できる原因による変動のこと。管理限界超えや不自然なパターンとして検知される。
偶然原因変動（Common Cause）: プロセスに本来備わっている避けられない微小なばらつきのこと。管理限界内に収まる変動は偶然原因として許容する。

管理図（SPC）の全体像
#

管理図：UCL/LCLの範囲内に収まっているかを時系列で監視する

管理図の運用フロー

指標を選定

定期測定できるプロセス指標

→

管理限界を計算

安定データ20点以上でCL・±3σ

→

パターンを監視

限界超え・連・トレンド・周期

→

★

原因調査→対策

特殊原因を特定し再発防止

こんな悩みに効く
#

数値の変動が「正常な範囲」なのか「異常」なのか判断できない
問題が大きくなってから気づくことが多い
日々のデータを見ているが、いつアラートを出すべきかの基準がない

基本の使い方
#

ステップ1: 管理したいプロセス指標を決める

継続的に測定できる数値指標を選ぶ。

製造: 製品の寸法、重量、不良率
サービス: 応答時間、処理件数、顧客満足度スコア
IT: サーバーレスポンスタイム、エラー率

ポイント: 指標は定期的（毎日・毎時間など）に同じ条件で測定できるものを選ぶ。

ステップ2: データを収集し、管理限界線を計算する

安定した状態（通常稼働時）のデータを20〜30点以上集め、3つの線を計算する。

CL（中心線）: データの平均値
UCL（管理上限）: 平均 + 3σ（標準偏差の3倍）
LCL（管理下限）: 平均 − 3σ

3σの範囲には、正常な変動の99.7%が収まる。つまり、この範囲を超えたら「偶然とは考えにくい異常」と判断できる。

ステップ3: 時系列にプロットし、パターンを監視する

新しいデータを追加していき、以下の異常パターンを監視する。

管理限界超え: UCLまたはLCLを超えた点 → 即座に原因調査
連（ラン）: 中心線の片側に7点以上連続 → 平均が偏移している
トレンド: 7点以上連続して上昇or下降 → プロセスが徐々に変化している
周期性: 規則的な上下パターン → 設備のメンテナンスサイクルなど

これらのパターンが現れたら「プロセスが管理外れ（Out of Control）」と判断する。

ステップ4: 異常の原因を調査し、対策する

管理外れを検知したら、何が変わったかを調査する。

材料のロットが変わった？
設備のメンテナンス時期を過ぎている？
担当者が交代した？
外部環境（気温・湿度）が大きく変化した？

原因を特定して対策を打ったら、そのデータポイントに注釈をつけて記録する。

具体例
#

例1：Webサービスのレスポンスタイム監視で障害を即日検知する

状況: 月間100万PVのWebアプリケーション。ユーザーから「最近遅い」という問い合わせが増えたが、どの時点から悪化したか特定できていなかった。

管理図の設計:

CL（平均）: 200ms
UCL: 350ms（平均+3σ）
LCL: 50ms

ある週のデータ: 月曜 180ms → 火曜 210ms → 水曜 190ms → 木曜 380ms → 金曜 420ms

検知: 木曜に管理上限を超え、金曜も続いている → 異常と判断。

調査: 木曜朝のデプロイで新機能が追加され、データベースクエリが最適化されていなかった。

対策: クエリにインデックスを追加し、レスポンスタイムが200ms前後に復帰。

**結果: デプロイ後に自動で管理図を確認するアラートを設定し、今後は即座に検知できる体制にした。**ユーザーからの「遅い」問い合わせが月15件→2件に減少。

例2：食品工場が不良率の管理図で材料ロット変更の影響を早期発見する

状況: 1日3,000個のパンを製造する食品工場。不良率（焼きムラ・形状不良）を日次で記録しているが、「なんとなく最近多い」という感覚的な判断しかできていなかった。

管理図の設計（30日間の安定データから計算）:

CL: 不良率2.5%
UCL: 不良率4.8%
LCL: 不良率0.2%

検知されたパターン:

15日目から7日連続でCLの上側にデータが並んだ（連のルール違反）
個々の点はUCLを超えていないが、明らかに平均が上方に偏移している

調査: 15日目に小麦粉の仕入先を変更していた。新ロットの含水率が従来より1.2%高く、焼きムラが発生しやすくなっていた。

対策: 新ロットに合わせてオーブン温度を3℃調整し、不良率がCL付近に復帰。

**結果: 管理限界を超える前に「連」のルールで早期検知できたことで、推定2万個分の不良品発生を未然に防止。**年間の廃棄コストを約120万円削減。

例3：コールセンターが応答時間の管理図でシフト改善のタイミングを特定する

状況: オペレーター30名のコールセンター。平均応答時間を45秒以内に維持することがSLA。時間帯別の管理図を導入して、人員配置を最適化したい。

管理図の設計（1時間ごとの平均応答時間）:

CL: 38秒
UCL: 52秒
LCL: 24秒

検知されたパターン:

毎週月曜の10〜12時にUCLを超える（週初めの問い合わせ集中）
毎日17時台にUCL付近まで上昇（シフト交代時のオペレーター不足）
金曜午後は一貫してLCL付近（問い合わせが少ない）

アクション:

月曜午前に臨時で2名追加配置
17時のシフト交代を16:45開始に前倒し、引き継ぎ時間を確保
金曜午後のオペレーターを1名減らし、研修時間に充当

**結果: SLA違反（応答45秒超え）の発生率が月平均12%→3%に改善。**シフト改善による残業代削減が月約35万円。管理図なしには「なんとなく月曜が忙しい」で終わっていたが、データで根拠を示して人員配置の変更を通せた。

やりがちな失敗パターン
#

管理限界を規格値と混同する — 管理限界はプロセスの統計的な変動範囲であり、製品の規格（仕様）とは別物。管理限界内でも規格外のこともあるし、その逆もある
安定していないデータで管理限界を設定する — 異常が混じったデータで計算すると管理限界が広くなりすぎる。まず安定期のデータだけで計算し、その後に全データを当てはめる
管理図を作っただけで監視しない — 管理図の価値は継続的に監視して異常を検知すること。作って壁に貼って終わりでは意味がない。日次・週次の確認フローに組み込む
UCL/LCL超えだけに注目し、パターンを見逃す — 管理限界内でも「7点連続で片側」「7点連続の上昇」はプロセスの変化を示す重要なシグナル。ウエスタン・エレクトリック・ルールなどの異常パターンを合わせて監視する

まとめ
#

管理図（SPC）は、プロセスの正常な変動と異常を統計的に区別し、問題を早期に検知するための手法。平均値と3σの管理限界線を引くだけで、日々のデータが正常範囲にあるかどうかが一目でわかる。まずは最も重要なプロセス指標を1つ選び、20〜30点のデータで管理図を作ってみよう。

管理図（SPC）

ひとことで言うと#

押さえておきたい用語#

管理図（SPC）の全体像#

こんな悩みに効く#

基本の使い方#

具体例#

やりがちな失敗パターン#

まとめ#