ひとことで言うと#
時系列データの中心に平均線(CL)、その上下に**管理上限(UCL)と管理下限(LCL)を引き、データがこの範囲内に収まっているかを監視する手法。範囲を超えた点や不自然なパターンがあれば「プロセスに異常が発生している」**と判断でき、問題を早期に発見して対処できる。
押さえておきたい用語#
- CL(Center Line)
- 管理図の中心に引かれるデータの平均値を示す線のこと。プロセスが正常なときのデータはこの線の周辺に分布する。
- UCL / LCL(Upper / Lower Control Limit)
- 平均値から**±3σ(標準偏差の3倍)**の位置に引かれる管理限界線のこと。正常な変動の99.7%がこの範囲に収まるため、超えた点は異常と判断する。
- 特殊原因変動(Assignable Cause)
- 材料変更・設備故障・担当者交代など、特定できる原因による変動のこと。管理限界超えや不自然なパターンとして検知される。
- 偶然原因変動(Common Cause)
- プロセスに本来備わっている避けられない微小なばらつきのこと。管理限界内に収まる変動は偶然原因として許容する。
管理図(SPC)の全体像#
こんな悩みに効く#
- 数値の変動が「正常な範囲」なのか「異常」なのか判断できない
- 問題が大きくなってから気づくことが多い
- 日々のデータを見ているが、いつアラートを出すべきかの基準がない
基本の使い方#
継続的に測定できる数値指標を選ぶ。
- 製造: 製品の寸法、重量、不良率
- サービス: 応答時間、処理件数、顧客満足度スコア
- IT: サーバーレスポンスタイム、エラー率
ポイント: 指標は定期的(毎日・毎時間など)に同じ条件で測定できるものを選ぶ。
安定した状態(通常稼働時)のデータを20〜30点以上集め、3つの線を計算する。
- CL(中心線): データの平均値
- UCL(管理上限): 平均 + 3σ(標準偏差の3倍)
- LCL(管理下限): 平均 − 3σ
3σの範囲には、正常な変動の99.7%が収まる。つまり、この範囲を超えたら「偶然とは考えにくい異常」と判断できる。
新しいデータを追加していき、以下の異常パターンを監視する。
- 管理限界超え: UCLまたはLCLを超えた点 → 即座に原因調査
- 連(ラン): 中心線の片側に7点以上連続 → 平均が偏移している
- トレンド: 7点以上連続して上昇or下降 → プロセスが徐々に変化している
- 周期性: 規則的な上下パターン → 設備のメンテナンスサイクルなど
これらのパターンが現れたら「プロセスが管理外れ(Out of Control)」と判断する。
管理外れを検知したら、何が変わったかを調査する。
- 材料のロットが変わった?
- 設備のメンテナンス時期を過ぎている?
- 担当者が交代した?
- 外部環境(気温・湿度)が大きく変化した?
原因を特定して対策を打ったら、そのデータポイントに注釈をつけて記録する。
具体例#
状況: 月間100万PVのWebアプリケーション。ユーザーから「最近遅い」という問い合わせが増えたが、どの時点から悪化したか特定できていなかった。
管理図の設計:
- CL(平均): 200ms
- UCL: 350ms(平均+3σ)
- LCL: 50ms
ある週のデータ: 月曜 180ms → 火曜 210ms → 水曜 190ms → 木曜 380ms → 金曜 420ms
検知: 木曜に管理上限を超え、金曜も続いている → 異常と判断。
調査: 木曜朝のデプロイで新機能が追加され、データベースクエリが最適化されていなかった。
対策: クエリにインデックスを追加し、レスポンスタイムが200ms前後に復帰。
**結果: デプロイ後に自動で管理図を確認するアラートを設定し、今後は即座に検知できる体制にした。**ユーザーからの「遅い」問い合わせが月15件→2件に減少。
状況: 1日3,000個のパンを製造する食品工場。不良率(焼きムラ・形状不良)を日次で記録しているが、「なんとなく最近多い」という感覚的な判断しかできていなかった。
管理図の設計(30日間の安定データから計算):
- CL: 不良率2.5%
- UCL: 不良率4.8%
- LCL: 不良率0.2%
検知されたパターン:
- 15日目から7日連続でCLの上側にデータが並んだ(連のルール違反)
- 個々の点はUCLを超えていないが、明らかに平均が上方に偏移している
調査: 15日目に小麦粉の仕入先を変更していた。新ロットの含水率が従来より1.2%高く、焼きムラが発生しやすくなっていた。
対策: 新ロットに合わせてオーブン温度を3℃調整し、不良率がCL付近に復帰。
**結果: 管理限界を超える前に「連」のルールで早期検知できたことで、推定2万個分の不良品発生を未然に防止。**年間の廃棄コストを約120万円削減。
状況: オペレーター30名のコールセンター。平均応答時間を45秒以内に維持することがSLA。時間帯別の管理図を導入して、人員配置を最適化したい。
管理図の設計(1時間ごとの平均応答時間):
- CL: 38秒
- UCL: 52秒
- LCL: 24秒
検知されたパターン:
- 毎週月曜の10〜12時にUCLを超える(週初めの問い合わせ集中)
- 毎日17時台にUCL付近まで上昇(シフト交代時のオペレーター不足)
- 金曜午後は一貫してLCL付近(問い合わせが少ない)
アクション:
- 月曜午前に臨時で2名追加配置
- 17時のシフト交代を16:45開始に前倒し、引き継ぎ時間を確保
- 金曜午後のオペレーターを1名減らし、研修時間に充当
**結果: SLA違反(応答45秒超え)の発生率が月平均12%→3%に改善。**シフト改善による残業代削減が月約35万円。管理図なしには「なんとなく月曜が忙しい」で終わっていたが、データで根拠を示して人員配置の変更を通せた。
やりがちな失敗パターン#
- 管理限界を規格値と混同する — 管理限界はプロセスの統計的な変動範囲であり、製品の規格(仕様)とは別物。管理限界内でも規格外のこともあるし、その逆もある
- 安定していないデータで管理限界を設定する — 異常が混じったデータで計算すると管理限界が広くなりすぎる。まず安定期のデータだけで計算し、その後に全データを当てはめる
- 管理図を作っただけで監視しない — 管理図の価値は継続的に監視して異常を検知すること。作って壁に貼って終わりでは意味がない。日次・週次の確認フローに組み込む
- UCL/LCL超えだけに注目し、パターンを見逃す — 管理限界内でも「7点連続で片側」「7点連続の上昇」はプロセスの変化を示す重要なシグナル。ウエスタン・エレクトリック・ルールなどの異常パターンを合わせて監視する
まとめ#
管理図(SPC)は、プロセスの正常な変動と異常を統計的に区別し、問題を早期に検知するための手法。平均値と3σの管理限界線を引くだけで、日々のデータが正常範囲にあるかどうかが一目でわかる。まずは最も重要なプロセス指標を1つ選び、20〜30点のデータで管理図を作ってみよう。