ITILサービスマネジメント

英語名 ITIL Service Management
読み方 アイティル・サービス・マネジメント
難易度
所要時間 基本理解に1〜2日、組織導入に6〜12か月
提唱者 英国政府 CCTA 1989年、現在はAxelos/PeopleCertが管理(ITIL 4: 2019年)
目次

ひとことで言うと
#

ITILは、ITサービスの計画・提供・運用・改善を体系化したベストプラクティス集です。「インシデント管理」「変更管理」「問題管理」「サービスレベル管理」などのプロセスを標準化することで、ITサービスの品質と効率を継続的に向上させます。

用語の定義
#

押さえておきたい用語
  • サービスバリューシステム(SVS):ITIL 4の中核概念。需要をきっかけに、組織の活動を通じて価値を生み出す全体の仕組み
  • インシデント管理(Incident Management):ITサービスの中断や品質低下を迅速に復旧させるプロセス。「まず使えるようにする」が目的
  • 問題管理(Problem Management):インシデントの根本原因を特定し、再発を防止するプロセス。インシデント管理とは別のプロセスとして運用される
  • 変更管理(Change Management):ITインフラやサービスへの変更を計画的に実施し、リスクを最小化するプロセス
  • サービスレベル合意(SLA):ITサービスの提供者と利用者の間で合意した品質基準。稼働率、応答時間、復旧時間などの指標で定義する

全体像
#

ITIL サービスバリューシステムインシデント管理サービス中断の迅速復旧問題管理根本原因の特定と再発防止変更管理計画的な変更でリスク最小化サービスレベル管理SLAの合意と監視サービスデスクユーザーとの単一窓口継続的改善サービス品質の継続的向上需要 → 価値の創出 → 利用者への価値提供すべてのプラクティスが連携してITサービスの価値を最大化する
サービス戦略の策定
何を提供するか
サービスの設計・構築
SLA・プロセスの整備
運用とサポート
インシデント・変更管理
継続的改善
KPIに基づく品質向上

こんな悩みに効く
#

  • システム障害のたびに対応が場当たり的で、復旧に時間がかかる
  • 変更を加えるたびにトラブルが発生し、「触らぬ神に祟りなし」状態になっている
  • IT部門への問い合わせが増える一方で、同じ質問が何度も来る

基本の使い方
#

インシデント管理を整備する(最優先)
サービス中断が発生したときの対応フローを標準化します。受付→分類→優先度判定→エスカレーション→復旧→クローズの流れを定義し、ツール(ServiceNow、Jiraなど)で管理します。まず「全インシデントを記録する」習慣を作ることが第一歩です。
問題管理で根本原因を追究する
繰り返し発生するインシデントを問題として登録し、根本原因を調査します。インシデント管理が「消火活動」なら、問題管理は「火の原因を断つ」活動。月次で「繰り返しインシデントTop 5」をレビューし、恒久対策を実施します。
変更管理でリスクを制御する
システムへの変更(パッチ適用、設定変更、リリース)を計画的に管理します。変更要求→影響評価→承認→実施→レビューのフローを確立。リスクの高い変更は変更諮問委員会(CAB)で審議し、テスト環境での検証を必須にします。
SLAを定義して継続的に改善する
ITサービスの品質基準をSLA(サービスレベル合意)として利用部門と合意します。稼働率99.9%、インシデント初期応答30分以内、変更成功率95%以上などの指標を設定し、月次でモニタリングして改善します。

具体例
#

中堅企業のITSM導入
製造業(従業員500名、社内システム15種)のIT部門(8名)が、ITIL準拠のITSMを導入。導入前は障害連絡がメール・電話・口頭でバラバラに来て、対応漏れが月5件発生していた。Phase 1:ServiceNowでサービスデスクを構築し、全問い合わせをチケット化。Phase 2:インシデントの優先度基準(P1:全社影響、P2:部門影響、P3:個人影響)を定義。Phase 3:繰り返しインシデントTop 5の問題管理を開始。1年後、インシデントの平均復旧時間が4時間→1.5時間に短縮し、対応漏れがゼロに。IT部門の満足度調査スコアが2.8→4.1(5点満点)に改善した。
SaaS企業の変更管理プロセス構築
BtoB SaaS企業(エンジニア60名、顧客2,000社)が、本番デプロイ後のトラブル頻発を受けて変更管理を導入。導入前は週15回のデプロイのうち2〜3回がロールバックになっていた。変更管理プロセスとして、変更をStandard(定型:自動承認)、Normal(通常:チームリード承認+テスト必須)、Emergency(緊急:事後レビュー付き)の3種に分類。Normalの承認にはテスト結果とロールバック手順の添付を必須化。6か月後、デプロイ回数は15回/週を維持しつつ、ロールバック率が18%→4%に低下。本番障害の月平均件数が8件→2件に減少した。
大学のIT部門のサービスレベル改善
私立大学(学生12,000名、教職員800名)のIT部門(15名)が、学内からの苦情増加を受けてITILベースのサービス改善を実施。まず過去6か月の問い合わせ3,600件を分析し、**42%が「パスワードリセット」「Wi-Fi接続」「印刷トラブル」の3種類に集中していることを発見。FAQとセルフサービスポータルを構築し、この3種類の問い合わせの60%をセルフサービスに誘導。同時にSLAを「問い合わせ受付から初回応答まで4時間以内」と設定し、達成率を月次でモニタリング。SLA達成率が3か月で65%→92%に改善し、学内満足度調査で「ITサポートに満足」の回答が38%→67%**に上昇した。

やりがちな失敗パターン
#

失敗原因対策
ITILのプロセスを全部一度に導入しようとする25以上のプラクティスを同時に始め、どれも中途半端になるまずインシデント管理と変更管理の2つだけ導入し、安定したら順次追加する
プロセスが形骸化して「チケットを書く作業」になるITILの目的を理解せず、手続きだけが残る「なぜこのプロセスが必要か」を全員が理解するまで研修と振り返りを繰り返す
ツール先行でプロセスが後回しになる高機能なITSMツールを導入したが、プロセスが未定義で使いこなせないまずプロセスを定義・合意し、それを支援するツールを選定する
SLAが厳しすぎて現場が疲弊する理想的な数値を設定してしまい、達成できず信頼を失う現状の実績データに基づいてSLAを設定し、四半期ごとに段階的に引き上げる

まとめ
#

ITILの価値は「ITサービスを場当たり的ではなく構造的に管理できる」点にあります。全プロセスを完璧に導入する必要はなく、「インシデントを記録する」「変更を計画的に行う」の2つだけでもIT部門の品質は大きく変わります。重要なのはフレームワークに自組織を合わせるのではなく、自組織の課題解決にITILのプラクティスを適用するという姿勢です。