#インシデント対応
4件のフレームワーク
インシデント・コミュニケーション / Incident Communication
障害時の社内外への情報発信とステークホルダー管理の体系的手法
障害時の顧客通知
社内エスカレーション
ポストモーテム共有
カオスゲームデー / Chaos GameDay
計画的障害注入でシステム耐障害性を検証するイベント型演習
システム耐障害性の検証
インシデント対応訓練
障害検知の改善
ランブック / Runbook
定型運用手順をドキュメント化し属人化排除
インシデント対応の標準化
オンコール引き継ぎ
運用の自動化判断
ブレイムレス・ポストモーテム / Blameless Postmortem
ブレイムレス・ポストモーテムとは、障害やミスを個人の責任にせず「仕組みの問題」として振り返るGoogle SRE発の手法。再発防止アクションを確実に実行するためのテンプレートと進行手順を解説。
障害振り返り
インシデント対応改善
組織学習