#信頼性
6件のフレームワーク
データ信頼スコア
データセットの品質・鮮度・完全性を定量評価
データ品質の可視化
分析結果の信頼度判断
データガバナンスの定量管理
データ信頼性エンジニアリング
SREの考え方をデータ基盤に適用し信頼性を担保
データパイプラインの安定運用
データ品質の継続的監視
障害対応の標準化
インフラ信頼性設計
冗長性・フェイルオーバー・自動修復を組み込んだ基盤
高可用性アーキテクチャの設計
障害耐性の向上
SLA達成
SRE原則
ソフトウェアエンジニアリングの手法で運用問題を解決し、信頼性をシステマティックに管理するGoogleの運用哲学
運用の体系化
信頼性目標の定量管理
カオスエンジニアリング
本番環境に意図的に障害を注入し、システムの弱点を事前に発見・改善する実践手法
システムの弱点の事前発見
耐障害性の検証と改善
冪等性パターン
同じ操作を何度実行しても結果が変わらないように設計し、リトライや重複リクエストに安全に対処するパターン
決済処理の重複防止
APIのリトライ安全性の確保