クラウドコスト最適化

英語名 Cloud Cost Optimization
読み方 クラウド コスト オプティマイゼーション
難易度
所要時間 1〜2時間
提唱者 クラウドコンピューティング / FinOps Foundation
目次

ひとことで言うと
#

クラウドインフラの無駄なリソースを特定し、適切なサイジング・料金モデル・アーキテクチャ改善によってコストを最適化するフレームワーク。「使った分だけ払う」の理想と現実のギャップを埋める。

押さえておきたい用語
#

押さえておきたい用語
FinOps(フィンオプス)
クラウドの財務管理を技術チームとビジネスチームが協力して行う運用プラクティスのこと。可視化・最適化・運用の3フェーズで回す。
Right Sizing(ライトサイジング)
実際の使用量に合わせてインスタンスタイプやリソースを適正サイズに調整する作業。
Reserved Instance / Savings Plan
1〜3年の利用を約束することでオンデマンド料金から最大72%割引を受けられる料金モデル。
Spot Instance(スポットインスタンス)
クラウドプロバイダーの余剰キャパシティを最大90%割引で利用できるインスタンス。ただし中断される可能性がある。
Idle Resource(アイドルリソース)
起動しているが使われていない無駄なリソースを指す。開発環境のつけっぱなし、未使用のEBSボリュームなどが典型。

クラウドコスト最適化の全体像
#

クラウドコスト最適化:3つのレバーで無駄を削減
Phase 1: 可視化コストの内訳を把握タグ戦略の整備異常検知アラートPhase 2: 最適化ライトサイジングRI / Savings Planアイドルリソース削除Phase 3: 運用予算管理とアラート定期レビューサイクルチームへの責任分散コスト削減の3つのレバー無駄の削除アイドルリソース停止未使用EBS/EIP削除開発環境の自動停止効果: 10〜30%削減サイズの適正化CPU使用率に合わせて縮小Gravitonへの移行ストレージ階層の見直し効果: 15〜40%削減料金モデルの活用RI / Savings Plan購入Spotインスタンス活用EDP / プライベート料金効果: 20〜72%削減総合効果: 30〜60%のコスト削減
クラウドコスト最適化の進め方フロー
1
現状の可視化
タグ付けとコストダッシュボードでサービス別の内訳を把握
2
Quick Win実行
アイドルリソース削除とライトサイジングで即効性のある削減
3
料金モデル最適化
安定稼働分にRI/Savings Planを適用
継続運用
月次レビューと予算アラートで最適状態を維持

こんな悩みに効く
#

  • クラウド費用が毎月増えているが、何にいくら使っているか把握できていない
  • 開発環境が24時間365日稼働しており、夜間・休日の費用が無駄になっている
  • Reserved Instanceの購入判断ができず、オンデマンド料金のまま放置している

基本の使い方
#

タグ戦略を整備してコストを可視化する
すべてのリソースにチーム名・環境(prod/staging/dev)・サービス名のタグを付ける。タグなしリソースを検出するルールも設定する。AWS Cost Explorer、GCP Billing、Azureコスト分析などで内訳をダッシュボード化する。
アイドルリソースを特定して削除する
CPU使用率5%以下のインスタンス、未接続のEBSボリューム、未使用のElastic IPなど、「お金だけかかっている」リソースを洗い出す。AWS Trusted Advisor、GCP Recommenderが自動検出してくれる。
ライトサイジングを実行する
過去2週間のCPU・メモリ使用率を分析し、インスタンスタイプを最適化する。平均CPU使用率が20%以下ならワンサイズ下げる余地がある。
料金モデルを最適化する
安定して稼働しているベースライン分にReserved Instance / Savings Planを適用する。バッチ処理やCI/CDにはSpotインスタンスを活用する。

具体例
#

例1:SaaSスタートアップがAWS月額を半減させる

従業員40名のBtoB SaaS。月額AWS費用が 280万円 に達し、シリーズAの資金計画を圧迫していた。

Phase 1: 可視化 タグ付け率を15%→95%に向上。サービス別・環境別のコストダッシュボードを作成し、開発環境が本番とほぼ同じスペックで24時間稼働していることが判明。

Phase 2: 最適化

施策月額削減額
開発環境の夜間・休日自動停止-42万円
本番のライトサイジング(m5.2xlarge→m5.xlarge)-35万円
未使用EBS・スナップショット削除-18万円
Savings Plan(1年・Compute)購入-52万円

月額AWS費用は 280万円 → 133万円 に削減。年間約1,760万円の節約になった。

例2:ゲーム会社がSpotインスタンスでCI/CDコストを圧縮する

モバイルゲーム開発会社。20人の開発チームがCI/CDパイプラインで1日平均200ビルドを回しており、ビルドサーバーの月額コストが120万円に達していた。

ビルドサーバーをSpotインスタンスに切り替え。中断対策として以下を実装。

  • ビルドジョブのチェックポイント機能(中断後に途中から再開)
  • Spotプール(複数のインスタンスタイプを指定して可用性を確保)
  • 緊急時のオンデマンドフォールバック

月額コストは 120万円 → 38万円 に。Spot中断によるビルド遅延は月平均2回程度で、リトライで自動復旧するため開発者への影響はほぼなかった。

例3:地方自治体がクラウド移行後のコスト膨張を抑制する

人口15万人の自治体。オンプレミスからAWSに移行した結果、初年度のクラウド費用が想定の1.8倍に膨れた。原因は「オンプレと同じスペックのインスタンスをそのまま立てた」リフト&シフトだった。

FinOpsの考え方を導入し、情報政策課とベンダーが月次でコストレビューを実施。

  • 夜間バッチ用のサーバーを常時起動→Lambda化で 80%削減
  • 文書管理のストレージをS3 Standard→S3 Intelligent-Tieringに変更で 45%削減
  • 利用頻度の低い内部システムをFargateのスケジュール起動に変更

2年目のクラウド費用は初年度比 40%削減 を達成し、当初の想定コスト内に収まった。

やりがちな失敗パターン
#

  1. 可視化なしに最適化を始める — 何にいくら使っているかわからない状態で施策を打っても効果測定ができない。まずタグ戦略とダッシュボードを整備する
  2. Reserved Instanceを買いすぎる — 安定稼働分だけに適用する。成長が読めないサービスにRIを買うと、使い切れないリスクがある。Savings Plan(Compute型)のほうが柔軟性が高い
  3. コスト削減を1回限りのプロジェクトにする — 月次レビューを仕組み化しないと、半年で元のコスト水準に戻る。FinOpsは継続的な運用プラクティス
  4. パフォーマンスを犠牲にしすぎる — コスト削減のためにインスタンスを小さくしすぎてレイテンシが悪化すると、ユーザー体験が劣化する。パフォーマンスバジェットとセットで管理する

まとめ
#

クラウドコスト最適化は 「可視化→最適化→継続運用」 の3フェーズで進める。まずタグ付けとダッシュボードで現状を把握し、アイドルリソース削除とライトサイジングでQuick Winを出す。安定稼働分にはReserved Instance / Savings Planを適用し、バッチ処理にはSpotを活用する。月次レビューを仕組み化して、コスト最適状態を維持し続けることが成功の鍵になる。