DWHモデリング

データウェアハウスの論理・物理モデル設計の体系的手法

DWHの新規構築 既存DWHのリファクタリング 分析基盤の設計
難易度 ⏱ 数日〜数週間

インパクト分析

A/Bテスト・差分の差分法・回帰不連続デザインなど因果推論の手法を使い、施策の真の効果をバイアスを排除して正確に測定するフレームワーク。実験設計から分析手順までを解説。

施策の効果測定 因果関係の検証 投資対効果の算出
難易度 ⏱ 数日〜数週間(データ収集含む)

データSLA

データの鮮度・可用性・品質のサービスレベル合意

データ提供の品質保証 チーム間の期待値合わせ データ基盤の運用改善
難易度 ⏱ 1〜2週間(初期設計)

データカタログ設計

データ資産を発見可能にするカタログ構築手法

データ資産の可視化 データ発見性の向上 データガバナンスの基盤構築
難易度 ⏱ 2〜6週間(初期構築)

データプロダクト・ライフサイクル

データ製品の企画→構築→運用→廃止を体系管理

データプロダクトの企画・立ち上げ 運用中データの品質管理 不要データの整理・廃止
難易度 ⏱ 1〜2時間(設計)、継続的(運用)

データプロダクトキャンバス

データを「製品」として設計・運用する

データプロダクトの企画 データメッシュの実装 データ品質の設計
難易度 ⏱ 1〜2時間

データメッシュガバナンス

データの所有権をドメインに分散させつつ、グローバルポリシーとローカルポリシーで全社的な品質・セキュリティを担保する連邦型ガバナンスのフレームワーク。分散と統制の両立手順を解説。

分散型データ基盤の設計 データ品質の全社統一 ドメイン自律とガバナンスの両立
難易度 ⏱ 数週間〜数か月(導入全体)

データ信頼スコア

データセットの品質・鮮度・完全性を定量評価

データ品質の可視化 分析結果の信頼度判断 データガバナンスの定量管理
難易度 ⏱ 1〜2時間(初回設計)

データ信頼性エンジニアリング

SREの考え方をデータ基盤に適用し信頼性を担保

データパイプラインの安定運用 データ品質の継続的監視 障害対応の標準化
難易度 ⏱ 2〜4週間(初期導入)

実験基盤設計

A/Bテストを組織的にスケールさせるプラットフォーム

A/Bテストのスケール 実験文化の醸成 意思決定の科学化
難易度 ⏱ 数か月(基盤構築全体)

操作変数法

内生性問題を外生的操作変数で解決し因果効果を推定する手法

観察データからの因果推定 内生性バイアスの除去 政策効果の推定
難易度 ⏱ 3〜8時間(データ準備・分析含む)

分断時系列分析

介入前後の時系列トレンド変化を統計的に評価する因果推論手法

施策の因果効果測定 政策変更の影響評価 プロダクト変更の効果検証
難易度 ⏱ 2〜5時間(データ準備含む)

DataOps

データパイプラインにCI/CDとアジャイルを適用

データパイプラインの自動化 データ品質の継続的監視 データチームの生産性向上
難易度 ⏱ 2〜4時間

dbt変換モデル

SQLベースのデータ変換とテストの標準化

DWH内の変換パイプライン構築 データ品質テストの自動化 分析用テーブルの標準化
難易度 ⏱ 1〜3時間

ELTパイプライン設計

変換をDWH内で行う現代的データ統合手法

データ基盤構築 複数ソースの統合 分析環境の高速化
難易度 ⏱ 1〜3時間

Prophet予測モデル

Metaが開発した季節性対応の時系列予測

売上予測 トラフィック予測 在庫計画
難易度 ⏱ 2〜4週間

ガードレールメトリクス

施策の副作用を検知する安全指標の設計と運用

A/Bテストの安全設計 KPIダッシュボード構築 施策リリース判定
難易度 ⏱ 30分〜1時間

マーケティング・ミックス・モデリング

メディア投資のROIを統計的に分解・最適化

広告ROI分析 メディア予算配分最適化 マーケティング効果測定
難易度 ⏱ 4〜8週間

アンサンブル学習

複数モデルを組み合わせて予測精度を向上

予測精度向上 モデル安定化 コンペティション
難易度 ⏱ 2〜4週間

ブートストラップ法

復元抽出で統計量の信頼区間を推定する

信頼区間推定 A/Bテスト補助 小標本分析
難易度 ⏱ 1〜2週間

データアクティベーション

分析結果を実際のビジネスアクションに変換する

分析結果の施策化 パーソナライゼーション データ基盤のROI向上
難易度 ⏱ 1〜2時間

データドリブンOKR

ByteDanceが実践する「データドリブンOKR」— リアルタイムデータに基づいてOKRを高頻度で更新し、急成長を実現する目標管理フレームワーク

目標管理の高度化 データ活用文化の構築 急成長企業の経営管理
難易度 ⏱ 継続的な運用

データプロファイリング

データの構造・品質・統計的特性を事前把握し分析精度を高める

新規データソースの評価 データ移行前の品質検査 ETLパイプラインの検証
難易度 ⏱ 30分〜1時間

データ匿名化

個人情報を保護しながら分析価値を維持するデータ加工手法

分析データの安全な共有 法規制への対応 外部委託時のデータ保護
難易度 ⏱ 2〜6週間

データ品質の6次元

正確性・完全性など6軸でデータ品質を評価

データ品質監査 データガバナンス設計 分析基盤の信頼性向上
難易度 ⏱ 1〜2時間

ゴール・シグナル・メトリクス(GSM)

Googleが開発した指標設計手法。ゴール→シグナル→メトリクスの3層で曖昧なUX目標を計測可能な数値に変換する

KPI設計 UX指標の具体化 プロダクト改善の効果測定
難易度 ⏱ 1〜2時間

ノーススターメトリクス・ツリー

北極星指標を起点に入力指標を階層展開

プロダクトKPI設計 チーム目標の整合 グロース戦略の構造化
難易度 ⏱ 1〜2時間

カウンターメトリクス

主要KPI改善時に犠牲になる指標を監視しバランス維持

A/Bテストの副作用検知 KPI改善の品質担保 施策の多面的評価
難易度 ⏱ 30分〜1時間

コホートリテンション曲線

コホート別の継続率推移を可視化し離脱パターン分析

サブスクリプション分析 アプリ継続率改善 顧客LTV予測
難易度 ⏱ 1〜2時間

ストリーム処理パターン

リアルタイムデータの逐次処理設計手法

リアルタイム分析 異常検知 イベント駆動処理
難易度 ⏱ 2〜8週間

テキストマイニングフレームワーク

大量テキストから有用なパターンや知識を自動抽出

顧客の声分析 レビュー分類 トレンド検出
難易度 ⏱ 2〜6週間

ファネルコンバージョン分析

各ステップの離脱率を特定しコンバージョン全体を最適化

EC購買フロー改善 SaaS契約率向上 広告LP最適化
難易度 ⏱ 1〜2時間

ベイジアンA/Bテスト

ベイズ統計に基づく柔軟な実験評価と意思決定

Webサイト改善 価格テスト UI/UX実験
難易度 ⏱ 1〜2時間

メダリオンアーキテクチャ

Bronze・Silver・Goldの3層でデータレイクハウスを構造化

データレイクハウス設計 ETLパイプライン構築 データ品質の段階的向上
難易度 ⏱ 1〜3時間

メトリクス分解

KPIを構成要素に因数分解し改善打ち手を特定

KPI改善の打ち手特定 売上要因分析 ボトルネック発見
難易度 ⏱ 30分〜1時間

因果推論フレームワーク

観察データから因果関係を特定するRubinモデルやDAG等の統合手法

施策効果の厳密な測定 交絡因子の統制 ビジネス上の因果関係の特定
難易度 ⏱ 2〜3時間

計装計画

イベントトラッキングの設計・命名・実装を体系化

イベント設計 分析基盤構築 ユーザー行動追跡
難易度 ⏱ 1〜3週間

交差検証法

データを分割してモデルの汎化性能を推定

モデル選択 ハイパーパラメータ調整 汎化性能評価
難易度 ⏱ 1〜2週間

混同行列と評価指標

分類モデルの性能を多角的に評価する手法

モデル性能評価 閾値最適化 不均衡データ対応
難易度 ⏱ 1〜2週間

差の差分析(DID)

処置群と対照群の前後変化の差を比較して因果効果を推定

施策の因果効果測定 政策評価 地域別キャンペーン効果分析
難易度 ⏱ 1〜2時間

多腕バンディット問題

探索と活用のバランスを最適化する手法

広告クリエイティブ最適化 レコメンド配信 価格最適化
難易度 ⏱ 1〜2時間

探索的データ分析(EDA)

可視化と要約統計で仮説を立てる前にデータ全体像を掴む

新規データセットの理解 仮説発見 異常値の検出
難易度 ⏱ 1〜3時間

統計的検出力分析

必要サンプルサイズを事前計算し実験精度を担保

A/Bテスト設計 臨床試験計画 アンケート調査設計
難易度 ⏱ 30分〜1時間

特徴量選択手法

予測に有効な変数を体系的に選ぶ方法論

モデル精度向上 次元削減 解釈性の改善
難易度 ⏱ 1〜3週間

CRISP-DM

データ分析プロジェクトを6つのフェーズで体系化し、手戻りを最小化する業界標準プロセスモデル

データ分析プロジェクトの計画策定 機械学習モデルの開発工程管理 分析チームのプロセス標準化 ステークホルダーへの進捗説明
難易度 ⏱ 1〜3時間(全体計画)

アトリビューションモデリング

マーケティングチャネルごとの貢献度を定量評価し、予算配分を最適化するための分析フレームワーク

広告予算の最適配分 チャネル別ROIの可視化 マーケティングミックスの見直し カスタマージャーニーの貢献度分析
難易度 ⏱ 3〜6時間

イベント分析

ユーザー行動をイベントログとして構造化し、行動パターンの発見からプロダクト改善につなげる分析手法

機能利用率の可視化 ユーザーの離脱ポイント特定 エンゲージメント指標の設計 プロダクト改善の仮説発見
難易度 ⏱ 2〜4時間

データインフォームド意思決定

データを判断材料の一つとして活用しつつ、人間の知見・文脈・直感も組み合わせて最適な意思決定を行うアプローチ

戦略的な意思決定 データと直感が矛盾する場面の判断 新規事業・未知の領域での判断 チームの意思決定プロセス設計
難易度 ⏱ 30分〜1時間

データオブザーバビリティ

データパイプラインの異常を自動検知し、品質問題を早期発見・迅速対応するための監視フレームワーク

パイプライン障害の早期検知 データ品質の継続監視 SLA違反の自動アラート インシデント対応の迅速化
難易度 ⏱ 数週間〜数ヶ月(段階的に導入)

データコントラクト

データ提供者と利用者間でスキーマ・品質基準・SLAを明文化し、信頼できるデータ連携を実現する合意手法

データ連携の品質保証 スキーマ変更の事前合意 チーム間のデータ責任明確化 データメッシュの基盤構築
難易度 ⏱ 1〜2週間(1契約あたり)

データサンプリング手法

大規模データから適切な標本を抽出し、偏りを最小限に抑えて効率的に分析するためのサンプリング設計ガイド

アンケート調査の標本設計 大規模データの効率的な探索分析 A/Bテストの対象ユーザー抽出 品質検査のサンプル決定
難易度 ⏱ 1〜3時間

データプロダクト思考

データを製品として扱い、品質・発見性・利用体験を継続的に向上させるアプローチ

データの利用率向上 データメッシュの実践 社内データ資産の価値最大化 セルフサービス分析の実現
難易度 ⏱ 数週間〜数ヶ月(段階的に適用)

データリネージ

データの発生源から最終利用までの流れを追跡・可視化し、信頼性と影響範囲を把握する手法

データ品質問題の原因特定 変更影響範囲の把握 コンプライアンス対応 データパイプラインの可視化
難易度 ⏱ 数週間〜数ヶ月(段階的に構築)

データ成熟度モデル

組織のデータ活用レベルを5段階で診断し、次に取るべきアクションを明確にするフレームワーク

組織のデータ活用レベル診断 データ戦略のロードマップ策定 経営層への投資説得 部門間のデータ活用格差の把握
難易度 ⏱ 2〜4時間(初回診断)

ディメンショナルモデリング

スタースキーマやスノーフレークスキーマでDWHを設計し、分析しやすいデータ構造を構築する手法

DWH/データマートの設計 BIダッシュボードの基盤構築 分析クエリの高速化 レポーティング基盤の整備
難易度 ⏱ 数週間〜数ヶ月(DWH規模による)

メトリクスツリー

KPIを因数分解してツリー構造で可視化し、最もインパクトの大きい改善レバーを特定するフレームワーク

KPIの構造的な分解 改善インパクトの大きいレバーの特定 チーム間の目標整合 施策の優先順位づけ
難易度 ⏱ 1〜2時間

メトリクスレイヤー

KPIや指標の定義を一元管理し、組織全体で同じ計算ロジックに基づく意思決定を可能にする仕組み

KPI定義の統一 レポート間の数値不一致解消 セルフサービスBIの基盤構築 指標のガバナンス強化
難易度 ⏱ 数週間〜数ヶ月(段階的に構築)

異常検知の実践

統計手法と機械学習を組み合わせてデータの異常値を自動検出し、ビジネス上の問題を早期発見する実践ガイド

KPIの急変検知と原因特定 不正取引の自動検出 製造ラインの品質異常検知 サーバー障害の予兆検知
難易度 ⏱ 4〜8時間(初期構築)

実験統計学

A/Bテストや実験の統計的設計・分析・解釈の基本を体系的に学び、データに基づく意思決定の精度を上げるフレームワーク

A/Bテストの統計設計と結果判定 施策効果の因果推定 マーケティング実験の設計 プロダクト改善の仮説検証
難易度 ⏱ 2〜4時間(設計)+ 1〜4週間(実行)

重要指標の見極め

バニティメトリクスを排除し、事業成果に直結する本当に動かすべき指標を選び抜くフレームワーク

KPI選定の見直し レポートの指標削減 バニティメトリクスの排除 チームの目標設定
難易度 ⏱ 1〜2時間

先行指標と遅行指標

先行指標で未来を予測し先手を打つ指標設計で、結果が出る前に軌道修正を可能にするフレームワーク

KPI設計の見直し 目標管理(OKR・MBO)の指標選定 早期警戒システムの構築 チームの行動指標の設計
難易度 ⏱ 1〜2時間

A/Bテストの統計設計

サンプルサイズや有意差の考え方を正しく理解し、信頼できるA/Bテストを設計するためのフレームワーク

WebサイトのUI改善検証 マーケティング施策の効果比較 価格設定の最適化 メール件名の最適化
難易度 ⏱ 2〜3時間(設計)+ 数日〜数週間(実行)

ABC分析

売上や在庫を重要度でA・B・Cにランク分けし、重点管理すべき対象を見極める分析手法

商品の売上ランク分類 在庫管理の最適化 顧客の重要度分類 リソース配分の見直し
難易度 ⏱ 1〜2時間

ETLプロセス

データの抽出・変換・読み込みを体系化し、分析基盤を構築するためのフレームワーク

データウェアハウスの構築 複数システムのデータ統合 定期レポートの自動化 データ移行プロジェクト
難易度 ⏱ 4〜8時間

KPIダッシュボード設計

重要指標を一画面に集約し、組織の状態をリアルタイムに把握するための設計手法

経営状況のリアルタイム把握 チームの目標管理 異常の早期発見 ステークホルダーへの報告
難易度 ⏱ 4〜8時間

KPIツリー

最終目標(KGI)を分解してツリー構造にし、打ち手の優先順位を明確にするフレームワーク

売上目標の達成手段の可視化 ボトルネックの特定と改善優先度の判断 チーム目標の整合性確保 施策のインパクト試算
難易度 ⏱ 1〜3時間

LTV分析

顧客の生涯価値を算出し、獲得コストとのバランスから投資判断を最適化する分析手法

マーケティング予算の最適配分 顧客セグメントの優先順位付け 価格戦略の検証 事業の収益性評価
難易度 ⏱ 2〜4時間

MECE(ミーシー)

モレなくダブりなく物事を分解し、論理的に整理するための思考フレームワーク

問題の構造化 プレゼン資料作成 議論の整理
難易度 ⏱ 15〜30分

NPS分析手法

顧客の推薦意向を数値化し、ロイヤルティの構造を分析して改善施策を導く手法

顧客ロイヤルティの測定 解約リスクの予測 改善優先順位の特定 競合との比較
難易度 ⏱ 1〜3時間(分析)

OLAP分析

多次元データを自在に切り口を変えながら高速に集計・分析する手法

売上の多角的分析 予実管理 KPIの深掘り分析 経営ダッシュボード構築
難易度 ⏱ 数時間〜数日

RFI分析(Recency-Frequency-Impact)

直近性・頻度・影響度の3軸でイベントやインシデントを評価し、優先対応を決定する分析手法

インシデントの優先順位づけ バグの対応順序決定 顧客クレームの分析 リスク評価と対策立案
難易度 ⏱ 1〜2時間

Webアナリティクス

Webサイトのアクセスデータを分析し、ユーザー行動の理解と改善施策を導くフレームワーク

サイト改善 コンバージョン最適化 コンテンツ戦略の評価
難易度 ⏱ 1〜2時間(基本分析)/ 継続的

マーケットバスケット分析

顧客の購買データから『一緒に買われやすい商品の組み合わせ』を発見する分析手法

クロスセル施策の設計 商品レコメンドの構築 店舗レイアウトの最適化 セット商品の企画
難易度 ⏱ 2〜4時間

データカタログ

組織内のデータ資産を一覧化・検索可能にし、誰でも必要なデータを見つけられる仕組み

データ資産の可視化 データ発見の効率化 データガバナンスの基盤構築 新メンバーのオンボーディング
難易度 ⏱ 数週間〜数ヶ月(段階的に整備)

データガバナンス

組織全体でデータの品質・安全性・活用ルールを整備し、データ資産を最大限に活かす管理フレームワーク

データ活用の全社推進 コンプライアンス対応 データ品質の標準化 部門間のデータ共有促進
難易度 ⏱ 数週間〜数ヶ月(段階的に導入)

データクレンジング

分析の精度を左右する、データの欠損・重複・不整合を発見し修正するプロセス

分析精度の向上 レポートの信頼性確保 システム統合時のデータ整備 マスターデータの品質管理
難易度 ⏱ 1〜4時間

データパイプライン設計

データの収集・変換・格納・活用までの一連の流れを設計し、分析基盤を構築する手法

分析基盤の構築 レポート自動化 リアルタイムデータ処理 データウェアハウス構築
難易度 ⏱ 1〜4週間(設計〜構築)

データビジュアライゼーション原則

データを正しく・わかりやすく・美しく伝えるための可視化の基本原則

プレゼン資料のグラフ改善 ダッシュボード設計 レポートの説得力向上 誤解のないデータ伝達
難易度 ⏱ 1〜3時間

データメッシュ分析

データのオーナーシップを各ドメインに分散させ、自律的なデータ活用を実現するアーキテクチャ思想

大規模組織のデータ活用 データサイロの解消 データチームのスケーリング
難易度 ⏱ 3〜6ヶ月(導入プロジェクト)

データリテラシー

データを読み解き、活用し、批判的に評価する力を組織全体で底上げするフレームワーク

組織のデータ活用力向上 データドリブン文化の醸成 分析結果の正しい解釈 データに基づく議論の質向上
難易度 ⏱ 継続的な取り組み

データ品質管理

データの正確性・完全性・一貫性を体系的に測定・改善し、信頼できるデータを維持する管理手法

データの信頼性向上 分析結果の精度担保 レポートの品質改善 データガバナンスの実践
難易度 ⏱ 継続的な取り組み

データ民主化

組織の全員がデータにアクセスし、自律的にデータ活用できる環境を構築するアプローチ

セルフサービスBIの導入 データドリブン文化の醸成 部門横断のデータ活用推進
難易度 ⏱ 3〜6ヶ月(組織導入)

データ倫理

データの収集・分析・活用において守るべき倫理的原則と実践的な判断基準

データ活用方針の策定 プライバシー保護の判断 AIの公平性確保 データ活用の社内ガイドライン作成
難易度 ⏱ 継続的な取り組み

カスタマーアナリティクス

顧客データを体系的に分析し、顧客理解と収益最大化を実現するための分析手法

顧客セグメンテーション 解約防止 クロスセル・アップセル戦略
難易度 ⏱ 1〜2週間(初期分析)

クラスター分析

データを類似性に基づいてグループ分けし、隠れたパターンやセグメントを発見する手法

顧客セグメンテーション 市場の分類 異常検知の前処理 商品グルーピング
難易度 ⏱ 3〜6時間

クロス集計

2つ以上の変数を掛け合わせた集計表で、データの関係性やパターンを発見する基本手法

アンケート結果の分析 顧客属性と行動の関係把握 仮説の検証 レポート作成
難易度 ⏱ 30分〜1時間

コホート分析

ユーザーを登録時期別にグループ分けし、時間経過に伴う行動の変化を比較する分析手法

サービスの継続率改善 施策の長期的効果検証 ユーザーの行動変化の把握 LTVの予測精度向上
難易度 ⏱ 2〜4時間

コンジョイント分析

製品やサービスの属性ごとの価値を定量化し、最適な組み合わせを導く市場調査手法

新商品の属性最適化 価格感度分析 ターゲット別の商品設計 競合シミュレーション
難易度 ⏱ 1〜2週間(調査設計〜分析)

ストリーミング分析

リアルタイムに流れるデータを即座に処理・分析し、即時的な意思決定を可能にする手法

リアルタイム異常検知 ライブダッシュボード 動的な価格設定
難易度 ⏱ 1〜3ヶ月(初期構築)

チャーンレート分析

顧客の解約率を測定・分析し、離脱の原因と防止策を体系的に導き出す手法

解約率の改善 解約予測モデルの構築 顧客維持戦略の立案 SaaS事業のヘルスチェック
難易度 ⏱ 2〜4時間

テキストマイニング

大量のテキストデータから有用なパターンやインサイトを自動的に抽出する分析手法

顧客の声(VoC)の分析 SNSの評判モニタリング 問い合わせ内容の自動分類 競合のレビュー分析
難易度 ⏱ 3〜6時間

ネットワーク分析

人・モノ・情報のつながりをグラフ構造で可視化・分析し、関係性のパターンを発見する手法

インフルエンサーの特定 組織のコミュニケーション分析 不正検知 レコメンデーション
難易度 ⏱ 数日〜数週間

パレート図分析

問題や原因を大きい順に並べ、累積比率で全体への影響度を可視化する分析手法

不良品原因の特定 クレーム分析 コスト削減の優先順位付け 売上構成の分析
難易度 ⏱ 30分〜1時間

ヒストグラム分析

データの分布形状を棒グラフで可視化し、ばらつきや偏りのパターンを読み取る分析手法

製品品質のばらつき確認 テスト結果の分布分析 顧客単価の傾向把握 業務処理時間の分析
難易度 ⏱ 30分〜1時間

ピボットテーブル分析

大量データを行・列・値の3軸で集計し、多角的な視点から傾向をつかむ分析手法

売上データの多軸分析 顧客セグメント別の比較 商品カテゴリ別の傾向把握 部門別の実績集計
難易度 ⏱ 30分〜1時間

ファネル分析

ユーザーの行動をステップごとに可視化し、どこで離脱しているかを特定するフレームワーク

ECサイトの購入率改善 SaaSのオンボーディング改善 広告キャンペーンの効果測定 アプリの継続率分析
難易度 ⏱ 1〜3時間

ベイズ思考

新しい情報を得るたびに確率を更新し、不確実な状況でより正しい判断に近づく思考法

不確実な状況での意思決定 仮説の妥当性評価 リスク判断の精度向上 医療検査の結果解釈
難易度 ⏱ 30分〜1時間(思考整理)

モンテカルロシミュレーション

乱数を使って何千通りものシナリオを生成し、不確実な状況の確率分布を把握する手法

事業計画のリスク定量化 プロジェクト完了確率の算出 投資ポートフォリオのリスク評価 需要予測の確率分布
難易度 ⏱ 4〜8時間

リアルタイム分析

データ発生と同時に分析・可視化し、即座にアクションにつなげる分析手法

異常検知のリアルタイム監視 ライブダッシュボード構築 リアルタイムパーソナライゼーション
難易度 ⏱ 1〜3ヶ月(基盤構築)

意思決定マトリクス

複数の選択肢を評価基準ごとにスコアリングし、最も合理的な判断を下すフレームワーク

ツール選定 採用候補の比較 プロジェクトの優先順位づけ 戦略オプションの評価
難易度 ⏱ 30分〜1時間

異常検知

通常のパターンから外れたデータを自動的に検出し、問題の早期発見と対応を可能にする手法

不正検知(クレジットカード不正、アカウント乗っ取り) システム障害の早期発見 品質管理の異常値検出 KPIの急変検知
難易度 ⏱ 3〜6時間

移動平均法

一定期間のデータを平均してノイズを除去し、トレンドを浮かび上がらせる分析手法

売上トレンドの把握 株価のテクニカル分析 需要予測 季節変動の除去
難易度 ⏱ 30分〜1時間

因子分析

観測データの背後にある隠れた共通因子を発見し、データの構造を理解する分析手法

アンケートデータの構造分析 顧客心理の解明 ブランドイメージの把握 テスト問題の妥当性検証
難易度 ⏱ 3〜6時間

仮説検定の基本

データから統計的に「意味のある差」を判定し、思い込みによる誤った判断を防ぐ手法

A/Bテストの判定 施策効果の統計的検証 品質管理 アンケート結果の分析
難易度 ⏱ 2〜4時間

回帰分析の考え方

データの関係性を定量的に把握し、因果と相関を正しく区別するための思考フレームワーク

施策の効果検証 KPIの要因分析 誤った意思決定の回避 データに基づく提案の説得力向上
難易度 ⏱ 1〜2時間(思考整理)

感度分析

前提条件の変化が結果にどれだけ影響するかを検証し、リスクの大きい要因を特定する手法

事業計画の堅牢性検証 投資判断のリスク評価 価格設定の影響分析 プロジェクト見積もりの精度向上
難易度 ⏱ 2〜4時間

管理図(SPC)

時系列データに管理限界線を設定し、プロセスの異常を早期に検知する分析手法

製造工程の品質管理 サービスレベルの監視 業務プロセスの安定性確認 KPIの異常検知
難易度 ⏱ 1〜2時間

季節性分析

データに潜む季節的なパターンを見つけ出し、需要予測や計画立案に活かす分析手法

需要予測の精度向上 在庫管理の最適化 広告予算の配分 キャンペーン時期の決定
難易度 ⏱ 2〜4時間

散布図分析

2つの変数の関係を点でプロットし、相関や外れ値を視覚的に発見する分析手法

広告費と売上の関係分析 従業員満足度と離職率の関係 気温と売上の関係 学習時間と成績の関係
難易度 ⏱ 30分〜1時間

時系列分析

時間の経過に沿ったデータの変動パターンを分解・理解し、将来の値を予測する分析手法

売上予測 需要予測 在庫計画 KPIのトレンド把握
難易度 ⏱ 3〜6時間

次元削減

高次元データの情報をできるだけ保ちながら、扱いやすい低次元に圧縮する分析手法

高次元データの可視化 モデルの計算コスト削減 ノイズ除去 特徴量の圧縮
難易度 ⏱ 数時間〜数日

自然言語処理入門

テキストデータをコンピュータで分析・理解するための基本的な手法と活用の考え方

顧客の声の分析 チャットボット構築 文書分類の自動化 感情分析
難易度 ⏱ 数日〜数週間

実験計画法

仮説を効率的に検証するための実験の設計・実行・分析の体系的な手法

施策の因果効果の測定 プロダクト改善のための実験 マーケティング施策の効果検証
難易度 ⏱ 1〜2週間(設計)+ 数週間(実行)

主成分分析(PCA)

多数の変数を少数の主成分に集約し、データの本質的な構造を見える化する次元削減手法

高次元データの可視化 特徴量の圧縮 ノイズ除去 クラスター分析の前処理
難易度 ⏱ 2〜4時間

処方的分析

データに基づいて最適なアクションを提案する、意思決定支援のための高度な分析手法

価格最適化 リソース配分の最適化 サプライチェーンの効率化
難易度 ⏱ 2〜6週間(モデル設計・実装)

信頼区間

データの推定値に対して『本当の値はこの範囲にある』と確率的に示す統計手法

A/Bテスト結果の解釈 アンケート結果の精度評価 売上予測の幅の提示 品質管理の基準設定
難易度 ⏱ 1〜2時間

生存分析

イベントが発生するまでの時間を分析し、継続率や離脱タイミングを精密に把握する手法

サブスクリプションの解約予測 顧客の生涯価値(LTV)の推定 機器の故障タイミング予測 臨床試験のデータ分析
難易度 ⏱ 3〜6時間

相関分析

2つの変数の関係性の強さと方向を数値で把握し、因果の手がかりを得る分析手法

施策効果の要因分析 売上ドライバーの特定 変数間の関連性の探索 予測モデルの変数選択
難易度 ⏱ 1〜3時間

地理空間分析

位置情報を活用してデータを地図上で可視化・分析し、空間的なパターンを発見する手法

出店戦略の立案 配送ルートの最適化 商圏分析 人流データ分析
難易度 ⏱ 数時間〜数日

特徴量エンジニアリング

機械学習モデルの精度を左右する特徴量(変数)を設計・作成する技術体系

予測モデルの精度向上 新しい分析視点の創出 データの前処理 ドメイン知識のモデルへの反映
難易度 ⏱ 数時間〜数日

予測分析

過去のデータからパターンを見出し、将来の結果を予測するための分析手法

需要予測 顧客離脱の予測 売上見込みの算出
難易度 ⏱ 2〜4週間(モデル構築・検証)