アンサンブル学習

複数モデルを組み合わせて予測精度を向上

予測精度向上 モデル安定化 コンペティション
難易度 ⏱ 2〜4週間

交差検証法

データを分割してモデルの汎化性能を推定

モデル選択 ハイパーパラメータ調整 汎化性能評価
難易度 ⏱ 1〜2週間

混同行列と評価指標

分類モデルの性能を多角的に評価する手法

モデル性能評価 閾値最適化 不均衡データ対応
難易度 ⏱ 1〜2週間

多腕バンディット問題

探索と活用のバランスを最適化する手法

広告クリエイティブ最適化 レコメンド配信 価格最適化
難易度 ⏱ 1〜2時間

特徴量選択手法

予測に有効な変数を体系的に選ぶ方法論

モデル精度向上 次元削減 解釈性の改善
難易度 ⏱ 1〜3週間

CRISP-DM

データ分析プロジェクトを6つのフェーズで体系化し、手戻りを最小化する業界標準プロセスモデル

データ分析プロジェクトの計画策定 機械学習モデルの開発工程管理 分析チームのプロセス標準化 ステークホルダーへの進捗説明
難易度 ⏱ 1〜3時間(全体計画)

次元削減

高次元データの情報をできるだけ保ちながら、扱いやすい低次元に圧縮する分析手法

高次元データの可視化 モデルの計算コスト削減 ノイズ除去 特徴量の圧縮
難易度 ⏱ 数時間〜数日

特徴量エンジニアリング

機械学習モデルの精度を左右する特徴量(変数)を設計・作成する技術体系

予測モデルの精度向上 新しい分析視点の創出 データの前処理 ドメイン知識のモデルへの反映
難易度 ⏱ 数時間〜数日

予測分析

過去のデータからパターンを見出し、将来の結果を予測するための分析手法

需要予測 顧客離脱の予測 売上見込みの算出
難易度 ⏱ 2〜4週間(モデル構築・検証)