データガバナンス

英語名 Data Governance
読み方 データ ガバナンス
難易度
所要時間 数週間〜数ヶ月(段階的に導入)
提唱者 IT ガバナンスの概念をデータ管理に特化して発展
目次

ひとことで言うと
#

誰が・どのデータを・どんなルールで管理し、活用するか」を組織全体で定義・運用する管理フレームワーク。データの品質、セキュリティ、アクセス権限、命名規則などを標準化し、データを信頼できる資産にする

押さえておきたい用語
#

押さえておきたい用語
データオーナー(Data Owner)
特定のデータ領域に対して品質と定義の最終責任を持つ人のこと。通常は部門長やマネージャーが担い、データの定義変更やアクセス権限の承認を行う。
データスチュワード(Data Steward)
データオーナーの下で日常的なデータ品質の維持・改善を担当する実務者のこと。各部門に配置し、ルールの遵守状況をモニタリングする。
データ品質(Data Quality)
データの正確性・完全性・一貫性・適時性・一意性・妥当性の6軸で評価される状態のこと。品質が低いと分析結果の信頼性が損なわれる。
マスターデータ管理(MDM)
顧客・商品・組織など、複数システムで共通に参照される基幹データを一元管理する仕組みのこと。重複や不整合の根本的な解消に必要。

データガバナンスの全体像
#

データガバナンス:棚卸し→ルール策定→品質監視→定着の4ステップ
1. データの棚卸しどんなデータが・どこに誰が管理・品質はどうかまず全体像を把握する2. オーナーとルール定義の統一・命名規則更新頻度・保存期間・権限ドキュメント化して全社共有3. データ品質の監視正確性・完全性・一貫性適時性・一意性・妥当性自動チェック+ダッシュボード4. 体制の定着データスチュワード配置四半期レビュー・教育研修「統制」ではなく「活用の基盤」信頼できるデータに基づく意思決定部門間で数字が合う → 分析の信頼性UP → 活用が加速
データガバナンスの導入フロー
1
データの棚卸し
何が・どこに・誰が管理
2
ルール策定
定義統一+オーナー設定
3
品質監視
6軸で測定し自動チェック
組織に定着
四半期レビューで形骸化防止

こんな悩みに効く
#

  • 部署ごとに同じ指標の定義が違い、会議で数字が合わない
  • 個人情報の管理が属人的で、情報漏洩のリスクがある
  • 「データドリブン」を掲げているが、そもそも使えるデータがどこにあるかわからない

基本の使い方
#

ステップ1: データの現状を棚卸しする

組織内にどんなデータが存在し、どう管理されているかを**棚卸し(データカタログの作成)**する。

確認項目:

  • どんなデータがあるか: 顧客データ、売上データ、アクセスログなど
  • どこに保存されているか: データベース、スプレッドシート、個人PC
  • 誰が管理しているか: 担当部署・担当者
  • 品質はどうか: 更新頻度、欠損率、重複の有無
  • アクセス権限は誰にあるか

ポイント: 「個人のPCにだけある重要データ」が見つかることが多い。まず全体像を把握することが第一歩。

ステップ2: データオーナーとルールを定める

各データに**責任者(データオーナー)**を設定し、管理ルールを定める。

定めるべきルール:

  • 定義の統一: 「売上」は税込か税抜か、返品を含むか
  • 命名規則: テーブル名・カラム名の命名ルール
  • 更新頻度: リアルタイム / 日次 / 月次
  • 保存期間: 何年分保持するか、いつ削除するか
  • アクセス権限: 誰が閲覧・編集できるか

ポイント: ルールはドキュメント化して全社に共有する。口頭の約束やメールでの伝達は機能しない。

ステップ3: データ品質の基準と監視を設定する

データの品質を測定可能な指標で定義し、継続的に監視する。

データ品質の6つの軸:

  1. 正確性: データが実際の値と一致しているか
  2. 完全性: 欠損値がないか
  3. 一貫性: 複数システム間でデータが矛盾していないか
  4. 適時性: データが最新か
  5. 一意性: 重複がないか
  6. 妥当性: 定義されたルールに従っているか

監視方法:

  • 自動チェックスクリプトで日次監視
  • 品質ダッシュボードで可視化
  • 閾値を下回ったらアラート通知
ステップ4: ガバナンス体制を組織に定着させる

ルールを作って終わりにせず、組織に定着させる仕組みを作る。

  • データスチュワード: 各部門にデータ品質の推進役を配置
  • 定期レビュー: 四半期に1回、ルールの実効性を確認・改善
  • 教育・啓蒙: データリテラシー研修の実施
  • ツール導入: データカタログツール(Alation、DataHubなど)

ポイント: ガバナンスは「統制」ではなく「データをもっと活用するための基盤」。制約を増やすのではなく、信頼できるデータを簡単に使えるようにすることが目的。

具体例
#

例1:製造業500人が「売上の定義」を統一し月次決算を10日→5日に短縮する

状況: 従業員500人の製造業。部署ごとにExcelで独自にデータを管理しており、「会社全体の正確な売上」すら即座にわからない。

問題の発見(棚卸しの結果):

  • 「売上」の定義が営業部(受注ベース)と経理部(検収ベース)で異なる
  • 顧客マスターが3つのシステムに分散し、重複が2,000件以上
  • 個人情報を含むExcelファイルが共有フォルダに無制限でアクセス可能
  • 退職者のアカウントがシステムに残ったまま

導入したガバナンス施策:

施策内容
定義の統一「売上」=検収ベース・税抜・返品控除後 に全社統一
マスターデータ統合顧客マスターを1つに統合、更新は経理部がオーナー
アクセス管理個人情報を含むデータは申請・承認制に変更
データカタログ主要データの場所・定義・オーナーをWikiに一覧化
定期レビュー四半期に1回、データ品質レポートを経営会議で共有

**結果: 月次決算の報告スピードが10営業日→5営業日に短縮。**部門間で「数字が合わない」問題が解消。個人情報漏洩リスクの指摘事項がゼロに。データを使った分析プロジェクトが四半期で3件→8件に増加。

例2:SaaS企業がデータ品質ダッシュボードで欠損率を15%→2%に改善する

状況: 従業員150名のBtoB SaaS。CRMのデータ品質が低く、マーケティングメールのバウンス率が18%、セグメント分析の信頼性が低い。

データ品質の診断結果:

  • メールアドレスの欠損率: 15%
  • 企業名の表記ゆれ: 3,200件(全8,000社中)
  • 担当者名の重複: 800件
  • 業種コードの未入力: 22%

ガバナンス施策:

  1. データオーナーの設定: CRMデータのオーナー=営業部長、スチュワード=営業企画2名
  2. 入力ルール策定: CRMの入力項目にバリデーション(必須項目、形式チェック)を追加
  3. 品質ダッシュボード構築: 欠損率・表記ゆれ件数・重複件数を週次で自動集計・可視化
  4. 週次クリーンアップ: スチュワードが品質スコアの低いレコードを修正(週2時間)

**結果: 6ヶ月で欠損率が15%→2%に改善。メールバウンス率が18%→3%に低下。**マーケティングメールの到達率向上により、リード獲得数が月100件→145件に増加。

例3:金融機関がGDPR対応を機にデータガバナンスを全社導入し、海外展開を加速する

状況: 従業員2,000名の金融サービス企業。欧州展開に伴いGDPR対応が急務だが、そもそも社内のデータ管理が属人的で、個人データの所在すら把握できていない。

段階的な導入:

  • Phase 1(1ヶ月): 個人データの棚卸し。28システムに個人データが散在していることを確認
  • Phase 2(2〜3ヶ月): 各システムのデータオーナーを任命(計15名)。個人データの分類(要同意/正当利益/法的義務)を実施
  • Phase 3(4〜6ヶ月): データ処理の法的根拠の整理、同意管理プラットフォームの導入、アクセス権限の再設計
  • Phase 4(継続): 四半期ごとの監査、年次のプライバシー影響評価

**結果: GDPR対応を期限内に完了し、欧州事業を予定通り開始。**データ管理の整備により、社内の分析プロジェクトのデータ準備期間が平均3週間→5日に短縮。副次的に、国内の個人情報保護法の改正対応もスムーズに完了。

やりがちな失敗パターン
#

  1. ルールを厳しくしすぎて誰も守らない — 100ページのガイドラインを作っても読まれない。最初はルールを3〜5個に絞り、最も効果の高いものから着手する
  2. IT部門だけで進めてしまう — データガバナンスは全社的な取り組み。ビジネス部門のデータオーナーを巻き込まないと、現場で使われないルールになる
  3. 一度整備して終わりにする — ビジネスやシステムは変化し続ける。ルールも定期的に見直し、形骸化を防ぐ。最低でも四半期に1回のレビューを組み込む
  4. ガバナンス=制約だと誤解される — 「面倒なルールが増えた」と思われると現場の協力が得られない。「信頼できるデータを簡単に使える環境を作る」というメリットを先に示す

まとめ
#

データガバナンスは、組織全体でデータの品質・安全性・活用ルールを整備するフレームワーク。データの定義を統一し、品質を監視し、責任者を明確にすることで、「信頼できるデータ」に基づく意思決定が可能になる。まずはデータの棚卸しを行い、最も問題の大きい1〜2つのデータに対してオーナーとルールを設定するところから始めよう。