ひとことで言うと#
「誰が・どのデータを・どんなルールで管理し、活用するか」を組織全体で定義・運用する管理フレームワーク。データの品質、セキュリティ、アクセス権限、命名規則などを標準化し、データを信頼できる資産にする。
押さえておきたい用語#
- データオーナー(Data Owner)
- 特定のデータ領域に対して品質と定義の最終責任を持つ人のこと。通常は部門長やマネージャーが担い、データの定義変更やアクセス権限の承認を行う。
- データスチュワード(Data Steward)
- データオーナーの下で日常的なデータ品質の維持・改善を担当する実務者のこと。各部門に配置し、ルールの遵守状況をモニタリングする。
- データ品質(Data Quality)
- データの正確性・完全性・一貫性・適時性・一意性・妥当性の6軸で評価される状態のこと。品質が低いと分析結果の信頼性が損なわれる。
- マスターデータ管理(MDM)
- 顧客・商品・組織など、複数システムで共通に参照される基幹データを一元管理する仕組みのこと。重複や不整合の根本的な解消に必要。
データガバナンスの全体像#
こんな悩みに効く#
- 部署ごとに同じ指標の定義が違い、会議で数字が合わない
- 個人情報の管理が属人的で、情報漏洩のリスクがある
- 「データドリブン」を掲げているが、そもそも使えるデータがどこにあるかわからない
基本の使い方#
組織内にどんなデータが存在し、どう管理されているかを**棚卸し(データカタログの作成)**する。
確認項目:
- どんなデータがあるか: 顧客データ、売上データ、アクセスログなど
- どこに保存されているか: データベース、スプレッドシート、個人PC
- 誰が管理しているか: 担当部署・担当者
- 品質はどうか: 更新頻度、欠損率、重複の有無
- アクセス権限は誰にあるか
ポイント: 「個人のPCにだけある重要データ」が見つかることが多い。まず全体像を把握することが第一歩。
各データに**責任者(データオーナー)**を設定し、管理ルールを定める。
定めるべきルール:
- 定義の統一: 「売上」は税込か税抜か、返品を含むか
- 命名規則: テーブル名・カラム名の命名ルール
- 更新頻度: リアルタイム / 日次 / 月次
- 保存期間: 何年分保持するか、いつ削除するか
- アクセス権限: 誰が閲覧・編集できるか
ポイント: ルールはドキュメント化して全社に共有する。口頭の約束やメールでの伝達は機能しない。
データの品質を測定可能な指標で定義し、継続的に監視する。
データ品質の6つの軸:
- 正確性: データが実際の値と一致しているか
- 完全性: 欠損値がないか
- 一貫性: 複数システム間でデータが矛盾していないか
- 適時性: データが最新か
- 一意性: 重複がないか
- 妥当性: 定義されたルールに従っているか
監視方法:
- 自動チェックスクリプトで日次監視
- 品質ダッシュボードで可視化
- 閾値を下回ったらアラート通知
ルールを作って終わりにせず、組織に定着させる仕組みを作る。
- データスチュワード: 各部門にデータ品質の推進役を配置
- 定期レビュー: 四半期に1回、ルールの実効性を確認・改善
- 教育・啓蒙: データリテラシー研修の実施
- ツール導入: データカタログツール(Alation、DataHubなど)
ポイント: ガバナンスは「統制」ではなく「データをもっと活用するための基盤」。制約を増やすのではなく、信頼できるデータを簡単に使えるようにすることが目的。
具体例#
従業員500人の製造業。部署ごとにExcelで独自にデータを管理しており、「会社全体の正確な売上」すら即座にわからない。
棚卸しをしてみると問題が次々と出てきた。「売上」の定義が営業部(受注ベース)と経理部(検収ベース)で異なり、顧客マスターが3システムに分散して重複が2,000件以上。個人情報入りのExcelが共有フォルダに無制限でアクセス可能で、退職者のアカウントもそのまま残っていた。
「売上」を検収ベース・税抜・返品控除後に全社統一し、顧客マスターを1つに統合(オーナーは経理部)。個人情報データは申請・承認制に変更し、主要データの場所と定義をWikiに一覧化した。
月次決算の報告スピードが10営業日→5営業日に短縮。「数字が合わない」問題が解消し、データを使った分析プロジェクトが四半期で3件→8件に増えた。
従業員150名のBtoB SaaS。CRMのデータ品質が低く、マーケティングメールのバウンス率が18%でセグメント分析の信頼性が低い。
診断すると、メールアドレスの欠損率15%、企業名の表記ゆれ3,200件(全8,000社中)、担当者名の重複800件、業種コードの未入力22%と、予想以上に深刻だった。
CRMデータのオーナーを営業部長、スチュワードを営業企画2名に設定。入力項目にバリデーション(必須項目・形式チェック)を追加し、欠損率・表記ゆれ・重複件数を週次で自動集計するダッシュボードを構築。スチュワードが週2時間で品質スコアの低いレコードを修正する運用を続けた。
6ヶ月で欠損率が15%→2%に改善。メールバウンス率が18%→3%に低下し、リード獲得数が月100件→145件に増加した。
従業員2,000名の金融サービス企業。欧州展開に伴いGDPR対応が急務だが、社内のデータ管理が属人的で個人データの所在すら把握できていない。
4フェーズで段階的に進めた。まず1ヶ月で個人データを棚卸しすると、28システムに散在していることが判明。2〜3ヶ月目はシステムごとにデータオーナー(計15名)を任命し、個人データを要同意/正当利益/法的義務の3区分に分類。4〜6ヶ月目にデータ処理の法的根拠を整理し、同意管理プラットフォームを導入してアクセス権限を再設計。以降は四半期監査と年次のプライバシー影響評価を継続運用としている。
GDPR対応を期限内に完了し、欧州事業を予定通り開始。データ管理の整備で社内の分析プロジェクトのデータ準備期間が平均3週間→5日に短縮され、国内の個人情報保護法改正への対応もスムーズに完了した。
やりがちな失敗パターン#
- ルールを厳しくしすぎて誰も守らない — 100ページのガイドラインを作っても読まれない。最初はルールを3〜5個に絞り、最も効果の高いものから着手する
- IT部門だけで進めてしまう — データガバナンスは全社的な取り組み。ビジネス部門のデータオーナーを巻き込まないと、現場で使われないルールになる
- 一度整備して終わりにする — ビジネスやシステムは変化し続ける。ルールも定期的に見直し、形骸化を防ぐ。最低でも四半期に1回のレビューを組み込む
- ガバナンス=制約だと誤解される — 「面倒なルールが増えた」と思われると現場の協力が得られない。「信頼できるデータを簡単に使える環境を作る」というメリットを先に示す
まとめ#
データガバナンスは、組織全体でデータの品質・安全性・活用ルールを整備するフレームワーク。「売上の定義が部署ごとに違う」という問題は、ツールではなくこのフレームワークでしか解決できない。棚卸しをしてみると「個人PCにしかない重要データ」が必ず出てくる。その発見が変化の起点になる。