ひとことで言うと#
「誰が・どのデータを・どんなルールで管理し、活用するか」を組織全体で定義・運用する管理フレームワーク。データの品質、セキュリティ、アクセス権限、命名規則などを標準化し、データを信頼できる資産にする。
押さえておきたい用語#
- データオーナー(Data Owner)
- 特定のデータ領域に対して品質と定義の最終責任を持つ人のこと。通常は部門長やマネージャーが担い、データの定義変更やアクセス権限の承認を行う。
- データスチュワード(Data Steward)
- データオーナーの下で日常的なデータ品質の維持・改善を担当する実務者のこと。各部門に配置し、ルールの遵守状況をモニタリングする。
- データ品質(Data Quality)
- データの正確性・完全性・一貫性・適時性・一意性・妥当性の6軸で評価される状態のこと。品質が低いと分析結果の信頼性が損なわれる。
- マスターデータ管理(MDM)
- 顧客・商品・組織など、複数システムで共通に参照される基幹データを一元管理する仕組みのこと。重複や不整合の根本的な解消に必要。
データガバナンスの全体像#
こんな悩みに効く#
- 部署ごとに同じ指標の定義が違い、会議で数字が合わない
- 個人情報の管理が属人的で、情報漏洩のリスクがある
- 「データドリブン」を掲げているが、そもそも使えるデータがどこにあるかわからない
基本の使い方#
組織内にどんなデータが存在し、どう管理されているかを**棚卸し(データカタログの作成)**する。
確認項目:
- どんなデータがあるか: 顧客データ、売上データ、アクセスログなど
- どこに保存されているか: データベース、スプレッドシート、個人PC
- 誰が管理しているか: 担当部署・担当者
- 品質はどうか: 更新頻度、欠損率、重複の有無
- アクセス権限は誰にあるか
ポイント: 「個人のPCにだけある重要データ」が見つかることが多い。まず全体像を把握することが第一歩。
各データに**責任者(データオーナー)**を設定し、管理ルールを定める。
定めるべきルール:
- 定義の統一: 「売上」は税込か税抜か、返品を含むか
- 命名規則: テーブル名・カラム名の命名ルール
- 更新頻度: リアルタイム / 日次 / 月次
- 保存期間: 何年分保持するか、いつ削除するか
- アクセス権限: 誰が閲覧・編集できるか
ポイント: ルールはドキュメント化して全社に共有する。口頭の約束やメールでの伝達は機能しない。
データの品質を測定可能な指標で定義し、継続的に監視する。
データ品質の6つの軸:
- 正確性: データが実際の値と一致しているか
- 完全性: 欠損値がないか
- 一貫性: 複数システム間でデータが矛盾していないか
- 適時性: データが最新か
- 一意性: 重複がないか
- 妥当性: 定義されたルールに従っているか
監視方法:
- 自動チェックスクリプトで日次監視
- 品質ダッシュボードで可視化
- 閾値を下回ったらアラート通知
ルールを作って終わりにせず、組織に定着させる仕組みを作る。
- データスチュワード: 各部門にデータ品質の推進役を配置
- 定期レビュー: 四半期に1回、ルールの実効性を確認・改善
- 教育・啓蒙: データリテラシー研修の実施
- ツール導入: データカタログツール(Alation、DataHubなど)
ポイント: ガバナンスは「統制」ではなく「データをもっと活用するための基盤」。制約を増やすのではなく、信頼できるデータを簡単に使えるようにすることが目的。
具体例#
状況: 従業員500人の製造業。部署ごとにExcelで独自にデータを管理しており、「会社全体の正確な売上」すら即座にわからない。
問題の発見(棚卸しの結果):
- 「売上」の定義が営業部(受注ベース)と経理部(検収ベース)で異なる
- 顧客マスターが3つのシステムに分散し、重複が2,000件以上
- 個人情報を含むExcelファイルが共有フォルダに無制限でアクセス可能
- 退職者のアカウントがシステムに残ったまま
導入したガバナンス施策:
| 施策 | 内容 |
|---|---|
| 定義の統一 | 「売上」=検収ベース・税抜・返品控除後 に全社統一 |
| マスターデータ統合 | 顧客マスターを1つに統合、更新は経理部がオーナー |
| アクセス管理 | 個人情報を含むデータは申請・承認制に変更 |
| データカタログ | 主要データの場所・定義・オーナーをWikiに一覧化 |
| 定期レビュー | 四半期に1回、データ品質レポートを経営会議で共有 |
**結果: 月次決算の報告スピードが10営業日→5営業日に短縮。**部門間で「数字が合わない」問題が解消。個人情報漏洩リスクの指摘事項がゼロに。データを使った分析プロジェクトが四半期で3件→8件に増加。
状況: 従業員150名のBtoB SaaS。CRMのデータ品質が低く、マーケティングメールのバウンス率が18%、セグメント分析の信頼性が低い。
データ品質の診断結果:
- メールアドレスの欠損率: 15%
- 企業名の表記ゆれ: 3,200件(全8,000社中)
- 担当者名の重複: 800件
- 業種コードの未入力: 22%
ガバナンス施策:
- データオーナーの設定: CRMデータのオーナー=営業部長、スチュワード=営業企画2名
- 入力ルール策定: CRMの入力項目にバリデーション(必須項目、形式チェック)を追加
- 品質ダッシュボード構築: 欠損率・表記ゆれ件数・重複件数を週次で自動集計・可視化
- 週次クリーンアップ: スチュワードが品質スコアの低いレコードを修正(週2時間)
**結果: 6ヶ月で欠損率が15%→2%に改善。メールバウンス率が18%→3%に低下。**マーケティングメールの到達率向上により、リード獲得数が月100件→145件に増加。
状況: 従業員2,000名の金融サービス企業。欧州展開に伴いGDPR対応が急務だが、そもそも社内のデータ管理が属人的で、個人データの所在すら把握できていない。
段階的な導入:
- Phase 1(1ヶ月): 個人データの棚卸し。28システムに個人データが散在していることを確認
- Phase 2(2〜3ヶ月): 各システムのデータオーナーを任命(計15名)。個人データの分類(要同意/正当利益/法的義務)を実施
- Phase 3(4〜6ヶ月): データ処理の法的根拠の整理、同意管理プラットフォームの導入、アクセス権限の再設計
- Phase 4(継続): 四半期ごとの監査、年次のプライバシー影響評価
**結果: GDPR対応を期限内に完了し、欧州事業を予定通り開始。**データ管理の整備により、社内の分析プロジェクトのデータ準備期間が平均3週間→5日に短縮。副次的に、国内の個人情報保護法の改正対応もスムーズに完了。
やりがちな失敗パターン#
- ルールを厳しくしすぎて誰も守らない — 100ページのガイドラインを作っても読まれない。最初はルールを3〜5個に絞り、最も効果の高いものから着手する
- IT部門だけで進めてしまう — データガバナンスは全社的な取り組み。ビジネス部門のデータオーナーを巻き込まないと、現場で使われないルールになる
- 一度整備して終わりにする — ビジネスやシステムは変化し続ける。ルールも定期的に見直し、形骸化を防ぐ。最低でも四半期に1回のレビューを組み込む
- ガバナンス=制約だと誤解される — 「面倒なルールが増えた」と思われると現場の協力が得られない。「信頼できるデータを簡単に使える環境を作る」というメリットを先に示す
まとめ#
データガバナンスは、組織全体でデータの品質・安全性・活用ルールを整備するフレームワーク。データの定義を統一し、品質を監視し、責任者を明確にすることで、「信頼できるデータ」に基づく意思決定が可能になる。まずはデータの棚卸しを行い、最も問題の大きい1〜2つのデータに対してオーナーとルールを設定するところから始めよう。