🧩 Data Mesh
✅ このスタイルの概要
組織のデータを「分散したプロダクト」として扱い、ドメインチームに所有権と責任を持たせるデータアーキテクチャ。
✅ 解決しようとした問題
- 中央集権型 DWH/Lake のボトルネック
- データ基盤チームへの要求集中(データ要求が捌けない)
- ドメイン知識不足によるデータ品質問題
✅ 基本思想・ルール
- ドメイン指向のデータ所有
- データプロダクト思考(SLO・品質・API)
- セルフサービスデータプラットフォーム
- 標準化されたインターフェースとガバナンス
✅ 得意なアプリケーション
- 大規模組織でのデータ分散管理
- 事業部ごとの独立した分析基盤運用
- データカタログ・データ API を活用する環境
❌ 不向きなケース
- 小規模な組織(分散のメリットが薄い)
- ガバナンス組織や SLO 運用の文化がない場合
✅ 歴史
- Zhamak Dehghani による提唱
- Data Lake / Warehouse の限界に対する設計思想的アプローチ
✅ 関連スタイル
- Data Lake / Lakehouse:データ保持レイヤの実装基盤
- CQRS / EDA:プロダクト間連携の実装手段
✅ 代表的なフレームワーク
-
Databricks / Lakehouse Platform
データプロダクト単位の管理に向いたプラットフォーム。 -
Snowflake + Data Marketplace
データシェアリングを前提とした Mesh 的運用が可能。 -
AWS Glue / Athena + Lake Formation
分散したデータプロダクトのメタデータ・アクセス権を統一管理。 -
Data Catalog(Amundsen / DataHub / Collibra)
データ検索・オーナーシップ管理を行う Mesh 必須コンポーネント。
✅ このスタイルを支えるデザインパターン
Data Mesh は組織構造のパターン寄りだが、技術的には次が関連する。
-
Facade
データ API やデータプロダクトの“入口”として機能する。 -
Mediator
プラットフォームが各データプロダクト間を調停する役割を担う。 -
Strategy
ドメインごとに異なる処理方式・保持形式を選択できる柔軟性。 -
Iterator
分散データを横断的に扱う際の抽象に利用されることがある。
✅ まとめ
Data Mesh は中央集権型データ基盤の限界に対し、
ドメインチームがデータをプロダクトとして所有し、
分散協調しながら全体最適を図るアーキテクチャ思想 である。
大規模組織向けであり、データプロダクト管理・ガバナンス・SLO 運用が不可欠である。