メインコンテンツまでスキップ

🧩 Data Mesh

✅ このスタイルの概要

組織のデータを「分散したプロダクト」として扱い、ドメインチームに所有権と責任を持たせるデータアーキテクチャ。

✅ 解決しようとした問題

中央集権型 DWH/Lake のボトルネック
データ基盤チームへの要求集中（データ要求が捌けない）
ドメイン知識不足によるデータ品質問題

✅ 基本思想・ルール

ドメイン指向のデータ所有
データプロダクト思考（SLO・品質・API）
セルフサービスデータプラットフォーム
標準化されたインターフェースとガバナンス

✅ 得意なアプリケーション

大規模組織でのデータ分散管理
事業部ごとの独立した分析基盤運用
データカタログ・データ API を活用する環境

❌ 不向きなケース

小規模な組織（分散のメリットが薄い）
ガバナンス組織や SLO 運用の文化がない場合

✅ 歴史

Zhamak Dehghani による提唱
Data Lake / Warehouse の限界に対する設計思想的アプローチ

✅ 関連スタイル

Data Lake / Lakehouse：データ保持レイヤの実装基盤
CQRS / EDA：プロダクト間連携の実装手段

✅ 代表的なフレームワーク

Databricks / Lakehouse Platform
データプロダクト単位の管理に向いたプラットフォーム。
Snowflake + Data Marketplace
データシェアリングを前提とした Mesh 的運用が可能。
AWS Glue / Athena + Lake Formation
分散したデータプロダクトのメタデータ・アクセス権を統一管理。
Data Catalog（Amundsen / DataHub / Collibra）
データ検索・オーナーシップ管理を行う Mesh 必須コンポーネント。

✅ このスタイルを支えるデザインパターン

Data Mesh は組織構造のパターン寄りだが、技術的には次が関連する。

Facade
データ API やデータプロダクトの“入口”として機能する。
Mediator
プラットフォームが各データプロダクト間を調停する役割を担う。
Strategy
ドメインごとに異なる処理方式・保持形式を選択できる柔軟性。
Iterator
分散データを横断的に扱う際の抽象に利用されることがある。

✅ まとめ

Data Mesh は中央集権型データ基盤の限界に対し、
ドメインチームがデータをプロダクトとして所有し、
分散協調しながら全体最適を図るアーキテクチャ思想である。

大規模組織向けであり、データプロダクト管理・ガバナンス・SLO 運用が不可欠である。

✅ このスタイルの概要
✅ 解決しようとした問題
✅ 基本思想・ルール
✅ 得意なアプリケーション
❌ 不向きなケース
✅ 歴史
✅ 関連スタイル
✅ 代表的なフレームワーク
✅ このスタイルを支えるデザインパターン
✅ まとめ