🧩 Data Warehouse(DWH)
✅ このスタイルの概要
組織全体のデータを統合し、分析用途に最適化して保存する集中型データストア。
✅ 解決しようとした問題
- 業務システムごとにデータがサイロ化している
- 分析のたびに複雑な JOIN や前処理が必要
- レポートや分析が属人化し、再現性が低い
Data Warehouse はこれらに対し、 「統合」「正規化」「履歴管理」 を軸とした集中基盤を提供する。
✅ 基本思想・ルール
- ETL(Extract → Transform → Load)でデータを整形し DWH に格納
- スキーマ設計はスター/スノーフレークスキーマなど分析に最適化
- 時系列データの保持(SCD など)で履歴も管理
✅ 得意なアプリケーション
- 統合レポート、BI ダッシュボード
- 企業全体の KPI を一元管理
- 監査・法規制対応のための確定データストア
❌ 不向きなケース
- 生データを柔軟に扱いたい探索的分析(Data Lake の方が適)
- ストリーミングなどリアルタイム性が重要なケース
✅ 歴史(系譜・親スタイル)
- 1990 年代から続く定番アプローチ
- Kimball / Inmon 方式など複数流派が存在
✅ 関連スタイル
- Data Lake / Lakehouse:より柔軟なデータ保持
- Lambda / Kappa Architecture:DWH をバッチレイヤーとして利用
✅ 代表的なフレームワーク
-
Amazon Redshift
クラウド DWH の先駆。大規模分析処理を提供。 -
Google BigQuery
サーバレス DWH として、スケール・クエリ高速化を実現。 -
Snowflake
仮想ウェアハウス構造とコンピュート分離アーキテクチャが特徴。 -
Teradata / Oracle Exadata
伝統的なオンプレミス DWH で高性能分析処理の基盤。
✅ このスタイルを支えるデザインパターン
-
Template Method
ETL の手順(抽出 → 整形 → 格納)を統一する。 -
Strategy
最適化戦略(インデックス/パーティション)を切り替える。 -
Iterator
大量データを逐次処理する際に使用。 -
Facade
統合レイヤ(BI ツールやメタデータ管理)が内部の複雑さを隠蔽。
✅ まとめ
DWH は 定型レポート・確定データ分析の王道 で、
安定した業務分析基盤として今も広く使われている。