データウェアハウス(DWH)は複数のシステムからデータを
・収集
・統合
・蓄積
し
・分析
するデータベースのことを言います。
データウェアハウスの特徴
主題ごとに整理される
業務システムごとではなく、顧客や商品などの主題ごとにデータが集約されます。
統合される
データの表記揺れ、形式の違いなどが解消されて格納されます。
時系列に整理されている
データは時系列に整理されています。
更新されない
データは更新されないので、削除もされません。そのため容量が必要になります。
具体的なクラウドサービス
Google BigQuery:Google Cloudが提供する、超高速な処理が特徴のサーバーレスDWH。
Amazon Redshift:AWSが提供する、拡張性とコストパフォーマンスに優れたDWH。
コメントを残す