近年、データの活用に多くの企業が取り組むようになり、ニュースや書籍ではビッグデータに関連した様々な用語を目にするようになりましたよね。
日本では「データマート」と呼ばれる情報の表示や分析を行っている企業がとても多くなりました。
ですが、「データマート」という言葉の意味を具体的に説明できる方は少ないのではないでしょうか。
今回はそんなデータマートの意味やデータウェアハウスとの違いについてお伝えします。
データマートとは
データマートとは、組織で情報システムに記録、蓄積されたデータから、各部門が目的に応じて必要なデータを抽出、集計し、利用しやすい形に加工し格納したデータベースのことです。
データマートはデータベース全体のことではなく、データベースの一部を指します。
データマートとデータウェアハウスの違い
はじめに、データウェアハウスについてお話ししましょう。
データウェアハウスとは、業務で発生した各種情報を時系列に保管したデータベースのことを指します。
ウェアハウスは「倉庫」という意味があることから、データウェアハウスとは、あらゆるデータをまとめたサーバーやソフトウェアであり、データベースの利用形態の一つです。
データマートとデータウェアハウスの具体的な違いは、以下のとおりです。
データマート
- サイズ:100GB未満
- 主題:1つ
- 範囲:1部門
- データソース:いくつかのソース
- データ統合:1つ
- 時間:分・週・月単位
データウェアハウス
- サイズ:100GB以上
- 主題:複数
- 範囲:組織全体
- データソース:多くのソース
- データ統合:すべてのビジネスデータ
- 時間:数ヵ月から数年単位
このことから分かるように、データマートは、組織の統合データベースであるデータウェアハウスからデータを取り出したものである場合が多いです。
データマートのメリット
データを管理し、ビジネスの貴重な知見を得ることは、あらゆる企業が直面する課題であり、これに対応するため、多くの企業は戦略的なデータマートを使用しています。
分析に際するレスポンス
ビッグデータを保有する企業にとって、データの活用用途は部門や目的によって異なりますよね。
用途によって、あらかじめ集計されたデータを活用することで、データ容量が小さくなり、処理の負担が小さくなる為、分析に際するレスポンスを高めることが出来ます。
データウェアハウスより安価
必要なデータセットが少なく、データウェアハウスを構築する必要性が低い場合は、データウェアハウスの安価な代替手段になります。
まとめ
データマートとは、組織で情報システムに記録、蓄積されたデータから、各部門が目的に応じて必要なデータを抽出、集計し、利用しやすい形に加工し格納したデータベースのことです。
- データマートはデータベース全体のことではなく、データベースの一部を指す
- データマートは、組織の統合データベースであるデータウェアハウスからデータを取り出したものである場合が多い
- データマートは、分析に際するレスポンスが高い
- データマートは、データウェアハウスより安価