POINTDWH / データウェアハウスとは
データウェアハウスはビジネスインテリジェンスに活用するためのデータ倉庫を意味します。
大きく①サブジェクト別分類②データの統合③データを消さない・更新しない④時系列順に蓄積するという4つの特性があります。
1990年頃ビル・インモンが最初にデータハウスの概念を提唱しました。
でーたうぇあはうす
ビジネスインテリジェンスに活用するためのデータ倉庫のこと
データウェアハウスはビジネスインテリジェンスに活用するためのデータ倉庫を意味します。
大きく①サブジェクト別分類②データの統合③データを消さない・更新しない④時系列順に蓄積するという4つの特性があります。
1990年頃ビル・インモンが最初にデータハウスの概念を提唱しました。
データウェアハウスとデータベースの違いは大きく2つあります。
データハウスは、容量の制限により過去のデータを削除し、直近のデータを管理、格納します。
一方で、データウェアハウスは、過去のデータを集約し、格納します。
つまり、データウェアハウスによってデータベースでは消されてしまうデータも分析することができます。また、論理的にデータが統合されているので分析をしやすいという違いもあります。
データウェアハウスの有用性でもっとも大きな特徴は複数システムのデータを組み合わせて分析できる点です。
以前は、業務をシステム化する中で各業務を単独で構築していたため、複数のデータを組み合わせて分析することができませんでした。例えば、会計や販売、顧客、生産、在庫といった各システムごとです。
ビジネスインテリジェンス(BI)とは、各業務システムから蓄積される膨大なデータを自動的に収集、分析、加工して企業経営における意思決定の迅速化を支援するシステムです。
様々なビジネスインテリジェンスツールがあります。データウェアハウスはビジネスインテリジェンスの一種です。
データウェアハウスが活用されている例としてPOSシステムを通して得たPOSデータ分析が挙げられます。
POSシステム(Point of Sales)とは、主にJANコード(バーコード)を用いた商品の売上管理や在庫管理などを行うシステムなどに活用されることが多く、現在ではPOSポストシステムを利用するための周辺機器を指します。
例えば、顧客情報や商品情報を、バイヤーは商品を仕入れるために、接客担当者は顧客の動向を確認するためのデータを即時に活用することができます。
データウェアハウスによって、関連データを分析することができます。
分析することによって、例えば月曜日に新聞紙を購入する20代の男性は野菜ジュースなどの健康食品を購入しているといった、単純なデータ集計ではわからない関連性を見出すことが重要です。
ビックデータ分析のツールの一つとしてデータウェアハウスは有効と言えます。
ビックデータとは、従来のデータベース管理システムなどでは記録や保管、解析が難しいような巨大なデータ群と言われています。
企業が保有するビックデータは、様々な基幹システムや情報システムから生まれるので、各データを一か所に集約することができるデータウェアハウスはビックデータ分析の環境を整えると言えます。
データベースマーケティングとは、顧客の年齢や住所、職業、家族構成、年収や性別、学歴や趣味といった様々な属性情報や購買履歴などをデータベース管理し、特定の属性の人たちの購買特性の傾向を分析することによって、その傾向にあった商品やサービスを積極的に提供していくマーケティング手法です。
よって、データウェアハウスを分析に活用することによって、商品やサービスを適切な人に提供することができます。
データマートとは、データウェアハウスに保管された各データの中から、目的に合わせて必要なデータのみを抜き出したデータベースのことです。即材に検索や集計ができるので、細かな分析が容易にできる。
一方で、データのやり取りが非効率であり、コストが余計にかかってしまうというデメリットもあります。
データレイクとは、規模に関わらず全ての構造化データと非構造化データを保存できる一元化されたリポジトリ(保管場所)を意味します。
非構造データとは、画像や動画、音声、SNSなどのデータもそのままの形で保存することができます。
データレイクは、多くの情報を集め、そこから分析結果を得る一方で、データウェアハウスは先に分析理論が確立されていて、理論を実証するためにデータを集めるという違いがあります。