データウェアハウス(DWH)
企業で扱われる大量のデータをテーマ別に時系列で蓄積するシステムのこと。「Data WareHouse」はデータの倉庫を意味し、「DWH」とも呼ばれる。
企業は会計管理、在庫管理、顧客管理など様々なシステムを用いてデータを管理している。システムを横断して分析するためには、各所に分散したデータを収集して、必要なデータを統合する必要がある。DWHはデータを整理した状態で統合し、条件に該当するものを抽出したり、データの重複を避けて保存したりできる。また、新しいデータを追加しても、古いデータを消去することなく蓄積していくため、データに時系列が生じる。時系列を持つことで、過去の状況把握も含めてデータ分析に活用できる。
DWHとよく似たものに「データベース(DB)」がある。どちらもデータを整理・保管するという意味では共通しているが、厳密には異なる。DWHは様々なデータを蓄積して分析することで、迅速で的確な意思決定を行うことが目的。DBはデータ活用までは想定していない。また、DWHはビッグデータを扱うため、DBより大きなストレージ容量を備えている。DBは保管できるデータ量に限界があるため、古いデータを順次削除したり、ストレージを追加する必要があり、時系列で整理することが難しい。
このように、DWHは社内に散在するデータを収集・統合して、意思決定に役立つ判断材料をデータの中から見つけるために活用される。企業が膨大なデータを戦略的に使いこなすために、DWHは必要不可欠なツールといえる。
(青木逸美)