- IT統制
- Tips
2023.06.27
更新日:
2023.06.27
全2回 データ活用手法の定番とトレンドを知る ~「データウェアハウス」「データレイク」「データファブリック」~ 《連載:第2回》 DX時代の新たなデータ活用手法「データファブリック」
第1回目記事では、複数のシステムに保存しているデータを一元管理できるデータウェアハウスと、非構造データも収集・蓄積できるデータレイクについて解説しました。今回は、現在最も注目を集めていると言っても過言ではないデータファブリックというアプローチを紹介します。
ベースは“データ仮想化”技術
データファブリックが登場したのは、DXという言葉が広まりつつあった2010年代の中頃のこと。一般にも広く知られるようになったのは、米ガートナーの『2021年のデータとアナリティクスにおけるテクノロジ・トレンドのトップ10』に取り上げられたことがきっかけと言われています。
現在、多くの企業でデータ利活用の足かせとなっているのが、データのサイロ化とそれに伴うアクセス・利活用の複雑化です。とりわけ、組織またはプラットフォームごとに複数のクラウドが存在する〈マルチクラウド〉や、オンプレミスとクラウドを併用する〈ハイブリッドクラウド〉の環境が一般化したことにより、データ駆動経営に欠かせない“組織横断的”なデータ利活用の実現が難しくなっています。こうした状況を打開する手法として期待されているのがデータファブリックです。
ただし、データファブリック(Data Fabric)は単一のツールやシステムを指す言葉ではありません。Fabric=“織物”という呼び名の通り、複数の異なるシステムやプラットフォーム、アプリケーションなどに分散したデータを、織物のように結び付けて統合するアーキテクチャを意味する概念です。
データファブリックでは基本的に、データウェアハウスやデータレイクと異なりデータを一ヵ所に収集・蓄積する必要がなく、データの形式やソースを問わず、マルチクラウドやハイブリットクラウド環境でもすべてのデータをリアルタイムで扱うことができます。さらに、クラウド営業支援ツールなどから取得したデータもIoTデバイスから取得したデータも、単一のアクセスポイント(画面など)で運用できるのが一般的です。
データファブリックのこうしたアプローチを可能にする上で、ベースとなる技術が〈データ仮想化〉です。データ仮想化とは、複数の部門やシステムに分散しているデータを、個別にコピーしたり移動させたりすることなくオンデマンドで統合し、データ利用者やソフトウェアへリアルタイムに提供・配信する技術を指します。意思決定の迅速化はもちろんのこと、データの物理的な移行や蓄積に伴う工程やコストが省ける、一元的なアクセス制御によってセキュリティとガバナンスを強化できることなどもメリットとして挙げられます。
自動化で“セルフサービス”も可能
データファブリックにおいてデータ仮想化と並ぶ重要な技術が、AI(人工知能)と機械学習を活用した〈自動化〉です。
実際に自動化できる範囲はシステムや実装によって異なり、また人による管理が欠かせない領域も存在しますが、基本的には新たなデータソースの採用とデータ収集、データクレンジング(異常検知や表記ゆれの修正など)と前処理、データ資産全体におけるメタデータの管理(第1回目記事参照)、意志決定に必要なデータを利活用するための処理などが挙げられます。データファブリックでは、こうした自動化技術とデータ仮想化により、データマネジメントにかかわる負担を削減し、データサイエンティストのような専門家でなくても“セルフサービス的”にデータを利活用することが可能になります。
以上のように、分散型アプローチのデータファブリックは、一元管理型のデータウェアハウスとデータレイクにはない様々なメリットをもたらしてくれますが、決してそれらを排除するものではなく、業務システムなどと同様にデータソースの一種として包含・統合する形で併用されています。
このような多様なアプローチが実現できることもデータファブリックの特徴であり、冒頭で紹介したガートナーの『2021年のデータとアナリティクスにおけるテクノロジ・トレンドのトップ10』には、「多種多様なデータ統合スタイルの使用/再利用や組み合わせが可能な技術を採用しているため、統合設計にかかる時間を30%、導入にかかる時間を30%、メンテナンスにかかる時間を70%削減することができます」と述べられています。
まだまだ新しい手法ではあるものの、既にデータファブリックによってビジネスで成果を上げている企業は存在します。数百種類に及ぶブランドを所有する海外の飲料では、それまで多大な労力を割いていたデータ収集を自動化。その分、消費者の嗜好やニーズなどを細かく分析することで、商品開発やサプライチェーンの改善などにつなげているということです。同様に日本の飲料メーカーでも、データファブリックを活用して様々なデータを統合し、ヒット商品を生んでいる事例が知られています。
今回はデータウェアハウス、データレイク、データファブリックと、3種類のデータ利活用にかかわる手法やシステムを紹介してきました。それぞれ多様な特徴をもっていますが、それはまた、「いかに多くの企業が様々なやり方でデータ価値の最大化に取り組んでいるか」ということの証しとも言えるでしょう。今回紹介したのはあくまで基礎知識。日々技術革新が進む分野ゆえ、情報収集は欠かせません。