データドリブン経営に求められるデータマネジメント方法とは

データドリブン経営に求められるデータマネジメント方法とは

 データドリブン経営を目指す企業にとって、全社統合型のデータ活用基盤の有効活用が、重要な課題となっている。

 戦略的なデータ利活用にとって、どのようなデータマネジメントの態勢をとるべきだろうか。

 また、サイロ化されたデータを、どのように統合すべきだろうか。

 本記事では、データドリブン経営を目指す企業に向け、伊藤忠テクノソリューションズ株式会社(以下、CTC)デジタルビジネス推進第1部エキスパートエンジニアの後藤真人氏が、データドリブン経営のための全社統合型のデータ活用基盤を有効活用するための取り組み方について、具体的な事例を交えて紹介する。



▼ 目次
データドリブン経営に求められるデータマネジメントとは
データマネジメントの課題を解決するサイロ化したデータの統合
データ活用基盤の実装に向けたプラットフォームの選択
オンプレミスとクラウドで運用するデータ活用基盤の違いとは
データ活用基盤に求められる要件を満たすプラットフォームとは
データ活用基盤の導入事例




1. データドリブン経営に求められるデータマネジメントとは

 データドリブン経営にデータマネジメントが求められる理由について、後藤氏は「事業部門ごとに独自でシステム構築を行っていると、全社を横断したデータ分析ができない」という課題を指摘する。

 そして、「DXを実現するためのシナリオとしては、市場や顧客の変化への迅速かつ柔軟な対応を行うために、AIなどのデジタル技術をマイクロサービスやアジャイル手法を駆使して、新たな製品やサービスを国際市場に素早く投入できるかが、一つの指標になる」と後藤氏は提唱する。

 しかし、現実のデータマネジメントにおいては、データ自体がサイロ化しているという課題がある。

 最たる例として「事業部や拠点ごとに独自にシステムを構築・運用しているため、データがサイロ化し全社横断で統合的にデータを分析できない」というケースも多い。


データドリブン経営に求められるデータマネジメント方法とは
図 1. サイロ化したデータの問題






2. データマネジメントの課題を解決するサイロ化したデータの統合

 サイロ化したデータを統合するための取り組みとして、後藤氏は下図のようなデータマネジメントの全体像を提案する。


データドリブン経営に求められるデータマネジメント方法とは
図 2. データマネジメントの全体像




 後藤氏は「全社視点で整合性のとれた分析を行うためには事業部や拠点ごとに分かれているデータを纏める必要がある」と指摘し、下記の解決策を示す。

  • コード体型の統一
    • 事業部や拠点などの異なるシステムで独自に割振られたコードやIDを統一する
  • マスタデータ管理
    • 顧客名などの表記の揺らぎを全社で統一する
  • エンタープライズ データモデル(EDM)の整備
    • 全社規模でデータ要素を洗い出し整合性のとれた形で標準化されたデータモデルを整備していく
  • メタデータ管理
    • データの管理者や利用者がEDM内の各データの意味を正しく理解し利用しやすくするために、メタデータ情報を付加してカタログ化
  • データ連携の仕組みの最適化
    • 基幹系システムやその他社内外にあるデータの整合性を維持
    • 効率的にデータ活用基盤にデータを受け渡す仕組みを構築
  • データ活用基盤のアーキテクチャ検討と実装
    • 組織全体のデータを格納するデータ活用基盤を整備
    • 組織横断のデータ利活用を促進するデータ連携のために、「データハブ」を介してデータを収集
  • データ品質管理
    • 不正値や欠損値を補正
  • データリネージの管理
    • データの発生した起源や変遷を可視化
  • データセキュリティ
    • アクセス権の制御やデータの暗号化
    • 参照権限に応じたデータのマスキング


 後藤氏は「9つの管理を全社統一的な監視やコントロールを行う取り組みが、データガバナンスになる」と整理する。



データドリブン経営に求められるデータマネジメント方法とは
図 3. 組織横断でデータ利活用するためのデータ活用基盤のアーキテクチャ






3. データ活用基盤の実装に向けたプラットフォームの選択

 データ活用基盤のプラットフォームに求められる要件について、後藤氏は下記の要素を列挙する。

  • スモールスタートが可能
    • 初期導入時に大きな費用をかけずに小規模な構成から利用を開始できるかがポイント
  • アジャイルな実装
    • 簡単な操作で短時間に基盤が用意できるか確認
  • 容易な活用
    • 複雑な設計や設定なしで、データロード後にすぐに利用できるかが問われる
  • 業界標準の仕様
    • 業界標準のインターフェースを提供しているか
  • 柔軟な拡張性
    • ニーズに応じて処理性能やデータ容量を瞬時に増強できるか
  • 安定した運用
    • 安定した運用を実現すめたるの冗長化やフェールオーバー機能が利用できるか






4. オンプレミスとクラウドで運用するデータ活用基盤の違いとは

 データ活用基盤の運用において、後藤氏は表1にオンプレミスとクラウドの違いを示す。


表1. データ活用基盤をクラウドで運用する場合のメリット
データドリブン経営に求められるデータマネジメント方法とは




 後藤氏は「クラウドを利用することで、スモールスタート可能でかつ迅速に環境準備が可能になる」とメリットを語る。

 加えて、クラウドによるデータ活用基盤では、データ量や処理量の急な増加にも柔軟に対応でき、自動メンテナンスによる運用負荷も軽減する。さらに、従量課金によるイニシャルコストの削減にもつながる。






5. データ活用基盤に求められる要件を満たすプラットフォームとは

 データ活用基盤のプラットフォームに求められる要件を満たすクラウドデータプラットフォームとして、後藤氏はSnowflakeを紹介する。

 Snowflakeは、クラウド ネイティブなデータ活用基盤である。

 その利点は「クラウドのメリットを活かした最新のテクノロジで、エンタープライズ規模のデータ活用基盤に必要な拡張性と運用性を実現し、短期間での利用開始を可能にする洗練されたアーキテクチャで構成されている」と後藤氏は語る。


データドリブン経営に求められるデータマネジメント方法とは
図 4. Snowflake 概要図




 さらに後藤氏は「Snowflakeは、AWS、Azure、Google Cloudに対応したクラウドデータプラットフォームになる」と補足し「柔軟な運用を支えるコンピュートとストレージを分離したアーキテクチャで構成されている」と説明する。

 Snowflakeを活用することで、データをサイロ化させることなく、用途に応じて複数のクラスタで統合化したデータにアクセスすることが可能になり、クラスタの処理性能を瞬時に拡張または縮小することが可能になる。そのアーキテクチャ構成は、下図のようになる。


データドリブン経営に求められるデータマネジメント方法とは
図 5. Snowflake のアーキテクチャ




 Snowflakeは、マルチクラウドのメリットを活かした冗長化構成が可能で、複数のパブリッククラウドベンダー間で、日本とアメリカのように地理的分散レプリケーションによる冗長化にも対応している。

 Snowflakeの利点について、後藤氏は下記を挙げた。

  • コマンド一つで元データのクローンを瞬時に作成できる「ゼロコピークローン」により、データの移動や複製をしないで、本番データのクローンを使った開発やテストも容易に実現できる
  • タイムトラベルという機能では、データ更新やデータロード操作後に更新前の過去時点のデータにもアクセスできるので、誤って削除や更新を行ったデータも SQL レベルの操作で再利用できる
  • データシェアリング機能を活用すると、企業内やパートナー企業とのデータの共有を容易に実現できる。加えて、Snowflake データ マーケットプレイスを通じた購買データの入手も可能になる



データドリブン経営に求められるデータマネジメント方法とは
図 6. Snowflakeの利点




 データマーケットプレイスの活用例として、「例えば、国内の事例であればウェザーニューズ社がこちらで天候情報を提供しているので、購買データとして自社で活用できる」と後藤氏は補足する。






6. データ活用基盤の導入事例

 Snowflakeの導入事例として、後藤氏は伊藤忠グループのデータ活用基盤を紹介する。


データドリブン経営に求められるデータマネジメント方法とは
図 7. 伊藤忠グループのデータ活用基盤の概要




 この図では、環境設計と環境構築にシステム運用という3つのパートで色分けされている。

 CTCによるデータ活用基盤の構築では、データ活用の進行状況に合わせて必要な機能の設計と構築を実施していく。また、機能面の実装のみならず、セキュリティ・システム運用のノウハウを活かして、各種ポリシーの策定や標準化も主導する。その流れは下図のようになる。


データドリブン経営に求められるデータマネジメント方法とは
図 8. データ活用基盤の導入支援内容




 後藤氏は「図の左上のDMPでは、AWS S3でデータ連携の仕組みとデータレイクを構築した」と説明する。

 図の右上の机上分析処理環境では、Databricksというサービスを利用して、AIのモデル開発環境として活用している。

 そして、右下のSnowflakeアカウントが本番環境としてのデータ活用基盤となる。

 Snowflakeにより「データ処理時間を80%削減できた」と後藤氏はメリットを語る。

 その他の部分でも、データ処理コストの40%削減、分析業務にかかる時間の50%、障害対応にかかる時間の50%削減も実現している。






さいごに

 さいごに後藤氏は、全社規模のデータ活用基盤を有効に活用するために、以下の3つのポイントを示した。

  • 全社統合型のデータ活用基盤を有効活用するためにはデータマネジメントの取組みが必須
  • クラウド ネイティブなデータ活用基盤を選択することにより、素早く容易にビジネスの立ち上げが可能
  • DXのようなアジリティを重視した取組みではクラウドを中心としたアーキテクチャによるプラットフォームの全体最適化が重要



ご意見・ご要望・ご感想をお聞かせくださいお寄せいただいたご意見を参考に、Webサイトの改善や情報発信に努めて参ります。





著者プロフィール

著者アイコン
後藤真人
伊藤忠テクノソリューションズ株式会社在籍中 | 1. 現在の担当業務 : お客様のDX推進に向けた取組みに対する支援活動に従事中 | 2. これまでの担当業務 : DB製品を中心としたシステム構築プロジェクトに従事。大手通信事業者様向けの課金システム構築プロジェクトに従事。大手ソフトウェアベンダー各社製品の技術主管としてデータプラットフォームを中心とした製品拡販及びSIプロジェクトに従事