活用の幅が大きく広がる機械学習によるデータ分析

 機械学習と同種のテクノロジーは、実は20年以上前から存在し、「データマイニング」として活用されてきた。これまでは主に、与信管理やカタログの発送対象者の選定などに使われてきているが、近年のWeb、メール、スマホ、アプリなどの様々なチャネルの発達、さらにはIoTの発展により大量データの収集が可能となり、実ビジネスでの機械学習の活用の幅が大きく広がっている。


▼ 記事のハイライト
1. 機械学習とデータの活用
2. 機械学習とデータマイニングの違い
3. 顧客の購買や反応を予測する際に利用される予測分析モデル
4. データサイエンティストでなくても定着利用できる予測分析ツール
5. 機械学習を活用した予測分析ツールの最新機能情報
6. 機械学習を活用した予測分析ツールのロードマップ


1. 機械学習とデータの活用

 近年、AIや機械学習をはじめとする様々なテクノロジーをビジネスに活用することが、企業の収益拡大に貢献することが期待されている。

 機械学習と同種のテクノロジーは、実は20年以上前から存在し、「データマイニング」として活用されてきた。これまでは主に、与信管理やカタログの発送対象者の選定などに使われてきているが、近年のWeb、メール、スマホ、アプリなどの様々なチャネルの発達、さらにはIoTの発展により大量データの収集が可能となり、実ビジネスでの機械学習の活用の幅が大きく広がっている。

2. 機械学習とデータマイニングの違い

 機械学習の話に入る前に、データマイニングとの違いについて解説したい。
(※違いをイメージしやすいよう、数ある機械学習・データマイニングの活用方法をあえて限定的に記述している点はご了解いただきたい。)

 一般的に、機械学習の目的としては結果が重視されている。例えば、人は天気予報で「降水確率80%」という結果を聞くと、「今日は傘を持って出かけよう」という意思決定を下す。この場合、降水確率の算出方法や雨が降る仕組みにはフォーカスを当てず、この「80%」という数値をベースに戦術的な意思決定を下して行動に移す。莫大なデータから、このような意思決定を強力に支援する信頼できる数値を算出することが、機械学習の目的であるといえる。

 一方、莫大なデータの中から、「どうして雨が降るのか?雨が降る時はどのようなデータが関連しているのか?」など未知のルールを見つけ出し、データから現象を深く理解して業務に活かすのが、データマイニングといわれる方法である。データマイニングは、データから仮説を発見することが重要であるため、分析する人間のビジネスやテクノロジーに関する知見・専門的スキルや経験が必要となる。

 以上の通り、分析作業に入る前に即業務に活用できる数値が欲しいのか、もしくはデータの中に潜む未知のルールを見つけたいのかを見極め、機械学習的アプローチとデータマイニング的アプローチのどちらを選択するのかをまず決定する必要がある。

機会学習

図 1. ビジネス要件におけるアプローチの違い

 また、一つの作業によって上記の二つのアプローチを同時に実行できるように考えられているが、実業務では大きくプロセスが異なるため、分析目的およびアプローチ方法を厳密に分けて考えた方が良い。まずはビジネスのテーマとして、「当てたい」のか「知りたい」のかをよく考えることが必要となる。

3. 機械学習による予測分析モデルを業務に活かす分析テーマ

 機械学習には顧客の購買や反応を予測する際に利用される“分類”、顧客の行動や振る舞いから類似したグループに分ける“クラスタリング”、時間とともに変化する値を予測する”時系列分析”といった様々な活用方法がある。

 ここからは、様々な場面で多く活用される“分類”による予測分析モデルの構築というテーマにフォーカスする。

 機械学習は、過去に発生した結果から学習をすることで予測式を導き出す。したがって、過去に発生した事象が対象となり、それらをデータとして分析を行う。この時に重要となるのが、分析結果をビジネスに活用し収益を得るために実際にアクションを起こすことである。企業での活用事例としては、過去に発生した事象に対してその発生確率を算出し施策に活用するという流れが多い。

 予測分析モデルを構築することで、購買履歴データから将来の購入予測確率を顧客に付与したり、過去のキャンペーンの履歴からキャンペーンの反応確率を算出したり、製造工程におけるマシンログから不良品の発生確率を算出することが可能である。

 機械学習による予測分析モデルを業務へ適用するために注意すべきことは、単に予測確率を算出するだけでなく、算出結果をビジネスにどう活用するかを事前にきちんと検討しておく必要があるという点だ。購入確率が判明すれば、顧客別に購入促進のキャンペーン施策を迅速に実施することができるのか?ROIは改善するのか?また、不良品の発生確率が判明すれば、即座に不良品を生産の工程から除外やリワークに回したりできるのか?といった事項が挙げられる。もし、算出結果を業務に活かしても、収益の改善に貢献ができなければ「機械学習はビジネスに貢献できないもの」というレッテルが貼られてしまう。

 このような間違った結果を導かないようにするため、機械学習を活用した予測分析のプロジェクトなどを立ち上げる場合には「どのような結果を導き」、「どのような業務で活用するのか」を事前に検討した上で進めていく必要がある。データさえあれば、どのような戦略を立ち上げ、どのような施策を打てば良いかなどを機械学習が自動的に学習・検討し、提示してくれるわけではない。業務担当者が立案した戦略に対して、その戦略を実現するために、最も効率的な施策を遂行する戦術の強化をもたらすものが機械学習であり、それを理解した上で我々も活用する必要がある。

4. 高いROIを生み出す、本当に必要なテクノロジー

 機械学習による予測分析モデルを構築するには、ビジネスに適用するための計画立案・データの整理・アルゴリズムの選択と活用というステップを踏む必要がある。その中で、特に阻害要因となりやすいのが、機械学習で活用するアルゴリズムを選択し、設定・実行する部分である。

 これには高度な知識が必要となるため、結局どのアルゴリズムを選択しどう設定するのかは、人のセンス・知識・経験がベースとなり、経験がない人間が実施する場合、全てのアルゴリズムを試し何が一番良いのかを判断することとなる。さらに、アルゴリズムの制約に基づいたデータ加工や項目の準備、変換をしていかなければならない。業務担当者が忙しい日常業務の中でこれらの作業を行うのは不可能であるため、実際はデータサイエンティストや分析担当者が時間をかけて行うこととなる。ここでまた、データ活用がスムーズに進まないという問題が起きやすい。

 このような中で、SAP® Predictive Analyticsはビジネステーマ、データがそろっていれば、統計的な前提に基づくデータの変換、アルゴリズムの選定やチューニングが必要なく、非常にスピーディーに予測モデルの構築を行うことができる。予測モデルの構築において必要となる多くのステップが自動化されているため、操作担当者のスキルや経験にかかわらず、同じデータを投入すると全員同じ結果を出すことができるような特許取得済みの機能が組み込まれている。

機会学習

図 2. SAP Predictive Analytics の機会学習機能

 SAP® Predictive Analyticsを活用することで、業務担当者は多くの予測分析モデルを、安全かつ大量に構築することが可能となり、日常業務における多くの意思決定を機械学習のテクノロジーに基づいてデータドリブンで行えるようになる。さらに、その予測結果となる数式は、SQL、UDF、SAS言語、Hive SQL、Spark SQL、JAVAなどの多くの言語に出力でき、様々なシステムに組み込んで独立して運用することもできるため、システム担当者の工数削減にも大きく貢献することができる。

 SAP® Predictive Analyticsは、多くのビジネスに貢献することが可能な非常に革新的なツールである。予測分析モデルの構築、データの変化に対応したモデルの再構築などを実現する非常に強力な仕組みが搭載されており、同等の機能を有している競合製品はほぼ存在しないという、ユニークなポジションを得ている。


5. 部署内にデータサイエンティストはいますか?

 みなさんがよく耳にする“データサイエンティスト”という職種。確かに分析担当者が社内にいれば、さまざまな業務のデータ活用が必要な場面で力強いサポートをしてくれると思います。しかし、現実解として部署内に専任の分析担当者はいますか?複雑な数式、複雑なアルゴリズムが実際の業務の中で求められているのではなく、ビジネスの現場に即した数字の“見方”ができるのが重要ではないでしょうか。予測分析を身近なものにするには、「統計学の知識がないビジネスユーザでも」「簡単に」「早く」利用できる必要があります。

5-1. 先進的な機械学習ツールの新機能

a.機械学習の運用管理機能の強化

 予測分析モデルは1度作成して終わりではありません。ビジネスデータの増加に対して、予測分析モデルの精度を維持することは重要です。SAP® BusinessObjects™ Predictive Analytics(以下、SAP Predictive Analytics)では、モデル精度を継続的に監視したり、スケジュールによるモデルの再学習・適用(スコアリング)作業の自動化を実現するPredictive Factoryを提供します。

 定期スケジューリングはもちろん、イベントやプログラムをトリガーとしたスケジューリングにも対応します。SAP® Predictive Analyticsでは、Predictive Factory上で新規モデル作成機能(分類・回帰、時系列)が追加されました。

 加えて、今までクライアント側で実行していたモデル作成処理を、Web上でより簡易的に実行することが出来るようになりました。また、運用管理機能も強化されてきており、モデル評価やシミュレーション用のレポート画面が大幅に拡張されています。

機会学習

図3: Predictive Factoryによる新規モデル作成(左図)、
モデル作成後の評価レポート(右図)


 今後リリース予定のバージョンでは、さらにPredictive Factoryに機能集約され、よりシンプルで、より使いやすいプラットフォーム環境を目指します。一部コンポーネント名称も変更されます。

機会学習

図4: SAP® Predictive Analytics プラットフォーム拡張イメージ


b.SAP HANA 連携の強化

 SAP® Predictive Analyticsのデータ加工機能において、HANA information View がサポートされました。 HANA information Viewを活用出来ることにより、柔軟性が高いデータ加工を実現します。

 また、SAP HANA 2.0 / SAP HANA 2.0 Expressのサポートデータソース追加や、HANA Multitenant Database Containersのサポートなどが挙げられます。

 *SAP HANA連携時のパフォーマンスも前バージョンから向上しています。

c.BigData対応の強化

 SAP® Predictive Analyticsでは、SparkやSAP Vora1.4に対応し、モデリングの高速化を実現します。

 予測分析領域におけるデータは日々増加の傾向にあります。今後、いかにインメモリエンジンを活用しモデリング処理の高速化を実現するかが重要になってくるでしょう。

 SAPは、SAP HANAを中心にインメモリ分析プラットフォームを今後も強化していきます。下図は、インメモリ上でモデル作成した場合のベンチマーク結果です。

 データが少ない時は差があまり出ませんが、15,000列 x 500,000行の大量データでモデルを作成した場合、インメモリ上でもモデリングでは通常より10倍以上のパフォーマンスを発揮することが確認できました(以下はNative Spark Modelingを利用した場合のベンチマーク結果)。

機会学習

図5: Native Spark Modelingにおけるベンチマーク

6. 製品ロードマップ

 SAP® Predictive Analyticsの製品ロードマップ(トピック)になります。
 ユーザーインターフェースの統合や分析機能の拡張、BigData対応、またSAPアプリケーションとの連携(SAP S/4HANA、SAP Hybris、その他)、Python対応等、継続的な機能拡張が予定されています。

機会学習

図4:SAP Predictive Analytics 製品ロードマップ

● 最後に

 今回は、SAPの機械学習を用いた予測分析ツールであるSAP® Predictive Analyticsの新機能を中心にご紹介しました。SAP® Predictive Analytics 単体でのご利用はもちろん、SAP S/4HANA含むSAPアプリケーション、SAP Analytics Cloud、SAP Cloud Platformとの連携も強化していきます。

 人事、会計、生産、その他領域等においても機械学習の考えが組込まれ、より高度な分析が出来るようになります。分析処理の簡易化・自動化により、今後はデータサイエンティストの方だけでなく、業務ユーザーが中心となるデータ分析・活用もますます増えていくことでしょう。

 また、新たなデジタルイノベーションシステムの仕組みとして「SAP Leonardo」を発表しました。この中には、機械学習、IoT、ビックデータ、アナリティクス、ブロックチェーン等の様々なソフトウェア機能を統合します。SAPアプリケーションへの連携はもちろん、深層学習を利用した動画や画像分析の仕組みなど、今後も革新的な機能を提供していきます。

● お問合せ

 SAP® Predictive Analytics 製品の検討や導入に関するご相談や詳細説明をご希望する方は、以下よりお気軽にご相談ください。


お問合せボタン