活用の幅が大きく広がる機械学習によるデータ分析(第1回)
~多くの意思決定をデータドリブンで行うことができる機械学習テクノロジー~

startup-photos

機械学習と同種のテクノロジーは、実は20年以上前から存在し、「データマイニング」として活用されてきた。これまでは主に、与信管理やカタログの発送対象者の選定などに使われてきているが、近年のWeb、メール、スマホ、アプリなどの様々なチャネルの発達、さらにはIoTの発展により大量データの収集が可能となり、実ビジネスでの機械学習の活用の幅が大きく広がっている。

 記事のハイライト
● 機械学習とデータマイニングの違い
● 顧客の購買や反応を予測する際に利用される予測分析モデル
● データサイエンティストでなくても定着利用できる予測分析ツール

※2017/1/17寄稿記事を再編集いたしました
著者: 株式会社ブレインパッド(英文 BrainPad Inc.)
デジタルソリューション統括部 統括部長 東 一成 氏
編集: ビジネスonIT

● 注目の集まる機械学習によるデータ活用

近年、AIや機械学習をはじめとする様々なテクノロジーをビジネスに活用することが、企業の収益拡大に貢献することが期待されている。

機械学習と同種のテクノロジーは、実は20年以上前から存在し、「データマイニング」として活用されてきた。これまでは主に、与信管理やカタログの発送対象者の選定などに使われてきているが、近年のWeb、メール、スマホ、アプリなどの様々なチャネルの発達、さらにはIoTの発展により大量データの収集が可能となり、実ビジネスでの機械学習の活用の幅が大きく広がっている。

● 機械学習とデータマイニングの違い

機械学習の話に入る前に、データマイニングとの違いについて解説したい。
(※違いをイメージしやすいよう、数ある機械学習・データマイニングの活用方法をあえて限定的に記述している点はご了解いただきたい。)

一般的に、機械学習の目的としては結果が重視されている。例えば、人は天気予報で「降水確率80%」という結果を聞くと、「今日は傘を持って出かけよう」という意思決定を下す。この場合、降水確率の算出方法や雨が降る仕組みにはフォーカスを当てず、この「80%」という数値をベースに戦術的な意思決定を下して行動に移す。莫大なデータから、このような意思決定を強力に支援する信頼できる数値を算出することが、機械学習の目的であるといえる。

一方、莫大なデータの中から、「どうして雨が降るのか?雨が降る時はどのようなデータが関連しているのか?」など未知のルールを見つけ出し、データから現象を深く理解して業務に活かすのが、データマイニングといわれる方法である。データマイニングは、データから仮説を発見することが重要であるため、分析する人間のビジネスやテクノロジーに関する知見・専門的スキルや経験が必要となる。

以上の通り、分析作業に入る前に即業務に活用できる数値が欲しいのか、もしくはデータの中に潜む未知のルールを見つけたいのかを見極め、機械学習的アプローチとデータマイニング的アプローチのどちらを選択するのかをまず決定する必要がある。

また、一つの作業によって上記の二つのアプローチを同時に実行できるように考えられているが、実業務では大きくプロセスが異なるため、分析目的およびアプローチ方法を厳密に分けて考えた方が良い。まずはビジネスのテーマとして、「当てたい」のか「知りたい」のかをよく考えることが必要となる。

BrainPad-ビジネス要件におけるアプローチの違い

● 機械学習による予測分析モデルを業務に活かす分析テーマ

機械学習には顧客の購買や反応を予測する際に利用される“分類”、顧客の行動や振る舞いから類似したグループに分ける“クラスタリング”、時間とともに変化する値を予測する”時系列分析”といった様々な活用方法がある。

ここからは、様々な場面で多く活用される“分類”による予測分析モデルの構築というテーマにフォーカスする。

機械学習は、過去に発生した結果から学習をすることで予測式を導き出す。したがって、過去に発生した事象が対象となり、それらをデータとして分析を行う。この時に重要となるのが、分析結果をビジネスに活用し収益を得るために実際にアクションを起こすことである。企業での活用事例としては、過去に発生した事象に対してその発生確率を算出し施策に活用するという流れが多い。

予測分析モデルを構築することで、購買履歴データから将来の購入予測確率を顧客に付与したり、過去のキャンペーンの履歴からキャンペーンの反応確率を算出したり、製造工程におけるマシンログから不良品の発生確率を算出することが可能である。

機械学習による予測分析モデルを業務へ適用するために注意すべきことは、単に予測確率を算出するだけでなく、算出結果をビジネスにどう活用するかを事前にきちんと検討しておく必要があるという点だ。購入確率が判明すれば、顧客別に購入促進のキャンペーン施策を迅速に実施することができるのか?ROIは改善するのか?また、不良品の発生確率が判明すれば、即座に不良品を生産の工程から除外やリワークに回したりできるのか?といった事項が挙げられる。もし、算出結果を業務に活かしても、収益の改善に貢献ができなければ「機械学習はビジネスに貢献できないもの」というレッテルが貼られてしまう。

baner171003_Tokyo

baner171004_Osaka

このような間違った結果を導かないようにするため、機械学習を活用した予測分析のプロジェクトなどを立ち上げる場合には「どのような結果を導き」、「どのような業務で活用するのか」を事前に検討した上で進めていく必要がある。データさえあれば、どのような戦略を立ち上げ、どのような施策を打てば良いかなどを機械学習が自動的に学習・検討し、提示してくれるわけではない。業務担当者が立案した戦略に対して、その戦略を実現するために、最も効率的な施策を遂行する戦術の強化をもたらすものが機械学習であり、それを理解した上で我々も活用する必要がある。

● 高いROIを生み出す、本当に必要なテクノロジー

機械学習による予測分析モデルを構築するには、ビジネスに適用するための計画立案・データの整理・アルゴリズムの選択と活用というステップを踏む必要がある。その中で、特に阻害要因となりやすいのが、機械学習で活用するアルゴリズムを選択し、設定・実行する部分である。

これには高度な知識が必要となるため、結局どのアルゴリズムを選択しどう設定するのかは、人のセンス・知識・経験がベースとなり、経験がない人間が実施する場合、全てのアルゴリズムを試し何が一番良いのかを判断することとなる。さらに、アルゴリズムの制約に基づいたデータ加工や項目の準備、変換をしていかなければならない。業務担当者が忙しい日常業務の中でこれらの作業を行うのは不可能であるため、実際はデータサイエンティストや分析担当者が時間をかけて行うこととなる。ここでまた、データ活用がスムーズに進まないという問題が起きやすい。

このような中で、SAP® Predictive Analyticsはビジネステーマ、データがそろっていれば、統計的な前提に基づくデータの変換、アルゴリズムの選定やチューニングが必要なく、非常にスピーディーに予測モデルの構築を行うことができる。予測モデルの構築において必要となる多くのステップが自動化されているため、操作担当者のスキルや経験にかかわらず、同じデータを投入すると全員同じ結果を出すことができるような特許取得済みの機能が組み込まれている。

sap-pa

SAP® Predictive Analyticsを活用することで、業務担当者は多くの予測分析モデルを、安全かつ大量に構築することが可能となり、日常業務における多くの意思決定を機械学習のテクノロジーに基づいてデータドリブンで行えるようになる。さらに、その予測結果となる数式は、SQL、UDF、SAS言語、Hive SQL、Spark SQL、JAVAなどの多くの言語に出力でき、様々なシステムに組み込んで独立して運用することもできるため、システム担当者の工数削減にも大きく貢献することができる。

SAP® Predictive Analyticsは、多くのビジネスに貢献することが可能な非常に革新的なツールである。予測分析モデルの構築、データの変化に対応したモデルの再構築などを実現する非常に強力な仕組みが搭載されており、同等の機能を有している競合製品はほぼ存在しないという、ユニークなポジションを得ている。

● 最後に

SAP® Predictive Analyticsには、効率の良い予測分析モデル構築、データ加工の方法論が組み込まれている。ビジネスの目標をしっかり定義し、施策を実行して効果を得ていくことが、データの価値を高めるために重要になるだろう。

baner171003_Tokyo

baner171004_Osaka

● お問合せ

 SAP® Predictive Analytics 製品の検討や導入に関するご相談や詳細説明をご希望する方は、以下よりお気軽にご相談ください。
Inquiry

編集:ビジネスonIT

Pocket

コメント

「ビッグデータ」の最新記事

一覧へ

startup-photos

活用の幅が大きく広がる機械学習によるデータ分析(第2回)

第1回目では機械学習を活用したデータ分析の基礎情報を理解いただくため、「機械学習とデータマイニングの違い」や「顧客の購買や反応を予…

bigdate#1eyec

データ分析の現場でよく使われているツールをご紹介します ~組織のデータをいかに活…

国が企業に向けて重要性を発信するほど注目度の高いデータ分析。攻めのIT実現に向けて、データ分析の領域で代表的ツールとされている「S…

bigdate#1eyec

組織のIT、「攻め」に使えていますか? ~組織のデータをいかに活用するか~

国を挙げて提唱されている「攻めのIT活用」。グローバルスタンダードにもなりつつある、攻めのITツール活用について、踏むべきステップ…

data-mining

データマイニング入門。予測・分類・相関の分析によりビジネスに未知なる知見をもたら…

データマイニングは近年よく聞かれるようになった用語だが、実際、どのような手法があり、導入するには何が必要になるのだろうか。活用例を…

bigdata-data-driven-company

データドリブン企業ってどんな企業?

ある企業の社長は、今後はデータドリブン企業と呼ばれるようになりたいと表明した。あらゆる業界・企業で膨大なデータが扱われるようになっ…