データマイニング入門。予測・分類・相関の分析によりビジネスに未知なる知見をもたらす

data-mining

データマイニングは近年よく聞かれるようになった用語だが、実際、どのような手法があり、導入するには何が必要になるのだろうか。活用例を含め、データマイニングの基礎を解説する。

 

■データマイニングとは?

データマイニングとは膨大な情報の中から新たな知見を発見する技術を指す。ソーシャルメディアからセンサーデータまで様々なデータが溢れるようになった現代で、それを分析できる計算機資源が確保できるようになった技術的進歩を背景に、データマイニングに対する注目が高まっている。

データマイニングでは、手作業では処理しきれないような膨大な情報の中から、次の行動につながるような知見を獲得し、ビジネスを優位に進める起爆剤となることが期待されている。データマイニングで有名な逸話に「ビールとオムツを並べて販売すると売り上げが上がる」といったシナリオがあるが、これまでの常識とは異なる視点を提供するのがデータマイニングだ。勘や経験、あるいは間違った思い込みによって行っていた意思決定を、統計的な手法で向上させるのがデータマイニングの利点となる。

■データマイニングの3つの手法:予測・分類・相関

データマイニングには大きく分けて「予測」「分類」「相関」という3つの手法がある。まず、「予測」では、ある未来の事象が発生する確率と、その要因を明らかにする。例えば、マーケティング活動において、見込み顧客の中でダイレクトメールを開封した人は成約する確率が高いと分かれば、メールでのマーケティングに予算を投入して投資対効果を高める施策が打てるだろう。その他にも、部品が故障する確率、サービスの解約率といったビジネス上の利用例が考えられる。

次に、「分類」では大量なデータの中から同じ特徴を持ったカテゴリ分けを行う。いわゆるセグメンテーションを行い、そのグループに最適な施策を打つといった活用例が考えられる。地理的データ・人口統計的データ・心理的属性・購買行動履歴などをもとに、カテゴリを分けると、データを扱いやすくなるのがメリットだ。

最後に、「相関」を見出すのが3つめの手法だ。膨大なデータの中から同時に発生する頻度の高い事象を発見する。前述の「ビールとオムツ」の関係がその代表だ。さらに、「この商品を買った人は、こちらの商品を買っています」という推薦機能も相関の一種だ。商品もユーザーも無数に存在する中で関連性を見出すのは、人手では不可能なので、データマイニングの力が欠かせない。

データマイニングの3手法

Pocket

コメント