データマイニングって聞くけど何?!
最近になってこの「データマイニング」という言葉を見かける機会が増えましたよね。
実はこの言葉が登場したのは1990年代と長い歴史があり、データを分析していく上でなくてはならないものの1つとなっています。
そして最後にデータマイニングをめぐる今後の課題についても明らかにしていきます。
それではまず、そもそもデータマイニングとは何かから始めていきましょう。
データマイニングとは何か
まず、データマイニングとはデータ(=情報)とマイニング(=採掘)という二つの単語を組み合わせたもの。
では、どうしてこのようなことをするのか次の章で見ていきましょう。
データマイニングを活用する目的
それを象徴するものとして特に有名なのはマーケティングでの応用。
具体的な話として「ビールとおむつの話」をご紹介します。
実際にあった話ではないようですが人間が考えるだけでは見出せないデータ同士の関連を発見することで新たなマーケティング戦略に繋がるというたとえ話となっています。
データマイニングの手法
データマイニングの目的について触れたのでどういった手法があるか見ていきましょう。
ロジスティック回帰分析
ロジスティック回帰はYesとNoのように明確な定義のできる予測によく使われる手法。
特に発生確率の予測で活躍します。
例としてダイレクトメールを送ることで購買を促す場合で考えましょう。
主成分分析
主成分分析は情報をより少なくすることでデータの特徴を掴めるようにすること。
ここでいう主成分は説明力の高い情報のことを指します。
よく使われる例として挙げられるのはマーケティングにおける優良顧客の定義。
クラスター分析
クラスター分析はそれぞれのデータが持つ情報を分類する手法。
ここでは類似性、つまり似た者同士でまとめるというものです。
決定木分析
決定木分析はデータの分類を通して予測していく手法。
例としておもちゃ屋で考えましょう。
お客さんが人気のゲーム機を買うのがAとなった場合、次にBとして何が起きるか分岐を繰り返していきます。
アソシエーション分析
アソシエーション分析は「ビールとおむつの話」のような商品の相関性を見つけていく手法。
例えばAmazonなどで買い物をしているとおすすめの商品として一人一人違ったものが出てきますよね。
買い物カゴに入れられたものの組み合わせということから「バスケット分析」や「マーケットバスケット分析」と呼ばれる場合もあります。
データマイニングの活用事例3つ
データマイニングの手法を見てきたので今度はどのようなところで活用されているか見ていきましょう。
クレジットカードの不正利用を見つける!
まずはクレジットカード。
データマイニングを用いればクレジットカードの利用履歴を基に不正利用を見つけることができます。
クレジットカードにはどの人がどんな商品を買ったかの記録がありとてつもなく膨大。
日を追うごとにデータの量も精度も上がっていくのでより安心して利用できることが期待されています。
ニュースアプリでその人に合ったものを提供!
データマイニングはニュースキュレーションアプリでも活躍しています。
ニュースキュレーションアプリは大量のニュースの中からユーザーごとの好みに合ったものや拡散しやすいものを自動で選んでくれるもの。
金融機関の審査でもデータマイニング!
データマイニングを金融機関の審査に利用するところも出てきています。
審査の材料として挙げられるのは職業や勤続年数、収入など多種多様。
これからのデータマイニング
データマイニングの重要性は今後さらに高まっていくことが予想されています。
というのもスマートフォンやSNSの普及などデータの量がどんどん多くなっていくから。
そのためこの膨大なデータを自分達の所属する企業や機関にどう活用していくかが課題となります。
そこで問題となるのは人材不足。
今回はデータマイニングという言葉がどういったもののことを言っていて何のためにするのか、どういった手法がありどこで使われているのかといった疑問を解き明かし、最後にデータマイニングが抱える今後の課題を明らかにしていきました。
手法は目的に応じて様々なものがあり今回は5つを紹介しました。
ますますデータの重要性が高まっている今、この技術を知ることで自分の所属する企業や組織がより良い方向に向かうきっかけにできるといいですよね。