データマイニングとは? ~その仕組みと可能性~

「情報氾濫」とも表現される現代においては、あふれるデータを企業経営へと活かすために、「データマイニング」を活用することが欠かせなくなりました。しかし、最近よく耳にするこの「データマイニング」とは、そもそもどのようなものなのでしょうか?

そこで今回は「データマイニング」の基本的な考え方と仕組みについて、具体的な手法にも触れながら説明します。また、「データマイニング」の持つ可能性についても検討します。

「データマイニング」とは?

「データマイニング」とは、大量のデータについて統計学や人工知能などを駆使して、データ間の相関関係や隠れたパターンなどを見出すための手法です。

データマイニングという言葉の示す通り、情報(データ)から有益なものを採掘(マイニング)する技術ということです。ITビジネスの分野では、近年「ビッグデータ」が注目を集めています。それに従い、ビッグデータを有効に活用するための手段として、データマイニングにも注目が集まっています。

データマイニングの仕組み ~事前準備~

準備その1: データマイニングの元となるデータの収集

データマイニングを行うために、まずは実際にデータを収集することが必要です。一般的には、元となるデータが多ければ多いほど、有益な情報を採掘(マイニング)できる可能性が高まります。そのためデータマイニングに先んじて、「データウェアハウス」を設けるケースも少なくありません。

「データウェアハウス」はまさに情報(データ)の倉庫(ウェアハウス)であり、大量のデータを保管するために設けられます。しかしいわゆる「データベース」とは、少し異なります。データウェアハウスはデータベースとは異なり、登録されたデータの削除や更新を原則として行いません。データウェアハウスは、データを蓄積することが目的だからです。

そしてまた、改変されずに次々と積み上げられた情報の中にこそ、データマイニングによって採掘される原石が眠っているのです。したがって、データマイニングを行う上では、データウェアハウスの存在は欠かせないものとなっています。

準備その2: 収集したデータの加工

収集されたデータは、データマイニングを行うことができるように加工を施されます。データマイニングはコンピュータシステム上で行うことがほとんどなので、データマイニング用のシステムに合わせて、システム上で動作可能な状態へと加工する必要があります。

特に、数値データや記号データといった「データ形式」は、原則としていずれかに統一する必要があります。また正確な結果を出すには、「正規化」などを施す必要もあります。こうしたデータの加工を「クレンジング」と表現する場合もあり、効果的なデータマイニングを行う上で非常に重要なステップとされています。

データマイニングの仕組み ~具体的手法~

手法その1: 事前に仮説を用意しない「機械学習」

データの収集と加工が完了すると、実際にデータマイニングを実施することになります。
さまざまな手法や技術が用いられますが、代表的なものにはまず、「人工知能」などを活用した「機械学習」といわれる手法があります。「機械」とはコンピュータのことです。コンピュータの性能が上がり、ビッグデータの時代になり急速に発展している手法です。

「機械学習」では、事前に仮説を想定する必要がありません。データの中からコンピュータが自分で学習しながら相関関係などを導き、人ではできない新しい分類(顧客セグメント)などを発見してくれます。あるいは、「ある事象の原因の特定」や「個客ごとの最適なマーケティングシナリオの選定」など複雑な条件が絡む課題の分析や最適化も「機械学習」の得意分野です。

手法その2: 事前に仮説をたてる「統計分析」

統計学や確率論などを活用したデータマイニング手法です。代表的な統計手法は「回帰分析」「主成分分析」「因子分析」などがあります。

統計分析では多くの場合、事前に仮説をたて、必要なデータを集め、検証したい課題や事象に合わせて適切な分析手法を選定して分析します。分析結果を読み解き、このサイクルを繰り返し実行します。そのため統計学などの知識を有する人物が必要となりますが、データマイニングツールによってある程度の専門知識を補ってくれる製品があります。

実際の分析現場では、必要に応じてあらゆる手法を組合せて、予測モデル構築や原因特定、最適化・最大化などのビジネスが必要とするアウトプットを分析結果として導きます。いずれにしてもデータマイニングを行うには「大量の元データ」「データマイニング用のシステム」「データマイニングに必要な知識を有する人物」という3要素が欠かせません。

データマイニングの持つ可能性

データマイニングツールを活用すれば、「人工知能」や「統計学」などの専門知識を基本レベルで理解していれば、分析結果を正しく読み解けるようサポートしてくれる製品があります。データマイニングによって、従来行われてきた「顧客の購買情報にもとづいた営業戦略」などをさらに高度に実行することができるようになります。

また、Web検索技術の発達をうまく活用すれば「Web上の検索ワードに対してデータマイニングを行い、人々が何に関心を持っており、どのような視点で関心の対象を理解しているのかを知ること」も可能でしょう。

一方で、これまであまり重要視されていなかったデータにも光を当て「ショッピングモール内の温度、湿度、照明光度と売上との関係」といった、新たな視点からの相関関係も見出されるかもしれません。

いずれにしても「ビッグデータ」時代の到来した現代において「データマイニング」は企業の業績を飛躍させる大きな可能性を秘めています。

ITトレンド掲載中のデータマイニングの製品をご覧になりたい方はこちら

    データマイニングの製品を調べて比較