Japan
サイト内の現在位置
データマイニングとは?代表的な手法から活用ポイントまで詳しく解説

データマイニングという手法をご存じでしょうか。近年、さまざまな業種において重要なキーワードとなりつつあるAI、ビッグデータ、データ利活用と同じ文脈で語られることが多いため、日々の業務に携わる中で注目しているかたもいるかもしれません。
本記事はデータマイニングについて基本的な概要を解説し、代表的な手法、データマイニングを成功させるポイントについてもお伝えします。データマイニングについてイチから知りたいかたはもちろん、今後ビジネスでデータマイニングを活用する機会があるかたに向けても詳細に解説しています。ぜひ最後までお読みください。
データマイニングとは
まず、データマイニングの概要を解説します。あわせて、データマイニングをとおして得られるものや実際の流れについても紹介します。
データマイニングの概要
データマイニングとは、大量のデータに対して統計学やAIなどを駆使した分析を行い、何らかの知見を得るための活動のことです。「マイニング」は日本語で「採掘」と訳されます。大量のデータを鉱山に見立て、鉱山から知識という鉱物を掘り当てるイメージをするとわかりやすいでしょう。
近年はIoT技術などの発達により、リアルタイムで大量のデータを分析するケースが増加しています。その際、あわせてデータマイニングが行われることも増えているのです。
データマイニングの目的は、データ同士の関連性や予想される事象の発生確率を見出すことです。特にマーケティングの分野では、過去のデータから市場動向、顧客の嗜好性などを予測する目的でデータマイニングが活用されています。
データマイニングで得られるもの
データマイニングを行うことで、どのような知見が得られるのでしょうか。ここでの知見は、「データ(Data)」、「情報(Information)」、「知識(Knowledge)」、「知恵(Wisdom)」の4つに分類され、これらの頭文字をとってDIKWモデルと呼ばれています。
<データマイニングにおけるDWIKモデル>
データ:画像、音声、数値などの収集されたすべての素材
情報:収集されたデータを整理し解釈できる形にしたもの
知識:情報を分析した結果得られた法則性やルール
知恵:知識を活用して物事を判断する力
データを意味のある情報に変換し、そこから知識を引き出すところまでがデータマイニングの領域です。知識を利用して正しく判断する力である「知恵」は、データマイニングではなく扱う人のスキルに依存する部分といわれています。
データマイニングの流れ
実際にデータマイニングを行う際はどのような流れになるのでしょうか。データマイニングのプロセスは、大まかに、データの収集、加工、分析と進んでいきます。
第1ステップのデータ収集では、まさに鉱山から鉱物を採掘するかのように、分析対象となるデータを大量に集めます。当然ながら、やみくもに大量のデータを集めれば良いというわけではなく、マーケティングであれば顧客の購買履歴など、目的に沿ったデータを集める必要があります。
データが収集できれば、次は加工のステップに移ります。ここでは、さまざまなフォーマットのデータを分析しやすい形式に整えていきます。この作業をデータクレンジングと呼びます。
最後に実施するのがデータの分析です。データマイニングにおける分析にはさまざまな手法が存在するため、この後の章で紹介します。分析結果が得られた後は、最初に立てた仮説と結果を検証し、次に仮説を立てる際に役立てることが重要です。
データマイニングの手法
ここでは、データマイニングの代表的な手法について紹介します。
クラスタリング
クラスタリングとはデータの類似性を元に分類する手法です。「クラスター」は「集団」を意味します。クラスタリングは、特にマーケティングの領域で顧客セグメントの分類を行う際に使われます。
たとえば、来店客を年齢、来店した時間帯、客単価などで分類して分析することにより、今後アプローチすべき年齢層、割引セールを実施すべき時間帯などの仮説を立てられます。
その際、クラスターとして分類した情報を、グラフや表などを使い視覚的に表現することで、仮説を立てるための議論をスムーズに進められます。
ロジスティック回帰分析
ロジスティック回帰分析は、複数の要因(説明変数)を起点として、二択の結果(目的変数)が起こる結果を確率として算出する手法です。この場合の目的変数は、顧客がある商品を買うか、買わないかというように二択で表現できます。
ロジスティック回帰分析によって、ある性質も持つ顧客が何パーセントの確率で商品を買うのかが分かります。この結果、より重点的にアプローチすべき見込み顧客が明確になります。
ABC分析
ABC分析は、過去の購買データを元に商品の売れ筋を分析し、どの商品に重点的に売り出すべきかを明確にする手法です。ABC分析は主に小売業において、売れ筋と死に筋の正本を明確化し、適切な在庫管理につなげる目的で活用されています。ABC分析では、取り扱う商品に対し、売上高が大きいものからA~Cのランク付けを行い、発注の優先度を決めます。
在庫管理においては、売れ筋の商品を欠品させると機会損失につながります。一方で、死に筋商品を過去と同様のペースで発注し続けると、在庫が積み上がってしまいます。適切な在庫管理においてはABC分析が重要な役割を果たします。
マーケット・バスケット分析
ある商品と同時に購入される傾向が強い商品を分析する手法が、マーケット・バスケット分析です。同じ買い物カゴ(バスケット)に入る商品に焦点を当てる分析手法のため、このように呼ばれます。
マーケット・バスケット分析では、ある商品を買ったお客さまが一見関係のなさそうな別の商品を買うという関連性を見つけられます。マーケティングにおいては、マーケット・バスケット分析の結果を活用すれば「商品の配置をかえて同時に買ってもらうことを狙う」といった施策の立案が可能になります。
データマイニングを成功させるポイント
ここでは、データマイニングを成功させるにあたって重要なポイントについて解説します。
データウェアハウス(DWH)の整備
データマイニングにおいて、分析対象となるデータは膨大な量になります。そうしたデータの管理のため、近年はAI分析やデータマイニングを行うことを前提としたDWH(データウェアハウス)というサービスが一般的になりつつあります。DWHは、AIによる分析やデータマイニングができる形にデータを最適化した上で、保管することができるしくみです。
また、DWHの多くには、外部からの攻撃を防御するしくみやデータの暗号化など、セキュリティを向上させる機能が備わっています。データマイニングにおいて、データを大量かつ安全に保管できるしくみは必須といえます。データマイニングの活用を検討する際は、DWHの導入もあわせて検討すると良いでしょう。
データクレンジングのための体制確保
データマイニングで扱うデータには、欠損やノイズが残っている場合があります。また、形式が整えられていないケースもあるでしょう。データに不備がある場合、そのままでは処理できないため、適切な形にそろえる「データクレンジング」が必要です。
データクレンジングは個々のデータを手作業で整形していく作業であり、大きな工数がかかることが予想されます。データマイニングをスムーズに進めるためには、データクレンジングのスキルを持った人材を確保し、滞りなく作業を進められる体制を整備する必要があります。
適切なツールの導入
データマイニングを行うためのツールは数多くリリースされており、選択肢は多いといえます。しかし、ツールによって適している用途や分析対象となるデータが異なります。
ツール選定に先立って、なぜデータマイニングをしたいのか、データマイニングを通じてどのような知見を得たいのかを明確にしましょう。ツールはあくまで手段にすぎません。データマイニングにおいては、目的を明確化することが、もっとも重要です。
また、目的に沿ったツールでも現場担当者にとって使いにくいものであれば、有効活用は難しくなります。ツールの導入時は開発元に依頼して無償トライアルを実施するなど、ツールを現場に浸透させるための準備が必要です。
データマイニングのビジネス活用事例
ここでは、データマイニングがどのようにビジネスで活用されているのかについて解説します。
金融業界におけるクレジットカード不正利用の検知
金融業界では、クレジットカードの不正利用を検知する目的でデータマイニングが活用されています。
クレジットカードは多くの人々が日常的に利用するものであるため、日々膨大な利用履歴のデータが蓄積しています。この大量に発生する利用データを分析し、過去の不正利用と類似したパターンを見つけ出すことで、クレジットカードの不正利用を早期に検知できるのです。
たとえば、通常は月額で数万円程度しかクレジットカードを使わない利用者がいたとします。その利用者がある月だけ突然100万円近くクレジットカードを利用した場合、悪意のある他者に不正利用された可能性があると判断できます。
しかし、当然ながら利用者が偶然大きな買い物をしただけのケースもあるため、月々の利用額だけで不正利用かどうか判断することは難しいでしょう。AIを活用したデータマイニングの手法であれば、複数のデータを参照・分析し、過去の法則に基づく総合的な判断を行えます。
金融業界ではクレジットカードの不正利用検知以外にも、住宅ローンの与信審査、保険商品の開発など広い用途でデータマイニングが活用されています。
小売業におけるマーケティング施策立案
クラスタリング、ABC分析といったデータマイニングの手法は小売業で活用されるケースが多いことから、小売業はデータマイニングが盛んに実践されている業界といえるでしょう。特に、膨大な購買データから顧客の購買傾向や嗜好性を分析し、マーケティング施策を立案するケースなどで多く活用されています。
たとえば、先述したマーケット・バスケット分析であれば、同時に購入される傾向の強い商品を割り出し、それらの商品を近い位置に陳列するといった施策が考えられます。小売業においては、データマイニングの手法によって、多種多様な施策を練ることができるようになります。
製造業における設備管理
製造業においても、工場の設備管理でデータマイニングが活用されています。工場ではさまざまな機器が稼働しており、稼働年数やメンテナンスの周期は多岐に渡ります。また、近年はIoTの技術が進展したこともあり、工場内のあらゆる機器からデータを収集することが一般的です。
一見、問題なく稼働しているように見える機器であっても、IoTのセンサーでは異常な動きや音が検出できているかもしれません。IoT機器が収集したデータをデータマイニングによって分析し、故障の予兆をつかむことができれば、計画的にメンテナンスを行い、機器故障による生産停止のリスクを大幅に低減できるでしょう。
データマイニングの今後
広い用途で活用されるデータマイニングですが、今後の市場動向はどのようになっているのでしょうか。市場調査レポートの提供を行うケネス・リサーチが2021年に発表したレポートによると、データマイニングツールの世界市場は2017年の5.17億ドルから2025年までに12.1億ドルに成長するとされており、年間で10%以上の成長が予想されています。(出典:KENNES RESEARCH Global Data Mining Tools Market)
データマイニングはAI、ビッグデータ、IoTとの関連が深く、これらの技術が進歩するにつれてより高性能なデータマイニングツールが生まれてくるでしょう。また、先述した事例以外の業界でもデジタルトランスフォーメーション(DX)が進展することが予想されるため、2025年以降も市場の拡大が見込まれます。
まとめ
データマイニングは大量のデータから有用な知見を見つけ出し、ビジネスに役立てていく技術です。AI、ビッグデータといった最新技術との関わりが深く、クラスタリングやロジスティック回帰分析といったさまざまな手法が用いられます。
データマイニングを成功させるためには、実現したい目的を明確にした上でデータの安全な保管、データクレンジングの体制確保などに注意し、自社に適したツールを活用することが重要です。
データマイニングは多様な業界で活用されている技術であり、データマイニングツールの市場は今後も拡大していくことが予想されています。この機会にデータマイニングについて詳しく知り、ビジネスでの活用を検討してみてはいかがでしょうか。
dotData・データドリブンDXのカタログをダウンロードいただけます
データサイエンスのプロセスを完全自動化した「dotData」のほか、データドリブンDXの実現を支援するソリューションを紹介しています。
My NEC ログインが必要となります

カタログ、ホワイトペーパー、事例リーフレットなど関連資料をご用意しております
dotData/データドリブンDXソリューションについて
お気軽にお問い合わせください。