Japan
サイト内の現在位置
ビッグデータ分析とは?分析手法から活用ポイントまで詳しく解説

ITに携わる人に限らず、ビッグデータという言葉を耳にする機会は多いでしょう。ビッグデータは従来のデータよりも大量かつ多様なデータであり、近年はビッグデータを分析して得られた知見をビジネスに活用する動きが盛んになっています。
本記事はそもそもビッグデータとは何かという基本的な部分をはじめ、ビッグデータ分析の代表的な手法や、ビッグデータ分析を成功させるポイントについても解説します。ビッグデータ分析について基本から知りたいかたはもちろん、今後ビジネスでビッグデータ分析を実施する予定があるかたに向けた情報も詳しく紹介しています。ぜひ最後までお読みください。
ビッグデータ分析とは
ここでは、ビッグデータという用語の意味をはじめとして、ビッグデータ分析の概要について解説します。
ビッグデータ分析の概要
ビッグデータとは、企業が日々のビジネスにおいて処理を求められる大規模なデータのことを指します。ビッグデータ分析は、主にビッグデータを対象とした分析を行い、ビジネス推進の上で有用な知見を得ることを目的に行われます。
IDC社の調査によると、全世界のデータ量は年々急激に増加し、2025年には163ゼタバイト(1ゼタは1兆の10億倍)になると予想されています。ビッグデータ分析の需要は、今後ますます拡大していくことが予想されます。(出典:IDC 3 Key Differentiators to Seek in Hybrid Cloud Services)
ビッグデータの3つのV
ビッグデータをわかりやすく表現する概念として、3つのVという考えかたがあります。3つのVはそれぞれ、Volume(量)、Velocity(速度)、Variety(種類)の頭文字です。3つのVに加えて、データの正しさ(Veracity)、価値(Value)を加えた5つのVという考えかたもあります。
ビッグデータは「ビッグ」という単語を含むことからもわかるとおり、日々のビジネスで発生する大量のデータのことを指します。また、そのデータは画像、音声などの非構造化データに至るまで多岐にわたります。さらに、ビッグデータは高速でやり取りされるものが多いため、これらを迅速に処理できるしくみが求められます。
ビッグデータと普通のデータの違い
ビッグデータは、従来存在する普通のデータとどのような違いがあるのでしょうか。
ビッグデータという概念が生まれる前から存在する従来型のデータは、コンピューターやシステム間でやり取りできるよう決まった形式と構造を持っており、構造化データと呼ばれています。
一方、ビッグデータについては3つのVに「Variety(種類)」という言葉があるように、形式が定まらない非構造化データを中心に構成されています。また、「Volume(量)」という言葉が示すように、従来のデータよりも圧倒的な量になることもビッグデータの特徴といえるでしょう。
ビッグデータ分析の手法
ここでは、ビッグデータ分析の代表的な手法について紹介します。
クロス集計
クロス集計とは、データを属性別に分類し傾向を分析する手法です。アンケートを通じて2つ以上の質問を投げかけ、その回答結果から回答者の属性ごとの傾向を判断するものが例としてあげられます。
クロス集計には、顧客の属性から傾向を判別する「属性クロス集計」、設問への回答結果に基づいて行う「設問クロス集計」の2種類があります。クロス集計には統計学の専門知識が不要であり、エクセルなどで簡単に行えるため、ビッグデータ分析の中では比較的活用しやすい手法と言えるでしょう。
回帰分析
回帰分析は、ある結果に関連する要因が、結果に対してどの程度の影響があるのかを分析する手法です。
回帰分析では、結果を「目的変数」、結果に関連する要因を「説明変数」と呼びます。たとえば、目的変数を「ある店舗の売上高が前年比で上昇する」とした場合に、割引の有無、競合製品の価格、店舗周辺の人口など「売上高の拡大につながる要因」が説明変数となります。
分析の結果、どの要因(説明変数)が結果(目的変数)にもっとも寄与するかを把握できれば、実効性のあるマーケティング施策を打ち出すきっかけとなり得ます。
回帰分析は、複数の要因(説明変数)を起点として、二択の結果(目的変数)が起こる確率を算出する手法です。この場合の目的変数は、「顧客がある商品を買うか、買わないか」というように二択で表現できます。
回帰分析によって、どのような性質も持つ顧客が何パーセントの確率で商品を買うのかを予測できます。この結果、より重点的にアプローチすべき見込み客が明確になるのです。
アソシエーション分析
アソシエーション分析は、日本語で「連関分析」と訳すことができます。これは、ビッグデータを分析対象として「AであればBだろう」という因果関係を見出そうとする手法です。マーケティングの分野では、消費者の行動からパターンを見つけ出すために活用されてきました。
アソシエーション分析から派生した手法に「バスケット分析」があります。バスケット分析は、ある商品と同時に買われやすい商品を見つけ出す手法です。
有名な例として、一見関係性のなさそうなビールと紙おむつが同時に購入されやすいことがバスケット分析によって判明しています。このことから、子育て中の妻に依頼されて買い物に来た男性が、紙おむつと一緒に自分が飲むビールも一緒に買う傾向が強いのではという仮説が立てられます。
クラスター分析
クラスター分析はデータの類似性をもとに分析する手法です。クラスターは日本語で「集団」という意味を持ちます。特にマーケティングの領域で、顧客セグメントの分類を行う際に使われます。
たとえば、アンケート結果から判明した顧客の年齢、家族構成などから既存顧客のグループ化を行い、グループごとの売れ筋商品などを分析することがあります。顧客をいくつかのグループに分けることによって、集中的にアプローチすべき年齢層や、強化すべき商品ラインナップについての仮説を立てることができます。
また、クラスター分析によって、自社製品が市場の中で置かれた立ち位置やシェア、競争力の有無などについても割り出せます。
決定木分析
決定木分析とは、「はい」か「いいえ」で答えられるアンケートのような分岐を与え、これに対する答えを繰り返すことで幅広い結果を予測する手法です。木が枝分かれしていくように見えるため、決定木分析と呼ばれています。
決定木分析の際は顧客に対して実際にアンケートを行うのが一般的です。たとえば、「どのような条件であれば商品を買いたいか」という内容のアンケートを実施することで、顧客の属性、割引の有無といった個々の条件と、購買行動の間にある因果関係を探れます。
主成分分析
主成分分析は、ビッグデータ分析の対象となるデータに複数の変数が存在する場合に用いられる分析手法です。ビッグデータ分析においては、変数が多くなることによって分析が複雑になることがあります。
主成分分析は、分析対象とする変数をいくつかに絞ることで、分析そのものをシンプルにする手法です。変数を集約することによって、従来は可視化が難しかった分析結果をグラフなどで表現することも可能になります。ビッグデータ分析の結果を専門領域外の人に向けて説明する際、主成分分析が役立ちます。
ビッグデータ分析を成功させるポイント
ここでは、ビッグデータ分析を成功させるにあたって重要なポイントを解説します。
ビッグデータの利用目的を明確にする
ビッグデータ分析においては、まず何を目的として分析を行うのか、分析結果からどのような知見を得たいのかといった根本的な部分を明確にする必要があります。ビッグデータ分析で扱うデータは多種多様であるため、まずは目的に沿ってどのデータを対象に分析するのか決めなければなりません。また、データの種類によって分析に適した手法を選択することも重要です。
安全にデータを保管できる仕組みを整備する
ビッグデータ分析で扱われるデータは膨大です。近年は、ビッグデータ分析を行うことを前提としたDWH(データウェアハウス)というサービスが一般的になりつつあります。DWHとは、ビッグデータ分析ができる形にデータを最適化した上で、安全に保管できるしくみのことです。
また、多くのDWHには外部からの攻撃を防御するしくみや、データの暗号化などセキュリティを向上させる機能が備わっています。データマイニングにおいてデータを大量かつ安全に保管できるしくみは必須と言えます。データマイニングの活用を検討する際には、DWHの導入もあわせて検討すると良いでしょう。
データのクレンジングを行う
ビッグデータ分析で扱うデータには、そのままの状態では欠損やノイズが残っている場合があります。また、形式も画像や音声などフォーマットがそろっていないケースもあるでしょう。データに不備がある場合、そのままでは分析ができないため、データを適切な形に整える「データクレンジング」という作業が必要になります。
データクレンジングは個々のデータを分析に適した形に整える工程であり、人手を介した作業が必要です。効率的にビッグデータ分析を行うためには、データクレンジングのスキルを持った人材を一定数確保し、滞りなく作業が進められるような体制を確保する必要があります。
先ほど紹介したDWHには、データクレンジングの機能を持った製品もあります。DWHの導入もデータクレンジングを効率化するひとつの手段です。
ビッグデータ分析のビジネス活用事例
ここでは、ビッグデータ分析の活用事例について、代表的なものを紹介します。
ECサイトの改善
ECサイトには日々多数のユーザーが訪れ、商品購入の有無に関わらずさまざまな履歴データを残していきます。ECサイトのアクセス数を増やすためには、日々発生するデータを分析することで有効な知見を得る必要があります。
たとえば、ECサイトの訪問履歴と顧客情報を分析し、特定の年齢層や家族構成の顧客に対して集中的に広告を出すことで、アクセス数や購買率の増加につなげたケースがあります。
ECサイトにおける顧客の訪問データには、今後のアクセス数増加や売上拡大につながる情報が眠っている可能性があります。ビッグデータ分析によって、本来は活用しきれていなかったデータが宝の山に変わるかもしれません。
PHRの取り組み
ビッグデータ分析は、PHRという分野でも活用されています。PHR(Personal Health Record)とは、個人の健診結果や受診記録を生涯にわたって管理しようとする考えかたです。日本においても、母子手帳やお薬手帳の電子化など、PHRの実現に向けた取り組みが進められています。
しかし、PHRの目的は健康情報の記録だけではありません。健診結果や受診記録をビッグデータとして分析し、医薬品の創薬、予防医療の拡大といった分野に生かすことで、健康寿命を延ばすという使命もあります。
MaaS分野における活用
鉄道や自動車といった交通手段の統合を図るMaaS(Mobility as a Service)においては、日々発生する移動データを対象にビッグデータ分析を行うことで、さまざまな知見を得られます。
たとえばある都市において渋滞予測を行う際には、リアルタイムで発生する交通量の情報、各車両の移動データ、天候や工事の情報を総合的に分析することで、より精度の高い予測を行えます。
MaaSは交通分野に留まらず、小売業、医療といった他分野においても広がりを見せている概念です。今後拡大が予想されるMaaS分野において、ビッグデータ分析は重要な役割を果たすでしょう。
ビッグデータ分析の今後
広い分野で活用されているビッグデータ分析ですが、今後の市場動向はどのようになっているのでしょうか。
国内外の市場調査を行うリサーチステーション合同会社が発表したレポートによると、ビッグデータの世界市場は2021年時点の1,626億ドルから2026年には2,734億ドルに成長するとされており、年間で実に10%以上の成長が予想されています。(出典:Research Station,LLC ビッグデータの世界市場:2026年に至るソリューション別、業界別予測)
AIなどの技術進歩に伴い、ビッグデータ分析が活用される領域はますます広がっていくことが見込まれます。
まとめ
ビッグデータ分析は、大量かつ多種多様なデータを分析することで、ビジネスにおいて有用な知見を見つけ出す技術です。AIなどの最新技術との関わりが深く、クロス集計、回帰分析をはじめ分析を行うための手法も多数存在します。
ビッグデータ分析によってビジネスで成果を得るためには、まず分析結果からどのような知見を得たいのか、それによって何を実現したいのかを明確にしましょう。また、膨大なデータを安全に保管し、必要に応じてデータクレンジングを実施できる環境を整備することも重要です。
ビッグデータ分析は幅広い分野で活用されている技術であり、ビッグデータ分析の市場は今後も拡大していくことが予想されています。この機会にビッグデータ分析について詳しく知り、活用を検討してみてはいかがでしょうか。