ページの先頭です。
サイト内の現在位置を表示しています。
  1. ホーム
  2. ソリューション・サービス
  3. AI・ビッグデータ
  4. 特集コンテンツ
  5. イベント・セミナーレポート
  6. C&Cユーザーフォーラム&iEXPO2014
  7. 事例でわかる!ビッグデータ分析による価値創出とは?
ここから本文です。

事例でわかる!ビッグデータ分析による価値創出とは?

写真:堀野 真雄 氏

NEC
ソリューションプラットフォーム統括本部
堀野 真雄

本日は「ビッグデータの分析」にフォーカスして、NECの事例をご紹介します。お伝えしたいのは「事例紹介による活用イメージの深堀」と「お客様にご提供できるNECの価値」の2点です。

提供するソリューションは、

データ蓄積のデータベースアプライアンスのData Platform for Analyticsと、統計解析ツールのSAS、これがベースの製品となります。

おもな活用領域は流通・小売業のマーケティングと金融与信業務

NECでは、Data Platform for AnalyticsとSASを、ビッグデータソリューションのプラットフォームと位置付けています。一方でソリューション提供には役割に応じたノウハウが必要なため、ビッグデータを分析できる形にする「データエンジニアチーム」と、ビッグデータを実際に分析する「データサイエンスチーム」の2チーム体制で臨んでいます。

この2つのチームに加え、分析方法を体系化したテンプレートがあり、プラットフォームと2つのチームとテンプレートをあわせてソリューションとして提供しています。以下に代表的な2つの活用領域を紹介します。

一つは流通業・小売業を中心とした「マーケティング」です。例えばキャンペーンを行った場合、反応する顧客はどのような顧客層なのか、また高い確率で反応する顧客に対してはどのようなキャンペーンを展開すればコストの削減や売上拡大につながるのかを分析します。

もう一つは、「クレジットスコアリング」という金融業の与信業務です。返済滞納者などを過去の取引履歴から分析して、事前に施策を打つことでリスクを低減します。

マーケティングもクレジットスコアリングも、どちらもコンシューマーを対象とした、個人の大量の行動履歴のデータが対象になっています。

分析業務には「要件整理」と「仮説検証型PDCA」が必須

具体的な分析業務の進め方は、大きく分けると「要件整理」と「仮説検証型PDCA」の2つに分類されます。

「要件整理」では、分析によって何を解決するのかという分析テーマを決め、次に仮説を立て、それに基づき必要なデータを考え、保有データの検証や、データ加工などのデータの整備を行います。
「要件整理」の後は、仮説を立てて、それに基づいた分析データの項目を加工してつくり、分析を進めていきます。結果が出たら、施策の実施結果の効果検証を行い、さらに分析を行いより精度を上げていく、といった「仮説検証型PDCA」のサイクルをまわすことで継続的な改善アクションにつなげます。

分析業務を進めるうえでの重要なポイントが3つあります。
1つめのポイントは、「分析データ加工」です。これはデータの欠損を補ったり、表記を統一するデータクレンジング作業のことです。例えば「NEC」という会社表記一つ取っても、半角や全角文字が混在していたり、「日本電気」という表記が混じっていたりした場合、データを「名寄せ」して表記を統一しないと、分析データとして使える状態にはなりません。

2つめのポイントは、「分析モデルの作成」です。分析モデルの良しあしを決めるのは変数作成で、5W2Hの観点で分析モデル構築のための変数を作成します。
例えば「年齢」の項目でも、データベースには生年月日しか入っていないことが多く、しかも「年代」という項目を新たに作った際、5歳刻みがいいのか、10歳刻みがいいのか、あるいは中学生・高校生・大学生といったように特定のレンジで分類すべきかなど、その区切りによって傾向値が大きく変化します。結果が変われば、それに伴ってアプローチや施策も変わってくるため、データ項目、変数の決定は非常に重要です。

この分析のモデル作成は、例えば、1万人の顧客の1億件の購買履歴がある場合、1万人の顧客マスターに対して、2次属性・3次属性を変数として設定していきます。変数設定は試行錯誤を繰り返しながら何回も検証して進めます。意図する結果が出ない場合は新しい変数をつくり、別の傾向が出たときも見直すことを繰り返し、最終的に運用フェーズに導きます。

3つめのポイントはわかりやすい「分析レポート」の作成です。試行錯誤の結果として出てきた分析の結果や傾向を、わかりやすいレポートとしてまとめる必要があります。

単なる統計結果としてではなく、分析の結果として得られた「特殊な傾向」や、通常では見つけにくい「隠れたパターン」などを、ドキュメント作成力を駆使してわかりやすくまとめるように心掛けます。

最適な販促活動時期を過去のデータから導き出す

金融業のソリューションであるEBM(イベント・ベースド・マーケティング)の事例を紹介します。これはお客様の結婚・出産・入学といったライフステージや、大口のローンを完済したことを「イベント」と捉え、それぞれのイベントに際して、どのタイミングでどのような金融商品を提案していくのが最適かを、過去の取引履歴のデータから分析して導き出していく、というソリューションです。

最終的には、お客様のデータをもとに、コールセンターから住宅ローンや金融商品を訴求するような、効率的な販売戦術につなげられます。

このソリューションには、前述の「クレジットスコアリング」が伴います。クレジットスコアリングには「機械的な作業」と、最終的に人間の目で見て手直しする「人間系の作業」があります。

機械的作業は、実際に借りたことがある人を統計ツールで確率順に数値化していくものです。例えば、半年間で500万円以上の大口の入出金があった人を「借りる傾向にある」人とし、数値の高い順に並べて分類するものです。

これを補完する形で、最終的に人間の目でそれが正しいかどうかを見極め、項目や変数を正しく並べていく作業が「人間系の作業」です。人の視点で、最終的に正しくモデルとして使えるものを取捨選択することが必要になります。

最後に行うのは「検証」です。実際につくったモデルは数値化され、「何パーセント」というスコアで示されます。このとき、モデルをつくるために使ったデータと使っていないデータを分け、精度にどの程度の差が出るのかを比較するのが「検証プロセス」です。

このような視点を踏まえ、モデルの精度を上げながら顧客リストを出し、そのリストにもとづいてコールセンターで販売促進活動を通じて売上向上を目指すのがEBMの役割です。

顧客の購買履歴から商品の需要予測を導き出す

続いて、流通業のポイントカードを使った分析事例をご紹介します。

ポイントカードでお客様を囲い込んで、休眠や離反を防止しながら「優良顧客層」を育成する分析・活用事例です。対象となるデータはID付きPOSデータで、お客様の「誰が、いつ、どこで」という消費情報が精緻に取得できます。

実際に顧客分析をする場合は、「シナリオ」を作成します。まず、「新規顧客の獲得」「顧客の離反防止」など、目的とその優先順位を定め、どのように改善していくかというシナリオを定義します。この結果に応じて、施策の立案などに結び付けます。

次に商品分析ですが、商品の売れるタイミング(購買時間帯)を見る「商品時系列分析」と、初回及び2回目以降の購買率をデータ化した「トライアル&リピート分析」があります。

「商品時系列分析」は時間帯別の売れ筋商品を表わし、適切な商品発注の指標となります。一方の「トライアル&リピート分析」は、初回の購入率の高低に対して、再購入率の度合いを示しています。

このトライアル率とリピート率の相関関係をもとに、例えばトライアル率が低くてもリピート率が高ければ、継続して購入が期待できる成長商品だということが一目で分かります。特に新商品では、発売後1カ月間のリピート率把握によって、継続して仕入れ、販売するべきか否かを判断することができます。

また「性別」というセグメントで分析することも可能です。ある商品について、男性より女性に売れていると判別できれば、その商品のターゲット層が明確に見て取れます。

NECのデータ活用基盤・分析テンプレート「Data Platform for Analytics×SAS」

ここまで、データ分析に関するお客様事例を中心にご紹介しましたが、最後にNECが提供するツールやプラットフォームについてお話しします。

ビッグデータソリューションは「プラットフォーム」、2つの専任チームが提供する「サービス」とシステム構築の実績に基づく「分析テンプレート」により構成されています。この「分析テンプレート」は、「分析のシナリオ」「個々の分析テーマごとの指標」「分析の手法」などを定義しており、お客様の業務合わせて「EBM」「Webアクセス」「品質分析」の3種類を提供しています。それぞれのテンプレートでは、分析の指標や手法に加え、最終的にレポートとしてまとめるアウトプットの概要設計までを定義しています。さらにNECでは、分析に必要な指標と手法にもとづき、データサイエンティストが最適なコンサルティングを行ないます。

またソリューションのバックボーンとしてDWHアプライアンスが、「Data Platform for Analytics(DP4A)」です。「Data Platform for Analytics」は、データ分析に必要なハードとソフト環境を事前に設計・検証済みのシステムで、導入が容易かつ、低コストながら、非常に高速な処理速度を実現できるのが特徴です。

一方、データ分析機能を提供する「SAS」は、顧客の行動パターンをセグメント化して、顧客特性に最適化された施策の企画・実行を実現する大規模データ・マイニング・ツールです。

購買行動パターンをもとに、セグメント化した顧客層の購入商品の特徴や価格帯、購入アイテム数など、さまざまな傾向を分析軸の項目別に自動的に表示します。統計分析の場合、顧客属と購買傾向を比較しやすいデータにして抽出・表示する「SAS」の機能は、精度が高く信頼性のあるデータ分析を支援します。

ビッグデータの分析において、分析作業全体の60%を占めるのが「データ加工」と云われており、このステップの効率化が最大の課題となっています。そのためにより高速処理が可能な環境が求められます。

NECの「Data Platform for Analytics & SASソリューション」は、データベース側で高速かつ、繰り返しの処理が可能な機能を提供することで、膨大なデータから効率的に「最大の知恵」を引き出し、ビッグアナリティクスによる価値創出を実現します。

ページの先頭へ戻る