サイト内の現在位置

Twitterデータ分析で「にわかファン」定着のヒントを探る ― 分析コンテスト 最優秀賞アイデア

NECは、NTTデータとTwitterの協力のもと2020年1月に分析コンテストを社内開催した。参加者は、提示されたTwitterデータを分析し、そこから導き出したビジネスアイデアの競争に挑戦。一次選考を通過したファイナリスト5組による最終プレゼンが行われ、最終審査の結果、「最優秀賞」1組、審査員特別賞として「Twitter賞」「NTTデータ賞」各1組が選出された。

分析コンテストを通じて、どのようなアイデアが創出されたのか。最優秀賞を受賞したチーム、そして特別審査員を務めたNTTデータ 伊東大輔氏、Twitter Japan 後藤和枝氏にインタビューした。

分析コンテスト 最優秀賞 受賞者


長尾将宏 NEC AI・アナリティクス事業部


飛田尚洋 NEC 第一ネットワークソリューション事業部


賀勢征司 NEC 第一ネットワークソリューション事業部


岩上 陽 NEC 第一ネットワークソリューション事業部


分析コンテスト 特別審査員


伊東大輔
NTTデータ ITサービス・ペイメント事業本部 SDDX事業部 マーケティングデザイン統括部 デジタルマーケティング担当 課長代理


後藤和枝
Twitter Japan Developer and Enterprise Solutionチーム・⽇本&アジア地区のデータパートナー事業リード


Twitterデータ分析に興味と不安が入り交じる

―― 最優秀賞おめでとうございます。チームのみなさんは、普段から業務でデータ分析をされているのでしょうか。チームメンバーについて教えてください。

長尾:
私は、AI・アナリティクス事業部という、NECのAI事業を推進する全社横断組織の所属です。業務では、データサイエンティストとしてデータ分析を行ったり、アドバイザーとしてプロジェクトを支援したりしています。

このチームでは、私だけが違う部門で、あとのメンバーは第一ネットワークソリューション事業部に所属しています。ただ、私も過去に同じ事業部に所属していて、そうした経緯もあって今回のチームが作られました。

飛田:
長尾から紹介があったように、私と賀勢、岩上の3人は、第一ネットワークソリューション事業部の所属で、通信キャリアをお客様としたビジネスに携わっています。事業部としては通信機器の開発を手掛けており、なかでも私はIoT機器をお客様に活用いただくためのクラウドフレームワークを構築し、そこから得られるデータの分析に取り組んでいます。

賀勢と岩上も、私と同様に通信キャリア向けのデータ分析に従事していて、機器のデータだけなく、アンケートの回答データの分析なども手掛けています。

最終審査プレゼンにはチームを代表して長尾(写真 右)が登壇。オンライン開催のため無観客となるなか、チームから飛田(写真 左)が応援に駆けつけた。

―― 分析対象はスポーツイベントに関連したTwitterデータでしたが、どのような印象を持ちましたか。

長尾:
「おもしろいデータをもらえたな」というのが第一印象です。Twitterデータについては、過去にAPIを利用してデータを取得したことがあるのですが、今回はそれよりも期間、件数ともに上回っていたので、そうしたデータが分析できることがうれしかったですね。

岩上:
日本で開催され、盛り上がったスポーツイベントと相関のあるデータで何ができるのか、なんだかおもしろそうだな、と思いました。

賀勢:
私も「タイムリーでおもしろそう」という印象を持ちました。個人でTwitterを利用しているのですが、ツイートには、日本語としてちょっと怪しいというか、独特の表現が使われているものがたくさんあると感じています。なので、分析の際にそれがどう影響するのか、ちゃんと分析できるのか不安な面もありました。

飛田:
私はこれまでも分析コンテストに参加していて、スポーツをテーマにした分析もやってきました。それに、「そろそろテキスト分析が来るのでは」と予想していたので、分析対象のデータについて聞いて、順当というか、取り組みやすそうだと思いました。ただ、対象となったスポーツについて私はあまり詳しくなかったので、「ファンがコンテストに参加していたら、太刀打ちできないかも」という心配もしました。

飛田、賀勢、岩上は、前回(第3回)の分析コンテストにおいてビジネスアイデア最優秀賞を獲得したチームのメンバーでもある(写真 左から賀勢、岩上、飛田。写真は前回コンテストの表彰式)。

悩みながらも「王道」のアイデアで勝負

―― 今回のアイデアは、Twitterデータを分析して、スポーツの「にわかファン」と「玄人ファン」を区分して特徴を考察し、どうすれば「にわかファン」をコアなファンへと変えられるか検討したものです。アイデアの着想はどこから得たのですか。

長尾:
最初から「にわかファン」に着目していたわけではありません。データ観察のなかでツイートの単語出現頻度を可視化したところ、イベントが盛り上がるにつれて「ファン」「にわか」という単語が目立つようになり、興味を持ちました。また、スポーツビジネスにおいては、いかにファンとのエンゲージを高めるかが課題だとの記事も目にしました。

そうしたことから、データ分析を活かして、イベント期間中に生まれた「にわかファン」を、試合会場に足を運ぶまでのファンにする方法が検討できないか、と考えたのです。

最優秀賞を獲得したビジネスアイデアの概要。ツイートを「にわか」と「玄人」に分けてクラスタリングすることで違いを分析し、コアなファンとなり得る「にわか」クラスタの特徴を明らかにした。その特徴をもとにペルソナを仮定してカスタマージャーニーを作成。NECのスポーツチームを例としてビジネス効果を試算した。

飛田:
私たちとしては、今回のアイデアはかなり王道だと思っていて。本当は、Twitterデータならではといえるような、思いもしなかった意外性のあるビジネスに結びつけたかったのです。ただ、実際に分析を進めていくなか、利用できるデータの制約もあり、ほかのアイデアは行き詰まってしまって。

こうした王道のアイデアは、ほかのコンテスト参加者も考えるだろうから、厳しい競争になると予想していました。蓋を開けてみると、ファイナリストのなかにスポーツを正面から取り上げたチームはほかにいなかったので、結果としてはうまくいったといえるのかもしれません。


―― 検討するなかで、ほかにはどんなアイデアがあったのですか。

賀勢:
他人のツイートを盗用する悪質な「パクツイ」を検知するアイデア、ツイートの盛り上がりの度合いを分析してイベント成功の指標を新しく作るアイデアなどがありました。今回はうまくビジネスにつながるような分析ができず、実を結ばなかったのですが。


―― 分析で苦労した点、工夫した点について教えてください。

長尾:
「にわかファン」と「玄人ファン」のクラスタリングで、クラスタごとの特徴を考察するのに苦労しました。単語出現頻度の可視化に加えて、ツイートに目を通すことでクラスタごとの特徴を考察したのですが、件数が多くて大変でした。細かな件数は数えていませんが、提示されたデータから分析用に抽出したツイートは30万件ほどで、そのうち1、2割くらいは読んだのではないでしょうか。

また、「にわかファン」分析のアイデアに決まったのは、報告書の提出締め切りの1週間前くらいだったので、本当に時間がなくて。それまでデータ観察の結果をもとにメンバーそれぞれで検討していたのですが、「これでいこう!」と決めてからは、作業分担して分析と報告書作成を一気に進めました。データの前処理に分析、ペルソナやカスタマージャーニー作りなど、メンバーそれぞれが得意とする工程でうまく分担できたので、提出に間に合わせることができたと思います。

飛田:
そうですね。「このクラスタには、こうしたツイートが見られるから、こういう特徴があるといえる」というのを具体的に示すことが、分析の説得力につながると考えていたので、長尾の頑張りのおかげです。最終審査プレゼンでの反応を見ると、ねらいどおりだったと思います。

長尾:
それと、今回の分析では特別新しい手法を使っているわけではなく、データ分析としてはどれもスタンダードな手法を採用しています。そうしたシンプルな手法で、おもしろいと思えるような分析結果が出せたことが、今回のよかった点だと思います。

飛田:
アイデア出しにおいては、データの制約に悩まされました。今回、提供されたのは特定期間のTwitterデータといっても、全量データではなくキーワードで抽出してサンプリングされたデータです。そのため、データの不足からビジネスとして説得力のある分析ができないと判断して、お蔵入りになったアイデアもあります。

Twitterデータは、1ツイート140文字という制約のなかで生まれる独特な表現など、自然言語といってもメールやニュース記事などとは違った特性があると考えています。なので、それを活かした分析をやってみたいと思ったのですが、やりきれなかったのが心残りです。

賀勢:
確かにデータの制約は悩ましい問題でした。同時に、これが全量だったらもっと大変だったかもしれないとも思います。ある程度絞られたデータだったから、今回の分析手法がうまくはまって、個別のツイートに目を通して分析に活かす余裕が作れたのかもしれないし、当初私が心配していたような怪しい日本語のツイートも少なくて済んだのかもしれません。判断が難しいところです。

選定したトピック、ビジネスとしての実現性を高く評価

―― 特別審査員のおふたりは、このアイデアのどのような点を高く評価したのでしょうか。

後藤:
まず、アイデアのトピックとしてスポーツビジネスに目をつけられた点です。今、スポーツは大変注目されていて、グローバルイベントだけでなく、国内イベントも官民一体で盛り上げていこうと力を注いでいる分野です。それをトピックとして選んだうえで、最終的には自社のスポーツチームの運営を盛り上げるビジネス施策にまとめたという点を、高く評価いたしました。

また、この最終的なアイデアに至るまでにチームでビジネスの課題と分析テーマを重ねて吟味されたこと、分析手法の選定と実施についてのロジックがわかりやすく説得力のあることが、プレゼンから伝わってきました。さらに、一連のタスクがプロセス化されているようにお見受けしました。そうした点も評価につながっています。

伊東:
「にわか」と「玄人」といったファンの度合いを分析して可視化したのがおもしろいと感じましたし、カスタマージャーニーなどのフレームワークを活用してビジネス施策を提案した点がよかったです。ペルソナを想定してカスタマージャーニーを描き、施策を検討するというのは、マーケティングの現場で実際に行われていることです。つまり、このアイデアはTwitterデータを活用したビジネスとしてすぐに実践できる。そこが審査でのポイントでした。

後藤:
少し参加者のみなさんに質問させてください。さきほど、サンプリングされた一部のデータでは、分析トピックが限られてしまうとのご指摘がございました。みなさんはTwitterの全量データを利用した分析に興味をお持ちですか。「全量データだったら、こんな分析ができそう」とイメージがあればうかがいたいのですが。

長尾:
もし全量データだったら、例えば「実際に試合会場に足を運んでいる人」の属性が分析できて、その結果をファンの定着施策の検討に活かせるかもしれません。どこまで実現できるのかわからないのですが、個人的には、時系列のデータが取得できると、さらに踏み込んだ分析ができると思います。「にわかファン」の人がその前後でどのようなことをツイートしているのかがわかれば、いろいろ新しい発見がありそうです。

飛田:
データが増えれば、あるツイートがほかのツイートやユーザーにどんな影響を与えたのか、というツイートの影響度の分析ができるようになると期待しています。ツイートやユーザー間のつながりを見るような分析、ネットワーク分析の手法を用いると、何かおもしろい知見が得られそうです。

賀勢:
今回は「すでに “にわかファン” になっている人」に着目しましたが、データが増えることでもっと裾野を広げて「これから “にわかファン” になりそうな人」が分析できたら、新規ファンの獲得という観点でスポーツビジネスに活かせると考えます。また、全量データの分析で「Twitterらしさ」「Twitterの文化」がどのようなものか、その姿が見えるのではと興味を持っています。

後藤:
貴重なご意見ありがとうございます。このようにデータサイエンティストのみなさんに本格的なTwitterデータ分析に興味を持っていただける機会となりよかったです。イノベーションの材料として、みなさんの技術アセットやソリューションにTwitterデータを組み合わせていただけることに期待したいです。例えばNECさんの社内で、Twitterデータの分析に手軽に取り組めるフレームワークや、Twitterデータの活用について知見を共有するフレームワークが構築できると、この取り組みがさらに広がり、ビジネスの実現と継続につながっていくと、お話を聞くなかで感じました。今後の取り組みに、私たちとしてもさらに期待したいです。

伊東:
みなさん、全量データ分析への興味や期待が高いですね。全量データを扱う際は、そのまますべてのデータを利用するのではなく、ある程度の絞り込みが必要です。その方法によっては、その後の分析結果に大きく影響を与えるので、重要な工程といえます。であるからこそ、そのデータを絞り込む手法を競うことも含めたコンテストが今後企画できるとおもしろいかもしれません。


―― 最優秀賞チームのみなさん、最後にコンテスト参加を振り返っての感想や今後の展望について聞かせてください。

長尾:
自然言語処理は、ホットで、今後の広がりに期待ができる領域ですから、継続して取り組んでいきたいです。コンテストで利用した分析手法は普段から業務で利用しているものですから、今回の経験を活かしてさらに改良して洗練させ、プロジェクトに適用していこうと思います。また、BERTのような最先端の自然言語モデルにも興味があるので、そうした新しいものもどんどん取り入れて、ビジネスにつなげたいです。

飛田:
私は連続して分析コンテストに参加しているので、次回のコンテストのテーマを予測して当てるのが野望ですかね(笑)。今回もですが、毎回時間がなくて苦労するので、テーマを予測しつつ、世のトレンドを追って次回に備えたいと思います。

岩上:
今回Twitterデータを分析してみて、貴重な経験ができたと感じています。Twitterデータの分析で誤情報や悪意のある虚偽情報を判別するといったこともできるのはと、さらに興味が湧いてきました。この経験を活かしながら、今後もデータ分析に取り組んでいきたいです。

賀勢:
Twitterデータの分析はおもしろいと感じました。今後、また同じようにTwitterデータを分析する機会があったなら、さきほど伊東さんからあったように「玉石混淆のデータから有用なデータを絞り込む」というタスクに興味があります。今回はある程度整ったデータだったので、もっと雑多なデータの場合に、どこまでできるか挑戦したいです。

(2020.4.8 オンラインにて取材)

関連記事:ともに学び、競う ― AI人材育成としての「分析コンテスト」