サイト内の現在位置

スムーズな鉄道乗り換えのためにデータ分析ができること ― 分析コンテスト 「Twitter賞」受賞アイデア

NECは、NTTデータとTwitterの協力のもと2020年1月に分析コンテストを社内開催。参加者は、提示されたTwitterデータを分析し、そこから導き出したビジネスアイデアを競った。一次選考を通過したファイナリスト5組による最終プレゼンが行われ、最終審査の結果、「最優秀賞」1組、審査員特別賞として「Twitter賞」「NTTデータ賞」各1組が選出された。

今回、Twitter賞を受賞したチーム、そして特別審査員を務めTwitter賞を選出したTwitter Japan 後藤和枝氏に、アイデアの概要やその着想、評価のポイントを聞いた。

分析コンテスト Twitter賞 受賞者


廣澤一輝
NECソリューションイノベータ デジタルソリューション事業部 第二グループAIサービスグループ


飯田伸也
NECソリューションイノベータ デジタルソリューション事業部 第二グループAIサービスグループ


分析コンテスト 特別審査員


後藤和枝
Twitter Japan Developer and Enterprise Solutionチーム・⽇本&アジア地区のデータパートナー事業リード


「難しいデータ」にアイデア出しで行き詰まる

―― Twitter賞の受賞おめでとうございます。普段はどのような業務をされているのか、自己紹介をお願いします。

廣澤:
私は、プロジェクトでデータ分析を担当しています。特に画像解析を多く扱っていて、「NEC the WISE」における「RAPID機械学習」というディープラーニング技術を用いた分析を手掛けています。もちろん、NECの独自技術だけなく、そのほかのOSSなどを用いた分析もします。

また、データ分析に関連した研修の講師としても活動していて、「NECアカデミー for AI」で講師を務めています。

飯田:
私も廣澤と同じく、普段の業務ではデータ分析を行っています。「異種混合学習」を用いた需要予測など、データ活用ソリューションをお客様に提案するなかで、回帰分析や時系列分析などをしています。

NECソリューションイノベータは、NECグループの社会ソリューション事業をICTで担う中核会社として、幅広い業種のお客様に向けたSI/サービスとソフトウェア開発を展開。データ活用・AIサービス領域にも注力しており、廣澤や飯田のようなデータサイエンティストが現場で活躍している(写真 左から廣澤、飯田)。

―― 分析対象はスポーツイベントに関連したTwitterデータでしたが、どのような印象を持ちましたか。

廣澤:
コンテストの開催告知で対象データについて知ったときは、「想定の範囲内だな」と思いました。これまでのコンテストをふまえて、今回もきっと話題性のあるテーマが選ばれるだろうと考えていましたから。

それから、コンテストが始まって実際にデータを見たときは、コンテストの性質上、データが絞り込まれていて難しそうだと感じました。特定のキーワードで抽出してサンプリングされたデータだったので、アイデアを広げにくそうだと。

飯田:
そうですね、私も同感です。特定のキーワードで絞られたデータだけだと、その周辺の情報、例えば対象のスポーツイベント前後の出来事やユーザーの動きが見えません。それに、そのキーワードが含まれていなくても、内容としては関連が深いツイートもあるはずですから。なので、特定キーワード以外の情報が集めにくいデータとなっていたため、今回のアイデア出しは非常に悩まされました。

これはコンテストが終わっての感想になりますが、特定キーワードではなくデータ期間でサンプリングした方が、より幅広いアイデアが出やすかったのかなと思いました。

足りないデータを補い、分析の説得力を高める

―― 制約つきのコンテスト用データでしたが、最終的には、Twitterデータやオープンデータの分析から鉄道の乗り換え困難駅を推定し、国際イベント開催時における鉄道各社の対策立案を支援するビジネスアイデアを提出されました。アイデアやその着想について教えてください。

廣澤:
国際イベントの開催にともなう課題にはいくつかありますが、その1つが訪日外国人の増加による鉄道駅の混雑です。メディアの記事や調査レポートに目を通すと、日本の鉄道は訪日外国人にとって複雑で、乗り換えが難しいという意見の多いことがわかりました。

そこで、イベント会場の最寄り駅に着くまでに経由する駅について、データ分析によって乗り換えの困難度を事前に示せれば、重点的に案内係や案内板を配置することができ、混雑の解消、ひいては経済損失の解消につながると考えたのです。その乗り換えが困難な駅を分析する材料の1つとして、Twitterデータを利用したのが今回の分析になります。

Twitter賞を獲得したビジネスアイデアの概要。乗り換えが複雑で訪日外国人が迷う可能性が高い駅を導き出すことで、適切な案内係や案内板の配置を計画し、混雑や経済損失の解消を目指す。

廣澤:
アイデア検討には、とても悩みました。よいアイデアが出てこないまま時間が経ち、もうあきらめようかとも思ったのですが、ある人から「ねばれば、なんとか形にできるよ」と励まされて。そうして考えるうちに、いくつか思いついたアイデアの1つが、鉄道駅の乗り換え困難度についての分析です。より多くの人が価値を感じ、ビジネスとして形にしやすいと考え、最終的に決めました。

飯田:
急に「思いついた!やろう!」と廣澤から連絡があって(笑)。アイデアを聞いて、それから一気に分析を進めました。

今回、Twitterデータ以外の利用できるオープンデータを探して、それらを分析用に加工するのが大変でした。例えば、駅の構内情報をデータとして使っているのですが、地図はあっても数値化まではされていないので、駅1つ1つについて、ホームや改札の数を手作業で入力しています。使える時間には限りがあったので、締め切りに間に合うよう作業するのに焦りました。

また、結果的に分析ではTwitterデータ以外のデータの比重が大きくて、Twitterデータを活用しきれなかったというのも、苦労したというか、悩ましく思った点です。

廣澤:
飯田から話があったように、提示されたTwitterデータだけでは足りない部分をどう補うかが分析のポイントでした。使うデータは何でもよいわけではないですから、第三者から見ても信頼性のある、検証可能なデータ利用をしています。そのデータを追加することが、分析の説得力を高めることにつながるよう工夫しました。

さらに、説得力という観点では、期待効果について金額で示すことが大切だと考えていて、今回の分析でも「これくらいの経済損失を解消できる」と、具体的でリアリティのある額を提示しました。期間限定のイベントを前提に試算したので、金額としては大きくありません。それでも、具体的な数字があるとないとでは、聞き手が受ける印象が全然違ってくると思います。

飯田:
私も、分析の「説得力」や「正しさ」を大事にしています。分析の結果が納得できるものであること、聞き手を説得できるようなものであることを意識して、今回も取り組みました。

社会生活に欠かせないインフラ領域への活用に期待

―― 特別審査員の後藤さんは、このアイデアのどのような点を高く評価したのでしょうか。

後藤:
評価のポイントはいくつかありますが、今回のアイデアから創出可能な経済効果を具体的に数値化されていた点です。そして、廣澤さんたちがご自身の知見を活かして、課題設定、データ分析、分析結果の考察、ビジネス効果の試算まで一連の作業を、コンテストの成果としてしっかりまとめられている点も、大きなポイントでした。

飯田さんが気にされていたように、たしかにTwitterデータがメインの分析ではないため、賞の選出にあたっては、その点を指摘する意見もありました。しかし、鉄道という生活において重要なインフラのビジネスアイデアなため社会的な価値が高く、また、Twitterデータをセンサーデータとして活用するなど、インフラ領域でのイノベーション的な取り組みの可能性を示すよい例だと考え、Twitter賞として選びました。

「Twitterらしさ」「Twitterならでは」という観点は、私たちとしても大切にしているものです。でも、それだけではなく、いかにTwitterデータが社会やビジネスに役立つ付加価値を新たに提供できるかということも、同じように重要だと考えていますから。


―― 今回、あらためて受賞チームの説明を聞いていかがでしたか。

後藤:
廣澤さんたちが、しっかりとビジネスへの活用を前提としてアイデアを検討されたことが伝わってきました。ビジネスでの活用については、業界でも業務知識の専門性、データ分析の専門性、IT&データマネジメント技術の専門性など複数の専門知識が必要なことは認識されてきています。業界の専門知識を応用されてビジネス課題からうまく分析仮説を導かれていたり、設定や回帰や時系列分析など複数の分析を実施され業務に展開するためのインサイトを見出されていたりと、チームで幅広い専門性をカバーされていたことを教えていただきました。また、コンテストのデータについて、今後の企画に参考となる本音も聞けてよかったです。

今後、もし適切な分析用のデータにアクセスする機会が用意された場合、コンテストあるいはPoC(概念実証)への参加に興味をお持ちでしょうか。また、業務で取り組まれているプロジェクトや提供しているソリューションへのTwitterデータ活用について、ご意見をうかがいたいです。

廣澤:
Twitterデータの分析には興味がありますので、機会があれば、それがコンテストであれPoCであれ、ぜひ挑戦したいです。私たちNECソリューションイノベータにはテキスト分析を得意とする部隊がいます。そうしたメンバーを巻き込んでソリューションへのTwitterデータ活用に取り組むことができれば、また新しい気付きが得られると考えます。

飯田:
私もTwitterデータの分析に興味を持っているので、引き続き取り組みたいと考えています。次回があるなら、データにもっとバリエーションがあるとうれしいですね。データの取得期間を広げたり、キーワードでの抽出方法を変更したりすれば、いろいろなアイデアへと広げやすくなると思います。

また、NECの独自技術である異種混合学習において、Twitterデータをどのような形で活用できるか気になります。異種混合学習は、予測の裏付けとなる根拠を可視化できることが特徴です。Twitterデータを説明変数の1つとして追加するなら、分析の目的にあった形にデータを加工して、分析結果に与える影響を確認しながら、慎重に判断していく必要があるだろうとイメージしています。

後藤:
おふたりからTwitterデータ分析への意欲を聞けてうれしく思います。Twitterデータは、ツイートの内容に着目して分析に利用する方法もあれば、ツイート件数の推移に着目して使う方法もあり、さまざまに応用できると考えています。実際にデータに触れていただくことでビジネス活用のアイデアが生まれてきますから、みなさんがやってみたくなるようなイベントや取り組みを、NEC社向けのパートナーシップのなかで検討していきたいです。


―― 最後に、受賞チームのおふたりからコンテスト参加を振り返っての感想や今後の展望についてお願いします。

飯田:
受賞できてうれしく思います。ただ、今回のアイデアは廣澤が考えて、私は分析に協力した形だったので、今後は自分でもアイデアを考えていきたいです。今振り返ると、もっと時間に余裕があれば、駅と利用者の関係や、同じ駅の利用者どうしの関係、人の流れ、という観点から何かアイデアが出せたかもしれません。いろいろと興味が出てきたので、今後も機会があれば挑戦したいと思います。

廣澤:
今回、Twitter賞に選んでいただいて、大変光栄に思います。データ分析者としての自信につながりました。アイデア自体は、イベント延期が続き国内外の移動が減っている現状において提案や実証に持ち込むのは難しいですから、まずは論文にまとめようかと考えています。今後についてですが、Twitterデータの分析コンテストに次回があれば、連続受賞をねらって、力を入れて取り組みたいです。

(2020.4.8 オンラインにて取材)

関連記事:ともに学び、競う ― AI人材育成としての「分析コンテスト」