Japan
サイト内の現在位置
千葉 雄樹のコラム
スポーツ界におけるデータ分析
NEC AI・アナリティクス事業部
千葉 雄樹
2018年6月22日

概要
世界的なサッカーイベントで連日盛り上がっています。
今日のプロ・サッカー、ひいてはスポーツ・ビジネスの世界とデータ分析は強い関係にあることをご存知でしょうか。近年様々な角度から注目される機会の増えたデータ・スポーツですが、その分析手法の概要に触れてみたいと思います。
本文
近年、データ・スポーツの効用とその成果について語られる機会が増えてきました。普段は自動車領域を中心にデータ分析をさせて頂いている身ですが、元々スポーツへの個人的な関心から、データ・スポーツの話題を興味深く見ております。そういう意味では一ファンに過ぎない私ですが、今回はこの領域について少し触れてみたいと思います。
さて、データ・スポーツ手法の有効性を世に知らしめた最も有名な書籍は、2003年に出版され映画化もされた「マネー・ボール」でしょう。映画化に際しては、物語上の多少の誇張も含むそうですが、米メジャー・リーグでデータ分析手法を駆使し、予算規模の少ない万年下位チームを地区優勝に導いた実話です。
「マネー・ボール」で用いられている分析の流れは、およそ以下のようにまとめられましょう。
-
あらゆるプレーをデータ化し
-
各プレーが勝利に貢献する度合いを定量的に評価する
-
選手を、勝利への貢献度の高いプレーの積み上げ結果として評価し
-
限られた予算の中で獲得可能な選手を抽出し、チームと戦術を編成する
データ・スポーツにおいては、種目によらず、およそこの流れに沿って分析を行うものと考えて良いと思います。実はこの作業手順はスポーツに限りません。我々がデータ分析をするときにも、データ化、定量分析、評価、そして施策への反映と、ほぼ共通の手順で作業を進めます。
「マネー・ボール」で用いられた手法についてもう少し続けます。特徴的な点としては、2の「勝利に貢献する度合い」を「得点期待値」という指標に落とし込んでいることでしょう。1つ1つのプレーが「得点期待値」とどれだけ強い関係を持っているか、言い換えれば、「得点期待値」をどれだけ向上させるかを、回帰分析で算出する、という方法が基本になっています。こうして得点期待値に基づいてプレーと選手を定量的に評価しているわけです。
その結果、データに基づいて明らかにした事実が、直感とよく合う場合と、そうでない場合が出てきます。そのようなとき、直感に合わない事実を分析の齟齬として見捨てるのは得策ではありません。そのような事実の中に、相手を出し抜く重要な知見が含まれている可能性があるからです。「マネー・ボール」では、得点期待値への貢献に対して、市場価値が過小評価されている選手に注目し、このような選手を数多く獲得して成果を出す過程を描いています。
せっかくなのでサッカー界におけるデータ分析についても少し触れたいと思います。サッカー界にデータ分析手法が持ち込まれたのは、野球よりもやや後になってからだそうです。その理由の1つは、1のデータ化のプロセスにおけるコストの問題であったようです。野球と異なり、選手やボールの動きをデータ化するのに、手作業で作成するコストが大変大きかったのですね。また、データ分析の効用についてみても、野球では1つ1つのプレーが独立しているのに対し、サッカーは時間的にも空間的にも相互に関係し合いながら「流れて」いくため、データ化の仕方とその効用について、長らく疑問視されてきた背景もあるようです。
しかしながら、今日ではデータ化のノウハウや技術導入が進み、この問題は解決されつつあります。例えば「トラッキング」と呼ばれる画像処理手法を通じて、選手の位置、速度などを自動的にデータ化するなどの取組が既に国内外でなされています。
(森川潤著, MONEY FOOTBALL! 統計学が解き明かすサッカーの”新時代”, ダイヤモンド社)
さらに近年は、その成果も1スポーツファンに過ぎない私達の眼に触れるところまで漏れ伝わって来る機会が増えています。無名だった選手が短期間で大活躍の末、スター選手になっていくようなとき、実はそれは偶然ではなく、データ分析による緻密な仕掛けの上に起こすべくして起こした結果であるケースがあるようです。
一方で、例えば、サッカーにおいて選手のパスの回数や走行距離などの、テレビ放映でも公表される試合のスタッツの数字の多くは、勝敗とは直接の関係が弱いことなども分かっています。このことは、実際にサッカーの好きな方でしたら、直感にも合うのではないでしょうか。圧倒的なパス成功本数は攻めあぐねて自陣で回しているものかもしれません。長い走行距離は相手チームに「走らされた」結果である可能性があります。シュートを十何本も打ちながら1ゴールも上げることができず黒星を喫するチームや、逆にカウンターからのたった1本のシュートで勝利を手にする試合など、珍しくはないでしょう。
つまり、何でもかんでもデータ化し、勝ち負けの結果と結び付けても、それだけで役に立つ知見は得られないわけです。勝利に貢献するプレーは何か、そもそも勝利をどのように定量化するか、といった点は、工夫のしどころであり、技術的な発展余地と言えるでしょう。実際に、そこに独自の観点や工夫を織り込んでいる事例、例えば総走行距離ではなく、スプリントの長さや回数に着目するといった手法を通じて成果を出している事実が伝えられるにつけ、各チームがますます熾烈な分析手法開発競争を行っている様子が伝わってきます。
データ・スポーツは、これまで「流れ」や「運」、「たまたま」といった言葉で片付けられてきた物事にも意味を与え、それらをコントロールすることで目的に近づくという試みとも言えます。このような試みは今後も続くでしょうし、スポーツをますます面白くしてくれると考えます。
こうして眺めてみますと、これまで述べてきた一連のプロセスはスポーツに限らず、我々が様々な領域でデータ分析をするときとほとんど変わりありません。例えば私の場合、製造業のお客様とのお付き合いが多いわけですが、工場における生産品質の問題でデータ分析を使うケースを考えますと、生産工程に関係するデータを集め、品質を定量的な評価指標に落とし込み、品質に関係の強い生産過程を抽出し、その中で改善可能な施策を検討する、という流れで進めていきます。
そして何より、「マネー・ボール」でも描かれたように、組織における仕事の進め方がとても重要である点には変わりはありません。データ分析は強力なツールですが、万能ではないのです。適切な組織のキーマンを巻き込み、理解と同意を得て、コスト対効果を見極めながら現状の改善を目指さねば、貴重な分析結果も絵に描いた餅で終わってしまいます。このことを、いつも意識しておかねばと強く思います。
今回のサッカーイベントでも、あっと驚く試合展開や、つい最近まで無名だった選手の大躍進を目にする機会があると思います。もしかしたら、それはたまたまではなく、データに基づいた緻密な分析による、大胆な成果の1つかもしれません。試合を観戦しながら、こういったデータ分析の手法にも関心を寄せて頂ければ幸いです。