イベントデータとトラッキングデータとは

サッカーのデータは、大きく「イベントデータ(Event Data)」と「トラッキングデータ(Tracking Data)」という2つの系統に分かれる。この区別は、どちらが優れているかという話ではなく、何を記録しているかが違うという分担の話である。

イベントデータは、パスやシュートといった離散的な出来事を一つずつ記録したものである。「いつ」「どこで」「誰が」「何をしたか」が基本構造になる。

トラッキングデータは、ピッチ上の全選手とボールの位置座標を連続的に記録したものである。試合中のどの瞬間を切り出しても、「誰がどこにいたか」が残る。

ひと言で対比するなら、イベントデータは「何が起きたか」の記録、トラッキングデータは「どこにいたか」の記録といえる。サッカーのスタッツのほとんどは、このどちらか、あるいは両者を組み合わせて算出されている。個別の指標を読むときに「この数字はどの系統から来ているのか」を押さえておくと、指標ごとの強みと限界、そして「なぜその指標が特定のリーグでしか見かけないのか」といった疑問に、自然と見当がつくようになる。

イベントデータとトラッキングデータを3項目で比較した表。記録するもの・代表的な指標・強みの行で、それぞれの特徴を対比している
イベントデータとトラッキングデータは「何を記録するか」が根本的に異なる

イベントデータ ─ 何を記録し、どう取得されるか

イベントデータが記録するのは、試合中にボールをめぐって起きた可視の出来事である。パス、シュート、クロス、タックル、インターセプト、ドリブル、ファウル。こうしたプレーのひとつひとつに、位置座標、発生時刻、関与した選手、結果(成功/失敗)といった属性が付与される。

収集方法としては、試合映像を見ながら人の手でタグ付けしていく方式が長く中心を担ってきた。各データプロバイダーが独自の定義と作業フローに沿って、毎試合ごとに大量のイベントを記録していく。近年はトラッキングデータや映像から一部を自動抽出する動きも進んでいるが、「起きた出来事を列挙する」という記録の枠組み自体は変わらない。

この系統から生まれる主な指標には、以下のようなものがある。

  • xG / xA — シュートやパスの状況から得点・アシストの確率を推定する
  • プログレッシブパス — パスがどれだけボールを前進させたかを測る
  • パス成功率、タックル数、シュート数 — 古典的なカウント指標

イベントデータの大きな特長は、映像さえあれば収集可能という取得のしやすさにある。専用機材や特殊なスタジアム設備を必要としないため、世界の大半のプロリーグで長期間にわたって蓄積されており、サッカーのデータ分析はこの系統から出発してきたといえる。

トラッキングデータ ─ 何を記録し、どう取得されるか

トラッキングデータが記録するのは、選手22人とボールの位置座標を、1秒あたり10〜25回程度のペースで連続的に記録した時系列データである。各瞬間に「誰が、ピッチ上のどこにいたか」が残るため、ボールから離れた動き、いわゆるオフ・ザ・ボールの動きまで捉えることができる。

取得方式はおおむね3系統に整理できる。

  • 光学トラッキング — スタジアムに専用カメラを複数台設置し、映像から全選手の座標を算出する方式。精度は高いが、カメラ設置とメンテナンスのコストが大きく、導入できるスタジアムが限られる
  • GPS(ウェアラブルデバイス) — 選手が装着する小型デバイスで位置・加速度などを取得する方式。公式戦での着用可否はリーグごとに運用が異なる。トレーニング時のフィジカル管理用途で広く普及している
  • ビデオトラッキング(放送映像のAI解析) — 放送映像を機械学習で解析して座標を抽出する方式。常設カメラのない会場でもデータが得られる利点があり、近年急速に実用化が進んでいる

この系統から生まれる主な指標・分析には、以下のようなものがある。

  • 走行距離、スプリント回数、最高速度、加速度 などのフィジカル指標
  • ピッチコントロール — ピッチ上の各エリアをどちらのチームが支配しているかを確率的に可視化する
  • オフ・ザ・ボールの動き — 裏抜け、ライン間への侵入、囮の走りといった、ボールに直接触れないプレーの評価
  • プレス強度の厳密な計測 — 守備者と保持者の距離の推移などから、プレッシャーの実態を数値化する

トラッキングデータの強みは、イベントデータには映らない領域を捉えられる点にある。戦術的な意図のかなりの部分は、実はこのオフ・ザ・ボール領域で決まっている。その領域に数字の光を当てられるかどうかが、近年の分析の厚みを大きく左右してきた。

限界と注意点

2つの系統はそれぞれに見ていないものがあり、両方の限界を知ったうえで指標を読むことが望ましい。

イベントデータはオフ・ザ・ボールを記録しない

イベントデータが捉えるのは、ボールが絡んだ出来事である。シュートを引き出すための囮の走り、パスコースを空けるために相手を引きつける動き、守備のカバーリング──こうしたボールに触れない21人のプレーは、基本的に記録されない。ボール周辺で起きたことだけを見て戦術を評価しようとすると、試合の大きな部分を取りこぼす可能性がある。

イベントデータはプロバイダーの定義に依存する

何を「タックル成功」とするか、何を「プログレッシブパス」とするかは、データプロバイダーごとに基準が異なる。指標の名前が同じでも、定義が揃っていなければ数値は揃わない。情報源をまたいでスタッツを比較する際には、定義差の存在を前提に読む必要がある。

トラッキングデータは意図までは読めない

選手が「なぜその位置にいたのか」「何を狙ってそう動いたのか」は、座標データそのものからは直接取り出せない。トラッキングデータが示すのは結果としての軌跡であり、その背後の判断を解釈するには映像や戦術的な文脈が欠かせない。

トラッキングデータは取得環境による差が大きい

光学・GPS・ビデオの各方式は測定原理が異なるうえ、同じ方式の中でもカメラ性能や処理アルゴリズムが揃っているとは限らない。たとえば「スプリント回数」ひとつをとっても、速度閾値の設定や計測方法が異なれば、リーグや情報源をまたいだ単純比較は難しくなる。

「あるリーグで見かけない指標」を「無意味な指標」と誤読しない

ピッチコントロールのように、トラッキングデータが整備された環境でしか算出できない指標がある。こうした指標をあまり見かけないリーグがあるとき、それは「そのリーグにとって必要ない」からではなく、算出の土台となるデータが揃っていないからという場合が多い。指標が手に入るかどうかと、指標の価値そのものは、別の話である。

関連する指標と概念

イベントデータとトラッキングデータの区別は、個別の指標を読むときの前提として機能する。

参考