脅威期待値とは

xT(脅威期待値:Expected Threat)は、ピッチを格子状のエリアに分割し、各エリアに「その位置から攻撃が得点に至る見込み」を割り当てることで、パスやドリブルなどボール移動の価値を数値化した指標である。

たとえば、ボールを前へ運ぶ行為を見る代表的な指標として、プログレッシブパスは移動距離を、パッキングは通過した相手選手数をそれぞれ測る。ボールをどれだけ前に進めたかは、これらの指標で数値化できる。

ただし、前進の量と価値は別の問題である。同じ15mの前進でも、自陣と敵陣では得点への近さが大きく違う。同じように3人の相手選手を追い越しても、中央とサイドでの突破では、その後のシュート確率が変わる。つまり、距離や人数を数えるだけでは、ボールを運ぶ価値までは見えない。

xTは、ボールの移動先に応じて攻撃の価値を評価する指標である。ピッチの各エリアに脅威度を割り当て、どのエリアへボールを動かしたかによって、選手のアクション価値を数値化する。シュートを打たなくても、危険なエリアへパスを通したり、ドリブルで運んだりするだけで、その貢献が可視化される。

xTは、xGを補う指標としても読める。xGはシュートが打たれた瞬間しか評価しないため、シュート前の前進や崩しは、xGだけでは数字に残らない。xTは、xGでは見えにくいシュート以前の攻撃貢献を拾う指標でもある

この指標は2018年のカルン・シン(Karun Singh)の公開記事で広く知られるようになった。基礎となるマルコフ連鎖を使った価値モデルは、2011年にサラ・ラッド(Sarah Rudd)が発表した研究が源流にある。

ピッチを格子状のエリアに分割し、各エリアに得点確率に基づく脅威度を色濃淡で割り当てたxTマップの概念図。敵陣ゴール近くのエリアほど色が濃く、脅威度が高いことを示している
xTはピッチの各エリアに脅威度を割り当てて、ボール移動の価値を面的に数値化する

仕組みと読み方

計算の基本

xTでは、まずピッチを格子状のエリアに分ける。カルン・シンの元モデルは16×12のグリッドを採用しているが、粒度はプロバイダーや研究者によって異なる。

各エリアには「そのエリアでボールを持ったとき、そこから次の数アクション以内に得点に至る確率」が割り当てられる。過去の大量のイベントデータから、ボールの移動と得点の関係を学習することで値が決まる。

値を決める中核は、ボール保持者がそのエリアで取り得る2種類の選択肢の評価である。

  • そのエリアからシュートを打つ(そのシュートのxGに相当する期待値)
  • ボールを別のエリアに動かす(移動先のエリア価値)

両方の期待値を確率的に混ぜ合わせて、各エリアの脅威度が決まる。ここで難しいのは、移動先のエリア価値が決まらないと現在のエリアの価値も決まらないという、相互依存の関係にあることだ。この構造はマルコフ連鎖と呼ばれる数学モデルに対応し、反復計算で解かれる。

反復回数は「何アクション先まで見るか」と対応している。1回の反復ではそのエリアからシュートを打つ価値しか見えないが、2回目はそのエリアから1回動かしてシュートを打つ価値、3回目は2回動かしてからシュートを打つ価値、というように積み重なっていく。カルン・シンの元モデルでは、4〜5回の反復で値がほぼ安定することが示されている。n回反復したxTは、「次のn個のアクション以内に得点する確率」として読める。

各エリアに値が決まると、選手がエリアAからエリアBへボールを動かしたアクションのxTは、エリアBの値からエリアAの値を引くだけで計算できる。プログレッシブパスが前進の距離を基準で切り出して「1本」と数える指標だったのに対し、xTはエリア価値の差分そのものがアクションの値になる。

xTのもう一つ重要な性質は、イベントデータだけで計算できることだ。ボールがどのエリアからどのエリアへ動いたかの情報があれば足りる。相手や味方の配置座標(トラッキングデータ)は使わない。この実装上の軽さが、xTが広く使われてきた大きな理由の一つである。

選手・チーム単位で読み取る

選手単位では、パスやキャリー(ドリブル)のxTを累積して読む。1試合・1シーズンで、その選手がどれだけ脅威のあるエリアへボールを運んだかが数値化される。per 90正規化と組み合わせて、ポジションが近い選手同士で比較するのが基本になる。

チーム単位では、xT総量がボールを前に運べる攻撃力の目安になる。エリア別に集計すれば、右サイドからの侵入が多いチーム、中央の崩しが効いているチームといった、攻撃スタイルの傾向も見えてくる。

可視化の定番は「xTマップ」である。選手・チームごとにxTを生成した場所をピッチ上に色の濃淡で表現すると、どのエリアから脅威を作り出しているかが一目で掴める。数値の羅列では見えにくいプレースタイルが、空間的な分布として立ち上がってくる。

限界と注意点

オフ・ザ・ボールの状況は評価できない

xTはボールの位置だけを入力に値を決める。相手の陣形、DFの組織化、味方の配置、スペースの広さは、モデルに入らない。

同じエリアへのパスでも、相手の守備が整っているときといないときでは本来の価値は違う。xTはこの差を区別できない。同じエリア移動であれば、同じxTが与えられる。

この限界を補う方向で、選手配置まで見るEPV(ポゼッション期待値、Expected Possession Value)系の後続モデルも登場している。ただし、それらはトラッキングデータが前提になり、データ要件が重くなる。

グリッド粒度や反復回数の設計で値が変わる

xTはモデル設計の自由度が大きい。グリッドの粒度(16×12・12×8・20×15など)、反復回数(何アクション先まで見るか)、学習対象のリーグやシーズンによって、エリアに割り当てられる値は変わる。

同じ選手のxTが複数のデータサイトで食い違うのは、これらの設計差が積み重なった結果である。

守備アクションは評価しない

xTは攻撃側、つまりボール保持者のアクションを評価するモデルである。タックル、インターセプト、カバーリングといった守備アクションは対象外になる。

守備的MFやCBのボール奪取の価値、ハイプレスで相手の保持を崩した働きは、xTの数値には現れない。守備側の貢献まで含めて広く評価したい場合は、VAEPやOBVなど、攻撃と守備の両方のアクションを対象に含めたxTの後続モデルが使われる。

反映できないプレー要素が多い

xTは、エリア間の移動だけをアクション評価の入力にする。アクション種別(パスとドリブルの違い、ショートとロングの違い)、パスの強度、タイミング、シュート以外の付帯的なプレーは、すべてモデルの外側にある。

同じエリアAからエリアBへのボール移動でも、速いスルーパスで通した場合と、時間をかけてドリブルで持ち込んだ場合では、防がれる難しさが違う。xTはこの差を区別できない。オフ・ザ・ボールの状況を考慮しない点と合わせて、xTが持つ粒度の粗さの現れである。

これらを取り込んだ後続モデル(VAEP・OBV・PVなど)は精度で勝るが、必要なデータや計算コストも大きくなる。xTはシンプルな設計を引き受けたうえで、幅広く使える「入門的な基準」としての位置にある。精度の高さではなく、取り回しの良さで選ばれてきた指標と読むのが正確である。

関連する指標

  • プログレッシブパス — 前進を「距離」で評価する指標。xTが面的・確率的に前進を捉えるのに対し、こちらは直線的・機械的に捉える別アプローチ
  • プログレッシブキャリー — ボールを保持したまま前進する動きを「距離」で評価する指標。プログレッシブパスと対になり、パスとキャリーで前進を測る設計
  • パッキング — 通過した相手選手の人数を軸にプレーを評価する指標群。距離でもエリア価値でもない、人数の視点から価値を測る
  • アクション価値モデル(OBV / VAEP) — アクション一つ一つを「得点しやすさ/失点しやすさ」の変化で評価するモデル群。xTが攻撃のみを対象とするのに対し、攻撃と守備の両方を評価する発展形にあたる
  • EPV(ポゼッション期待値) — トラッキングデータを用いて選手配置まで考慮した、より精緻なポゼッション価値モデル。xTの思想を精度側に拡張した方向にあり、データ要件も大きくなる
  • xG(ゴール期待値) — xTの計算内部で「シュート時の得点確率」として使われる基礎指標。xTはxGを上流まで遡って面的に展開した指標とも読める
  • xA(アシスト期待値) — パスをシュート創出の観点で確率評価する指標。xTと発想は近いが、評価対象はアシストやそれに準じるパスに限定される
  • イベントデータ vs トラッキングデータ — xTがイベントデータだけで計算できる利点の前提理解

参考