平均回帰とは
平均回帰(Regression to the Mean)とは、極端な値が観測された後、次の観測では実力の水準に近づいていく傾向を指す統計的な現象である。
この概念自体はサッカー固有のものではない。19世紀の統計学者フランシス・ゴルトンが親子の身長の関係を調べた研究に端を発する、統計学の古典的な知見である。ばらつきを持つ観測データであれば、テストの点数であれ株価であれ、同じ現象が確認されている。
ただしサッカーでは、この概念が特に重みを持つ。得点が希少な競技であるために短期の結果に運の上振れ・下振れが大きく混ざり、かつ1シーズンの試合数が限られているため、極端な数字が出たまま「傾向」として語られやすい。平均回帰を知っていると、短期の数字をどれだけ真に受けてよいかの見当がつくようになる。
重要な点は、平均回帰が「能力が落ちる(あるいは上がる)」という話ではないことである。極端な数字には実力だけでなく偶然の寄与が含まれており、時間の経過とともにその偶然の部分が打ち消されていく。結果として、数字は実力の水準に近づいていく。
サッカーで典型的に現れる場面
平均回帰は、サッカーのスタッツを扱うさまざまな場面で確認できる。
G-xGの0への回帰
G-xG(実際の得点とxGの差分)は、短期的に大きくプラスにもマイナスにも振れる指標である。あるチームが序盤10試合でG-xGが+5だったとしても、試合数を重ねるにつれてこの差分はゼロに近づいていく傾向がある。xGを大きく上回り続ける、あるいは下回り続けることは長期的にはまれであり、序盤の乖離の多くには偶然の上振れ・下振れが含まれている。
PDO
PDOは、枠内シュートに対する得点率と、被枠内シュートに対するセーブ率を合算したチーム指標である。リーグ全体の平均PDOは構造上、常に一定の値(表記法によって100、1000、1.00と異なる)に固定される。この「平均が定義上動かない」という数学的性質から、極端なPDOが長期間続くことは起こりにくく、時間とともに平均付近に戻っていく傾向が繰り返し観察されてきた。
ただしPDOはシュートの質(打った位置や状況)を一切考慮しないため、PDOに含まれる「偶然の影響」と「実力の影響」は完全には分離できない。シュートの質が高いチームや優れたGKを擁するチームが、平均よりやや高いPDOを恒常的に維持する傾向があることも知られている。
GKのセーブ率
シーズン前半に極端に高いセーブ率を記録したGKが、後半にかけて数字を落とすケースは珍しくない。これを「衰え」や「研究された結果」と解釈したくなるが、前半の数字に運の上振れが含まれていただけという可能性がある。逆に、前半に低かったセーブ率が後半に改善するパターンも同様に、回帰として説明がつくことがある。
開幕ダッシュと不振からの浮上
シーズン序盤に好成績を続けたチームが中盤以降に失速する、あるいは序盤不振だったチームが盛り返す。こうした動きは戦術的な変化やチームの「勢い」で語られがちだが、極端値が実力水準に戻っただけという場合も少なくない。
限界と注意点
平均回帰を指標の読み方に組み込むうえで、いくつか注意したい点がある。
回帰する先は「リーグ平均」ではない
平均回帰=すべてがリーグ全体の平均に収束する、という誤解は根強い。実際には、回帰する先はそのチームや選手の「真の実力水準」である。たとえば、真に優れたストライカーがシーズン序盤にxGを大幅に上回ったとする。その選手の数字は時間とともに落ち着いていくが、戻る先は「リーグ平均の得点力」ではなく「自分本来の上乗せ幅」である。同じ理屈で、力の劣るチームが上位の水準まで浮上するわけでもない。
すべてが完全に回帰するわけではない
平均回帰は確率的な傾向であり、法則ではない。主力選手の離脱、戦術の根本的な転換、監督交代など、チームの構造そのものが変わった場合には、「回帰すべき水準」自体がシフトしている可能性がある。数字が動いた原因を探るとき、回帰なのか構造変化なのかの区別は簡単ではなく、一つの正解があるとも限らない。
回帰の速度は指標ごとに異なる
この点はサンプルサイズの議論と表裏一体である。シュート数やパス数のように1試合あたりの発生回数が多い指標は、極端値が出ても比較的早く実力水準に戻っていく。一方、得点やセーブ率、G-xGのように安定化の遅い指標は、回帰にもより長い時間を要する。
「回帰しただけ」を別の原因で説明してしまう誤り
成績が大きく変動したとき、戦術変更やメンタルの変化、対戦相手の質など、もっともらしい「原因」を見つけたくなるのは自然な反応である。しかし、その変動が偶然の極端値から実力水準に戻っただけの可能性は常にある。変動の原因を特定する前に、まず回帰で説明がつく範囲かどうかを確認する手順が有用である。
関連する指標と概念
平均回帰は単独で完結する概念ではなく、周辺の指標や考え方と合わせて理解される。
- サンプルサイズと安定性 — 平均回帰が起きるのは、サンプルが少ない段階で偶然の影響が大きいためである。両者は同じ現象の別の側面といえる
- G-xG(得点−xG差分) — 平均回帰が最も具体的な形で現れる指標の一つ。短期的な上振れ・下振れを可視化する
- PDO — リーグ平均が構造上一定の値に固定されるため、平均回帰がもっとも分かりやすく現れる合成指標として知られる
- PSxG+/-(ゴール阻止数) — GKのセービング能力を評価する指標。シーズン単位の値が大きく動き、平均水準への回帰が観察されやすい
- xP(勝点期待値) — 実勝点とxPの差分は、運や判定の揺れを含むため、長期的には0に近づく。平均回帰が勝点という最終結果の側で現れる場面
- xG(ゴール期待値) — 得点そのものよりも安定的にチームの攻撃力を捉える指標。回帰した後に残る実力の水準を推定する手段としても機能する
- per 90正規化 — 出場時間を揃える標準化手法。per 90で極端な値が出た選手は、累計が増えるにつれて回帰していく典型的な場面でもある
参考
- Ian Graham How to Win the Premier League: The Inside Story of Football’s Data Revolution (2024)
