足球数据解析:从基础到高阶,期望进球(Expected Goal/xG)成主流话题

上一期介绍了足球基础数据的定义,并根据实战记录分析了一些可能出现的问题。还没看过的朋友请移步这里

您需要了解的足球统计知识

了解了足球相关数据的基本概念后,我们接下来可以看一下一些正在成为主流话题的高级数据术语,例如预期进球(Goal/xG)。

【历史】

数据和统计的概念在体育比赛商业化后被广泛运用到不同的项目中,满足观众对比赛不同维度的好奇心,提高球迷对比赛的理解。棒球被认为是第一个引入运动数据概念的运动。 1977年,比尔·詹姆斯以一名普通棒球迷的身份开始撰写《棒球年鉴》,这也被视为体育数字化的里程碑。随后,美国的其他运动项目,例如篮球和足球,也开始收集统计数据并发展各自的运动项目。足球尽管具有较高的知名度和较大的国际影响力,但近年来才慢慢开始追赶数字体育的潮流。 2012年,Opta的Sam Green首次提出了预期进球(xG)的概念。十年过去了,预期进球如今已成为球迷最熟悉的高层数据概念。越来越多的广播公司(Sky、BBC、ESPN)逐渐将预期进球作为常规的足球内容。笔者希望通过这篇文章,让球迷能够对预期进球建立一个基本的认识,从而帮助大家更好地欣赏和理解足球比赛。

【概念】

简而言之,预期进球(xG)是通过计算在特定位置和特定情况下进球的概率来确定得分机会质量的数据。

进球是足球场上最重要的事情。比对手多进一个(几个)球是判定胜利的唯一标准(看过上期内容的朋友就知道这里要加上的限制:不包括乌龙球)。在观看比赛的同时,我们常常会咒骂前锋不早点推门西甲进球记录,也会为一记精彩的“世界波”而目瞪口呆并大声庆祝。因为我们心里已经有了期待进球的概念:一脚射进空门——80%的机会进; 40米外远射——会进吗?别这么玩……射得好! ! !不同的态度代表了我们对“机会”二字的主观理解。

(xG的基本模型只考虑了位置对进球概率的影响)

因此,与我们内心的尺子相比,预期的目标是用更科学的方法,加入更多的客观考虑,进行更大的计算来判断机会的好坏。这些客观考虑因素包括:

具体位置:与球门的角度、与球门的距离

具体情况:射门位置(脚、头……)、防守压力、前传类型(传中、直塞球……)等。

就像其他数据一样,不同的数据供应商会有不同的模型,对不同的情况有不同的侧重点。但总体差异是相似的。预期进球由 0 到 1 之间的数字表示。1 表示球员肯定会进球的机会,0 表示不可能进球的机会。

如下图,布鲁诺·费尔南德斯本次机会的预期进球数为0.3,这意味着在该区域类似情况下,10次射门预计进3球。数字0.3是统计过去数千次类似情况的结果得出的结论。这里需要注意的是,预期进球仅用于评估射门前一刻机会的质量。换句话说,球员的射门能力并不能作为预期进球的参考。将下图中的B费替换为笔者,预期目标仍保持在0.3。

(B费获得门前机会,xG为0.3)

【进球概率进球】

此时有人可能会问,预期进球(xG)和进球概率(Goal)有什么区别和联系?事实上,如果把这两个概念放在如上图的情况下,两者并没有太大区别:xG 是 0.3,Goal 是 30%。仅从统计角度来看,预期进球数是一个可以叠加的数字西甲进球记录,而进球概率只能描述单个机会的质量。例如,根据赛季,费B的赛季预期进球数为8.2,但没有相应的赛季进球概率。

【应用】

那么了解预期进球 (xG) 对我们球员和球迷有什么作用呢?接下来我们看看它的两个主要应用方向。

1.帮助球员做出技战术决策

预期进球模型可以帮助球员在场上做出正确的决定。例如,场上哪些位置得分的概率较高?可以在概率较高的位置多尝试,避免在概率较小的区域踢球。另一方面,预期进球也可以帮助球员了解如何识别位置更好的队友,并在正确的时间执行额外的传球。如下图所示,在巴列卡诺与皇马的比赛中,维尼修斯获得了单刀破门的机会。此时,如果他起脚射门,进球的概率为31%,但维尼修斯选择传中,找到了门将。本泽马这一举动大大提高了这次进攻转化为进球的概率(达到86%),皇马终于能够凭借这粒迟到的进球以1:0带走三分。

(上周末的联赛中,皇马再次依靠维尼修斯和本泽马的连线破门)

相信看到这个例子后,当我们在场上遇到投篮狂人的时候,我们就可以拿出这张图片,用理智和情感,告诉对手,球应该传出去。

2. 球员/球队分析

预期进球的最大用途是辅助分析球员或球队的技战术特点。通过比较球员之间的预期进球分布图,我们可以更直观地了解球员在一场比赛或一个赛季中获得的射门机会。

加布里埃尔·热苏斯和恰尔汗奥卢在 2019-2020 赛季均完成了 100 次射门。然而,热苏斯打进了14球,恰尔汗奥卢“只”打进了8球。从传统的射门转化率来看,热苏斯的效率明显高于恰尔汗奥卢,但球迷知道,这种比较意义不大。毕竟前锋和中场的射门位置和射门难度有很大不同。预期进球数提供了更合理的基准单位:热苏斯的平均每次射门预期进球数为0.18,而恰尔汗奥卢的为0.07。由此可见,两人在赛季中获得的机会质量并不具有可比性。

(2019-2020赛季恰尔汗奥卢与热苏斯预期进球对比)

通过统计一名球员或球队在一场比赛、一段时间或一个赛季的预期进球数,我们可以更全面地了解球队创造得分机会和限制对手得分机会的能力。如果一名球员能够稳定保持进球数大于预期进球数,那么我们就可以说这名球员抓住机会的能力很强。通过对比本泽马和维尔纳近四个赛季的净效率(净效率=进球数-预期进球数),我们可以发现本泽马确实是一名更加稳定高效的射手。净效率等于0代表了球员的平均水平,因此维尔纳抓住机会的能力已经连续三个赛季低于预期。

(本泽马与维尔纳净效率对比)

特别鸣谢:EKOU原创漫画提供玩家卡通形象(微博:EKOU原创漫画)

另外,如果在一场比赛中,一支球队的预期进球远高于对手却输掉了比赛,那么这很有可能就是我们所说的“系统比赛”——信任过程。在防守端,如果球队能够将对手的预期进球限制在一个非常小的数字,那么也可以意味着整场比赛的防守质量已经达到了非常高的水平。

预期进球也可以用来评估球队在特定情况下的表现(例如开局/角球/定位球等)。曼联本赛季在角球方面遇到了困难。马奎尔前段时间刚刚在对阵利兹联的比赛中打进了他的第一个角球进球。通过对比联赛积分榜前四的角球数据,我们可以发现曼联通过角球的预期进球数仅为3.1,证明球队无法通过角球进球并非偶然:球队缺乏能力通过角球创造得分机会,不仅可以概括为运气不好。

【缺点】

1、统计因素不完全

很多人对预期进球这个概念感到排斥,因为预期进球往往会提供不准确的场上信息反馈,更不用说有一个可以直接用来决定胜负的通用公式了。足球运动充满了不确定性,正是因为不可预测的因素和结果,才赋予了这项运动无与伦比的魅力。如下图所示,上个月马竞对阵巴萨的比赛中,卡拉斯科为马竞首开纪录,随后阿尔巴扳平比分。戏剧性的一幕发生了。官方转播显示,阿尔巴的世界波比卡拉斯科的准单刀球更容易进球。这显然违反了我们对进球概率的主观判断。事实上,这也在一定程度上反映了当前预期进球和进球概率的计算问题。

(巴萨对阵马竞两球,预期进球值与观众判断相反)

就这个例子而言,笔者判断有几种可能会导致与认知相反的结果。阿尔巴射门时周围没有防守球员,而另一边阿劳霍距离卡拉斯科很近。也许西甲官方采用的模型对于后卫施加的压力有更重的参考。另一种情况可能是西甲采用的模式并不区分左脚和右脚球员。阿尔巴射门的位置实际上是靠近右脚球员的内切得分区域,因此可能会出现更多的进球,从而增加整体进球概率。 。然而,这个例子虽然说明了预期进球模型的缺点,但也再次强调了xG的关键因素:无论谁射门,只有相似情况下进球的概率。

2.模型一致性低;缺乏直观的应用价值

市场上有很多数据公司都有自己的预期目标计算方法。由于计算方法不同,得到的数字会有很大差异。因此,当球迷朋友引用预期进球数来论证自己的观点时,请记住,他山之石不能攻玉。在条件允许的情况下,同一主题尽量使用相同的数据源,避免得出错误的结论。另外西甲进球记录,预期进球不能直接用来判断球员的素质和球队的表现。但这对于所有足球数据来说可能都是如此,球迷需要将这些概念放在上下文中并正确应用它们。在接下来的内容中,我们还将提供更详细的正确应用这些数据和反面教材的例子。

特别鸣谢:EKOU原创漫画(微博同名)