相信朋友们都深知,授人以鱼不如授人以渔;授人以鱼不如授人以渔。与其羡慕深渊之鱼,不如退而结网。
我们先从“不能”开始吧。我参考媒体The Athletic的一篇文章,简单解释了足球分析的10条戒律以及我们应该使用的相应戒律:
(1)不可使用扑救率来评估门将的扑救能力
示例:“马丁·杜布拉夫卡是本赛季英超联赛中排名第八的门将,扑救率为73.9%。”
为何具有误导性:扑救百分比的计算方式为“扑救次数/射门总数”。但这个公式没有考虑到守门员面临的射门类型和质量的差异,这些因素对守门员的扑救能力以及扑救成功率有巨大影响。
例如,守门员X面临10次小禁区射门,而守门员Y面临10次射门,全部来自30码外。显然,守门员X更难扑救。
预期进球算法告诉我们,从较远的地方射门得分的可能性较小,而直接射向守门员或中场的球更有可能被扑出。任何看过足够多足球比赛的人都会同意这一点。
如果我们对每次射门都进行相同的处理来计算扑救成功率,那么我们就低估了守门员X 的表现,并使守门员Y 看起来比实际情况更好。
替代方案:您可以通过比较射门质量、使用预期进球(射中目标)与失球数来为守门员的统计数据添加急需的背景信息。
“阻止进球数”统计数据告诉我们守门员扑救的进球数量、他所面对的射门质量以及他实际失球的数量。通过这种方法,马丁·杜布拉夫卡看起来比他建议的扑救率要好得多,而维森特·瓜伊塔的表现就像一个超级守门员。
(2)不可使用距离或冲刺数据来表示努力程度
示例:“萨卡今天为阿森纳跑了11.2 公里,比任何其他球员都多。”
为何具有误导性:英超俱乐部自2013-14 赛季以来就可以获取跟踪数据,而媒体也可以获取派生输出数据。到目前为止,我们看到的主要是距离和速度数据。
但实际上,这些统计数据的背景信息最少,但在分析球队和球员时经常使用。原因有很多。
首先,行驶距离和赢得比赛的可能性之间没有直接联系。一定时间内走过的距离只有在时间游戏中才有用,而足球不是时间游戏。根据2019年欧洲冠军联赛技术报告,顿涅茨克矿工在所有32支参赛球队中平均跑动距离最长,但他们在小组赛中排名第三,并在欧联杯最后32强中被淘汰。曼联的平均距离第二差,但他们仍然进入了四分之一决赛。行驶的距离并不能告诉我们太多信息。
其次,跑步距离和冲刺数据趋于程式化,即玩家积累的数据会与他们的任务、所处的体系、对手的布局、比赛状态等各种因素有关。如果不控制这些因素——或至少提及它们——,数据几乎无法提供深入的见解。
最后,还有证据表明减少移动实际上可能有利于游戏。问问梅西就知道了。大多数球员的身体状况足以完成整个比赛,但空间的利用是关键。同样,有很多速度快如闪电的玩家,但最好的玩家知道何时使用他们的速度。很少有球员需要在场上与对手争夺速度。关键是何时爆发速度超越对手或接住错过的球。
这些数据确实有价值,但主要是在球员管理方面,保证球员处于良好的比赛状态。足球是一项关于空间和时间的游戏,目前测量这些的工具太粗糙,无法提供有趣的见解。
替代方案:目前没有好的替代方案。要么我们在使用数据之前对其进行合理化,要么我们最好不使用这些数据。
(3)不可使用控球率作为衡量质量的指标
示例:“托特纳姆热刺在0-1 输给纽卡斯尔的比赛中拥有79.8% 的控球率;这是自2003-04 赛季以来英超联赛中输球球队的第二高控球率。”
为何具有误导性:正如Marty Perarnau 在《瓜迪奥拉密档》 书中所说:“控球只是达到目的的一种手段。它是一种工具,而不是目标或目的。”莱斯特城以平均42.6%的控球率夺得2015-16赛季联赛冠军,曼城则以67.7%的控球率夺冠。本质上,你拥有多少财产并不重要,重要的是你如何使用它。
赢得一场控球战并不能告诉我们太多信息,除了球队的战术倾向之外,可能完全取决于比分。例如,欧冠联赛中,马竞1-0击败利物浦。第4分钟进球后,马竞摆出了大巴,控球率只有27%。如果没有早早进球,马竞的控球情况可能会大不相同。
替代方案:控球权仍然是一个有用的信息,可以帮助我们了解哪一方对比赛有更多的控制权,但不要用它来证明一支球队比另一支球队更好。预期进球是衡量球队质量的更好指标,因此,如果您想讨论质量,请查看您的球队在创造和阻止进球机会方面的表现。
(4)不可仅凭抢断和拦截次数来判断球员的防守能力
示例:“里卡多·佩雷拉是英超联赛中最好的防守球员,本赛季有119 次铲球。”
为何具有误导性:并非所有防守表现都是可量化的,而可量化的往往会受到球队风格的影响。从逻辑上讲,如果一支球队控球率较低,他们就有更多的机会防守,反之亦然。
因此,抢断和拦截的次数更多地反映了防守风格(即球员是被动还是主动),而不一定反映了球员的防守质量。维吉尔·范迪克每90 分钟只尝试0.76 次铲断,但没有人会因此认为他是一个糟糕的防守者。
此外,这些防守统计数据还受到球员所在球队风格的影响(主要是他们失去控球权并因此被迫采取行动的频率),因此很难将一名球员与另一名球员进行比较。
替代方法:为了解决这个问题,我们可以通过调整对方每1000次触球球员的防守动作次数来调整防守数据。 —— 这是一种将所有玩家置于同一级别的方法。乔丹·亨德森以每90 分钟2.6 次铲断排名联盟第15 位,但在调整控球权后,他每1,000 次对手触球就有4.6 次铲断,这使他成为联盟中最具防守性的中场球员之一。一。
调整后的防守统计数据提供了更全面的防守活动视图,但这些数字仍然只显示风格,而不显示整体质量。
(5)不可使用抢断成功率来判断球员的抢断能力
为什么它具有误导性:我要告诉你一个秘密:所谓的“擒抱失败”和“擒抱成功”实际上并没有那么不同,并且在尝试擒抱时忽略了另外两个关键结果。
通常,抢断分为两类:成功抢断和失败抢断。成功抢断是指球员在挑战期间成功重新获得球权,而不成功抢断是指球员在挑战期间未能重新获得球权。抢断失败的原因可能是球被戳出边线为对方赢得掷球入界,或者球被对方夺回。
目前定义的抢断成功率为“抢断成功次数/(抢断成功次数+抢断失败次数)”。这实际上告诉我们的是当球员铲球时球队赢回球权的比例。
问题在于,这种计算忽略了球员在试图抢断时被从持球者身边甩开,或者在试图抢断时被犯规的情况。在英超联赛中,铲断成功率最高的边后卫是马丁·凯利,他的铲断成功率高达80%。不过,通过观察比赛,我们发现万-比萨卡应该是最顶尖的球员之一,但他的铲断成功率仅排在第11位。这是怎么回事?
替代方案:可以通过引入那些被忽略的情况来避免这种错误,即总抢断成功率,其计算方式为“总抢断/(总抢断+抢断失败+抢断期间犯规次数)”。通过这个指标,万-比萨卡的真实抢断成功率为78.9%,排名第一,而马丁·凯利则以——下降至第29位,更符合实际表现。
(6)不应使用进球减去预期进球来衡量小样本中的终结能力
示例:“罗伯托·菲尔米诺本赛季只进了8 个进球,他的预期进球(xG) 为12.7,所以他是一个糟糕的终结者。”
为什么会产生误导:在理解进球能力时,有两个关键因素需要单独考虑和评估。首先是前锋自己创造得分机会的能力。进球是前锋的主要工作,而要进球,前锋就需要射门。我们使用预期进球来衡量这些射门的质量。如果一名球员能够持续进入良好的得分位置,随着时间的推移,进球就会到来。
投篮是一回事,射门又是另一回事。在小样本量(例如整个赛季)中,球员的目标和预期目标可能不匹配。以罗伯托·菲尔米诺为例。本赛季他的进球数比预期要少,但就他处于良好得分位置的次数而言,这是他最好的一个赛季。
菲尔米诺在利物浦的前三个赛季,他的进球有时比预期多,有时低于预期,有时则刚好合适。这些数据不足以对他的终结能力得出任何确定的结论。
替代方法:将预期进球(球员拥有的机会)与预期进球(进球数)进行比较是考虑射门质量的一个非常基本的方法。即使在较大的样本中,也要小心谨慎,至少需要考虑数百个镜头。
关于射门是否是一项可重复的技能,足球分析界存在很多争论。因此,在没有明确答案之前,您仍然可以依赖预期目标。随着时间的推移,大多数球员的得分将与预期目标一致。
(7)不应通过有无某名球员来判断球队表现
示例:“阿森纳本赛季的胜率在没有萨卡的情况下为40%,在有他的情况下为28%。”
为何具有误导性:“有或没有你”(或WOWY)数据旨在隔离某个球员对球队的影响,以了解该球员参加比赛与缺席时球队表现的差异。
这个数据在某些分析性更强的运动中可能是有效的,比如篮球,阵容变化更多,得分更高。然而,在足球比赛中,变量太多,无法以这种方式分析球员的表现。厄齐尔在这两起案件中都因他无法控制的因素而受到处罚。
以下是一些理想情况下应该考虑但在WOWY 中没有考虑的因素: 对手的质量?与萨卡并肩作战的其他球员的实力如何?有红牌吗?萨卡被换下了吗?
同样,你也有“伯恩利问题”。本·梅和詹姆斯·塔可夫斯基在本赛季英超联赛中踢满了每一分钟。谁更好?我们永远不会知道。
替代方法:更好的方法是根据球员的位置来分析他们,并关注他们可以控制的事情。对于创造力型中场来说,重点应该是创造机会的能力;对于前锋来说,重点应该是进球能力。把WOWY数据留给那些室内运动吧。
(8)不应通过传球准确率来判断球员的传球能力
示例:“菲尔·巴兹利是英超联赛中传球最差的边后卫,他的传球成功率仅为63.6%。”
为什么会产生误导:球员的传球准确性很大程度上取决于他们被要求做什么,以及他们在持球时的选择。有些球队,例如曼城,通常在压力较小的特定区域进行短传。正因为如此,他们的传球完成率会很高。其他球队,例如伯恩利,倾向于长传而不是短传—— 这些传球平均完成的可能性较小。
替代方案:我将来会写更多关于替代方案的文章,目前我认为没有很多指标可以正确解决这个问题。预期传球完成率可能会让我们更全面地了解为什么球员的传球完成率较低,但这些数据在公共领域相对较少。
(9)不应因为球员失误多而评判他们
示例:“特伦特·亚历山大·阿诺德的失误次数比英超联赛中任何其他球员都多。”
为什么会产生误导:《The Athletic》 的Michael Cox 一月份详细探讨了英超联赛中“失败”的含义,所以我不会在这里深入探讨。每个赛季金靴奖获得者未能进球的次数都比他们进球的次数还要多。如果我们想找到完成次数最多的最佳射手,我们会考虑转化率,因此我们需要进球数据。
替代方案:在大多数情况下,如果重点是球员的失误次数,则值得将其转换为百分比以添加背景信息。他们是否犯了很多错误,或者他们比其他球员尝试了更多的事情?
(10)不应比较出场时间不同的球员
示例:“特伦特·亚历山大-阿诺德和詹姆斯·麦迪逊是联盟中并列第二的机会创造者,各有75 次机会。”
为什么会产生误导:上场时间越长的球员就有更多机会在场上执行可数的动作。不将所有球员的上场时间放在平等的基础上意味着那些上场时间较少的球员几乎总是看起来更糟糕。
例如,通过调整上场时间,艾米·布恩迪亚实际上是联盟中每90 分钟创造机会第二多的人(每90 分钟3.3 个)。
替代方法:通过将统计数据调整为每90 分钟的上场时间(即将统计数据除以上场时间/90),可以在不同上场时间的球员之间进行更公平的比较。
用户评论
楼主说的很有道理!我一直就是不善于长时间看比赛分析,觉得容易被各种数据和术语弄晕头。现在想来,也许是缺乏一些系统性的学习方法,就像这篇文章提到的“聚焦于重要指标”,看来以后得好好琢磨一下
有6位网友表示赞同!
看完这个专栏后突然明白了很多!以前只会看结果,从来没想过要深入分析比赛背后的逻辑,从选手的表现到战术的运用,这些都很有意思。感觉自己对足球更有了深度理解了。
有18位网友表示赞同!
说实话,这10条戒律对我来说有些抽象,毕竟我一直是感性地喜欢足球。虽然了解一些数据分析的重要性,但我还是觉得最直接的感受最重要:比如一个球员的表现、球队的战术风格等等。
有15位网友表示赞同!
这篇博文真的是太棒了!很多情况下我们会因为片面信息而错过精彩比赛的原因,但这篇文章让我更加明白要理性思考和全面观察。以后我会认真学习这些分析方法,提高我对足球的理解水平
有14位网友表示赞同!
说真的,数据分析在现代足球界越来越重要,但这并不代表我们要完全抛弃主观的印象和感受。两者结合才能让我们更全面的欣赏这场运动带来的乐趣。
有6位网友表示赞同!
楼主把足球分析的方法总结得太棒了!这篇文章让我对足球的认识从浅层走向深层,以后不再只是看着比赛结果而发呆,而是能真正理解比赛背后的一切!
有5位网友表示赞同!
很多时候我们容易被数据和统计吓到,甚至忽视一些更直观的表现。我觉得分析方法很重要,但不能让它完全吞噬我们对足球的热爱和热爱游戏的激情。
有19位网友表示赞同!
这些戒律非常实用,对我这种平时就喜欢研究足球数据的伙伴来说很有帮助。不过,还是希望楼主能经常更新此类型的文章,让我们可以不断深化对足球的理解!
有12位网友表示赞同!
同意这篇博文里说的,足球分析不能局限于数据层面。战术、球员的心理状态、比赛环境等等因素都要考虑到才算是一个全面和有价值的分析
有19位网友表示赞同!
我觉得有些观点过于强调数字数据的运用,忽略了对球员技战术等方面的观察和理解。足球不仅仅是冰冷的数据,更是一种充满激情和活力的运动艺术!
有16位网友表示赞同!
虽然这些分析方法很有用,但我个人觉得享受比赛的过程才是最重要的。太过注重分析可能会让大家失去看球的乐趣。
有17位网友表示赞同!
文章内容很专业,能感受到作者对足球的认真研究和理解。希望未来能看到更多原创性的分析文章,引导球迷们更深入地了解比赛!
有13位网友表示赞同!
以前看比赛就是跟着感觉来,看完之后只能说赢了漂亮或者输得比较惨。读完这篇文章后我才意识到,足球还有那么多精深的东西需要学习和分析!现在我打算多关注一些战术变化和球员的表现,看看能否更深入地理解这场运动
有10位网友表示赞同!
赞同楼主观点!现在很多球迷沉迷于各种数据统计,却忽略了真正看球的精神,那就是享受比赛的激情和乐趣。希望大家都能理性看待数据分析,不要让它成为阻隔我们感受足球魅力的工具。
有10位网友表示赞同!
这篇文章很有启发意义!以后我再看一场比赛的时候,不仅要关注最终的结果,还要深入分析球员的表现、战术运用等等。相信自己能从这些分析中得到更深层的体会!
有5位网友表示赞同!
对于很多人来说,足球是一项非常注重团队合作的运动,数据分析能帮助我们更好地理解每个球员的角色和贡献。这篇文章让我对足球团队建设有了新的认识。
有19位网友表示赞同!
作为一名喜欢看球的球迷,我始终希望能将对足球的热情转化为更深刻的研究和探索:这篇博文给予了我很大的启发! 我会更加重视数据分析的方法,并将其应用到我的观赛体验中去。
有12位网友表示赞同!
我觉得每个球员在比赛中的表现都会受到各种因素的影响,包括战术安排、个人状态、对手的压力等等。数据的统计只是其中一部分,还需要我们根据实际情况进行综合判断,才能更准确地理解比赛的结果和意义!
有16位网友表示赞同!