分类
宾夕法尼亚大学新闻

“疯狂三月”背后的数学原理

“疯狂三月”将于本周拉开序幕。据估计,2017年的32场比赛平均每场有560万人观看,NCAA男子篮球联赛已经成为普通和严肃的大学体育爱好者的春季现象。

现在,中国的顶级球队正在为他们的首场比赛做准备,许多人可能想知道如何填补他们的疯狂三月等级。去年,沃伦•巴菲特(Warren Buffett)提高了对一个典型办公室团队的赌注,他给员工开出了100万美元的年薪,如果他们能猜对所有进入16强的团队,就可以终身领取奖金。

由于在前几轮比赛中出现了一些失误,没有人获得大奖,这并不奇怪,因为有超过920亿亿个填入括号的方法。即使每年有10亿人加入疯狂三月的行列,即使是在几百年的锦标赛中,获得完美排名的机会也是非常低的。

今天,佩恩与沃顿商学院统计学副教授沙恩·詹森(Shane Jensen)坐下来,讨论了体育分析,如何选择一个“更好”的排名,以及体育排名的未来以及对未来的预测。

 

有351支甲级男子篮球队。考虑到这么多的球队在赛季中并不会互相比赛,体育分析人士是如何对它们进行排名的呢?

运动队的排名通常采用Elo评分系统。它最初是为国际象棋而开发的,它允许你对没有玩过的棋手进行排名。对于团队运动,Elo关注的是一个团队对谁赢了或输了,以及对手对谁赢了或输了,并使用这些成对的结果来推断一个团队的实力。在Elo中,如果一支好球队踢的是模型认为的坏球队,而好球队输了,那么好球队的排名受到的伤害要大于输给另一支好球队。但这一制度也有一些弊端,因为它只基于谁赢了,而不考虑胜利的力量;例如,它不考虑一个球队是赢了20分还是1分。有更复杂的排名系统,考虑到胜利的力量或其他更详细的方面,在游戏中的表现。凯德·梅西(Cade Massey)和鲁弗斯·皮博迪(Rufus Peabody)每周都会在《华尔街日报》(The Wall Street Journal)上发表他们的足球排名。梅西-皮博迪指数(Massey-Peabody index)是世界上最复杂的足球排名系统之一,它考虑了得分差异以及逐场比赛的数据,从而推断出进攻和防守效率等因素。

只有64支球队(约18%)进入了疯狂三月的第一轮。如何选择团队?

因为在选择“疯狂三月”的参赛队伍时必须考虑很多因素,比如某些会议的保证参赛资格,所以有一个评选委员会负责对NCAA锦标赛的参赛队伍进行排名和选拔。总会有一些团队是不假思索的,但是有类似记录的团队需要更仔细地研究。委员会通常会根据反对的力量对这些小组作出一些区分。使用像Elo这样的排名系统,如果一个团队在面对那些以失败告终的团队时取得了非常好的成绩,那么这个团队的排名就不会像在面对其他优秀团队时取得胜利那样得到提升。打篮球的好处是,这个赛季有很多比赛,所以每支球队都能有更多不同的对手。但最终还是会出现一些不平衡,因为每支球队在一个赛季里都要打几百场比赛,才能与甲级联赛的所有球队竞争。

the bracket for march madness 2019是2019年美国大学生体育协会(NCAA)一级男子篮球联赛的官方排名,更广为人知的名称是“疯狂三月”(March Madness)。要在3月21日第一轮比赛开始前填写可打印版本的支架,请访问NCAA的网站(照片:NCAA)。

 

为括号选择团队的最佳方法是什么?除了团队排名,你还可以看其他指标吗?

团队的个别比赛可以提供信息,特别是如果你有很多关于篮球的知识。你可以看一场特定的比赛,比如“这支球队的防守真的很好,但我认为对这个特定的对手来说,这是一场糟糕的比赛。”“你也可以在不了解大学篮球的情况下预测一些比赛,比如一号种子通常会击败16号种子。问题是如果你必须提前设置整个括号;你只有在前几轮比赛中才能真正看到每一场比赛。在那之后,在被淘汰的队伍中有足够的随机性,以至于你甚至无法预测谁将在第二轮之后与谁对决。

“疯狂三月”是什么让这项赛事如此激动人心?

这是一项运动的完美结合,在这项运动中,比赛可以相对频繁地进行,而且有大量的队伍。虽然大学橄榄球迷会喜欢在赛季结束时举行一场有16或32支球队参加的大型比赛,但你每周踢足球的次数不能超过一次,所以一场大型比赛会花费太多时间来完成。比赛结构本身也是非常独特的。你有这么多的球队,而且每个球队都可能被一场比赛淘汰,这使得每一场比赛都非常激动人心。每一款游戏都是随机的,你总是能看到令人心烦意乱的场面。如果你有一个不平衡的比赛,你有一个不太好的球队打一个好的球队,那么不太好的球队最好的机会就是在一场比赛中击败他们。像NBA这样的季后赛模式并不像“疯狂三月”那样不可预测,因为在七场系列赛中被击败的几率要比一场比赛小得多。如果你想建立一个更好的团队更经常获胜的游戏,那么较长的游戏系列是理想的。但是如果你是一个普通的球迷,你想看到一些令人沮丧的事情发生,或者你想看到一些很酷的、意想不到的事情发生,三月madnessstyle的锦标赛非常适合这种类型的戏剧。

你认为分析将如何改变未来的体育?

人类努力的大部分领域正变得更加以数据为导向,而体育分析在这场数据革命中是一个非常活跃的前沿领域。使用新的体育数据来源已经有很多令人着迷的分析,我认为在可预见的未来,这一进展将继续下去。篮球运动是在个人球员和球跟踪技术领域发展最为进步的一项运动。在过去的几年里,他们一直在使用视频数据跟踪每一场NBA比赛中球的位置坐标和场上的每一个球员。这种高分辨率的数据使我们能够超越历史指标,如投篮效率或篮板数量,以检查更详细的游戏方面的发挥,如个人传球的准确性或球员在自己周围创造了多少空间。随着更详细的游戏数据被纳入排名模型,排名系统可能也会得到改善。然而,我们如何能够提高我们的预测是有上限的,因为每个游戏结果都有其固有的随机性和运气。我们永远不会达到能够完美预测一场即将到来的比赛的程度,我们也不希望这样的事情发生,因为那样会少很多刺激。

篮球摄像机跟踪系统的一个例子是SportsVU,它记录了场上球员的每一个动作。(Gif:统计SportVU)

 

在“疯狂三月”期间,你会支持谁?

我喜欢为那些最终进入常青藤联盟锦标赛的球员加油。我也喜欢为小家伙们呐喊助威,如果不是因为篮球,这些来自我从未听说过的地方的球队。

 

新闻旨在传播有益信息,英文原版地址:https://penntoday.upenn.edu/news/math-behind-march-madness