盲区|NBA数据统计的利与弊:本意是服务比赛,但很容易混淆事实( 二 )


这个局限性就是 , 当数据被剥离到比赛之外 , 其反映出的现象就和事实有偏差 , 再通俗一点说 , 就是一旦只看数据不看比赛 , 很容易得出错误的比赛认知 。
比如一场比赛中 , 同样的得分数据 , 高强度防守下挺身而出 , 和低强度防守下零敲碎打是不一样的价值 , 但是基础数据无法体现区别;
同样的篮板球数据 , 在人群中抢篮板或者卡位保护篮板和待在篮下捡篮板 , 也是完全不同的价值 , 但数据上也无法分辨;
同样的抢断数据 , 是凭借身体强度给对手压迫造成对方失误 , 还是孤注一掷地放弃防守位置扑出去 , 对球队来说也是不同的 , 基础数据同样一概而论 。

所以在当代篮球比赛中 , 在数据统计越来越被大家重视的情况下 , 有一些“聪明”的球员或明或暗、或多或少地在场上“刷数据” 。
本来一个难度不大的后场篮板 , 给谁都是给 , 但有些球员偏偏要和自家队友争一下 , 这样从数据统计上判断 , 他的篮板球能力貌似很强 。
再比如有些反击快攻的轻松得分机会 , 有些球员总是第一时间冲上去 , 不惜体力也要拿下这两分 , 这样一来 , 从数据统计上既能拉高场均得分 , 又能提高进攻效率 , 这会让大家觉得他是一名高效的得分手 。
2、高阶数据的线性问题

很多球迷会被“高阶”两个字吓住 , 以为高阶就是代表高深 , 进而把这些统计当成金科玉律甚至是真理一般对待 。 但事实上 , 如果你稍微花一点时间了解一下 , 就能发现所谓的高阶数据名不副实 。
高阶数据的原材料全部来源于基础数据 , 通过给得分、篮板、助攻、盖帽、抢断、失误、出手次数、命中次数这些基础统计赋予不同的权重 , 利用公式计算得出 。
这样一来就存在两个关键问题:
第一 , 加权参数如何保证精准?实际上这个问题是没有答案的 , 因为根本解决不了 。 虽然大型体育媒体ESPN有不少数据专家 , 尽可能利用统计学去赋予相对准确的加权 , 但NBA的比赛是动态发展的 。

不同年代比赛强度不同 , 节奏不同 , 60年代抢一个篮板和90年代抢一个篮板 , 是完全不同的价值 , 但是在计算公式中 , 这样的变化根本无法体现 。 这也就引出了第二个问题 , 基础数据的局限性 。
这个问题前文已经提到 , 如果一名球员去刷数据 , 体现在基础数据上就是更好看 , 而高阶数据来源于基础数据 , 所以刷得分、刷篮板、刷助攻同样能让自己的高阶数据好看 , 一个人为能控制高低的评价标准 , 还有多少权威性?

第三 , 则是更深层的问题 , 那就是高级数据的线性局限 。
比如A球员场均出战30分钟 , 场均出手15次 , 打出一组数据后通过加权计算 , 得出其进攻效率是25;另一位B球员场均出战36分钟 , 场均出手20次 , 计算出进攻效率是20 。 如果按效率值判断 , A无疑是进攻效率更高的球员 。
接下来就涉及到很多球迷的经典问题 , 是不是给普通球员足够的出手机会 , 也能打出球星的表现?当然不是!在实战中 , 对于任何一名球员 , 一定存在某一个自身能力上限的临界点或拐点 。
拿进攻为例 , 我们看到某一名球员可以高效地场均贡献20分 , 但如果强行要求他更多次出手 , 完成更多高难度攻坚 , 他的命中率会出现断崖式下跌 , 从0分到20分他需要用15次投篮机会 , 但是涨到25分 , 就可能要出手25次才行 。

但是高阶数据的线性特征就不能反映出这里的差异 , 在直角坐标系上 , 高级数据永远是一条平稳上升的直线 , 这种逻辑下 , 让A球员不断增加出手 , 场均得分会稳步提升 , 且效率值不变 。 但是实际中 , 这种操作在坐标系中应该是一条曲线 , 到了一名球员身体、能力承受上限的拐点 , 其效率值会暴跌 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: