Skip to main content
标签ad报错:该广告ID(9)不存在。
  主页 > 中超

NBA球员身体数据及位置分析

2024-04-16 浏览:
标签ad报错:该广告ID(7)不存在。

前言

让我们先来看则新闻,元旦联盟爆炸出一惊人记录,就是绿军与

热火

的比赛中,凯尔特人后卫小

托马斯

爆砍52分,其中第四节一人独揽29分,且命中杀死比赛的三分球。但小托马斯身高仅仅175cm。不禁会想身高会限制位置吗,还有现在的NBA为什么后卫闪耀中锋却凤毛麟角?

数据获取

从NBA中国官方网站获取449名现役NBA球员的位置,身高,体重,国籍等数据。

数据分析

1.球员身高分布

library(ggplot2) ggplot(hy0209,aes(x=Position,y=Height,col=Position))+geom_dotplot(binaxis = "y",binwidth=0.5,stackdir="center")

几个有意思的异常值

NBA运动员最矮的人

> hy0209[hy0209$Height==min(hy$Height),] Player player team Position Height Weight years country 44 Thomas, Isaiah 托马斯, 以赛亚 凯尔特人 后卫 175 83.9 5 美国 78 Felder, Kay 菲尔德, 凯 骑士 后卫 175 79.8 0 美国

意外发现联盟里有两名175cm的球员,这给那些热爱篮球的身高不够的骚年们多大的鼓励啊!!

NBA运动员最高的人

> hy0209[hy0209$Height==max(hy$Height),] Player player team Position Height Weight years country 146 Marjanovic, Boban 马亚诺维奇, 鲍班 活塞 中锋 221 131.5 1 塞尔维亚 326 Porzingis, Kristaps 波尔津吉斯, 克里斯塔普斯 尼克斯 前锋 221 108.9 1 拉脱维亚

看到也有两个人身高同时达到了221cm,而且还都不是美国人。

可以发现,NBA中锋球员明显少于后卫及中锋,中锋的数量不及后卫及前锋的三分之一,近几年NBA缺少中锋的言论确实不少,

NBA球员国籍分布
hy02091<-table(hy0209$country) hy02091<-as.data.frame(hy02091) hy02091<-hy02091[which(hy02091$Freq>2),] hy02091<-hy02091[-1,] ggplot(hy02091,aes(x=Var1,y=Freq))+geom_bar(stat="identity")

NBA里容纳43个国家的顶级球员,还有4名球员国籍不详。75.5%的球员是来自美国,6.5%来自法国,加拿大,巴西。

各个球队的中锋配置

hy02092<-hy0209[which(hy0209$Position=="中锋"),] ggplot(hy02092,aes(x=team))+geom_bar(stat="count")
在中锋匮乏的NBA,有8个球队只配备了一名中锋,黄蜂队却配置了4个中锋,快攻见长的勇士也配有3名中锋,根据市场供给原则,大胆的预测下,在今年球员交易日截止前,黄蜂队必有中锋被交易。

1.位置水平下的方差分析

将篮球队员的7个位置(我也不知道为何官方这样划分: 后卫, 后卫-前锋 , 前锋, 前锋-后卫, 前锋-中锋,中锋,中锋-前锋)看成7个水平,将7个位置下的身高看成该水平下的观测值

我们看不同水平下的观测值是否一样

> lamp<-data.frame( + X=hy0210$Height, + A=hy0210$level) > lamp.aov<-aov(X ~ A, data=lamp) > summary(lamp.aov) Df Sum Sq Mean Sq F value Pr(>F) A 1 25918 25918 1277 <2e-16 *** Residuals 447 9073 20 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

看到P值 <2e-16,所以不同位置下的身高明显不同。

数据探讨

先看下球员身高体重的分布

既然身高对位置有影响,不妨按身高体重进行聚类,用kmeans聚成3类,看聚类的效果好不好

> cust<-hy[,2:3] > kmeans_result1<-kmeans(cust,3) > hy$jl2<-kmeans_result1$cluster > table(hy$Position,kmeans_result1$cluster) > ggplot(hy,aes(x=Height,y=Weight,colour=jl2))+geom_point()

发现聚类的效果还算明显,基本上也契合了位置的分布,第一类是中锋,第二类锋卫摇摆人,第三类后卫。

小结

身高确实限制了NBA球员的位置黄蜂队会有中锋被交易。