Een wedstrijd analyse

Er is een verschil tussen netto en bruto: bruto is zonder enige handicap verekening, netto met handicap verekening volgens het aantal bijkomende slagen per hole.

We gaan de uitslag van 25/02/2014 gebruiken om dit te illusteren.

brut <- read.csv2("febbrut.csv")
net <- read.csv2("febnet.csv")
plot(net$net, brut$Bruto, type = "h", xlab = "netto-uitslag", ylab = "bruto")

 

nettobruto
Uit de figuur leren we dat iemand met een lage handicap bruto erg goed moet spelen om een aanvaardbare nettouitslag te halen,

terwijl je met een hoge handicap en een lage brutoscore toch een vrij goede nettoscore kan halen.

Vermits de golfuitslag nogal “dag”-afhankelijk is kunnen we via de correlatie tussen netto en bruto nagaan of het een positieve of negatieve dag is. Positief staat voor: de lage handicappers hebben beter gespeeld (een hogere netto uitslag) dan verwacht.

print(cor(net$net, brut$Bruto))
## [1] 0.3959

Deze correlatie geeft aan dat voor goed of slecht spelen het verschil niet te wijten is aan een lage of hoge handicap. Even een ‘statistische’ uitleg: correlatie geeft aan dat het verband tussen beide grootheden  ongeveer op een rechte lijn liggen, waarbij 1 een stijgende rechte en -1 een dalende rechte geeft. Wanneer de correlatie rond het nulpunt ligt is er geen verband tussen beide grootheden. In dit geval (0.39) is er zeker geen uitgesproken verband. Dit zie je duidelijk door bovenstaande figuur opnieuw te tekenen, nu met nadruk op de ligging van de punten.

reg <- lm(brut$Bruto ~ net$net, )
print(summary(reg))
## 
## Call:
## lm(formula = brut$Bruto ~ net$net)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -4.336 -1.489 -0.873  0.433  7.380 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept)   -0.874      2.427   -0.36    0.722  
## net$net        0.343      0.178    1.93    0.068 .
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.03 on 20 degrees of freedom
## Multiple R-squared:  0.157,	Adjusted R-squared:  0.115 
## F-statistic: 3.72 on 1 and 20 DF,  p-value: 0.0682
plot(net$net, brut$Bruto, type = "p", xlab = "netto-uitslag", ylab = "bruto")
abline(a = reg$coefficient[1], b = reg$coefficient[2], col = "red")

 

Bovenstaande code berekent de rode lijn op de figuur.

 

 

unnamed-chunk-3Deze rode lijn is de beste voorspelling die je kan maken over de brutoscore als je de nettoscore krijgt, hieruit blijkt dat beide scores weinig met mekaar te maken hebben.

De code is in R en de csv-bestanden werden op voorhand gesorteerd.  Zoals afgesproken is er geen naamvermelding. Voor de geïnteresseerde clubleden is inloggen op iGolf en naar de seniorenwedstrijd op die datum gaan kijken voldoende om te weten wie wie is.

Ter info: de wedstrijd liep over 9 holes en op matjes. De code van de berekening en de resultaten van de statistische analyse staan er maar bij voor het verhaal volledig te maken.

Leave a Reply