Statistiques appliquées au sport

Post on 22-Jun-2022

4 views 0 download

Transcript of Statistiques appliquées au sport

Statistiques appliquées au sport

Damien Gabriel, PhD

dgabriel@chu-besancon.fr

Liens pour télécharger (gratuitement) R, des packages, de la doc, etc…

Moteur de recherche

Documentationhttps://www.r-project.org/

Définition

• 4 étapes :

– Recueil de données

– Dépouillement de données

– Traitement des données

– Interprétation des résultats

1. Après l'équitation, le tir au pistolet, la natation et le cross-country, quelle est la cinquième épreuve du pentathlon moderne ?

1. L'escrime

2. Le lancement du poids

3. Une course cycliste

4. Le lancement du javelot

2. 1872 a vu la création du premier club de football. C'était...1. Le Havre Atletic Club

2. Paris Olympic Club

3. Auxerre Football Club

4. Nantes Sporting Club

3. Au tennis, les très fameux Mousquetaires se composaient de Borotra, Cochet, Lacoste et ...

1. Pêche

2. Brugnon

3. Nectarine

4. Melon

4. Quelle est la largeur d'un but de football ?1. 7,12 m

2. 7,22 m

3. 7,32 m

4. 7,42 m

5. Qu'est-ce qui fait 11 cm de diamètre pour un poids de 110 grammes ?

1. Un palet de hockey

2. Une quille de bowling

3. Une balle de polo

4. Un plateau de ball-trap

5. Les billes de billard sont maintenant en résine synthétique. A l'origine, elles étaient faites en...

1. Bois

2. Ivoire

3. Os

4. Granit

6. Quel est le nombre maximum de rameurs en Aviron ?

1. 6

2. 8

3. 10

4. 12

7. Le score maximum pour une partie de bowling est de :

1. 200 points

2. 300 points

3. 400 points

4. 600 points

8. Quel pays est spécialiste du lancer de tronc d'arbre ou de poutre ?

1. L'Irlande

2. L'Australie

3. Le Canada

4. L'Ecosse

9. Pour quel sport les arbitres sont-ils obligés d'utiliser la langue française ?

1. La lutte

2. L'escrime

3. La boxe

4. L'équitation

• Après l'équitation, le tir au pistolet, la natation et le cross-country, quelle est la cinquième épreuve du pentathlon moderne ?– L'escrime

– Le lancement du poids

– Une course cycliste

– Le lancement du javelot

• 1872 a vu la création du premier club de football. C'était...– Le Havre Athletic Club

– Paris Olympic Club

– Auxerre Football Club

– Nantes Sporting Club

• Au tennis, les très fameux Mousquetaires se composaient de Borotra, Cochet, Lacoste et ...– Pêche

– Brugnon

– Nectarine

– Melon

• Quelle est la largeur d'un but de football ?– 7,12 m

– 7,22 m

– 7,32 m

– 7,42 m

• Qu'est-ce qui fait 11 cm de diamètre pour un poids de 110 grammes ?– Un palet de hockey

– Une quille de bowling

– Une balle de polo

– Un plateau de ball-trap

• Les billes de billard sont maintenant en résine synthétique. A l'origine, elles étaient faites en...– Bois

– Métal

– Os

– Granit

• Quel est le nombre maximum de rameurs en Aviron ?– 6

– 8

– 10

– 12

• Le score maximum pour une partie de bowling est de :– 200 points

– 300 points

– 400 points

– 600 points

• Quel pays est spécialiste du lancer de tronc d'arbre ou de poutre ?– L'Irlande

– L'Australie

– Le Canada

– L'Ecosse

• Pour quel sport les arbitres sont-ils obligés d'utiliser la langue française ?– La lutte

– L'escrime

– La boxe

– L'équitation

Définition

• 4 étapes :

– Recueil de données

– Dépouillement de données

– Traitement des données

– Interprétation des résultats

2- Dépouillement des données

• Rassembler et organiser les données sous forme de tableaux, les classer, les coder

• De préférence, construire le tableau de données dans un tableur

Fonctionnement de R

• Démarrer R

• Rentrer les valeurs suivantes :42

-42

42.1

39+3

58-16

6*7

8/3

5^3

((10+15) / 5) – 3*2

Fonctionnement de R

• Les variables : cases mémoire qui permettent de stocker des valeurs (numériques, texte…)

• Permet de les réutiliser par la suite a <- 42

a

a <- 8

a

a <- "Vive les stats"

a

5 -> coucou

coucou

Nom de la variable sous Excel

Fonctionnement de R

• Attention : Le nom des variables peut contenir des lettres, chiffres et caractères spéciaux mais doit commencer par une lettre,

• Attention (2) : La casse est importante : a ≠ A

• Exemple :

test1 <- 1

Test1

1test <- 1

Fonctionnement de R

• Les vecteurs

– Objet fondamental du langage R

– Permet de stocker plusieurs nombres dans une même variable

– Tous ces éléments doivent être du même type : valeurs numériques, ou caractères. Mais surtout approprié pour variables quantitatives

Comment créer un vecteur

• Plusieurs possibilités, soit :

NomVecteur <- scan()

NomVecteur <- c(éléments à mettre dans le vecteur séparés par une virgule)

Pour modifier un vecteur déjà existant:

data.entry(NomVecteur)

Ou importer un fichier…

Les vecteurs

• Taper

Test <- c(7.1,9,4,12,18)

Vecteur <- c("H","C", "I","G","F")

• Pour simplifier la création des vecteurs

Vecteur <- 1:10

Vecteur <- seq(from=1, to=3 , by=0.25)

Vecteur <- LETTERS[1:5]

Opérations de bases sur les vecteurs

• Avec les données recueillies, créer le vecteur score

• Calculer max(score)

• Calculer min(score)

• Calculer mean(score)

• Calculer sd(score)

• Longueur du vecteur : length(score)

Opérations sur les vecteurs

Opérations plus complexes :

• Trier les éléments : sort(score)

• Addition sur le vecteur : score <- score + 1

• Graphique : barplot(score)

• Test de normalité : shapiro.test(score)

Les vecteurs

• Pour accéder au ième élément d’un vecteur, écrire vecteur[i], où i peut être une valeur unique ou même un vecteur

Quelles valeurs donnent ?

score [4]

score[c(4,8)]

score[-c(2,5,8)]

score[6:3] On peut regrouper les résultats dans un nouveau vecteur. Par exemple : NouvVecteur <- Vecteur[c(4,8)]

Les vecteurs

• On peut faire des sélections plus complexes des valeurs. Par exemple pour éliminer les valeurs aberrantes ou corriger une valeur

• Exemple :

score > 7

score[score > 7]

score2 <- score[score > 7]

• Pour remplacer une valeur dans un vecteur :

score[4] = 0

score[c(3,6)] <- c(1, 2)

Donne moi les cas ou les éléments du vecteur sont > 7

Donne moi les valeurs correspondantes

Regroupe ces valeurs

Les vecteurs

• Il est possible de donner un nom aux éléments d’un vecteur avec la fonction names()

• Avec les données recueillies, créer le vecteur prenom

• Puis names(score) <- prenom

• Il est alors possible d’appeler un élément par le nom qui lui est associé

score["ExemplePrenom"]

• Et d’utiliser le nom pour remplacer une valeur

score ["ExemplePrenom"] <- 2

Les facteurs

• Ressemblent aux vecteurs mais dédiés au stockage des variables qualitatives.

• Possède une information supplémentaire sur l’univers des valeurs, grâce à l’attribut niveaux

• Fonction factor(vecteur, niveaux)

• Exemple

• Avec les données recueillies, créer le vecteur : tricher <- factor(c("O", "O", "N", "N", "O" ), levels=c("O", "N"))

Les facteurs

• Que font les fonctions toupper(facteur) et tolower(facteur) ?

• Exemple2: Genre pour l’ensemble des étudiants :

GenreTotal <- c("M", "H", "F", "F","F", "M", "M", "F", "F","F", "M", "M", "F", "H","F", "M", "M", "F", "F","F", "M", "M", "F", "F","F", "M", "M", "F", "F","F")

Genre <- factor(GenreTotal, levels=c("M", "F"))

• Permet de détecter des données incorrectes

Les facteurs

• Important : impossible d’effectuer des opérations arithmétiques sur les facteurs

Diminue les erreurs pour variables qualitatives

Exemple : Que donne tricher <- tricher +1 ?

• Si facteur avec des valeurs numériques et que l’on veut faire des calculs transformer facteur en vecteur : as.vector()

vec_tricher <- as.vector(tricher)

2- Dépouillement des données

• Règle 1 : les individus sont placés en lignes et les variables en colonnes

• Règle 2 : Aucune case ne doit être vide. Une donnée manquante doit se noter « NA » (not available) sous R.

• Règle 3 : (conseil) Donner un titre à chaque colonne Nom de la variable sous R

Comparaison du bénévolat sportif et des emplois sportifs en Europe (Andreff, 1995)

Titre

Donnée manquante

Variables

Individus

Enregistrer les variables

• Fonction save(score, file="score.Rdata")

• Pour charger variable : load("score.Rdata")

• Enregistrer les variables score, prenom, tricher

• Pour connaitre le répertoire ou sont enregistrées les données : getwd()