Statistiques appliquées au sport

26
Statistiques appliquées au sport Damien Gabriel, PhD [email protected]

Transcript of Statistiques appliquées au sport

Page 1: Statistiques appliquées au sport

Statistiques appliquées au sport

Damien Gabriel, PhD

[email protected]

Page 2: Statistiques appliquées au sport

Liens pour télécharger (gratuitement) R, des packages, de la doc, etc…

Moteur de recherche

Documentationhttps://www.r-project.org/

Page 3: Statistiques appliquées au sport

Définition

• 4 étapes :

– Recueil de données

– Dépouillement de données

– Traitement des données

– Interprétation des résultats

Page 4: Statistiques appliquées au sport

1. Après l'équitation, le tir au pistolet, la natation et le cross-country, quelle est la cinquième épreuve du pentathlon moderne ?

1. L'escrime

2. Le lancement du poids

3. Une course cycliste

4. Le lancement du javelot

2. 1872 a vu la création du premier club de football. C'était...1. Le Havre Atletic Club

2. Paris Olympic Club

3. Auxerre Football Club

4. Nantes Sporting Club

3. Au tennis, les très fameux Mousquetaires se composaient de Borotra, Cochet, Lacoste et ...

1. Pêche

2. Brugnon

3. Nectarine

4. Melon

4. Quelle est la largeur d'un but de football ?1. 7,12 m

2. 7,22 m

3. 7,32 m

4. 7,42 m

5. Qu'est-ce qui fait 11 cm de diamètre pour un poids de 110 grammes ?

1. Un palet de hockey

2. Une quille de bowling

3. Une balle de polo

4. Un plateau de ball-trap

5. Les billes de billard sont maintenant en résine synthétique. A l'origine, elles étaient faites en...

1. Bois

2. Ivoire

3. Os

4. Granit

6. Quel est le nombre maximum de rameurs en Aviron ?

1. 6

2. 8

3. 10

4. 12

7. Le score maximum pour une partie de bowling est de :

1. 200 points

2. 300 points

3. 400 points

4. 600 points

8. Quel pays est spécialiste du lancer de tronc d'arbre ou de poutre ?

1. L'Irlande

2. L'Australie

3. Le Canada

4. L'Ecosse

9. Pour quel sport les arbitres sont-ils obligés d'utiliser la langue française ?

1. La lutte

2. L'escrime

3. La boxe

4. L'équitation

Page 5: Statistiques appliquées au sport
Page 6: Statistiques appliquées au sport

• Après l'équitation, le tir au pistolet, la natation et le cross-country, quelle est la cinquième épreuve du pentathlon moderne ?– L'escrime

– Le lancement du poids

– Une course cycliste

– Le lancement du javelot

• 1872 a vu la création du premier club de football. C'était...– Le Havre Athletic Club

– Paris Olympic Club

– Auxerre Football Club

– Nantes Sporting Club

• Au tennis, les très fameux Mousquetaires se composaient de Borotra, Cochet, Lacoste et ...– Pêche

– Brugnon

– Nectarine

– Melon

• Quelle est la largeur d'un but de football ?– 7,12 m

– 7,22 m

– 7,32 m

– 7,42 m

• Qu'est-ce qui fait 11 cm de diamètre pour un poids de 110 grammes ?– Un palet de hockey

– Une quille de bowling

– Une balle de polo

– Un plateau de ball-trap

• Les billes de billard sont maintenant en résine synthétique. A l'origine, elles étaient faites en...– Bois

– Métal

– Os

– Granit

• Quel est le nombre maximum de rameurs en Aviron ?– 6

– 8

– 10

– 12

• Le score maximum pour une partie de bowling est de :– 200 points

– 300 points

– 400 points

– 600 points

• Quel pays est spécialiste du lancer de tronc d'arbre ou de poutre ?– L'Irlande

– L'Australie

– Le Canada

– L'Ecosse

• Pour quel sport les arbitres sont-ils obligés d'utiliser la langue française ?– La lutte

– L'escrime

– La boxe

– L'équitation

Page 7: Statistiques appliquées au sport
Page 8: Statistiques appliquées au sport

Définition

• 4 étapes :

– Recueil de données

– Dépouillement de données

– Traitement des données

– Interprétation des résultats

Page 9: Statistiques appliquées au sport

2- Dépouillement des données

• Rassembler et organiser les données sous forme de tableaux, les classer, les coder

• De préférence, construire le tableau de données dans un tableur

Page 10: Statistiques appliquées au sport

Fonctionnement de R

• Démarrer R

• Rentrer les valeurs suivantes :42

-42

42.1

39+3

58-16

6*7

8/3

5^3

((10+15) / 5) – 3*2

Page 11: Statistiques appliquées au sport

Fonctionnement de R

• Les variables : cases mémoire qui permettent de stocker des valeurs (numériques, texte…)

• Permet de les réutiliser par la suite a <- 42

a

a <- 8

a

a <- "Vive les stats"

a

5 -> coucou

coucou

Nom de la variable sous Excel

Page 12: Statistiques appliquées au sport

Fonctionnement de R

• Attention : Le nom des variables peut contenir des lettres, chiffres et caractères spéciaux mais doit commencer par une lettre,

• Attention (2) : La casse est importante : a ≠ A

• Exemple :

test1 <- 1

Test1

1test <- 1

Page 13: Statistiques appliquées au sport

Fonctionnement de R

• Les vecteurs

– Objet fondamental du langage R

– Permet de stocker plusieurs nombres dans une même variable

– Tous ces éléments doivent être du même type : valeurs numériques, ou caractères. Mais surtout approprié pour variables quantitatives

Page 14: Statistiques appliquées au sport

Comment créer un vecteur

• Plusieurs possibilités, soit :

NomVecteur <- scan()

NomVecteur <- c(éléments à mettre dans le vecteur séparés par une virgule)

Pour modifier un vecteur déjà existant:

data.entry(NomVecteur)

Ou importer un fichier…

Page 15: Statistiques appliquées au sport

Les vecteurs

• Taper

Test <- c(7.1,9,4,12,18)

Vecteur <- c("H","C", "I","G","F")

• Pour simplifier la création des vecteurs

Vecteur <- 1:10

Vecteur <- seq(from=1, to=3 , by=0.25)

Vecteur <- LETTERS[1:5]

Page 16: Statistiques appliquées au sport

Opérations de bases sur les vecteurs

• Avec les données recueillies, créer le vecteur score

• Calculer max(score)

• Calculer min(score)

• Calculer mean(score)

• Calculer sd(score)

• Longueur du vecteur : length(score)

Page 17: Statistiques appliquées au sport

Opérations sur les vecteurs

Opérations plus complexes :

• Trier les éléments : sort(score)

• Addition sur le vecteur : score <- score + 1

• Graphique : barplot(score)

• Test de normalité : shapiro.test(score)

Page 18: Statistiques appliquées au sport

Les vecteurs

• Pour accéder au ième élément d’un vecteur, écrire vecteur[i], où i peut être une valeur unique ou même un vecteur

Quelles valeurs donnent ?

score [4]

score[c(4,8)]

score[-c(2,5,8)]

score[6:3] On peut regrouper les résultats dans un nouveau vecteur. Par exemple : NouvVecteur <- Vecteur[c(4,8)]

Page 19: Statistiques appliquées au sport

Les vecteurs

• On peut faire des sélections plus complexes des valeurs. Par exemple pour éliminer les valeurs aberrantes ou corriger une valeur

• Exemple :

score > 7

score[score > 7]

score2 <- score[score > 7]

• Pour remplacer une valeur dans un vecteur :

score[4] = 0

score[c(3,6)] <- c(1, 2)

Donne moi les cas ou les éléments du vecteur sont > 7

Donne moi les valeurs correspondantes

Regroupe ces valeurs

Page 20: Statistiques appliquées au sport

Les vecteurs

• Il est possible de donner un nom aux éléments d’un vecteur avec la fonction names()

• Avec les données recueillies, créer le vecteur prenom

• Puis names(score) <- prenom

• Il est alors possible d’appeler un élément par le nom qui lui est associé

score["ExemplePrenom"]

• Et d’utiliser le nom pour remplacer une valeur

score ["ExemplePrenom"] <- 2

Page 21: Statistiques appliquées au sport

Les facteurs

• Ressemblent aux vecteurs mais dédiés au stockage des variables qualitatives.

• Possède une information supplémentaire sur l’univers des valeurs, grâce à l’attribut niveaux

• Fonction factor(vecteur, niveaux)

• Exemple

• Avec les données recueillies, créer le vecteur : tricher <- factor(c("O", "O", "N", "N", "O" ), levels=c("O", "N"))

Page 22: Statistiques appliquées au sport

Les facteurs

• Que font les fonctions toupper(facteur) et tolower(facteur) ?

• Exemple2: Genre pour l’ensemble des étudiants :

GenreTotal <- c("M", "H", "F", "F","F", "M", "M", "F", "F","F", "M", "M", "F", "H","F", "M", "M", "F", "F","F", "M", "M", "F", "F","F", "M", "M", "F", "F","F")

Genre <- factor(GenreTotal, levels=c("M", "F"))

• Permet de détecter des données incorrectes

Page 23: Statistiques appliquées au sport

Les facteurs

• Important : impossible d’effectuer des opérations arithmétiques sur les facteurs

Diminue les erreurs pour variables qualitatives

Exemple : Que donne tricher <- tricher +1 ?

• Si facteur avec des valeurs numériques et que l’on veut faire des calculs transformer facteur en vecteur : as.vector()

vec_tricher <- as.vector(tricher)

Page 24: Statistiques appliquées au sport

2- Dépouillement des données

• Règle 1 : les individus sont placés en lignes et les variables en colonnes

• Règle 2 : Aucune case ne doit être vide. Une donnée manquante doit se noter « NA » (not available) sous R.

• Règle 3 : (conseil) Donner un titre à chaque colonne Nom de la variable sous R

Page 25: Statistiques appliquées au sport

Comparaison du bénévolat sportif et des emplois sportifs en Europe (Andreff, 1995)

Titre

Donnée manquante

Variables

Individus

Page 26: Statistiques appliquées au sport

Enregistrer les variables

• Fonction save(score, file="score.Rdata")

• Pour charger variable : load("score.Rdata")

• Enregistrer les variables score, prenom, tricher

• Pour connaitre le répertoire ou sont enregistrées les données : getwd()