Statistiques appliquées au sport
Transcript of Statistiques appliquées au sport
Liens pour télécharger (gratuitement) R, des packages, de la doc, etc…
Moteur de recherche
Documentationhttps://www.r-project.org/
Définition
• 4 étapes :
– Recueil de données
– Dépouillement de données
– Traitement des données
– Interprétation des résultats
1. Après l'équitation, le tir au pistolet, la natation et le cross-country, quelle est la cinquième épreuve du pentathlon moderne ?
1. L'escrime
2. Le lancement du poids
3. Une course cycliste
4. Le lancement du javelot
2. 1872 a vu la création du premier club de football. C'était...1. Le Havre Atletic Club
2. Paris Olympic Club
3. Auxerre Football Club
4. Nantes Sporting Club
3. Au tennis, les très fameux Mousquetaires se composaient de Borotra, Cochet, Lacoste et ...
1. Pêche
2. Brugnon
3. Nectarine
4. Melon
4. Quelle est la largeur d'un but de football ?1. 7,12 m
2. 7,22 m
3. 7,32 m
4. 7,42 m
5. Qu'est-ce qui fait 11 cm de diamètre pour un poids de 110 grammes ?
1. Un palet de hockey
2. Une quille de bowling
3. Une balle de polo
4. Un plateau de ball-trap
5. Les billes de billard sont maintenant en résine synthétique. A l'origine, elles étaient faites en...
1. Bois
2. Ivoire
3. Os
4. Granit
6. Quel est le nombre maximum de rameurs en Aviron ?
1. 6
2. 8
3. 10
4. 12
7. Le score maximum pour une partie de bowling est de :
1. 200 points
2. 300 points
3. 400 points
4. 600 points
8. Quel pays est spécialiste du lancer de tronc d'arbre ou de poutre ?
1. L'Irlande
2. L'Australie
3. Le Canada
4. L'Ecosse
9. Pour quel sport les arbitres sont-ils obligés d'utiliser la langue française ?
1. La lutte
2. L'escrime
3. La boxe
4. L'équitation
• Après l'équitation, le tir au pistolet, la natation et le cross-country, quelle est la cinquième épreuve du pentathlon moderne ?– L'escrime
– Le lancement du poids
– Une course cycliste
– Le lancement du javelot
• 1872 a vu la création du premier club de football. C'était...– Le Havre Athletic Club
– Paris Olympic Club
– Auxerre Football Club
– Nantes Sporting Club
• Au tennis, les très fameux Mousquetaires se composaient de Borotra, Cochet, Lacoste et ...– Pêche
– Brugnon
– Nectarine
– Melon
• Quelle est la largeur d'un but de football ?– 7,12 m
– 7,22 m
– 7,32 m
– 7,42 m
• Qu'est-ce qui fait 11 cm de diamètre pour un poids de 110 grammes ?– Un palet de hockey
– Une quille de bowling
– Une balle de polo
– Un plateau de ball-trap
• Les billes de billard sont maintenant en résine synthétique. A l'origine, elles étaient faites en...– Bois
– Métal
– Os
– Granit
• Quel est le nombre maximum de rameurs en Aviron ?– 6
– 8
– 10
– 12
• Le score maximum pour une partie de bowling est de :– 200 points
– 300 points
– 400 points
– 600 points
• Quel pays est spécialiste du lancer de tronc d'arbre ou de poutre ?– L'Irlande
– L'Australie
– Le Canada
– L'Ecosse
• Pour quel sport les arbitres sont-ils obligés d'utiliser la langue française ?– La lutte
– L'escrime
– La boxe
– L'équitation
Définition
• 4 étapes :
– Recueil de données
– Dépouillement de données
– Traitement des données
– Interprétation des résultats
2- Dépouillement des données
• Rassembler et organiser les données sous forme de tableaux, les classer, les coder
• De préférence, construire le tableau de données dans un tableur
Fonctionnement de R
• Démarrer R
• Rentrer les valeurs suivantes :42
-42
42.1
39+3
58-16
6*7
8/3
5^3
((10+15) / 5) – 3*2
Fonctionnement de R
• Les variables : cases mémoire qui permettent de stocker des valeurs (numériques, texte…)
• Permet de les réutiliser par la suite a <- 42
a
a <- 8
a
a <- "Vive les stats"
a
5 -> coucou
coucou
Nom de la variable sous Excel
Fonctionnement de R
• Attention : Le nom des variables peut contenir des lettres, chiffres et caractères spéciaux mais doit commencer par une lettre,
• Attention (2) : La casse est importante : a ≠ A
• Exemple :
test1 <- 1
Test1
1test <- 1
Fonctionnement de R
• Les vecteurs
– Objet fondamental du langage R
– Permet de stocker plusieurs nombres dans une même variable
– Tous ces éléments doivent être du même type : valeurs numériques, ou caractères. Mais surtout approprié pour variables quantitatives
Comment créer un vecteur
• Plusieurs possibilités, soit :
NomVecteur <- scan()
NomVecteur <- c(éléments à mettre dans le vecteur séparés par une virgule)
Pour modifier un vecteur déjà existant:
data.entry(NomVecteur)
Ou importer un fichier…
Les vecteurs
• Taper
Test <- c(7.1,9,4,12,18)
Vecteur <- c("H","C", "I","G","F")
• Pour simplifier la création des vecteurs
Vecteur <- 1:10
Vecteur <- seq(from=1, to=3 , by=0.25)
Vecteur <- LETTERS[1:5]
Opérations de bases sur les vecteurs
• Avec les données recueillies, créer le vecteur score
• Calculer max(score)
• Calculer min(score)
• Calculer mean(score)
• Calculer sd(score)
• Longueur du vecteur : length(score)
Opérations sur les vecteurs
Opérations plus complexes :
• Trier les éléments : sort(score)
• Addition sur le vecteur : score <- score + 1
• Graphique : barplot(score)
• Test de normalité : shapiro.test(score)
Les vecteurs
• Pour accéder au ième élément d’un vecteur, écrire vecteur[i], où i peut être une valeur unique ou même un vecteur
Quelles valeurs donnent ?
score [4]
score[c(4,8)]
score[-c(2,5,8)]
score[6:3] On peut regrouper les résultats dans un nouveau vecteur. Par exemple : NouvVecteur <- Vecteur[c(4,8)]
Les vecteurs
• On peut faire des sélections plus complexes des valeurs. Par exemple pour éliminer les valeurs aberrantes ou corriger une valeur
• Exemple :
score > 7
score[score > 7]
score2 <- score[score > 7]
• Pour remplacer une valeur dans un vecteur :
score[4] = 0
score[c(3,6)] <- c(1, 2)
Donne moi les cas ou les éléments du vecteur sont > 7
Donne moi les valeurs correspondantes
Regroupe ces valeurs
Les vecteurs
• Il est possible de donner un nom aux éléments d’un vecteur avec la fonction names()
• Avec les données recueillies, créer le vecteur prenom
• Puis names(score) <- prenom
• Il est alors possible d’appeler un élément par le nom qui lui est associé
score["ExemplePrenom"]
• Et d’utiliser le nom pour remplacer une valeur
score ["ExemplePrenom"] <- 2
Les facteurs
• Ressemblent aux vecteurs mais dédiés au stockage des variables qualitatives.
• Possède une information supplémentaire sur l’univers des valeurs, grâce à l’attribut niveaux
• Fonction factor(vecteur, niveaux)
• Exemple
• Avec les données recueillies, créer le vecteur : tricher <- factor(c("O", "O", "N", "N", "O" ), levels=c("O", "N"))
Les facteurs
• Que font les fonctions toupper(facteur) et tolower(facteur) ?
• Exemple2: Genre pour l’ensemble des étudiants :
GenreTotal <- c("M", "H", "F", "F","F", "M", "M", "F", "F","F", "M", "M", "F", "H","F", "M", "M", "F", "F","F", "M", "M", "F", "F","F", "M", "M", "F", "F","F")
Genre <- factor(GenreTotal, levels=c("M", "F"))
• Permet de détecter des données incorrectes
Les facteurs
• Important : impossible d’effectuer des opérations arithmétiques sur les facteurs
Diminue les erreurs pour variables qualitatives
Exemple : Que donne tricher <- tricher +1 ?
• Si facteur avec des valeurs numériques et que l’on veut faire des calculs transformer facteur en vecteur : as.vector()
vec_tricher <- as.vector(tricher)
2- Dépouillement des données
• Règle 1 : les individus sont placés en lignes et les variables en colonnes
• Règle 2 : Aucune case ne doit être vide. Une donnée manquante doit se noter « NA » (not available) sous R.
• Règle 3 : (conseil) Donner un titre à chaque colonne Nom de la variable sous R
Comparaison du bénévolat sportif et des emplois sportifs en Europe (Andreff, 1995)
Titre
Donnée manquante
Variables
Individus
Enregistrer les variables
• Fonction save(score, file="score.Rdata")
• Pour charger variable : load("score.Rdata")
• Enregistrer les variables score, prenom, tricher
• Pour connaitre le répertoire ou sont enregistrées les données : getwd()