Statistiques : exercices
Télécharger Exercices(Sur ce lien, clic droit puis enregister la cible sous...)
Exercice 1
Dans un lycée, on veut comparer les taux de réussite au bac sur deux années différentes.
Pour l'année 97, on note 54 succès pour 62 interrogés.
Pour l'année 98, on note 50 succès pour 56 interrogés.
Le taux de réussite a-t-il évolué entre 97 et 98 ?
Variable étudiée : X : résultat au bac.
C'est une variable qualitative binaire (succès / échec). On effectue donc un test sur les proportions.
Hypothèses : H0 : p97 = p98
H1 : p97 ≠ p98
Paramètre : ε = Loi du paramètre si H0 est vraie : ε ~ N (0;1)
Conditions de validité : n97 . p / 5 et n97 (1 – p) / 5
n98 . p / 5 et n98 (1 – p) / 5
Choix du risque : α = 5 %
Règle de décision : si │εc│< 1, 96 alors je ne rejette pas H0
si │εc│/ 1, 96 alors je rejette H0
Calculs : n97 = 62 n98 = 56
p097= = 0, 87 = 87% p098= = 0, 89 = 89%
p = = 0, 88 = 88%
Validité : n97 . p = 62 3 0,88 = 54,6 > 5 et n97 (1 – p) = 62(1 – 0,12) = 7,4 > 5
n98 . p = 56 3 0, 88 = 49, 3 > 5 et n98 (1 – p) = 56(1 – 0, 12) = 6, 7 > 5
εc = - 0, 33
soit │εc│< 1, 96 alors je ne rejette pas H0
Conclusion : au risque 5%, on ne peut pas rejeter H0. nous n'avons pas mis en évidence de différence significative du taux de réussite au bac entre 97 et 98.
Pas de calcul du degré de signification dans le cas d'un non rejet de H0.
Le taux de réussite en 97 est de 75% selon des sources ministérielles. Les résultats du lycée en question en 97 sont-ils conformes à ce chiffre ?
On s'intéresse uniquement à l'échantillon de données recueilli en 97. il s'agit d'un test de comparaison d'une proportion observée à une valeur de référence.
Variable étudiée : X : le taux de réussite au bac en 97.
C'est une variable qualitative binaire. On effectue donc un test sur les proportions.
Hypothèses : H0 : p97 = pref (ici pref = 75%)
H1 : p97 ≠ pref
Paramètre : ε = Loi du paramètre si H0 est vraie : ε ~ N (0;1)
Conditions de validité : n97 . pref / 5 et n97 (1 – pref) / 5
Choix du risque : α = 5 %
Règle de décision : si │εc│< 1, 96 alors je ne rejette pas H0
si │εc│/ 1, 96 alors je rejette H0
Calculs : n97 = 62
p0= = 0, 87 = 87%
Validité : n97 . pref = 62 3 0, 75 = 46, 5 > 5 et n97(1 – pref) =6230,25 = 15,5 > 5
εc = 2, 18
soit │εc│> 1, 96 alors je rejette H0
Conclusion : au risque 5%, le taux de réussite au bac dans le lycée en 97 diffère significativement de la moyenne nationale (75%). Il est plus élevé.
Calcul du degré de signification dans le cas d'un rejet de H0 :
Pour εc
= 2, 18, on lit dans la table 2.10-2 < α < 3.10-2
D'où p < 3.10-2
Un fabricant de vêtements teste ses produits sur des sportifs. On note dans ce tableau l'appréciation de ces derniers.
|
Très insatisfaits |
Plutôt insatisfaits |
Plutôt satisfaits |
Très satisfaits |
Hommes |
10 |
12 |
15 |
17 |
Femmes |
16 |
14 |
10 |
8 |
Le fabricant veut savoir si l'appréciation des femmes diffère de celle des hommes.
En calculant les proportions observées de personnes très satisfaites chez les hommes et les femmes, ces deux proportions diffèrent-elles significativement ?
On a deux échantillons distincts de nH = 54 et nF = 48.
p0H et p0F sont les proportions de très satisfaits chez les hommes et les femmes.
p0H = = 0,31 = 31% p0F = = 0,17 = 17%
On effectue un test de comparaison de 2 proportions observées.
Hypothèses : H0 : pH = pF
H1 : pH ≠ pF
Paramètre : ε = Loi du paramètre si H0 est vraie : ε ~ N (0;1)
Conditions de validité : nH . p / 5 et nH (1 – p) / 5
nF . p / 5 et nF (1 – p) / 5
Choix du risque : α = 5 %
Règle de décision : si │εc│< 1, 96 alors je ne rejette pas H0
si │εc│/ 1, 96 alors je rejette H0
Calculs : nH = 54 nF = 48
p0H = = 0,31 = 31% p0F = = 0,17 = 17%
p = = 0, 245 = 24,5%
Validité : nH . p = 54 3 0,245 = 13,2 > 5 et nH (1 – p) = 5430,755 = 40,8 > 5
nF . p = 48 3 0,245 = 11,8 > 5 et nF (1 – p) = 4830,755 = 36,24 > 5
εc = 1, 64
soit │εc│< 1, 96 alors je ne rejette pas H0
Conclusion : au risque 5%, on ne peut pas rejeter H0. nous n'avons pas mis en évidence de différence significative entre les proportions de "très satisfaits" chez les hommes et les femmes.
Pas de calcul du degré de signification dans le cas d'un non rejet de H0.
On s'intéresse maintenant aux personnes globalement satisfaites.
On effectue donc un test de comparaison de deux proportions observées.
Soit p0H et p0F sont les proportions observées de globalement satisfaits chez les hommes et les femmes, respectivement.
p0H = = 0,59 = 59% p0F = = 0,375 = 37,5%
p = = 0, 49 = 49%
Validité : nH . p = 54 3 0,49 = 26,5 > 5 et nH (1 – p) = 5430,51 = 27,5 > 5
nF . p = 48 3 0,49 = 23,5 > 5 et nF (1 – p) = 4830,51 = 24,5 > 5
εc = 2, 168
soit │εc│> 1, 96 alors je rejette H0
Conclusion : au risque 5%, la proportion de personnes satisfaites des vêtements de sport diffère significativement entre les hommes et les femmes : les hommes sont plus satisfaits.
Calcul du degré de signification dans le cas d'un rejet de H0 :
Pour εc = 2, 168, on lit dans la
table 3.10-2 < α < 4.10-2
D'où p < 4.10-2
Exercice 3
On veut comparer la rapidité des enfants selon leur sexe. Un parcours d'obstacles leur est proposé. On note les temps.
Filles : 32 44 26 28 25 36 29 32 35 41 40 32 25 21 30 39 41 28 27 32 40 28
Garçons : 45 40 38 29 42 39 31 37 32 28 41 48
Tracer l'histogramme des 2 séries avec des amplitudes de 5 sec.
Variable étudiée : X : le temps mis pour parcourir le parcours d'obstacles.
C'est une variable quantitative continue.
On discrétise la variable par classe.
Classe |
[20 – 25 [ |
[25 – 30 [ |
[30 – 35 [ |
[35 – 40 [ |
[40 – 45 [ |
Effectif |
1 |
8 |
5 |
3 |
5 |
Fréquence |
1 / 22 |
8 / 22 |
5 / 22 |
3 / 22 |
5 / 22 |
Hauteur |
0,045 |
0,364 |
0,227 |
0,136 |
0,227 |
Filles :
Classe |
[20 – 25 [ |
[25 – 30 [ |
[30 – 35 [ |
[35 – 40 [ |
[40 – 45 [ |
Effectif |
2 |
2 |
3 |
3 |
2 |
Fréquence |
2 / 12 |
2 / 12 |
3 / 12 |
3 / 12 |
2 / 12 |
Hauteur |
0,17 |
0,17 |
0,25 |
0,25 |
0,17 |
Garçons :
Trouver la valeur médiane chez les filles et les garçons.
Il faut ranger par ordre croissant les données, et prendre la valeur du milieu
Filles : 32 sec
Garçons : 38, 5 sec (lorsque le nombre de données est pair, faire la moyenne entre les deux valeurs).
SxiF = 711 sec Sx = 23 825 sec²
SxiG = 450 sec Sx = 17 318 sec²
= = 32,3 sec s= 39, 66 sec² s= 6,30 sec
= = 37,5 sec s= 36, 92 sec² s= 6,08 sec
On est dans le cas des petits échantillons.
Soit IC90% (µ) =
Pour les filles : on cherche dans la table de la loi de Student.
a = 10%
k = 21 ddl
t= 1, 721
Pour les garçons :
a = 10%
k = 11 ddl
t= 1, 796
♀ : IC90% (µF) =
= 32,3 6 1,721 •
= [30,0 ; 34,6]
♂ : IC90%
(µG) =
= 37,5 61,796 •
= [34,3 ; 40,7]
Voit-on une différence entre la moyenne des filles et celle des garçons ?
C'est une variable quantitative continue. On effectue un test de comparaison de moyennes.
On a deux groupes distincts. On veut voir si les performances moyennes des deux échantillons sont égales ou non.
On fait un test de comparaison de deux moyennes observées dans les petits échantillons.
Hypothèses : H0 : µF = µG
H1 : µF ≠ µG
Paramètre : t = Loi du paramètre si H0 est vraie : t ~ S (nF + nG - 2)
Choix du risque : α = 5 %
Règle de décision : si │tc│< t alors je ne rejette pas H0
si │tc│/ t alors je rejette H0
Calculs : k = 22 + 12 –2 = 32 ddl
s² = 38,7 sec²
tc = - 2, 33 avec t = 1, 96
soit │tc│> 1, 96 alors je rejette H0
Conclusion : au risque 5%, il existe une différence significative entre les filles et les garçons au niveau du temps mis pour effectuer le parcours d'obstacles. Les filles sont plus rapides.
Calcul du degré de signification dans le cas d'un rejet de H0.
Pour tc = 2, 33, on lit dans la table la ligne du
nombre de ddl et on voit que 2.10-2 > α > 1.10-2
D'où p < 2.10-2
Exercice 4
On a compté le nombre d'absent au cours d'EPS au 1er semestre.
Nombre d'absents |
0 |
1 |
2 |
3 |
8 |
Nombre de séances |
6 |
8 |
4 |
2 |
1 |
Variable étudiée : X : le nombre d'absents.
C'est une variable quantitative discrète.
xi : les différentes modalités de la variable
ni : les effectifs
xi |
0 |
1 |
2 |
3 |
8 |
ni |
6 |
8 |
4 |
2 |
1 |
ni xi |
0 |
8 |
8 |
6 |
8 |
x²i |
0 |
1 |
4 |
9 |
64 |
ni x²i |
0 |
8 |
16 |
18 |
64 |
Nombre d'absents
Nombre de séances
Sni = 21 Sni xi = 30 Sni x²i = 106
Caractéristiques de position :
· moyenne : = = 1,43
· médiane : 1
· mode : 1
Caractéristiques de dispersion :
· variance : s² = 3,00
· écart-type : s = 1,73
· étendue : e = 8 – 0 = 8
En effectuant un diagramme en bâtons, on constate que la distribution n'est pas symétrique.
On constate qu'il y a 33% ( ) de valeurs supérieures à la moyenne (1,43), et que 50% des valeurs sont de part et d'autre de la médiane. Ces deux faits résument bien la dissymétrie de la distribution.
Exercice 5
On teste deux boissons énergétiques qui ont pour but une meilleure récupération de la fréquence cardiaque normale d'un individu. Sur des athlètes, on note le temps de récupération avec les deux boissons.
Athlète |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
Boisson I |
123 |
132 |
109 |
110 |
121 |
101 |
105 |
124 |
121 |
106 |
111 |
Boisson II |
127 |
131 |
105 |
113 |
125 |
112 |
106 |
137 |
116 |
119 |
128 |
Calculer le temps de récupération
moyen et l'intervalle de confiance à 90% avec la boisson I.
Variable étudiée : X : le temps de récupération après l'effort.
C'est une variable quantitative continue.
= = 114,82 sec
On est dans le cas des petits échantillons.
t = 1,812 (voir table de la loi de Student)
IC90%
(µ) =
=
[109,7 ; 119,9]
Avec la boisson I :
SxiI = 1263 sec Sx = 145 975 sec²
s = 86,82 sec² sI = 9,32 sec
La vitesse de récupération est-elle différente selon la boisson ?
On effectue un test de comparaison de deux moyennes sur séries appariées (dans le cas des petits échantillons).
Athlète |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
Boisson I |
123 |
132 |
109 |
110 |
121 |
101 |
105 |
124 |
121 |
106 |
111 |
Boisson II |
127 |
131 |
105 |
113 |
125 |
112 |
106 |
137 |
116 |
119 |
128 |
D =
XII
– XI |
4 |
-1 |
-4 |
3 |
4 |
11 |
1 |
13 |
-5 |
13 |
17 |
D² |
16 |
1 |
16 |
9 |
16 |
121 |
1 |
169 |
25 |
169 |
289 |
Hypothèses : H0 : µD = 0
H1 : µD ≠ 0
Paramètre : t = Loi du paramètre si H0 est vraie : t ~ S (n - 1)
Choix du risque : α = 5 %
Règle de décision : si │tc│< t alors je ne rejette pas H0
si │tc│> t alors je rejette H0
Calculs : n = 11
Sxid = 56 sec
Sx = 832 sec²
D= 5, 09 sec
sD = 7, 05 sec
tc = 2, 39 avec t = 2, 228
soit │tc│> 2, 39 alors je rejette H0
Conclusion : au risque 5%, le temps de récupération diffère significativement selon la boisson. La I est la meilleure.
Calcul du degré de signification dans le cas d'un rejet de H0 :
Pour tc = 2, 39, on lit dans la table la ligne du
nombre de ddl et on voit que 5.10-2 > α > 2.10-2
D'où p < 5.10-2