Statistiques : exercices

Télécharger Exercices(Sur ce lien, clic droit puis enregister la cible sous...)

 

Exercice 1

 

Dans un lycée, on veut comparer les taux de réussite au bac sur deux années différentes.

Pour l'année 97, on note 54 succès pour 62 interrogés.

Pour l'année 98, on note 50 succès pour 56 interrogés.

Le taux de réussite a-t-il évolué entre 97 et 98 ?

 

Variable étudiée : X : résultat au bac.

C'est une variable qualitative binaire (succès / échec). On effectue donc un test sur les proportions.

 

Hypothèses : H0 : p97 = p98                  

H1 : p97 ≠ p98 

 

Paramètre : ε =             Loi du paramètre si H0 est vraie : ε ~ N (0;1)

 

 

Conditions de validité :          n97 . p / 5              et       n97 (1 – p) / 5

n98 . p / 5              et       n98 (1 – p) / 5

 

Choix du risque : α = 5 %

 

Règle de décision : si │εc│< 1, 96 alors je ne rejette pas H0

si │εc/ 1, 96 alors je rejette H0

 

Calculs : n97 = 62 n98 = 56

p097=  = 0, 87 = 87%    p098=  = 0, 89 = 89%

p =  = 0, 88 = 88%

Validité : n97 . p = 62 3 0,88 = 54,6 > 5         et       n97 (1 – p) = 62(1 – 0,12) = 7,4 > 5

n98 . p = 56 3 0, 88 = 49, 3 > 5     et       n98 (1 – p) = 56(1 – 0, 12) = 6, 7 > 5

εc = - 0, 33

soit │εc│< 1, 96 alors je ne rejette pas H0

 

Conclusion : au risque 5%, on ne peut pas rejeter H0. nous n'avons pas mis en évidence de différence significative du taux de réussite au bac entre 97 et 98.

 

Pas de calcul du degré de signification dans le cas d'un non rejet de H0.

 

Le taux de réussite en 97 est de 75% selon des sources ministérielles. Les résultats du lycée en question en 97 sont-ils conformes à ce chiffre ?

 

On s'intéresse uniquement à l'échantillon de données recueilli en 97. il s'agit d'un test de comparaison d'une proportion observée à une valeur de référence.

 

Variable étudiée : X : le taux de réussite au bac en 97.

                   C'est une variable qualitative binaire. On effectue donc un test sur les proportions.

 

Hypothèses : H0 : p97 = pref                    (ici pref = 75%)

H1 : p97 ≠ pref 

 

Paramètre : ε =               Loi du paramètre si H0 est vraie : ε ~ N (0;1)

 

 

Conditions de validité :          n97 . pref / 5           et       n97 (1 – pref) / 5

 

Choix du risque : α = 5 %

 

Règle de décision : si │εc│< 1, 96 alors je ne rejette pas H0

si │εc/ 1, 96 alors je rejette H0

 

Calculs : n97 = 62

p0=  = 0, 87 = 87%

Validité : n97 . pref = 62 3 0, 75 = 46, 5 > 5    et       n97(1 – pref) =6230,25 = 15,5 > 5

εc = 2, 18

soit │εc│> 1, 96 alors je rejette H0

 

Conclusion : au risque 5%, le taux de réussite au bac dans le lycée en 97 diffère significativement de la moyenne nationale (75%). Il est plus élevé.

 

Calcul du degré de signification dans le cas d'un rejet de H0 :

Pour εc = 2, 18, on lit dans la table 2.10-2 < α < 3.10-2

D'où p < 3.10-2

 

 

Exercice 2

 

Un fabricant de vêtements teste ses produits sur des sportifs. On note dans ce tableau l'appréciation de ces derniers.

 

 

Très insatisfaits

Plutôt insatisfaits

Plutôt satisfaits

Très satisfaits

Hommes

10

12

15

17

Femmes

16

14

10

8

 

Le fabricant veut savoir si l'appréciation des femmes diffère de celle des hommes.

En calculant les proportions observées de personnes très satisfaites chez les hommes et les femmes, ces deux proportions diffèrent-elles significativement ?

 

On a deux échantillons distincts de nH = 54 et nF = 48.

p0H et p0F sont les proportions de très satisfaits chez les hommes et les femmes.

 

p0H = = 0,31 = 31%  p0F = = 0,17 = 17%

 

On effectue un test de comparaison de 2 proportions observées.

 

Hypothèses : H0 : pH = pF                     

H1 : pH ≠ pF 

 

Paramètre : ε =             Loi du paramètre si H0 est vraie : ε ~ N (0;1)

 

 

Conditions de validité :          nH . p / 5               et       nH (1 – p) / 5

nF . p / 5               et       nF (1 – p) / 5

 

Choix du risque : α = 5 %

 

Règle de décision : si │εc│< 1, 96 alors je ne rejette pas H0

si │εc/ 1, 96 alors je rejette H0

 

Calculs : nH = 54  nF = 48

p0H = = 0,31 = 31%     p0F = = 0,17 = 17%

p =  = 0, 245 = 24,5%

Validité :        nH . p = 54 3 0,245 = 13,2 > 5          et       nH (1 – p) = 5430,755 = 40,8 > 5

nF . p = 48 3 0,245 = 11,8 > 5      et       nF (1 – p) = 4830,755 = 36,24 > 5

εc = 1, 64

soit │εc│< 1, 96 alors je ne rejette pas H0

 

Conclusion : au risque 5%, on ne peut pas rejeter H0. nous n'avons pas mis en évidence de différence significative entre les proportions de "très satisfaits" chez les hommes et les femmes.

 

Pas de calcul du degré de signification dans le cas d'un non rejet de H0.

 

 

On s'intéresse maintenant aux personnes globalement satisfaites.

 

On effectue donc un test de comparaison de deux proportions observées.

 

Soit p0H et p0F sont les proportions observées de globalement satisfaits chez les hommes et les femmes, respectivement.

 

p0H = = 0,59 = 59%     p0F = = 0,375 = 37,5%

p =  = 0, 49 = 49%

Validité :        nH . p = 54 3 0,49 = 26,5 > 5  et       nH (1 – p) = 5430,51 = 27,5 > 5

nF . p = 48 3 0,49 = 23,5 > 5        et       nF (1 – p) = 4830,51 = 24,5 > 5

εc = 2, 168

soit │εc│> 1, 96 alors je rejette H0

 

Conclusion : au risque 5%, la proportion de personnes satisfaites des vêtements de sport diffère significativement entre les hommes et les femmes : les hommes sont plus satisfaits.

 

Calcul du degré de signification dans le cas d'un rejet de H0 :

 Pour εc = 2, 168, on lit dans la table 3.10-2 < α < 4.10-2

D'où p < 4.10-2

 

 

Exercice 3

 

On veut comparer la rapidité des enfants selon leur sexe. Un parcours d'obstacles leur est proposé. On note les temps.

 

Filles :          32      44      26      28      25      36      29      32      35      41      40      32      25      21      30      39      41      28      27      32      40      28

 

Garçons :     45      40      38      29      42      39      31      37      32      28      41      48

 

Tracer l'histogramme des 2 séries avec des amplitudes de 5 sec.

 

Variable étudiée : X : le temps mis pour parcourir le parcours d'obstacles.

                   C'est une variable quantitative continue.

On discrétise la variable par classe.

 

Classe

[20 – 25 [

[25 – 30 [

[30 – 35 [

[35 – 40 [

[40 – 45 [

Effectif

1

8

5

3

5

Fréquence

1 / 22

8 / 22

5 / 22

3 / 22

5 / 22

Hauteur

0,045

0,364

0,227

0,136

0,227

Filles :

 

 

 

 

Classe

[20 – 25 [

[25 – 30 [

[30 – 35 [

[35 – 40 [

[40 – 45 [

Effectif

2

2

3

3

2

Fréquence

2 / 12

2 / 12

3 / 12

3 / 12

2 / 12

Hauteur

0,17

0,17

0,25

0,25

0,17

Garçons :

 

 

 

 

 

 

 

 

 

 

 

 

 

Trouver la valeur médiane chez les filles et les garçons.

Il faut ranger par ordre croissant les données, et prendre la valeur du milieu

Filles : 32 sec

Garçons : 38, 5 sec (lorsque le nombre de données est pair, faire la moyenne entre les deux valeurs).

 

Calculer les temps moyens expérimentaux ( et ) et l'intervalle de confiance à 90% de la moyenne vraie (µ).

 

SxiF = 711 sec               Sx = 23 825 sec²

SxiG = 450 sec               Sx = 17 318 sec²

 

 = = 32,3 sec               s= 39, 66 sec²              s= 6,30 sec

 = = 37,5 sec               s= 36, 92 sec²             s= 6,08 sec

 

On est dans le cas des petits échantillons.

 

Soit              IC90% (µ) =

 

Pour les filles : on cherche dans la table de la loi de Student.

a = 10%

k = 21 ddl

t= 1, 721

 

Pour les garçons :

a = 10%

k = 11 ddl

t= 1, 796

 


♀ :     IC90%F) =

                             = 32,3 6 1,721 •

                             = [30,0 ; 34,6]

 

♂ :     IC90%G) =

                             = 37,5 61,796 •

                             = [34,3 ; 40,7]


Voit-on une différence entre la moyenne des filles et celle des garçons ?

 

C'est une variable quantitative continue. On effectue un test de comparaison de moyennes.

On a deux groupes distincts. On veut voir si les performances moyennes des deux échantillons sont égales ou non.

On fait un test de comparaison de deux moyennes observées dans les petits échantillons.

 

Hypothèses : H0 : µF = µG                     

H1 : µFµG 

 

Paramètre : t =             Loi du paramètre si H0 est vraie : t ~ S (nF + nG - 2)

 

 

Choix du risque : α = 5 %

 

Règle de décision : si │tc│< t alors je ne rejette pas H0

si │tc/ t alors je rejette H0

 

Calculs : k = 22 + 12 –2 = 32 ddl

s² = 38,7 sec²

tc = - 2, 33      avec  t = 1, 96

soit │tc│> 1, 96 alors je rejette H0

 

Conclusion : au risque 5%, il existe une différence significative entre les filles et les garçons au niveau du temps mis pour effectuer le parcours d'obstacles. Les filles sont plus rapides.

 

Calcul du degré de signification dans le cas d'un rejet de H0.

Pour tc = 2, 33, on lit dans la table la ligne du nombre de ddl et on voit que 2.10-2 > α > 1.10-2

D'où p < 2.10-2

 

 

Exercice 4

 

On a compté le nombre d'absent au cours d'EPS au 1er semestre.

 

Nombre d'absents

0

1

2

3

8

Nombre de séances

6

8

4

2

1

 

Variable étudiée : X : le nombre d'absents.

                   C'est une variable quantitative discrète.

 

xi : les différentes modalités de la variable

ni : les effectifs

 

xi

0

1

2

3

8

ni

6

8

4

2

1

ni xi

0

8

8

6

8

i

0

1

4

9

64

nii

0

8

16

18

64

          Nombre d'absents                   

          Nombre de séances

 

 

 

 

Sni = 21               Sni xi = 30            Snii = 106

 

Caractéristiques de position :

·        moyenne : = = 1,43

·        médiane : 1

·        mode : 1

 

 

 

Caractéristiques de dispersion :

·        variance : s² = 3,00

·        écart-type : s = 1,73

·        étendue : e = 8 – 0 = 8

 

En effectuant un diagramme en bâtons, on constate que la distribution n'est pas symétrique.

 

On constate qu'il y a 33% ( ) de valeurs supérieures à la moyenne (1,43), et que 50% des valeurs sont de part et d'autre de la médiane. Ces deux faits résument bien la dissymétrie de la distribution.

 

 

Exercice 5

 

On teste deux boissons énergétiques qui ont pour but une meilleure récupération de la fréquence cardiaque normale d'un individu. Sur des athlètes, on note le temps de récupération avec les deux boissons.

 

Athlète

1

2

3

4

5

6

7

8

9

10

11

Boisson I

123

132

109

110

121

101

105

124

121

106

111

Boisson II

127

131

105

113

125

112

106

137

116

119

128

 

Calculer le temps de récupération moyen et l'intervalle de confiance à 90% avec la boisson I.

 

Variable étudiée : X : le temps de récupération après l'effort.

                   C'est une variable quantitative continue.

 

 =  = 114,82 sec

 

On est dans le cas des petits échantillons.

 

t = 1,812 (voir table de la loi de Student)

 

IC90% (µ) =

                             = [109,7 ; 119,9]

 

Avec la boisson I :

                   SxiI = 1263 sec              Sx = 145 975 sec²

                   s = 86,82 sec²              sI = 9,32 sec

 

La vitesse de récupération est-elle différente selon la boisson ?

 

On effectue un test de comparaison de deux moyennes sur séries appariées (dans le cas des petits échantillons).

 

 

 

 

 

Athlète

1

2

3

4

5

6

7

8

9

10

11

Boisson I

123

132

109

110

121

101

105

124

121

106

111

Boisson II

127

131

105

113

125

112

106

137

116

119

128

D = XII – XI

4

-1

-4

3

4

11

1

13

-5

13

17

16

1

16

9

16

121

1

169

25

169

289

 

Hypothèses : H0 : µD = 0

H1 : µD ≠ 0

 

Paramètre : t =            Loi du paramètre si H0 est vraie : t ~ S (n - 1)

 

 

Choix du risque : α = 5 %

 

Règle de décision : si │tc│< t alors je ne rejette pas H0

si │tc│> t alors je rejette H0

 

Calculs : n = 11

Sxid = 56 sec

Sx = 832 sec²

D= 5, 09 sec

sD = 7, 05 sec

tc = 2, 39         avec t = 2, 228

soit │tc│> 2, 39 alors je rejette H0

 

Conclusion : au risque 5%, le temps de récupération diffère significativement selon la boisson. La I est la meilleure.

 

Calcul du degré de signification dans le cas d'un rejet de H0 :

Pour tc = 2, 39, on lit dans la table la ligne du nombre de ddl et on voit que 5.10-2 > α > 2.10-2

D'où p < 5.10-2