Statistiques descriptives

Télécharger stats descriptives(Sur ce lien, clic droit puis enregister la cible sous...)

 

Objectifs :

-         rassembler des données numériques

-         les représenter sous forme de graphique

-         en résumer l'information sous une forme condensée, plus accessible, plus commode

 

I.                   Généralités sur des distributions statistiques

 

1.      Variable statistique

 

C'est une caractéristique des individus constituant la série étudiée.

Deux catégories principales de variables :

 

-         variable ordinale : peut bénéficier d'un classement ordonné (intensité de la douleur)

-         variable nominale ou qualitative pure (couleur des yeux)

 

-         variables discrètes : nombre fini de valeurs (nombre d'enfants dans une famille)

-         variables continues : nombre infini de valeurs (taille, poids…)

 

On transforme souvent une variable continue en variable discrète.

 

La discrétisation

C'est une variable quantitative continue. La discrétisation s'effectue en un groupement par classe d'âge.

 

Âge

Nombre d'élèves

[11 – 13 [

96

[13 – 15 [

Variable discrète à 5 classes

88

[15 – 17 [

102

[17 – 19 [

45

[19 – 21 [

6

 

C'est une variable quantitative continue. La discrétisation s'effectue en un groupement par classe d'amplitude de 5 minutes.

 

Performance

Nombre d'athlètes

[140 – 145 [

Variable discrète à 7 classes

2

[145 – 150 [

5

[150 – 155 [

10

[155 – 160 [

15

[160 – 165 [

17

[165 – 170 [

9

[170 – 175 [

11

 

 

2.      Distribution statistique à une variable

 

Notation :

X la variable aléatoire

x la réalisation de la variable aléatoire

 

échantillon : obtenu par tirage aléatoire d'éléments dans une population de référence. Il est représentatif de la population de référence.

 

Soit un échantillon de taille n.

X va prendre les valeurs x1, x2,…, xn pour les éléments 1, 2,…, n de la série.

L'ensemble des valeurs x correspondant à chacun des éléments de l'échantillon constitue la distribution statistique de X.

 

1re étape : mise en ordre des données, construction d'un tableau de répartition.

Exemple : l'âge des 23 étudiants d'un groupe de TD

-         nature de la variable : quantitative discrète

-         nombre de modalités : 6

-         tableau de répartition

 

xi

18

19

20

21

22

26

S

ni

1

8

7

5

1

1

23

fi

0.04

0.35

0.3

0.22

0.04

0.04

1

 

S ni = n

 

S fi = 1

 

II.                Représentation graphique

 

Elle dépend de la nature de la variable.

 

1.      Variable qualitative

 

Qualitative ordinale : diagramme en bâtons

Qualitative nominale : diagramme à secteurs (camembert)

 

2.      Variable quantitative

 

Quantitative discrète : diagramme en bâtons

Quantitative continue : histogramme

 

Exemple :

Nombre d'enfants parmi 53 familles

 

Enfants

Familles

1

10

2

Variable quantitative discrète, 6 modalités.

20

3

15

4

Diagramme en bâtons

5

5

3

> 5

0

On interroge des garçons à leur entrée en 6e pour connaître le sport qu'ils pratiquent.

 

 

1985

1990

Variable : sport pratiqué par les garçons en 6e

1998

Football

36

37

Nature : qualitative nominale

52

Tennis

24

25

11

Athlétisme

13

18

Diagramme à secteurs

Autres

34

41

44

 

Calculer la fréquence de chaque sport avec l'effectif total de chaque année.

 

III.             Paramètre d'une distribution statistique

 

1.      Paramètre de position.

 

Moyenne : la moyenne arithmétique d'une série de n mesures x1, x2,…, xn est définie par

 

                                   =

 

si les données sont regroupées par modalités, on pondère chaque valeur xi par son effectif ni :

 

=

 

Mode : valeur la plus fréquente. Pour une variable continue avec regroupement en classes, c'est une classe modale.

 

Médiane : valeur qui partage l'échantillon en deux groupes de même effectifs (nécessite de réaliser au préalable un tri des valeurs selon un ordre croissant).

Si l'effectif est pair, on fait la moyenne des valeurs encadrant la médiane.

 

L'exemple des 23 étudiants :

 

Moyenne : = = 20, 1 ans

 

Mode : 19 ans

Médiane : 20 ans (12e valeur)

 

 

 

 

 

2.      Paramètres de dispersion

 

Ils renseignent sur l'étalement de la distribution.

 

 

Valeurs extrêmes : plus petite et plus grande des valeurs.

Étendue : différence entre les valeurs extrêmes.

 

Variance : s² = ( S xi² - n( )

 

Si les données sont regroupées par modalité de la variable :

 

s² = ( S ni xi² - n( )

 

écart-type : s =