Statistiques descriptives
Télécharger stats descriptives(Sur ce lien, clic droit puis enregister la cible sous...)
Objectifs :
-
rassembler des
données numériques
-
les représenter sous
forme de graphique
-
en résumer
l'information sous une forme condensée, plus accessible, plus commode
1.
Variable statistique
C'est une caractéristique
des individus constituant la série étudiée.
Deux catégories
principales de variables :
-
variable ordinale :
peut bénéficier d'un classement ordonné (intensité de la douleur)
-
variable nominale ou
qualitative pure (couleur des yeux)
-
variables discrètes
: nombre fini de valeurs (nombre d'enfants dans une famille)
-
variables continues
: nombre infini de valeurs (taille, poids…)
On transforme souvent une
variable continue en variable discrète.
C'est une variable
quantitative continue. La discrétisation s'effectue en un groupement par classe
d'âge.
Âge |
Nombre d'élèves |
|
[11 – 13 [ |
96 |
|
[13 – 15 [ |
Variable discrète à
5 classes |
|
[15 – 17 [ |
102 |
|
[17 – 19 [ |
45 |
|
[19 – 21 [ |
6 |
C'est une variable
quantitative continue. La discrétisation s'effectue en un groupement par classe
d'amplitude de 5 minutes.
Performance |
Nombre d'athlètes |
|
[140 – 145 [ |
Variable discrète à
7 classes |
|
[145 – 150 [ |
5 |
|
[150 – 155 [ |
10 |
|
[155 – 160 [ |
15 |
|
[160 – 165 [ |
17 |
|
[165 – 170 [ |
9 |
|
[170 – 175 [ |
11 |
2.
Distribution
statistique à une variable
Notation :
X la variable aléatoire
x la réalisation de la
variable aléatoire
échantillon : obtenu par tirage aléatoire d'éléments dans une
population de référence. Il est représentatif de la population de référence.
Soit un échantillon de
taille n.
X va prendre les valeurs
x1, x2,…, xn pour les éléments 1, 2,…, n de la
série.
L'ensemble des valeurs x
correspondant à chacun des éléments de l'échantillon constitue la distribution
statistique de X.
1re étape : mise en ordre des données, construction d'un
tableau de répartition.
Exemple : l'âge des 23
étudiants d'un groupe de TD
-
nature de la
variable : quantitative discrète
-
nombre de modalités
: 6
-
tableau de
répartition
xi |
18 |
19 |
20 |
21 |
22 |
26 |
S |
ni |
1 |
8 |
7 |
5 |
1 |
1 |
23 |
fi |
0.04 |
0.35 |
0.3 |
0.22 |
0.04 |
0.04 |
1 |
S ni = n
S fi = 1
Elle dépend de la nature
de la variable.
1.
Variable
qualitative
Qualitative ordinale : diagramme en bâtons
Qualitative nominale : diagramme à secteurs (camembert)
2.
Variable
quantitative
Quantitative discrète : diagramme en bâtons
Quantitative continue : histogramme
Exemple :
Nombre d'enfants parmi 53
familles
Enfants |
Familles |
|
1 |
10 |
|
2 |
Variable
quantitative discrète, 6 modalités. |
|
3 |
15 |
|
4 |
Diagramme en bâtons |
|
5 |
3 |
|
> 5 |
0 |
On interroge des garçons
à leur entrée en 6e pour connaître le sport qu'ils pratiquent.
|
1985 |
1990 |
Variable : sport
pratiqué par les garçons en 6e |
|
Football |
36 |
37 |
Nature :
qualitative nominale |
|
Tennis |
24 |
25 |
11 |
|
Athlétisme |
13 |
18 |
Diagramme à
secteurs |
|
Autres |
34 |
41 |
44 |
Calculer la fréquence de
chaque sport avec l'effectif total de chaque année.
1.
Paramètre de
position.
Moyenne : la moyenne arithmétique d'une série de n
mesures x1, x2,…, xn est définie par
=
si les données sont
regroupées par modalités, on pondère chaque valeur xi par son
effectif ni :
=
Mode : valeur la plus fréquente. Pour une variable
continue avec regroupement en classes, c'est une classe modale.
Médiane : valeur qui partage l'échantillon en deux
groupes de même effectifs (nécessite de réaliser au préalable un tri des
valeurs selon un ordre croissant).
Si l'effectif est pair,
on fait la moyenne des valeurs encadrant la médiane.
L'exemple des 23
étudiants :
Moyenne : = = 20, 1 ans
Mode : 19 ans
Médiane : 20 ans (12e valeur)
2.
Paramètres de
dispersion
Ils renseignent sur
l'étalement de la distribution.
Valeurs extrêmes : plus petite et plus grande des valeurs.
Étendue : différence entre les valeurs extrêmes.
Variance : s² = ( S xi² - n( )²)
Si les données sont
regroupées par modalité de la variable :
s² = ( S ni xi² - n( )²)
écart-type : s =