Caractéristiques de forme

Quelques remarques sur les coefficients d'asymétrie et d'aplatissement

Le coefficient d'asymétrie (Sk, skewness en anglais) et le coefficient d'aplatissement (K, kurtosis en anglais) sont définis classiquement pour une variable X sur une population d'effectif n par :

Le coefficient Sk évalue le défaut de symétrie d'une distribution. Il est nul pour une distribution symétrique (par exemple une distribution normale, ou une distribution binomiale avec p=0,5). Il est positif pour une distribution "étalée à droite".

Par exemple, si X suit une loi binomiale de paramètres N=10 et p=0,2, on obtient : Sk = 0,47 :

Il est négatif pour une distribution étalée à gauche. Par exemple, si X suit une loi binomiale de paramètres N=12 et p=0,7, on obtient Sk = -0,25 :

Le coefficient d'aplatissement (K, kurtosis en anglais) évalue la dispersion des valeurs "extrêmes" par référence à la loi normale. Il est nul pour une distribution normale, négatif pour une distribution moins "aplatie" qu'une distribution normale et positif sur une distribution plus aplatie qu'une distribution normale. A l'usage, cette notion d'aplatissement n'est pas si simple. Ainsi K est négatif pour une distribution uniforme, donc considérée comme moins aplatie qu'une distribution normale. Par exemple, on obtient K = -2 pour la distribution de Bernouilli de paramètre p=0,5. Mais, K est positif sur les distributions T de Student, par exemple. En utilisant un générateur de nombres aléatoires selon une distribution donnée, on obtient par exemple :

Calcul par les logiciels usuels : Excel, Statistica, R

Les fonctions COEFFICIENT.ASYMETRIE() et KURTOSIS() d'Excel fournissent des estimations des coefficients précédents, en considérant la série statistique comme un échantillon tiré d'une population. Les formules définissant ces estimations sont les suivantes :

Exemple : considérons la série statistique : 2, 4, 5, 6, 6, 6, 8, 8, 9, 10, 10, 12.

On obtient avec Excel :

=COEFFICIENT.ASYMETRIE(2;4;5;6;6;6;8;8;9;10;10;12)
-0,08854
=KURTOSIS(2;4;5;6;6;6;8;8;9;10;10;12)
-0,41062

Pour cette série, les coefficents Sk et K définis précédemment valent respectivement : Sk = -0,0771 et K = -0,7200.

Le menu Statistiques - Statistiques Descriptives de Statistica permet de calculer ces coefficients, avec des formules identiques à celles d'Excel. On obtient ainsi, sur la série précédente :

Statistiques Descriptives (Feuille de données1 dans Classeur1)

 

N Actifs

Moyenne

Minimum

Maximum

Ecart-type

Asymétrie

Aplatissement

Serie

12

7,1667

2,0000

12,0000

2,8551

-0,0885

-0,4106

Pour le logiciel de traitements statistiques R (cf. http://www.r-project.org), les fonctions skewness() et kurtosis() sont disponibles dans le package e1071. Comme le montre le calcul ci-dessous :

> library(e1071)
> serie <- c(2,4,5,6,6,6,8,8,9,10,10,12)
> skewness(serie)
[1] -0.0676344
> kurtosis(serie)
[1] -1.084144

ce ne sont ni les formules théoriques pour une population, ni les formules d'estimation d'Excel ou Statistica, mais les formules suivantes :

dans lesquelles sc désigne l'écart type corrigé.

On vérifie par exemple que :

> ((12/11)^1.5)*skewness(serie)
[1] -0.07706381

De même :

> (12/11)^2*(kurtosis(serie)+3)-3
[1] -0.7199735