Analyse factorielle des correspondances - Elections présidentielles 2017
On se propose ici d'étudier les résultats du premier tour de l'élection
présidentielle 2017 à l'aide d'une analyse factorielle des
correspondances. On croise les candidats (modalités colonnes) avec des
circonscriptions administratives (modalités lignes), afin de mettre en
évidence la variabilité territoriale du vote pour l'un ou l'autre des
candidats.
En ce qui concerne les circonscriptions administratives, plusieurs choix sont possibles :
- Les départements et territoires auxquels s'ajoute la catégorie "français de l'étranger" (107 modalités)
- Les régions d'avant 2016 (22 régions métropolitaines + une "région" outremer/étranger)
- Les nouvelles régions (13 régions métropolitaines + outremer/étranger).
En ce qui concerne les circonscriptions, considérer les régions plutôt
que les départements permet de réduire le nombre de modalités et donc
d'obtenir des résultats plus faciles à interpréter. Mais en utilisant
des circonscriptions trop vastes, on risque de neutraliser la
variabilité territoriale des votes.
En ce qui concerne les candidats, on se réserve la possibilité
d'éliminer (ou de placer en élément supplémentaire) un candidat ayant
obtenu un faible score, et dont la répartition des voix serait trop
"exotique".
Les données du premier tour ont été recopiées à partir du site du
Ministère de
l'Intérieur entre le mardi 25/04/2017 et le jeudi 27/04/2017.
Quelques écarts mineurs avec les données définitives publiées sur ce
site peuvent être relevés. Celles du second tour ont été recopiées à
partir du même site les jeudi 11/05/2017 et vendredi 12/05/2017. Les
traitements ont été réalisés sous
Statsoft Statistica 10.
Lien vers le fichier de données du premier tour (format Excel 2010) : Presidentielles-2017-v2.xlsx.
Lien vers le fichier de données rassemblant les deux tours : Presidentielles-2017-v3.xlsx
Premier essai
Il est tentant de tenir compte de l'abstention en l'intégrant en tant
que 12ème candidat. Mais celle-ci se révèle trop spécifique du vote
"outremer/étranger" et les résultats mettent essentiellement cet aspect
en évidence.
Deuxième essai
On croise les 14 nouvelles régions avec les 11 candidats. Les résultats
(non présentés ici) sont alors difficiles à interpréter. En effet, dès
le 2ème axe, c'est le particularisme du vote Lassalle (concentré dans
les Pyrénées Atlantiques, la Corse, etc) et celui de la région Corse
(10 fois moins peuplée que les autres) qui est mis en évidence, ce qui
masque des aspects plus intéressants tels que le vote Hamon, le votre
Mélenchon, etc.
Troisième essai
On croise les 14 nouvelles régions avec 10 candidats (on ne tient pas compte du vote Lassalle).
Le premier axe représente alors 80% de l'inertie totale, le second
n'atteint pas 10%. Autrrement dit, le phénomène étudié est, dans une
large mesure, unidimensionnel. On poursuit cependant l'étude sur les
deux premiers axes.
Les qualités de représentation sont excellentes pour Hamon, Macron, Le
Pen, Fillon, passable pour Mélanchon (61%), assez mauvaises pour les
"petits candidats".
Analyse du premier axe :
Le Pen (partie négative de l'axe) représente 67% de l'inertie de cet
axe. Macron (partie positive de l'axe) en représente 19%. Clairement,
cet axe oppose Le Pen à Macron, mais les autres "grands candidats" ont,
comme Macron, un score positif sur cet axe.
S'agissant des régions, on trouve en partie positive de l'axe notamment
l'Ile de France, la Bretagne et en partie négative le Grand-Est, les
Hauts de France, la région PACA.
Analyse du second axe :
Fillon (partie positive de l'axe) représente 63% de son inertie et
s'oppose à Hamon (11% d'inertie) et Mélanchon (19% d'inertie), en
partie négative de l'axe. Macron et Le Pen sont quasiment absents de
cet axe (moins de 0,7% d'inertie). Cet axe représente l'opposition
classique droite / gauche (Fillon v/s Mélenchon et Hamon), mais ni
Macron, ni Le Pen ne semblent intervenir dans cette opposition.
S'agissant des régions, le vote Fillon est bien représenté en région
PACA et dans les Pays de la Loire, tandis que les votes Mélenchon et
Hamon le sont en Nouvelle Aquitaine, Occitanie, Hauts de France.
Synthèse :
En complément aux analyses des axes, on peut aussi
remarquer que la modalité LEPEN est placée assez loin de l'origine sur
les graphiques, ce qui traduit le fait que l'inertie de la modalité
LEPEN est nettement plus importante que sa masse (respectivement 54,0%
et 21,6%) : autrement dit, les scores de Le Pen présentent une grande
variabilité selon les régions, variabilité nettement plus élevée que
celle des scores de Macron (inertie 15,8% pour une masse de 24,3%),
celle de Hamon (inertie 7,8%, masse 6,4%), Fillon (inertie 8,2%, masse
20,3%) ou plus encore Mélenchon (inertie 5,3%, inertie 19,8%).
Autrement dit, les électeurs du Front National, même s'ils sont plus
nombreux que lors des scrutins précédents, restent inégalement répartis
sur le territoire national.
Enfin, cette analyse montre clairement que la première source de variation est
une opposition Le Pen / Macron, qui semble indépendante des clivages
droite / gauche traditionnels, qui persistent cependant. Dans ces
conditions, est-il étonnant que la question des désistements apparaisse
aussi problématique ?
Lien vers les résultats de l'AFC : Presidentielles-Nvelles-regions.htm.
Quatrième essai
On croise les 107 modalités départements, territoires et "étranger" avec les 11 candidats.
Les trois premiers axes ont alors une inertie de plus de 10%, la
quatrième valeur propre est nettement plus petite que la précédente
(4,4% d'inertie). On ménera donc l'étude sur 3 axes.
Analyse du premier axe :
Comme précédemment, cet axe oppose clairement Le Pen (64% d'inertie) en
partie négative de l'axe à Macron (22% d'inertie) en partie positive de
l'axe. Mais Hamon, Fillon et Mélenchon sont aussi placés sur la partie
positive de l'axe.
Il n'est pas utile de citer tous les départements représentant plus de
1% d'inertie, mais on peut malgré tout remarquer en partie positive de
l'axe : Paris, l'Etranger, les Hauts de Seine, les Yvelines, le Val de
Marne, la Loire atlantique, le Finistère, l'Ille et Vilaine, le Rhône,
la Seine Saint Denis et en partie négative de l'axe : le Pas de Calais,
le Nord, l'Aisne, le Var, l'Oise, les Bouches du Rhône, la Moselle.
Analyse du deuxième axe :
Trois modalités colonnes ont une inertie supérieure à 9% : Fillon (46%,
partie positive de l'axe), Mélenchon (31%, partie négative de l'axe) et
Lassale (16%, partie négative de l'axe). Comme précédemment, cet axe
montre l'opposition classique droite / gauche, mais il faut noter
l'intervention du candidat Lassalle, dont le vote est concentré dans le
sud-ouest (Pyrénées atlantiques notamment). Or cette zone a peu voté
Fillon, d'où la proximité observée entre Lassalle et Mélanchon. Par
inertie décroissante, le candidat suivant est Hamon. Le Pen et Macron
ont des inerties très faibles (0,3% et 0,1%) sur cet axe.
Quelques départements remarquables en partie négative de l'axe (score
élevé pour Mélenchon et/ou Lassalle, score faible pour Mélenchon) :
Seine Saint-Denis, Pyrénées Atlantiques, Haute-Garonne, Gironde .
Quelques départements remarquables en partie positive de l'axe (score
élevé pour Fillon, score faible pour Mélenchon) : Alpes Maritimes,
Hauts de Seine, Yvelines, Var, Etranger, Polynésie.
Analyse du troisième axe :
Lassalle représente 80% de l'inertie de cet axe. Parmi les autres
candidats, seul Mélenchon dépasse 10% d'inertie. Cet axe représente la
spécificité du vote Lassalle, notamment ce qui le différencie du vote
Mélenchon.
En partie négative de l'axe, on trouve les départements dans lesquels
Lassalle a fait ses meilleurs scores : Pyrénées Atlantiques,
Haute-Corse, Corse du Sud, Landes, Hautes Pyrénées, Aveyron, Gers. En
partie positive, on trouve des départements où le vote Mélenchon a été
élevé, sans pour autant que celui pour Lassalle soit particulièrement
faible : Seine Saint-Denis, Nord, Réunion.
Synthèse :
La conclusion reste la même que celle formulée ci-dessus pour la
première AFC. Le travail sur les 11 candidats et non sur 10, s'il est
plus satisfaisant d'un point de vue méthodologique, n'apporte pas de
vrai changement dans la conclusion.
Lien vers les résultats de l'AFC : Presidentielles-2017-Departements.htm.
Prise en compte du deuxième tour dans l'étude
Les données relatives au deuxième tour se prêtent mal à une étude par
AFC : il ne reste plus que deux candidats, ce qui conduit à une AFC
réduite à un seul axe factoriel. Cependant, il est possible d'ajouter
les résultats du deuxième tour comme modalités colonnes
supplémentaires. Elles n'interviennent pas dans la définition des axes
factoriels, mais subissent les mêmes traitements que les autres
modalités colonnes, et leurs positions par rapport aux modalités
actives sur les graphiques peuvent être interprêtées, par exemple en
termes de reports de voix.
Pour ce scrutin du deuxième tour des présidentielles 2017, plusieurs
candidats n'avaient pas donné de consignes de vote et de nombreux
électeurs avaient indiqué qu'ils s'abstiendraient ou voteraient blanc
ou nul. Il aurait été souhaitable que notre analyse porte également sur
cet aspect du scrutin. Cependant, comme nous l'avons indiqué plus haut,
l'abstention est très spécifique du vote "Outremer/Etranger" et l'AFC
se borne alors à mettre en évidence cette spécificité sur les premiers
axes factoriels.
Nous avons envisagé de prendre en compte la spécificité du deuxième
tour tout en neutralisant d'autres sources de variation en introduisant
la différence entre les suffrages exprimés au premier tour et les
suffrages exprimés au deuxième tour. Mais, alors que cette différence
est systématiquement positive en métropole, elle devient négative pour
l'Outremer et l'Etranger. Autrement dit, même si on peut à la rigueur
faire l'hypothèse qu'en métropole, cette différence (diminution du
nombre de suffrages exprimés) est directement liée au choix de certains
électeurs de n'apporter leur soutien à aucun des candidats du second
tour, il apparaît que dans les départements et territoires d'outremer,
ainsi qu'à l'Etranger, d'autres facteurs interviennent et viennent
perturber ce schéma.
Il faut également noter que, dans tous les essais que nous avons tentés
relatifs à la prise en compte des suffrages non exprimés, les qualités
de représentation des modalités concernées étaient très faibles sur les
2 ou 3 premiers axes. Il était nécessaire de pousser l'analyse
jusqu'au 5ème ou 6ème axe pour disposer d'une qualité de représentation
acceptable, ce qui semble indiquer que les variations
territoriales concernant ces données obéissent à d'autres
critères et sont relativement indépendantes de ce qui est observé quant
aux candidats. Et il est remarquable que cette mauvaise qualité de
représentation se retrouve même en ne prenant en compte que les
départements ou régions métropolitain(e)s.
Ainsi, les résultats présentés ici concernent :
- 14 modalités lignes : les 13 régions métropolitaines et une "région" Outremer/Etranger ;
- 10 modalités colonnes actives : les candidats du premier tour, à l'exception de Lassalle ;
- 2 modalités colonnes placées en éléments supplémentaires, avec
comme effectifs, les résultats des candidats Macron et Le Pen au second
tour. Ces deux modalités sont nommées MACRON-2 et LEPEN-2.
Les résultats de l'AFC concernant les éléments actifs sont alors
évidemment identiques à ceux donnés plus haut. Les résultats nouveaux
concernent les quallités de représentation des modalités colonnes
supplémentaires et leur positionnement par rapport aux modalités
actives.
Les qualités de représentation obtenues (90,4% pour LEPEN-2 et 96,7%
pour MACRON-2 sont très bonnes. Sur le graphique relatif au premier
plan factoriel, on constate que les deux points correspondants sont,
comme les points LEPEN et MACRON, très proches du premier axe.
Autrement dit, pour ces deux candidats, le vote du second tour est dans
la logique de celui du premier tour. On constate cependant que les
points MACRON-2 et LEPEN-2 sont placés plus près de l'origine des axes
que les points LEPEN et MACRON. Ce phénomène est plus marqué s'agissant
de la candidate Le Pen. Ce graphique montre donc une variabilité
territoriale des scores moins grande au second tour qu'un premier tour,
particulièrement pour la candidate Le Pen.
On constate également que sur le second axe, les points MACRON-2 et
LEPEN-2 ont une coordonnée supérieure à celle des points
respectifs MACRON et LEPEN. Cet axe représentant le clivage droite /
gauche, avec la droite en partie positive de l'axe, faut-il en conclure
que l'on observe là l'effet des reports de voix à droite, et
parallèlement l'effet des reports de voix moins systématiques à gauche
? Il convient de rester prudent, car ce phénomène n'apparaît pas sur
l'étude menée par département avec 11 individus actifs en modalités
colonnes.
Lien vers les résultats de l'AFC : Presidentielles-2017-2tours.htm.
N.B. 1) Pour retrouver une étude analogue, menée sur les
résultats de l'élection présidentielle de 2012, suivre les liens
suivants :
2) On trouvera également une étude analogue concernant le premier tour
de l'élection de 2007 sous les liens suivants :
Presidentielles-2007.doc, Presidentielles-2007.pdf ainsi que les
résultats fournis par Statistica sous le lien :
Presidentielles-2007.htm.