Analyse factorielle des correspondances - Elections présidentielles 2017


On se propose ici d'étudier les résultats du premier tour de l'élection présidentielle 2017 à l'aide d'une analyse factorielle des correspondances. On croise les candidats (modalités colonnes) avec des circonscriptions administratives (modalités lignes), afin de mettre en évidence la variabilité territoriale du vote pour l'un ou l'autre des candidats.
En ce qui concerne les circonscriptions administratives, plusieurs choix sont possibles :
En ce qui concerne les circonscriptions, considérer les régions plutôt que les départements permet de réduire le nombre de modalités et donc d'obtenir des résultats plus faciles à interpréter. Mais en utilisant des circonscriptions trop vastes, on risque de neutraliser la variabilité territoriale des votes.

En ce qui concerne les candidats, on se réserve la possibilité d'éliminer (ou de placer en élément supplémentaire) un candidat ayant obtenu un faible score, et dont la répartition des voix serait trop "exotique".


Les données du premier tour ont été recopiées à partir du site du Ministère de l'Intérieur entre le mardi 25/04/2017 et le jeudi 27/04/2017.  Quelques écarts mineurs avec les données définitives publiées sur ce site peuvent être relevés. Celles du second tour ont été recopiées à partir du même site les jeudi 11/05/2017 et vendredi 12/05/2017. Les traitements ont été réalisés sous Statsoft Statistica 10.
Lien vers le fichier de données du premier tour (format Excel 2010) : Presidentielles-2017-v2.xlsx.
Lien vers le fichier de données rassemblant les deux tours : Presidentielles-2017-v3.xlsx

Premier essai

Il est tentant de tenir compte de l'abstention en l'intégrant en tant que 12ème candidat. Mais celle-ci se révèle trop spécifique du vote "outremer/étranger" et les résultats mettent essentiellement cet aspect en évidence.

Deuxième essai

On croise les 14 nouvelles régions avec les 11 candidats. Les résultats (non présentés ici) sont alors difficiles à interpréter. En effet, dès le 2ème axe, c'est le particularisme du vote Lassalle (concentré dans les Pyrénées Atlantiques, la Corse, etc) et celui de la région Corse (10 fois moins peuplée que les autres) qui est mis en évidence, ce qui masque des aspects plus intéressants tels que le vote Hamon, le votre Mélenchon, etc.

Troisième essai

On croise les 14 nouvelles régions avec 10 candidats (on ne tient pas compte du vote Lassalle).
Le premier axe représente alors 80% de l'inertie totale, le second n'atteint pas 10%. Autrrement dit, le phénomène étudié est, dans une large mesure, unidimensionnel. On poursuit cependant l'étude sur les deux premiers axes.
Les qualités de représentation sont excellentes pour Hamon, Macron, Le Pen, Fillon, passable pour Mélanchon (61%), assez mauvaises pour les "petits candidats".

Analyse du premier axe :

Le Pen (partie négative de l'axe) représente 67% de l'inertie de cet axe. Macron (partie positive de l'axe) en représente 19%. Clairement, cet axe oppose Le Pen à Macron, mais les autres "grands candidats" ont, comme Macron, un score positif sur cet axe.

S'agissant des régions, on trouve en partie positive de l'axe notamment l'Ile de France, la Bretagne et en partie négative le Grand-Est, les Hauts de France, la région PACA.

Analyse du second axe :

Fillon (partie positive de l'axe) représente 63% de son inertie et s'oppose à Hamon (11% d'inertie) et Mélanchon (19% d'inertie), en partie négative de l'axe. Macron et Le Pen sont quasiment absents de cet axe (moins de 0,7% d'inertie). Cet axe représente l'opposition classique droite / gauche (Fillon v/s Mélenchon et Hamon), mais ni Macron, ni Le Pen ne semblent intervenir dans cette opposition.

S'agissant des régions, le vote Fillon est bien représenté en région PACA et dans les Pays de la Loire, tandis que les votes Mélenchon et Hamon le sont en Nouvelle Aquitaine, Occitanie, Hauts de France.

Synthèse :

En complément aux analyses des axes, on peut aussi remarquer que la modalité LEPEN est placée assez loin de l'origine sur les graphiques, ce qui traduit le fait que l'inertie de la modalité LEPEN est nettement plus importante que sa masse (respectivement 54,0% et 21,6%) : autrement dit, les scores de Le Pen présentent une grande variabilité selon les régions, variabilité nettement plus élevée que celle des scores de Macron (inertie 15,8% pour une masse de 24,3%), celle de Hamon (inertie 7,8%, masse 6,4%), Fillon (inertie 8,2%, masse 20,3%) ou plus encore Mélenchon (inertie 5,3%, inertie 19,8%). Autrement dit, les électeurs du Front National, même s'ils sont plus nombreux que lors des scrutins précédents, restent inégalement répartis sur le territoire national.

Enfin, cette analyse montre clairement que la première source de variation est une opposition Le Pen / Macron, qui semble indépendante des clivages droite / gauche traditionnels, qui persistent cependant. Dans ces conditions, est-il étonnant que la question des désistements apparaisse aussi problématique ?

Lien vers les résultats de l'AFC : Presidentielles-Nvelles-regions.htm.

Tracé lignes et colonnes sur les axes 1 et 2

Quatrième essai


On croise les 107 modalités départements, territoires et "étranger" avec les 11 candidats.
Les trois premiers axes ont alors une inertie de plus de 10%, la quatrième valeur propre est nettement plus petite que la précédente (4,4% d'inertie). On ménera donc l'étude sur 3 axes.

Analyse du premier axe :

Comme précédemment, cet axe oppose clairement Le Pen (64% d'inertie) en partie négative de l'axe à Macron (22% d'inertie) en partie positive de l'axe. Mais Hamon, Fillon et Mélenchon sont aussi placés sur la partie positive de l'axe.
Il n'est pas utile de citer tous les départements représentant plus de 1% d'inertie, mais on peut malgré tout remarquer en partie positive de l'axe : Paris, l'Etranger, les Hauts de Seine, les Yvelines, le Val de Marne, la Loire atlantique, le Finistère, l'Ille et Vilaine, le Rhône, la Seine Saint Denis et en partie négative de l'axe : le Pas de Calais, le Nord, l'Aisne, le Var, l'Oise, les Bouches du Rhône, la Moselle.

Analyse du deuxième axe :

Trois modalités colonnes ont une inertie supérieure à 9% : Fillon (46%, partie positive de l'axe), Mélenchon (31%, partie négative de l'axe) et Lassale (16%, partie négative de l'axe). Comme précédemment, cet axe montre l'opposition classique droite / gauche, mais il faut noter l'intervention du candidat Lassalle, dont le vote est concentré dans le sud-ouest (Pyrénées atlantiques notamment). Or cette zone a peu voté Fillon, d'où la proximité observée entre Lassalle et Mélanchon. Par inertie décroissante, le candidat suivant est Hamon. Le Pen et Macron ont des inerties très faibles (0,3% et 0,1%) sur cet axe.

Quelques départements remarquables en partie négative de l'axe (score élevé pour Mélenchon et/ou Lassalle, score faible pour Mélenchon) : Seine Saint-Denis, Pyrénées Atlantiques, Haute-Garonne, Gironde .
Quelques départements remarquables en partie positive de l'axe (score élevé pour Fillon, score faible pour Mélenchon) : Alpes Maritimes, Hauts de Seine, Yvelines, Var, Etranger, Polynésie.

Analyse du troisième axe :

Lassalle représente 80% de l'inertie de cet axe. Parmi les autres candidats, seul Mélenchon dépasse 10% d'inertie. Cet axe représente la spécificité du vote Lassalle, notamment ce qui le différencie du vote Mélenchon.

En partie négative de l'axe, on trouve les départements dans lesquels Lassalle a fait ses meilleurs scores : Pyrénées Atlantiques, Haute-Corse, Corse du Sud, Landes, Hautes Pyrénées, Aveyron, Gers. En partie positive, on trouve des départements où le vote Mélenchon a été élevé, sans pour autant que celui pour Lassalle soit particulièrement faible : Seine Saint-Denis, Nord, Réunion.

Synthèse :

La conclusion reste la même que celle formulée ci-dessus pour la première AFC. Le travail sur les 11 candidats et non sur 10, s'il est plus satisfaisant d'un point de vue méthodologique, n'apporte pas de vrai changement dans la conclusion.


Lien vers les résultats de l'AFC : Presidentielles-2017-Departements.htm.

Tracé colonnes sur les axes 1 et 2

Prise en compte du deuxième tour dans l'étude

Les données relatives au deuxième tour se prêtent mal à une étude par AFC : il ne reste plus que deux candidats, ce qui conduit à une AFC réduite à un seul axe factoriel. Cependant, il est possible d'ajouter les résultats du deuxième tour comme modalités colonnes supplémentaires. Elles n'interviennent pas dans la définition des axes factoriels, mais subissent les mêmes traitements que les autres modalités colonnes, et leurs positions par rapport aux modalités actives sur les graphiques peuvent être interprêtées, par exemple en termes de reports de voix.

Pour ce scrutin du deuxième tour des présidentielles 2017, plusieurs candidats n'avaient pas donné de consignes de vote et de nombreux électeurs avaient indiqué qu'ils s'abstiendraient ou voteraient blanc ou nul. Il aurait été souhaitable que notre analyse porte également sur cet aspect du scrutin. Cependant, comme nous l'avons indiqué plus haut, l'abstention est très spécifique du vote "Outremer/Etranger" et l'AFC se borne alors à mettre en évidence cette spécificité sur les premiers axes factoriels.

Nous avons envisagé de prendre en compte la spécificité du deuxième tour tout en neutralisant d'autres sources de variation en introduisant la différence entre les suffrages exprimés au premier tour et les suffrages exprimés au deuxième tour. Mais, alors que cette différence est systématiquement positive en métropole, elle devient négative pour l'Outremer et l'Etranger. Autrement dit, même si on peut à la rigueur faire l'hypothèse qu'en métropole, cette différence (diminution du nombre de suffrages exprimés) est directement liée au choix de certains électeurs de n'apporter leur soutien à aucun des candidats du second tour, il apparaît que dans les départements et territoires d'outremer, ainsi qu'à l'Etranger, d'autres facteurs interviennent et viennent perturber ce schéma.

Il faut également noter que, dans tous les essais que nous avons tentés relatifs à la prise en compte des suffrages non exprimés, les qualités de représentation des modalités concernées étaient très faibles sur les 2 ou 3  premiers axes. Il était nécessaire de pousser l'analyse jusqu'au 5ème ou 6ème axe pour disposer d'une qualité de représentation acceptable, ce qui semble indiquer que les variations territoriales  concernant ces données obéissent à d'autres critères et sont relativement indépendantes de ce qui est observé quant aux candidats. Et il est remarquable que cette mauvaise qualité de représentation se retrouve même en ne prenant en compte que les départements ou régions métropolitain(e)s.

Ainsi, les résultats présentés ici concernent :
Les résultats de l'AFC concernant les éléments actifs sont alors évidemment identiques à ceux donnés plus haut. Les résultats nouveaux concernent les quallités de représentation des modalités colonnes supplémentaires et leur positionnement par rapport aux modalités actives.

Les qualités de représentation obtenues (90,4% pour LEPEN-2 et 96,7% pour MACRON-2 sont très bonnes. Sur le graphique relatif au premier plan factoriel, on constate que les deux points correspondants sont, comme les points LEPEN et MACRON, très proches du premier axe. Autrement dit, pour ces deux candidats, le vote du second tour est dans la logique de celui du premier tour. On constate cependant que les points MACRON-2 et LEPEN-2 sont placés plus près de l'origine des axes que les points LEPEN et MACRON. Ce phénomène est plus marqué s'agissant de la candidate Le Pen. Ce graphique montre donc une variabilité territoriale des scores moins grande au second tour qu'un premier tour, particulièrement pour la candidate Le Pen.

On constate également que sur le second axe, les points MACRON-2 et LEPEN-2 ont  une coordonnée supérieure à celle des points respectifs MACRON et LEPEN. Cet axe représentant le clivage droite / gauche, avec la droite en partie positive de l'axe, faut-il en conclure que l'on observe là l'effet des reports de voix à droite, et parallèlement l'effet des reports de voix moins systématiques à gauche ? Il convient de rester prudent, car ce phénomène n'apparaît pas sur l'étude menée par département avec 11 individus actifs en modalités colonnes.

Modalités colonnes sur le premier plan factoriel

Lien vers les résultats de l'AFC : Presidentielles-2017-2tours.htm.

 N.B. 1) Pour retrouver une étude analogue, menée sur les résultats de l'élection présidentielle de 2012, suivre les liens suivants :
2) On trouvera également une étude analogue concernant le premier tour de l'élection de 2007 sous les liens suivants : Presidentielles-2007.doc, Presidentielles-2007.pdf ainsi que les résultats fournis par Statistica sous le lien : Presidentielles-2007.htm.