Votes et gradient d’urbanité : une relation invalidée

Jacques Lévy est intervenu lundi 25 avril 2022 sur France Culture dans Le temps du débat, puis de nouveau le 1er mai, toujours sur France Culture, dans l’émission l’Esprit Public, pour commenter les résultats des élections. Son analyse s’appuie sur un travail cartographique conséquent visible ici.

Conformément à une thèse qu’il défend depuis longtemps (vous trouverez l’essentiel de ses idées appliquées au vote du 21 avril 2002 dans ce texte), il considère que les différences géographiques de vote s’expliquent avant tout par ce qu’il appelle les gradients d’urbanité, bien plus que par les différences de catégorie sociale, de diplôme ou d’âge.

Son idée forte est la suivante : l’urbain dense est le lieu de la diversité, de l’ouverture, de la tolérance, de la connexion au monde, dès lors, baigner dans des environnements à forte urbanité conduirait à voter pour des partis “de gouvernement”, “universalistes”, alors que quand l’urbanité est faible, on est enclin à voter pour des partis “protestataires”, “populistes”, “tribunitiens”. C’est cela qui expliquerait les votes, plus que le fait d’être jeune ou vieux, d’être diplômé du supérieur ou non diplômé, ouvrier, employé ou cadre supérieur.

Pour mesurer les gradients d’urbanité, Jacques Lévy s’appuie sur les zonages d’étude de l’INSEE, et dans ses dernières analyses, sur le zonage en aires d’attraction des villes. Chaque commune peut être rattachée à l’un des 8 gradients d’urbanité, qui sont définis sur la base d’une double distinction : en fonction de la tranche d’aire d’attraction des villes, d’une part, et de la situation de la commune par rapport à la commune centre de l’aire, d’autre part.

La commune qui présente le gradient d’urbanité le plus fort, c’est Paris, elle correspond au gradient 1. Suivent les communes de la banlieue de Paris, ainsi que les communes centres des aires de plus de 700 000 habitants, toutes étant de gradient 2 : les communes de la banlieue sont moins urbaines que Paris, mais elle bénéficient en quelque sorte de son ruissellement ; les communes centres des très grandes aires, ce n’est pas Paris, mais l’urbanité y est forte. Et ainsi de suite, jusqu’aux communes hors aires d’attraction des villes, de gradient 8, à l’urbanité la plus faible.

Pour mesurer l’impact des gradients d’urbanité, il procède à des analyses cartographiques, qui permettent de visualiser la géographie des votes en fonction de ces gradients, pour conclure le plus souvent que son analyse est validée. Il va cependant un cran plus loin : conscient que d’autres éléments peuvent jouer, notamment les effets de diplôme, de catégorie sociale ou d’âge, il affirme que les gradients d’urbanité sont plus explicatifs que ces autres éléments, sur la base d’un raisonnement quelque peu opaque et pour le moins curieux (voir ici, à partir de 5’30).

L’analyse de Jacques Lévy a fait l’objet de critiques sérieuses, depuis déjà longtemps (voir par exemple l’article de Fabrice Ripoll et Jean Rivière). Mon objectif ici est d’ajouter une pierre à la critique, en montrant qu’elle est invalidée empiriquement, sur la base des résultats du vote du premier tour des élections présidentielles 2022 de l’ensemble des communes de France métropolitaine.

Pour cela, il convient de définir précisément quels résultats on devrait obtenir si la “théorie” du gradient d’urbanité était vérifiée : on devrait observer i) un score des candidats de gouvernement qui augmente quand le degré d’urbanité augmente, ii) un score des candidats protestataires qui diminue quand le degré d’urbanité augmente, iii) un pouvoir explicatif du gradient d’urbanité supérieur au pouvoir explicatif d’autres distinctions (âge, CSP, niveau de diplôme), iv) un effet du gradient d’urbanité qui est observé à caractéristiques sociales égales par ailleurs.

Pour valider ou invalider ces propositions, je considère d’abord comme candidats de gouvernement Macron, Jadot, Pécresse et Hidalgo, et comme candidats protestataires les huit autres candidats, classés à gauche pour quatre d’entre eux (Mélenchon, Roussel, Poutou, Arthaud) et à droite pour les quatre autres (Le Pen, Zemmour, Lassalle, Dupont-Aignan). Sur cette base, je procède aux traitements suivants :

  1. j’analyse les scores moyens obtenus par chaque candidat, en fonction du gradient d’urbanité : si la théorie est vérifiée, le score moyen de Macron, Jadot, Pécresse et Hidalgo doit augmenter avec le degré d’urbanité, celui des huit autres candidats doit diminuer. Le gradient d’urbanité doit en outre expliquer une part importante des différences de vote observées entre communes,
  2. j’analyse parallèlement l’influence d’une autre variable que le gradient d’urbanité : la part des diplômés du supérieur par commune. Si la théorie est validée, cette variable doit expliquer une part moins importante du vote que le gradient d’urbanité,
  3. j’analyse dans un même modèle le gradient d’urbanité et la part des diplômés du supérieur, afin d’évaluer l’impact du gradient d’urbanité à niveau de diplôme donné. Si la théorie fonctionne, le gradient d’urbanité doit exercer l’influence attendue sur les scores des candidats de gouvernement et des candidats protestataires.

Commençons par cette première proposition, en mesurant l’impact du gradient d’urbanité sur les votes des 12 candidats. Dans le tableau, vous pouvez lire le score obtenu par chaque candidat dans la commune de Paris (gradient 1), puis l’écart à ce score pour les gradients de 2 à 8. La dernière ligne renseigne sur le pourcentage des différences de votes entre communes expliquées par le gradient d’urbanité.

Scores au 1er tour de l’élection présidentielle de 2022 par gradient d’urbanité (score moyen des communes du gradient 1 et écart à ce score pour les autres gradients)

A titre d’exemple de lecture, le score d’Emmanuel Macron dans la commune de Paris est de 35,3%, celui de Yannick Jadot est de 7,3%. En moyenne, dans les communes de la banlieue de Paris et dans les communes centre des aires de plus de 700 000 habitants, le score d’Emmanuel Macron est inférieur de 6,4 points de pourcentage au score qu’il obtient sur Paris, et celui de Yannick Jadot est inférieur de 2 points de pourcentage à son score parisien. Sur la dernière ligne de ces deux candidats, on constate que les gradients d’urbanité n’expliquent que 7% des différences communales de vote Macron, et 21% des différences pour Jadot.

Globalement, s’agissant des candidats de gouvernement, on constate que les scores hors Paris sont tous inférieurs au bloc sur Paris intra-muros, ce qui va dans le sens de la théorie, mais dans sa version extrême, où l’urbanité serait réservée au cœur de la capitale, point d’urbanité en dehors. De plus, le gradient d’urbanité n’explique qu’une faible partie des différences entre communes (variance expliquée inférieure à 10%), hormis pour Jadot, candidat pour lequel la théorie « marche » un peu mieux, puisque la variance expliquée par le gradient d’urbanité est de 21% et que son score est continûment décroissant quand on va du gradient 1 à 8.

Pour les candidats protestataires, la théorie fonctionne plutôt bien pour Marine le Pen puisque son score est continûment croissant avec le gradient (à l’exception du gradient 8, son score y est inférieur aux gradients 6 et 7) et il explique 46% des différences observées. En revanche, le résultat est inverse au résultat attendu pour Mélenchon (avec un pouvoir explicatif du gradient important, mais totalement contraire à l’attendu, de 46%) et pour Zemmour (mais avec un faible pouvoir explicatif du gradient d’urbanité, qui n’explique que 2% des différences de vote entre communes). Les résultats de Mélenchon et de Zemmour constituent clairement le premier élément d’invalidation de la théorie des gradients d’urbanité.

Deuxième temps de l’analyse, l’examen de la deuxième proposition, qui consiste à étudier le jeu d’une autre variable explicative considérée comme moins déterminante par Jacques Lévy que le jeu du gradient d’urbanité. J’ai retenu la part communale des diplômés du supérieur, qui exerce une influence certaine sur les votes. Je compare simplement la part des différences expliquées par le gradient d’urbanité, d’un côté, et la part expliquée par la part des diplômés du supérieur, de l’autre.

Variance expliquée par le gradient d’urbanité et par la part des diplômés du supérieur en pourcentage de la variance totale, dans les votes au 1er de tour de 2022. Pour la variable “part des diplômés du supérieur”, l’analyse a été faite en retenant la valeur continue de la variable, et également en constituant huit groupes de communes (1/8 des communes à plus faible part, puis 1/8 des suivantes, etc.), pour avoir un nombre de classes équivalent au nombre de gradient d’urbanité.

On constate que pour sept des douze candidats, la part des diplômés explique mieux les différences communales de score que le gradient d’urbanité, pour deux l’explication est équivalente (Hidalgo et Poutou), et c’est seulement pour 3 qu’elle est moins explicative que le gradient d’urbanité (Mélenchon, Lassalle et Dupont-Aignan), mais dans un sens contraire à l’attendu pour Mélenchon rappelons-le. L’écart est particulièrement fort pour Macron (+24 points de pourcentage d’explication) et pour Jadot (+32 points). Ces résultats constituent le deuxième élément d’invalidation de la théorie.

Dernier temps essentiel de la démonstration, l’analyse intégrée des deux effets. L’erreur principale de Jacques Lévy consiste en effet à étudier gradient d’urbanité, CSP, âge et diplôme séparément, en les considérant comme indépendants. Or, la composition sociale des territoires varie fortement selon le gradient d’urbanité. De ce fait, les différences de scores par gradient peuvent résulter non pas de sa théorie (on est plus tolérant quand on vit dans un environnement urbain, donc on vote moins pour les partis protestataires), mais de différences de caractéristiques sociales (on est plus diplômés, donc on vote moins pour les partis protestataires, qu’on habite dans l’urbain ou dans le rural). C’est à cette condition qu’on pourra éventuellement identifier le jeu d’un effet géographique « pur ».

Ecarts au score de gradient 1 pour les gradients 2 à 8 à part des diplômés du supérieur égale par ailleurs. Les valeurs soulignées sont non significativement différentes de 0 au seuil de 1%.

On constate que, quand on neutralise l’effet “part des diplômés du supérieur”, les résultats pour tous les candidats des partis de gouvernement sont contraires à la théorie : leur score est supérieur dans les communes hors Paris, il est même continument croissant pour Macron quand on passe du gradient 1 au gradient 8 d’urbanité (c’est le cas également pour Pécresse).

S’agissant des candidats protestataires, les résultats de Roussel sont maintenant contraires à la théorie (coefficients tous négatifs, mais leurs valeurs sont faibles), et ceux de Mélenchon le restent. A l’inverse, quand on neutralise l’effet de diplôme, le score de Zemmour devient un peu plus conforme à la théorie, il améliore ses scores quand l’urbanité diminue, mais la part des différences expliquées reste faible (7%).

Cette troisième série d’éléments va dans le même sens que les deux séries précédentes. Dès lors, il nous semble possible de conclure que la théorie du gradient d’urbanité, qui veut que vivre dans l’urbain incite à voter pour des partis de gouvernement et que s’éloigner de l’urbain le plus dense (Paris intra-muros) conduise à voter pour des partis protestataires, d’autant plus qu’on s’en éloigne, est invalidée empiriquement.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *