Présidentielle 2017: à 4 jours du vote!

La situation semble s'est stabilisée en France. Macron a stoppé sa chute (il semble même un peu remonter dans les derniers sondages) tandis que Mélenchon et Fillon ont arrêté leurs remontées (celle de Mélenchon étant de loin plus importante). Quant à Marine Le Pen, elle semble elle aussi être stable. À moins d'avoir des tendances très différentes dans les 2 prochains jours, j'ai l'impression que mes projections finales ressembleront beaucoup à celles de ce billet.

Voici un graphique avec ces sondages et les tendances:



En gros, Macron et Le Pen restent favoris pour accéder au 2e tour mais tant Fillon que Mélenchon ont leurs chances. Étant donnée la fiabilité des sondages français depuis 2002 et l'erreur moyenne (en particulier la tendance des sondages à être imprécis pour deux des 5 principaux candidats), on ne saurait exclure une surprise ce dimanche. L'écart entre les deux premiers et les autres est juste assez large pour faire en sorte qu'une surprise reste un scénario avec moins de 50% de chances d'arriver (oui, je sais, c'est la définition même d'une surprise, mais vous comprenez ce que je veux dire).

Premièrement, regardons les probabilités d'être au 2e tour ainsi que les intervalles de confiance pour les résultats au 1er tour.




Avec plus de 85% chacun, Macron et Le Pen restent favoris. Oui il y a les marges d'erreur et l'incertitude en général, mais il reste qu'être sondé devant par quasiment tous les sondages est mieux que de devoir compter sur une sous-estimaiton systématique dans les enquêtes d'opinion. Marine Le Pen continue d'être celle avec la plus faible incertitude car son électorat reste le plus définitf. Cela étant dit, elle avait déjà 80% d'électeurs déclarant leurs choix comme définitifs quand elle était à 25%. Elle est maintenant à moins de 23% et a toujours 80% d'électeurs solides. C'est un peu bizarre et cela montre qu'un électeur peut déclarer son choix comme définitif mais quand mêem changer d'avis après quelque temps. De tous les modèles, je crois que je suis le seul à tenir compte de cette variable. C'est peut-être une erreur mais en même temps, cette donnée est disponible dans tous les sondages et il serait tout autant étrange de l'ignorer. De plus, il semble logique que Macron ait davantage d'incertitude vu qu'il peut gagner (et perdre!) des deux bords.

Comparons mes probabilités à d'autres modèles. Depuis1958.fr donne 87% à Macron, 82% à Marine Le Pen, 16% à Mélenchon et 15% à Fillon. C'est hônnetement très proche (surtout que nos méthodologies sont très différentes). The Crosstab a davantage d'incertitude que moi. Macron et Le Pen sont en-dessous des 70% de chances alors que Fillon est à 35% et Mélenchon y est à 29%. Il faut dire qu'ils ont de plus larges marges d'erreur car ils ont calibrés leur modèle d'après la fiabilité des sondages depuis plus longtemps que moi (les sondages ont relativement bien fait depuis 2002). Finalement, The Economist est très similaire à The Crosstab, si ce n'est que les chances d Mélenchon y sont encore plus élevées.

Au final, les modèles s'entendent sur l'ensemble mais pas dans les détails.

Aussi, il nous faut mentionner que les sondeurs français sont actuellement accusés de "herding", cette tendance des sondeurs à tous avoir les mêmes chiffres. Cela arrive quand les sondeurs, au lieu de publier les chiffres réellement obtenus (et différents de la moyenne) font juste copier-coller la moyenne des sondages. Pourquoi? Comme ça vous ne pouvez pas être la seule firme dans l'erreur! à l'inverse, si les sondages ont tort, ils seront tous dans l'erreur!

J'avoue ignorer si ce phénomène est effectivement en train d'arriver en France mais force est de constater la super faible variation entre les sondages.

À noter qu'une seule firme fait des sondages par téléphone (Le Terrain) et les résultats sont différents des sondages faits en ligne. Je le mentionne car je trouve dommage que tous les sodneurs français utilisent la même méthode de collecte de données.

En termes de distributions, voici les simulations les plus récentes.

Je crois que cette image représente le mieux à quel point nous avons une course à 4. Pas une course égale avec tout le monde à 25%, mais une élection où 4 candidats ont de réelles chances d'être au 2e tour.

Parlant de 2e tour, voici les scénarios possibles:


Le scénario Macron - Le Pen reste de loin le plus probable mais nous avons maintenant 4 autres scénarios avec des chances non négligeables. Je ne projette pas actuellement le 2e tour mais la plupart ne seraient probablement pas très serrés (Macron gagne quasiment tous ses duels; le plus serré pourrait être Fillon contre Le Pen ou Mélenchon contre Macron).


Je ferai ma dernière mise à jour d'ici la fin de semaine, lorsque nous aurons tous les sondages.


Notes méthodologiques

Voici comment le modèle fonctionne.

1. Faire la moyenne pondérée des sondages en donnant plus de poids aux sondages récents.
2. Faire la moyenne du pourcentage d'électeurs pour chaque candidat qui déclarent leurs choix comme étant définitifs (plus de 80% pour Le Pen, environ 70% pour Macron par exemple).
3. Faire 50,000 simulations (avec écart type d'environ 1.3 pt). Donc ici, Macron (en moyenne à 23%) est parfois à 25% et d'autres fois à 21%.
4. Séparer les électeurs pour chaque candidat dans chaque simulation qui sont définitifs de ceux qui peuvent changer d'avis.
5. Parmi ceux qui peuvent changer, l'hypothèse est que la moitié, en moyenne, votera finalement pour ce candidat (distribution normale avec moyenne à 50%). L'autre moitié ne votera soit pas (fonction du taux prévu d'abstention) ou votera pour son 2e choix. Cette partie est difficile car peu de sondages fournissent cette information. J'ai dû y aller un peu subjectivement. Essentiellement, je me suis basé sur les affiliations idéologiques (Hamon et Mélenchon partagent beaucoup d'électeurs), les 2e choix de certains sondages ainsi que le report des voix au 2e tour. Autre hypothèse: à part les 5 principaux candidats, tous les autres ne peuvent que perdre des votes (=transférer aux 5 principaux), ils ne peuvent pas en recevoir.
6. Faire la somme des votes définitifs, des indécis ayant finalement décidé de rejoindre ce candidat ainsi que les transferts des autres candidats. Cela nous donne des marges d'erreur totales d'environ 3.8%, ce qui correspond exactement aux marges d'erreur effectives des sondages depuis 2002. En d'autres mots, le modèle contient la bonne quantité d'incertitude mais celle-ci est introduite de plusieurs manières (simulations au début, part des indécis qui votent pour un autre candidat, abstention, etc).
7. Calculer le nombre de fois où chaque candidat est dans les deux premiers.