Un (2e) regard sur la Présidentielle Française

Hier j'ai posté un long billet expliquant comment je simulais l'élection présidentielle française qui aura lieu le 23 avril. Les explications de ce billet sont toujours valables mais j'ai réalisé que j'avais fait une petite erreur dans mon code. Une erreur certes petite mais avec de grandes conséquences. Je trouvais mes résultats un peu étranges et j'ai passé la journée à essayer de trouver où était l'erreur.

En particulier, je trouvais bizarre que Macron n'ait pas une incertitude plus élevée que Le Pen. Macron devrait avoir un plancher plus faible (car moins de ses électeurs l'ont définitivement choisi) mais aussi un plafond plus élevé (car, étant au centre, il peut aller grapiller des voix un peu partout, ce que Marine Le Pen ne peut pas faire).

Au final, voici les distributions que j'aurais dues publier hier. Encore une fois, mes excuses.


Résultats possibles pour les 5 principaux candidats
au 1er tour de l'élection présidentielle de 2017

Macron en orange, Le Pen en gris, Fillon en bleu, Hamon en rose et Mélenchon en rouge

Comme vous pouvez le voir, Marine Le Pen (en gris) est fortement concentrée autour de 25%. Son électorat est fiable et a peu de chance de ne pas voter ou de changer d'avis. Macron (en orange) à l'inverse fait face à une incertitude bien plus importante. Si vous aimez les chiffres, l'écart-type de Macron est de près de 3 points alors que celui de Le Pen est de seulement 1.7 (le plus faible des 5 candidats).

Les chances de se retrouver au 2e tour sont les suivantes (ainsi que les intervalles de confiances à 95% pour les intentions de votes):

Probabilités de se retrouver au second tour ainsi que les intervalles de confiances (à 95%) pour les résultats au 1er tour

Il y a trois possibles second tours: Macron vs Le Pen (le plus probable avec 89% de chances d'arriver), Le Pen vs Fillon (9.6% des fois) et finalement Macron vs Fillon (1.5% des fois).

Quant à Hamon et Mélenchon, ce dernier a une distribution moins étendue car il est plus sur la gauche et a ainsi un potentiel d'électeurs un peu plus faibles. Cela étant dit, la campagne d'Hamon reste en chute libre et il ne serait pas surprenant que Mélenchon termine 4e. Actuellement les chances que cela se produise sont d'un tout petit peu moins de 50%.

Nous verrons si les semaines à venir permettront à François Fillon de remonter la pente, mais ses chances actuellement ne sont au moins pas nulles. Il bénéficie du fait que sa base est forte est (semble-t-il_ fortement décidée. Mais il reste qu'un résultat autre que Macron et Le Pen dans les deux premières positions représenterait une erreur majeure des sondages. Mon travail ici était de montrer à quel point cela était possible.

Un regard sur la Présidentielle Française

Ce blogue est Canadien, mais cela ne signifie pas que je ne suive que la politique de ce pays. Dans les faits, mon introduction à la politique s’est faite quand je vivais encore en Suisse lors de l’élection présidentielle française de 2002 (en Suisse Romande, nous avons les chaînes françaises). J’avais suivi cette campagne de très proche et la surprise de voir Jean-Marie Le Pen (alors leader du Front National, un parti considéré d’extrême-droite) au 2e tour était, jusqu’à la victoire de Trump, la plus grosse surprise que j’avais eu lors d’une élection.

Si vous êtes un français du Québec, ou de France, je comprends qu’il puisse être un peu étrange de lire une analyse de la politique française faite par un Suisse vivant maintenant à Vancouver. Mais je me suis dit qu’il serait intéressant de construire un petit modèle pour le 1er tour. Et je peux vous assurer que je m'y connais en politique de l'Hexagone.

Avant de regarder les détails, un petit résumé de la situation en France. Tout d’abord, il faut savoir que l’élection présidentielle en France se joue sur deux tours. Les deux candidats terminant en tête lors du premier tour s’affrontent deux semaines plus tard. Habituellement (à part en 2002), ce 2e tour oppose le candidat de la droite républicaine (dont le parti principal change souvent de nom -RPR, puis UMP et maintenant Les Républicains) au candidat de la gauche (représentée majoritairement par le Parti Socialiste qui est un parti social-démocrate typique d’Europe). Sauf que cette année, nous assistons à un bouleversement majeur de la Ve République. Les deux grands favoris actuellement, et cela depuis des semaines, sont Marine Le Pen (fille de Jean-Marie dont elle a repris le parti il y a quelques années) et Emmanuel Macron, un ex-ministre Socialiste du gouvernement sortant qui a fondé son propre parti/mouvement : En Marche! Macron se positionne au centre, une tactique qui d’habitude ne fonctionne pas très bien en France. En 2002, la présence de Jean-Marie Le Pen au 2e tour avait essentiellement été due à la division de la gauche. Mais cette année, le FN est tout simplement le parti en tête depuis des mois. Marine Le Pen a travaillé fort depuis 2012 afin de positionner son parti comme étant plus modéré (ou plus acceptable). Fini par exemple les déclarations controversées sur les chambres à gas. Ses efforts, couplés à la montée d’un sentiment d’aliénation d’une partie des Français (plus de frontières, immigration, mondialisation, etc) fait en sorte que le FN n’a cessé de progresser, non seulement dans les sondages mais dans les diverses élections (régionales, etc).

La présence de Macron est plus surprenante. Mais il faut dire que tant la gauche que la droite lui ont offert un boulevard. La droite tout d’abord en choisissant François Fillon lors de sa primaire, un candidat plus à droite et conservateur que le centriste Jupée. Tout semblait bien fonctionner jusqu’à ce que Fillon se retrouve au milieu d’un histoire d’emplois fictifs (un phénomène étonnamment courant en politique française…). Il est carrément sous enquête judiciaire mais a décidé de ne pas se retirer. Il a chuté de 30% à 18-19% mais il tient bon à ce niveau. Du côté de la gauche, au lieu de choisir Manuel Valls, Premier-Ministre sortant et vu comme centriste, la primaire a vu la victoire de Benoît Hamon, un candidat bien plus à gauche. Ainsi cela semble avoir laissé le champ libre à Macron qui, bien qu’ayant fondé son propre mouvement, a le programme le plus en continuité avec le président Hollande (Socialiste; qui a décidé de ne pas se présenter car il jugeait n’avoir aucune chance). Hamon est en chute libre et risque en fait d’être dépassé sur sa gauche par Mélenchon (un ex-socialiste qui trouvait son parti pas assez à gauche).

Okay, ce résumé est déjà trop long, passons aux sondages et simulations.

Simulations


Cette élection a sa dose de sondages naturellement mais la France ne semble pas avoir de Nate Silver, du moins à ma connaissance. Et ces sondages sont remarquablement constants. On voit très peu de variations, bien moins qu’au Canada ou Québec. L’une des raisons semble être que les sondeurs français ne font pas un échantillonnage purement aléatoire mais y vont au contraire avec des quotas et beaucoup de pondération. Parlant de cette dernière, le FN était traditionnellement sous-estimé par les sondages car les électeurs avaient honte d’avouer voter Le Pen. Cela semble ne plus être le cas (ou bien moindre), en partie grâce aux efforts de Marine Le Pen mais aussi car les sondages sont maintenant faits sur internet et les gens semblent plus enclin à révéler leurs préférences.

Si l’on regarde ces sondages, on voit que Macron et Le Pen sont solidement devant. Cependant, les sondages français incluent tous une mesure de la certitude du vote. Et à ce jeu-là, Le Pen peut compter sur le soutien de 80% de ses électeurs. Macron, de son côté, semble avoir un vote plus fragile avec seulement 55-65% de ses électeurs se déclarant sûrs de leur choix. Voici donc la première chose dont je veux tenir compte dans mes simulations.

L’autre étant l’abstention. Elle semble pouvoir atteindre les 30-35% cette année, ce qui serait très élevé pour la France (pour une élection présidentielle).

Au final, voici comment j’ai procédé :

1. J’ai fait la moyenne des sondages depuis le débat de la semaine dernière. Cela donne Macron et Le Pen à environ 25%, Fillon à 19-19, Hamon et Mélenchon vers les 12%.

2. Je simule ces intentions de votes en utilisant les marges d’erreur (donc Le Pen peut être aussi élevée que 27% mais aussi basse que 22% par exemple).

3. En utilisant le degré de certitude des électeurs, je sépare ces intentions de votes en deux parties : la partie assurée et la partie restante/potentielle.

4. Pour la partie restante, je fais l’hypothèse que trois choses peuvent arriver : 1. Ces électeurs votent finalement pour ce candidat 2. Ces électeurs ne votent pas et 3. Ces électeurs votent pour quelqu’un d’autre. C’est vraiment là que ça se complique et où je dois faire des hypothèses. Voici donc ce j’ai décidé. Premièrement, je simule la part qui votera quand même pour ce candidat. En moyenne, je pars du principe que la moitié ne changeront pas d’avis. Pourquoi la moitié? Il me fallait un chiffre. Si vous avez un bon argument contre (ou en faveur d’une autre option), laissez-moi le savoir. Ensuite, le reste de ces votes vont se diviser entre ceux qui ne voteront pas et ceux qui voteront pour un autre candidat. Le nombre de personnes qui ne votera pas est une fonction directe de l’abstention. Quant à la redistribution des votes, là aussi il m’a fallu faire des hypothèses. Je me suis servis des données sur le 2e tour ou de la proximité partisane (page 10 ici par exemple). L’avantage de la France, c’est que le clivage gauche-droite y est très clairement exposé. Ainsi, il est évident que les électeurs d’Hamon sont bien plus enclins à voter Macron que Le Pen. J’ai ainsi crée une matrice de redistribution. La proximité partisane y est l’élément le plus important. Cela veut dire que Macron, dont le vote est plus fragile, a aussi un fort potentiel car il peut recevoir des votes de quasiment tout le monde.

5. Je fais ainsi des simulations aléatoires où je redistribue une partie des votes. Il y a des simulations où (par exemple) Hamon conserve 60% de son vote, 20% ne votent pas et 20% vont chez Macron. Mais dans une autre simulation, Hamon ne conserve que 50%, 25% s’abstiennent et 25% vont chez Mélenchon.

Je fais 50,000 simulations où tous ses paramètres sont simulés aléatoirement. Cela me permet de regarder les possibles distributions pour les principaux candidats. Ce n’est de loin pas parfait car j’ai dû faire beaucoup d’hypothèses, mais c’est un début.


[Remarque: J'ai réalisé quie j'avais fait une erreur dans mon code pour ces simulations. Je n'arrivais pas à accepter que Macron ait une distribution aussi peu étendue. Cela n'était pas logique. Ainsi la partie ci-dessus reste correcte (ainsi que les deux premiers graphiques ci-dessous), mais svpl regardez ce billet pour les vrais distributions.

Résultats

Premièrement, regardons les résultats pour les votes « sûrs » ou « définitifs ». Ces distributions montrent les résultats possibles (l’axe horizontal est les pourcentages des votes, l’axe vertical est le nombre de simulations -sur 50,000- qui ont un tel résultat (Le Pen est en gris foncé, macron en orange, Fillon en bleu, Hamon en rose et Mélenchon en rouge). À ce jeu-là, Le Pen est largement devant alors que Macron se retrouve à batailler avec Fillon.


Ce graphique montre la fragilité du vote Macron. Malgré une avance dans les sondage, moins de 60% de ses électeurs déclarent leur choix comme étant définitif (contre plus de 80% pour les partisans de Marine Le Pen). Macron a ainsi un plancher potentiellement très bas.

Le graphique suivant montre les distributions avec une partie des indécis répartis. Plus exactement, et tel qu’expliqué ci-dessus, parmi les électeurs qui n’ont pas fait un choix définitif, nous simulons ce qui pourrait arriver si tous ces électeurs votaient finalement pour ce candidat ou, à l’inverse aucun ne le faisait (en moyenne, la moitié vote pour le candidat préféré). Ici on voit que Macron a une distribution large. En d’autres mots, il a la plus grande incertitude. Cela arrive car son potentiel est haut et le pourcentage de ses électeurs qui ont fait un choix définitif est relativement faible. On voit aussi que Macron se rapproche de Le Pen.


Finalement, Macron a aussi un plus haut potentiel car il va chercher des appuis pratiquement partout. Il a le soutien d’électeurs traditionnellement droite Républicaine, centre (le MoDem), gauche (il se partage les Socialistes 50-50 environ) et même de la gauche plus radicale. Pour cette dernière étape, nous redistribuons les voix des électeurs non-définitifs (étape 4-5 ci-dessus). Nous faisons aussi en sortes que les votes sommes à 100% maintenant.


Les résultats sont que Macron et Le Pen sont largement favoris pour finir dans les deux premiers. Il est actuellement quasi impossible de prédire qui finira en tête. Les sondages donnent une légère avance à Macron mais le FN est souvent sous-estimé en France et la possible faible participation avantage la candidate du FN. Ce qui est intéressant c’est que l’incertitude semble s’annuler pour Macron. D’un côté le fait que moins de 60% de ses électeurs déclarent leur choix définitif est naturellement une mauvaise nouvelle, mais d’un autre côté Macron peut bénéficier des indécis de beaucoup d’autres candidats.

Pour que Macron ne termine pas devant Fillon, cela requiert maintenant une sorte de scénario catastrophe dans lequel les sondages l’auraient surestimé, l’abstention est élevée et les indécis se tournent finalement vers Hamon ou Fillon (imaginons un retour aux partis traditionnels). Cela fait beaucoup de conditions et ces simulations montrent qu’il est peu probable que tous cela arrive en même temps. Au final tous mes efforts (tenir compte de l’absention, des 2e choix, de la sureté des choix, etc) semblent essentiellement s’annuler et nous donner des résultats similaires à de simples distributions basées sur les intentions de vote, telles celles de Qc125.com Oh, beaucoup de boulot pour pas grand-chose il semblerait mais tant pis.

Les probabilités d’accéder au 2e tour sont les suivantes :


Au final la situation actuelle est qu’un 2e tour Macron-Le Pen est de loin le scénario le plus probable. Pour Fillon, ses seules chances sont s’il réussit à remonter vers les 20% dans les sondages. Il lui faut également espérer qu’une partie des appuis à Macron se tourne vers Hamon, Mélenchon ou Fillon (les électeurs MoDem -parti centriste de François Bayrou- sont actuellement majoritairement derrière Macron mais cela pourrait changer). La dynamique récente cependant montre que ce n’est pas le cas.
Quant à Hamon, ses chances d’accéder au 2e tour sont nulles. Il est en fait fort probable que Mélenchon termine devant lui, surtout après sa forte performance au débat la semaine passée. Si cela devait arriver, nous aurions un paysage politique très différent. Le PS et Les Républicains seraient très amoindries. Nous aurions un centre avec Macron, regroupant le PS modéré et l’ex-centre (MoDem, etc). Une droite dure autour de Le Pen et une gauche assez radicale autour de Mélenchon.


Je tâcherai de faire une mise à jour hebdomadaire de ces simulations.

S'agit-il vraiment d'un effet Gabriel Nadeau-Dubois?

Le plus récent sondage Léger montrait une forte hausse de Québec Solidaire (+5 points), une variation statistiquement significative. Vu que cela coincide avec l'arrivée de Gabriel Nadeau-Dubois, la plupart des médias et chroniqueurs ont vite parlé d'un "effet GND".

Un seul sondage n'est de loin pas suffisant pour conclure définitivement qu'il y a un effet. Cependant, à regarder le graphique représentant la moyenne mensuelle de QS depuis janvier 2016, il semble indéniable que quelque chose est arrivé.



1. Y-a-til un effet statistiquement parlant?

QS était à seulement 9% en janvier chez Léger. Avec 14% ce mois-ci, il s'agit ainsi d'une hausse de 5 points. Une hausse de 5 points, étant donné le niveau d'appui électoral de QS et les tailles d'échantillons (environ 850 électeurs décidés), est significative statistiquement parlant. Toute hausse supérieure à 3% le serait par ailleurs. Quant au PQ, une chute de 4 points n'est juste pas significatif (il faudrait une chute de 4.2 points...).

Cependant, il est tout à fait possible que cet "effet GND" soit amplifié dans ce sondage car QS était plus bas que d'habitude en janvier et est possiblement plus haut ce mois-ci. Regardez le graphique ci-dessus, QS à 9% était en fait son plus bas niveau depuis plus d'un an chez Léger (et QS était à 11% le même mois chez Crop). QS était aussi déjà vers les 14% (même 16% en fait!) il y a un an. Comme quoi cette formation a déjà connu des hauts dans les sondages sans la présence de GND.

Imaginons ainsi que le Léger de janvier représentait un niveau anormalement bas alors que le sondage de ce mois-ci représente un niveau anormalement haut. En d'autres mots: la vérité est peut-être entre les deux). Ainsi QS pourrait en fait être à 12% en moyenne chez Crop/Léger entre les deux mois (et le PQ à 27%). Si tel était le cas, quelles sont les chances d'avoir ces deux sondages? En d'autres termes, si ni QS ou le PQ n'ont bougé entre janvier et mars, quelles sont les probabilités d'avoir deux échantillons qui génèrent de telles variations? Faisons des simulations.

Tous les partis sont mis à leur moyenne entre janvier et mars. La taille d'échantillon est de 850 (Léger a sondé 1000 personnes mais il n'y a en moyenne que 850 d'électeurs décidés). 10000 simulations (=10000 sondages).

Le résultats? QS est à 14% ou davantage un peu plus de 3% des fois. Le PQ est à 25% ou moins environ 10% des fois. Les deux ensembles? 70 fois sur 10,000. Cela démontre que même si l'on tient compte du fait que QS était possiblement plus bas que normal dans le Léger de janvier (et plus haut que normal en mars), les variations observées ne peuvent pas vraiment être dues au hasard. Il y a un effet significatif. Je crois que cela est établit assez clairement.

Mais simplement car une variation est significative ne signifie pas qu'elle soit causée par un évènement spécifique. Dans les faits, cela ne veut même pas dire que l'effet est réel à coup sûr. Après tout vous pouvez trouver des corrélations significatives entre le nombre de films de Nicolas Cage et le nombre de personnes se noyant dans leurs piscines! Être significatif dans notre contexte signifie simplement qu'une variation aléatoire de 5 points en deux mois n'est pas probable.


2. Ok, il y a un effet, mais est-ce dû à l'arrivée de GND?

L'annonce de la candidature de GND a généré pas mal d'attention médiatique. Regardez les courbes Google Trend ci-dessous.




Sauf que voilà, il y a eu d'autres évènements qui ont donné à QS une couverture médiatique. Par exemple n'oublions pas la campagne de QS et Manon Massé afin de "sauver" Sainte-Marie-Saint-Jacques. Si on ajoute ce terme dans Google Trend, on voit que "Manon Massé" a en fait généré davantage de recherches que GND. Et Léger liste maintenant QS comme "le aprti de Manon Massé" dans ses sondages.




Établir une causalité n'est jamais facile. Il faut faire attention d'attribuer un effet (la hausse de QS) à un seul évènement. C'est le fameux "Post hoc ergo propter hoc", le "après, alors à cause de".


Au-delà d'un point de vue statistique, remarquons que ce même sondage Léger contient quelques questions qui n'indiquent en rien que GND permettra à QS de progresser. Par exemple il génère davantage de mauvaises  opinions que de bonnes (23% bonnes vs 33% mauvaises). Cela est différent au sein des électeurs QS cependant où il reçoit 64% d'opinions favorables. Quant à son impact électoral, seulement 12% des électeurs PQ se disent davantage tentés par QS maintenant que GND est candidat contre 63% pour qui cela ne fait pas de différence (ou possiblement sont moins tentés - le sondage Léger groupant ces deux options). Il est possible que les électeurs séduits par GND aient déjà tous passés à QS, il reste que ces deux questions ne montrent pas vraiment qu'un effet GND devrait être important.

Au final, il se peut que ce soit un effet GND, mais cela pourrait aussi être un effet Massé, ou un effet couverture médiatique tout simplement. Ou, probablement, un mélange de tout cela.


3. Quelle est l'ampleur de cet effet?

Cette dernière question est la plus difficile. La réponse la plus naive est 5 points naturellement. Mais tel que démontré précédemment, cela constitue très probablement une surestimation de cet effet. QS était plus aux alentours des 10% avant l'arrivée de GND, donc enlevons 1 point à cet effet. Nous sommes rendus à +4.

Ensuite, la 2e partie de ce billet devrait vous convaincre qu'il y avait potentiellement d'autres effets. Nous ne pouvons pas vraiment aller au-delà de cette déclaration cependant. Lorsque nous aurons plusieurs mois de données avec GND comme candidat/député QS, nous pourrons nous faire une meilleure idée, mais au minimum, disons que le +4 devient un +3.

Personnellement, je dirais que cet effet de 3 points est probablement la borne supérieure d'un effet GND. Mais ne vous méprenez pas, une hausse de 3 points est importante. Il n'y a pas beaucoup de candidats qui peuvent se targuer d'avoir fait augmenter leur parti de 10 à 13%. C'est assez extraordinaire en fait.

Finalement, il nous faudra attendre avant d'établir d'où proviennent ces votes. Là encore on serait tenter de voir QS +5 et PQ -4 comme étant des vases communicants, mais c'est un peu simpliste. La CAQ a aussi baissé depuis janvier, tout comme les "autres".

Nous verrons avec le prochain Crop si l'on voit un tel effet. Je crois cependant que le meilleur test sera le résultat dans la partielle dans Gouin.

Trying to predict the BC election 2 months in advance

There was a new Mainstreet poll last week. The numbers are all within the margins of error of the previous one. Hardly shocking since nothing really happened in between. The problem? It's pretty much guaranteed this poll can't be right. Or, more specifically, there is almost no chance in hell the BC Conservative will indeed receive 11% of the vote.

Why is that? Well, for starter, this party doesn't currently have a leader. Mainstreet is using the name of the party's president in their polls. Also, as of right now, I don't believe they even have a single candidate. That can be problematic because, you know, that's kinda how people are able to cast votes for your party. I'm serious, go on the website and you'll find a tab called "become a candidate". Some ridings have an "interview scheduled" but most have literally nothing. [update: somebody pointed out to me that they actually have 3 candidates. My bad. Still, my point stands]

This is pretty remarkable for a party that, for all intents and purposes, doesn't exist, to be able to poll in the double digits! But it won't be the case on May 9th.

As a side note, it's also well possible the Green Party is currently overestimated. But we can give them the benefit of the doubt for now.

So, what can we do? Well, past electoral results show that BC isn't the most volatile province. Or at least hasn't been since 2005. I mean, just look at the result of the BC Liberals (the party that has been in power literally the entire 21st century) from 2005 to 2013: 45.8%, 45.8% and 44.13%! The past might not be predictive of the future, but you'll allow me to be skeptical when I see polls putting the BC Lib at 35% or lower (like last week). The pre-election polls in 2013 also had this party really low and we all know what happened at the end.

Another indication that the BC Liberals are currently underestimated is the clear overestimation of the BC Conservatives. With that said, the Mainstreet poll is somewhat surprisingly showing that most BC Conservative voters currently have the Green and NDP as second choice - only 19% have the Liberals. My own analysis from the past results does agree that it'd be a mistake to assume BC Cons voters can only switch to the Liberals. For instance, one region where the BC Conservative party increased the most last election was Vancouver Island. Granted it was essentially because they ran candidates where they had none in 2009, but it does show that the fertile grounds for the BC Cons is not necessarily where we think.

Also, the numbers mentioned above are after redistributing the 23% of undecided (so among decided and leaning voters). Before redistribution, the BC Lib are at 27% and the NDP at 32%. Assuming the undecided won't chose a "small" party, and also assuming a slight advantage for the incumbent (typical in Canada really - so a 60-40 split in favour of the Liberals), it gives us 41% for the party of Christy Clark and also 41% for the party of John Horgan, while the Green would be at 10 and the Conservative at 8%.

The BC prediction market has the following numbers: BC Lib at 41.2%, BC NDP at 41.3%, BC Green at 10.7% and the BC Cons at 5.7%. I have to say, these numbers look pretty much what I would expect (that's assuming the BC Cons will manage to run candidates in at least half the ridings though).

Using these numbers, my predictions are as follows:

In order: voting intentions; Seat projections with 95% confidence intervals; Chances of winning the most seats


The market gives the Liberals over 55% chance of winning a majority and only 40% to the NDP while I respectively have 47% and 44%. I also have 3% chances of a Liberals minority, the same for a BC NDP minority and finally a 3% chance for a tie.

We see a very close race. However, if we consider a tie as a Liberal victory (technically Christy Clark would be asked first to form a government -she'll actually be asked even if she loses but let's forget that for a moment), then Clark's long range chances of keeping her job are 53% (this is what you see on the graphic above).

The model is somehow giving higher chances to the Liberals despite projecting them with fewer seats. That's a weird occurrence but far from impossible. It arises mostly for two reasons. First of all, we have the possible ties as explained above. Secondly, the seat distributions aren't always absolutely symmetrical. You can see the phenomenon with the confidence intervals: the BC Liberals' possible seat distribution is slightly to the right of the BC NDP's one.

Also, and this might be more important, these long range projections have the BC Conservative too low to be a threat anywhere. On the other hand, the BC Green would be in the race in up to four ridings. And if Andrew Weaver and his party were to win these ridings, that would hurt the NDP more because those are NDP seats.

Let me put that slightly differently. If we account for the uncertainty that exists, the BC NDP is slightly more at risk of a better-than-expected showing of the Green party. And in a tight race where every seat counts -and where the NDP might have to actually win more seats since a tie wouldn't be good enough, that is enough to give the Liberals a slight edge. However, if the numbers above were to actually happen on election night (i.e: the BC Green would not outperform the polls and indeed only get 10.7% of the vote), then John Horgan would likely become Premier.

If we use a more qualitative/subjective approach, there are other reasons to expect a close race. The Liberals have the economy going for them along with public finances. For many people, life has been good in BC during the 21st century and they might not want to take a chance. On the other hand, after 16 years in power, many people are probably ready for a change. Plus Clark is very unpopular.

In terms of policies, the Liberals will mention all the measures about real estate (I'm not going to debate whether they will work or not), a hot topic in BC. People seem to have responded favorably to those. As for the NDP, two key proposals (minimum wage at $15 and $10 daycare) also appear to be popular (if we believe Mainstreet's numbers).

Let's summarize with bullet points:

- At this point, a reasonable long range forecast for the BC election would see the main two parties pretty much tied around 40-41% with the BC Conservative significantly lower than the current poll numbers.

- This would create an incredibly tight race. In particular, it doesn't seem that any party holds a serious electoral advantage with the electoral map or the vote efficiency (i.e: winning more seats with fewer votes). It would instead come down to a couple of key races (17 ridings projected to be close -within 5%- out of 87).

- The BC NDP is more at risk because if the BC Green party was to out perform the polls, they'd likely take seats away from the NDP, not the Liberals.

- If we forget about ties being technically a win for the incumbent, the race is as close to 50-50 as it gets.

In conclusion, at this point in time, it appears likely that the 2017 BC election will be a close race. We are still far from the election and obviously many things can happen, but this is the best we can do at this point. And I truly believe that those are better projections than if we were to simply take the current polls at face value.

Here below is a picture with the projections and probabilities based on the numbers mentioned above.


Sondage Léger mars 2017: Le PLQ largement devant

Ce matin nous avons eu le plaisir d'avoir un nouveau sondage Léger. Et alors qu'il y avait une lutte serrée entre PLQ et PQ au cours des derniers mois, le parti de Philippe Couillard semble avoir une avance importante ce mois-ci. Bien sûr il nous faudra attendre d'autres sondages avant de parler de nouvelle tendance.

Aussi, QS semble profiter d'un petit effet Gabirle Nadeau-Dubois, bien qu'il ne soit pas assuré que la hausse soit due à son arrivée.

En utilisant les chiffres du sondage, et sans aucune modification (à l'inverse de ce que je ferais en campagne où je redistribuerais les indécis différemment), nous avons les projections suivantes (note: j'utilise encore l'ancienne carte électorale, je mettrai à jour d'ici cet été. La nouvelle carte ne change pas grand chose de toutes manières):

Dans l'ordre: intentions de vote; Projections de sièges avec intervalles de confiances à 95%; Chances de remporter le plus de sièges.
Comme vous pouvez le voir, même sans une "prime à l'urne", les Libéraux seraient largement favoris. Dans les faits la victoire serait quasi assurée. Peut-être plus surprenant, le PLQ ne serait pas assuré d'avoir une majorité. En effet, les chances ne sont "que" de 25% malgré une avance de 9 points dans le vote populaire! D'un autre côté, il serait peut-être un peu fou d'imaginer que l'on puisse récolter une majorité avec seulement 34% des suffrages.

Pour QS, ces chiffres sont vraiment bons. Sont-ils dus à l'arrivée de GND en politique (qui se présentera dans Gouin)? Dur à dire. QS à été aux alentouts des 14% avant, donc ce n'est pas un résultat complètement hors de la normale. Le sondage Léger montre aussi que GND divise beaucoup, à part chez QS. Mon opinion actuellement est que GND va facilement remporter Gouin (surtout si le PQ ne présente pas de candidat en effet) mais ne permettra pas à QS de progresser massivement d'un coup. Faites attention, simplement car QS progresse et le PQ baisse ne signifie pas que cela est dû à GND.

Parlant toujours de QS, le meilleur scénario absolu en se basant sur ce sondage? 10 sièges! Oui cela paraît ridicule mais on parle d'un scénario très peu probable dans lequel ce parti ferait bien mieux que le sondage et aurait un vote efficace. Quoiqu'il en soit, voici la liste des comtés où QS n'est pas à 0% de chances: Gouin, Mercier, SMSJ, Laurier-Dorion, Hochelaga-Maisonneuve, Rosemont, Bourget, Crémazie, Rimouski, Sherbrook, Taschereau - tous au-dessus des 1%, ainsi que: Viau, Vachon, Trois-Rivières, Taillon, Saint-Jérôme, Rouyn-Noranda, Poite-aux-Trembles, Montarville, Marie-Victorin, La Prairie, Bourassa-Sauvé, Borduas, Anjou et Abitibi-Est. Bien sûr, dans bien des cas on parle d'une possiblité de 1 victoire sur 10000. Néanmoins, cela montre où QS pourrait gagner en cas de "vague QS".

Au fait, juste pour le fun, voici la distribution des simulations. Comme vous pouvez le voir, les trois principaux partis ont une distributiuon assez large alors que QS est fortement concentré vers 5-6 sièges. Il y aurait aussi assez d'incertitude pour que le PQ puisse finir 1er ou 3e. Au fait, il ya  3 simulations sur 10000 où la CAQ gagne une minorité.


Et voici les projections par comté (clique-droit pour télécharger l'image)


Gabriel Nadeau-Dubois sera vraisemblablement élu dans Gouin

Gabriel Nadeau-Dubois sera vraisemblablement élu dans Gouin
Il semble que les rumeurs avaient vu juste et que Gabriel Nadeau-Ducois remplacera bel et bien Françoise David dans Gouin. Mais va-t-il gagner? Réponse courte: oui. Réponse longue: lire la suite.

Il n'y a aucun doute que Québec Solidaire avait remporté Gouin grâce à un effet/bonus pour l'ex-cheffe de ce parti. Sas cet effet personnel et se basant uniquement sur les variations provinciales (ou mêmes régionales, le PQ aurait conservé ce siège en 2012.


Résultats dans Gouin pour QS
Variation provinciale
Variation dans l'Est de l'île
2007
26.03%


2008
31.85%
0.14%
1.70%
2012
46.03%
2.25%
6.99%
2014
50.98%
1.60%
1.40%

Mais au fil des années, Madame David a su transformer un château-fort Péquiste en une forteresse pour QS. La preuve en 2014 avec près de 51% des votes tel qu'indiqué ci-dessus.

Mes estimations indiquent que l'effet David était d'environ 15 points. En d'autres mots, Françoise David était environ 15 points au-dessus de ce que l'on attendrait d'un candidat qui ne serait pas une vedette.

Pour Nadeau-Dubois, même dans un pire scénario qui le verrait perdre tout cet effet personnel, il remportera quand même le comté. Ce serait une course très serrée si ces votes retournaient au PQ, mais QS serait favori. De plus, Nadeau-Dubois est connu et il devrait lui-même avoir un petit effet personnel. Dur à estimer/deviner l'ampleur de ce dernier cependant .

La situation est encore plus claire avec l'absence d'un candidat PQ dans ce comté, tel qu'annoncé par Jean-François Lisée. Il n'y a ainsi aucun doute que QS conservera ce siège. Dans les faits, cette complémentaire n'aura comme surpense que le score de QS. Il s'agîra du premier test réel d'une possible entente/alliance entre le PQ et QS.

La perte d'une candidate vedette (et chef) devrait faire baisser QS mais l'alliance avec le PQ devrait le faire augmenter. QS a aussi démontré dans SMSJ ou récemment dans Verdun que cette organisation est capable d'aller chercher des votes dans les comtés ciblés. Je n'ai aucun doute que QS déploira les grands moyens dans Gouin et ainsi je crois que la baisse sera faible. Surtout que les électeurs ne pourront se ralier sur le PQ.

Imaginons qu'il perde la moitié de l'effet David (je surestime probablement la perte ici), QS se retrouverait à environ 47% en se basant sur les sondages récents et les projections. Après, le PQ est actuellement projeté aux alentours des 24% dans Gouin. Si Nadeau-Dubois arriver à conserver ou récupérer 80% du vote PQ, il pourrait être à 65%.

Le taux de 80% est crucial car si cette entente pour un candidat unique devait être appliquée à d'autres comtés, il est primordial qu'une grande majorité des électeurs de ces partis suivent. Je soupçonne que beaucoup de Péquistes resteront chez pour la partielle cependant.

Quoiqu'il en soit, il n'y a pas vraiment de scénario où Gabriel Nadeau-Dubois ne devient pas député de Goin. La vraie question est plutôt de savoir s'il gagnera avec plus ou moins de 60% des votes.

With 2 months before the election, BC NDP in familiar territory

The BC election is about 2 months away and the latest Mainstreet/Postmedia poll places the BC NDP of John Horgan ahead. At the same time in 2013, the BC NDP was also enjoying a comfortable lead. Will history repeat itself?

Well, first of all, the current lead over the BC Liberals is far smaller than 4 years ago. There were polls giving the NDP a 20-points lead. Also, let's remember that another Mainstreet poll a little over a week ago had the main two parties tied at 37%.

Moreover, while the BC NDP is at 38% among decided and leaning voters, we shouldn't forget that there are 24% of undecided. Before redistribution, the NDP is actually at 30% while the Liberals are at 25%. Let's assume these undecided split 60-40 for the incumbent (that are usually underestimated by the polls) and you get a perfect tie around 40%. In this case (BC Liberals and NDP at 40, Green at 11 and Conservatives at 10%), and you can convince yourself of it using the simulator, the race would be as close as 5 seats. Quite frankly, these numbers are probably closer to what will happen next May than the current official numbers of this poll.

All that to say that while the BC NDP has the lead, it's far from a safe or guaranteed one. Using the decided+leaning numbers, we get the following projections:

In order: voting intentions, seat projections with 95% confidence intervals, chances of winning the most seats

Quite a change compared to my previous projections. There are a couple of reasons. First of all,the numbers are very different. As mentioned above, the two parties were at 37% back then. On top of that, I made some adjustments to the model. Specifically, I'm accounting for the loss of long term incumbents, something that has been hurting the Liberals in the past (an average drop of as much as 6 points). I'm also assuming that the independents in Abbotsford South, Cariboo North and Delta South won't run again and I therefore redistributed their votes. I also decreased the BC Conservatives in Peace-River-South because their candidate of 2013 that got as much as 27% of the vote, Kurt Peats, is not running again and actually endorsed the BC Liberals.

I maintain that the NDP is more at risk of a good performance of the Green party. Not only in term of votes, but seats. The Green party is very high on Vancouver islands, a region where the NDP won most of the seats.

With that said, the numbers for the Green and especially the BC Conservatives don't make much sense. The latter doesn't even currently have a leader and has virtually (or literally) no candidate. It's actually impressive to think that a ghost party can poll so high. If this party could get its things together, it would actually be competitive in many ridings.

I can't just go ahead and assume the support for the PC and Green is overestimated though. They'll get the benefit of the doubt for now. As for who would benefit from a collapse of the Conservatives, intuition says the Liberals but second choices from Mainstreet show that while 42% of Conservative voters have the Liberals as second choice, there are 34% who would pick the NDP.

The Green voters' second choices are overwhelmingly for the NDP but empirical data shows that it might not be that clear cut.

Non voting intention data from the poll show that while Christy Clark is fairly unpopular (-36 net favorability), John Horgan isn't even known or doesn't generate an opinion of 51% of the voters. I know they'll pay more attention during the election but still, the BC NDP needs to start marketing its leader. The only time I hear his name is during some negative ads on the radio!

One thing that could really help Christy Clark is the strong BC economy. BC residents are quite confident about the future as well. Honestly, from a purely subjective opinion, the situation seems quite favourable to a reelection of the Liberals. People in BC don't love the Liberals, but I'm not convinced they are ready to switch to the unknown NDP. Time will tell of course.