5 septembre 2012: Post-mortem détaillé

Quelle soirée électorale! Entre la surprise Libérale (ce parti était même en tête pendant une partie de la soirée), la relative déconvenue/malchance de la CAQ et l'évènement tragique lors du discours de Pauline Marois, on peut dire qu'il y a eu de l'action.

Ce billet compare en détails les projections aux résultats réels.

Commençons par le phénomène évident: le PLQ a fait bien mieux que prévu. En finissant 2e à 31%, seulement 1 petit point derrière le PQ, le parti de Jean Charest aurait bien pu terminer la soirée en tête! Une performance bien supérieure à ce que les sondages prédisaient. Oui oui il y avait des sondages montrant le PLQ plus élevé, en particulier le fameux Forum du milieu de campagne ou celui d'hier. Mais en même temps, ces sondages montraient la CAQ bien inférieure à 27% et le PQ loin de son 32%. Donc c'est pas comme si on avait vraiment pu prévoir. Il semble que Claire Durand avait partiellement raison, mais même là ses calculs ne sont pas parfaits. Au final, je l'ai toujours dit et répété, ma job n'est pas de deviner les pourcentages mais de les transposer en sièges. Bien sûr, je me dois d'essayer de deviner ces pourcentages sinon je n'aurais pas vraiment de quoi écrire des projections et ce blogue se résumerait à avoir un simulateur! J'avoue que c'est toujours un peu agaçant quand les sondages ne fournissent pas la bonne image de la réalité. Je comprends que c'est difficile et qu'il y a beaucoup de facteurs qui ne sont pas de ma faute, mais je préférerais naturellement pouvoir fournir des projections finales proches de la réalité, sans avoir un parti sous-estimé de 4-5 points.

Pour tester si le modèle a fonctionné, il faut utiliser les pourcentages de l'élections, c'est-à-dire PQ à 31.9%,  le PLQ à 31.2% et la CAQ à 27%, ainsi que QS à 6%, le Parti Vert à 1% et ON à 1.9%. En termes de sièges, cela donnerait ceci globalement (entre parenthèses les résultats finaux du DGEQ):

PQ: 51 (54)
PLQ: 48 (50)
CAQ: 24 (19)
QS: 2 (2)

Ainsi, on voit que globalement, c'est plutôt pas mal. La CAQ est certes sur-estimée de 5 sièges, mais l'intervalle pour ce parti allait de 16 à 30. Ainsi, on peut dire que la CAQ a objectivement été malchanceuse dans le sens que son vote s'est retrouvé extrêmement inefficace. C'est assez fou d'ailleurs de voir le parti de François Legault juste derrière les deux autres partis en termes de voix mais si loin en termes de sièges. Mais au final, c'est satisfaisant de voir que le modèle aurait correctement prédit que le PQ et PLQ seraient en lutte pour la victoire alors que la CAQ serait loin derrière. Un effet du mode de scrutin bien transposé dans le modèle. En passant, parlant de mode de scrutin, je n'ai jamais caché que je ne suis pas un fan du système actuel. Je suis un grand partisan d'une réforme (personnellement, j'aime beaucoup le système compensatoire allemand). On m'a gentiment demandé de parler de cette pétition en ligne et je vous en fais part ici. C'est non-partisan donc je ne vois pas le problème. Il me semble qu'après hier soir, on devrait au moins reparler d'une possible réforme, mais je sais bien que cela n'arrivera pas.

Une autre façon de voir l'inefficacité de la CAQ est de regarder le pourcentage de succès dans les comtés remportés par moins de 5%. Alors que le PLQ en a gagné 11 sur 16, la CAQ n'en a remporté que 8 sur 20. Ainsi, on le voit, la CAQ était là, compétitive, juste derrière. Mais juste derrière avec ce mode de scrutin signifie perdant.

Au niveau des circonscriptions, avec les pourcentages de l'élection, le modèle aurait correctement prédit 105comtés sur 125, donc 20 erreurs. C'est une performance ok. Une bonne performance est d'avoir 10-15 erreurs, cela tombe à bon entre 15-20 et devient ok au-delà de 20. En tenant compte du fait qu'il y avait une nouvelle carte et deux nouveaux partis, c'est peut-être pas si pire comme on dit en bon Québécois. Aussi, sur les 20 erreurs, il y en 6 qui sont dans des luttes serrées et où le modèle avait correctement prédit une telle lutte. Il y a donc 14 comtés où le modèle avait juste tort en ce qui concerne le gagnant (remarque: il faudrait aussi compter les fois où le modèle a eu le bon gagnant mais des écarts ou pourcentages différents, mais c'est moins grave et je n'ai pas encore eu le temps). Parmi ces erreurs, il y a par exemple Argenteuil où, malgré un taux de participation très différent de l'élection partielle, les résultats y ont été remarquablement similaires.

Je vous invite à regarder les résultats comté par comté, il y a vraiment beaucoup de circonscriptions où les projections sont très proches, y compris dans de nombreuses luttes serrées correctement prédites. C'est une chose de projeter le bon gagnant, mais personnellement, ma satisfaction vient davantage quand les pourcentages sont proches. Quand vous y pensez, réussir à prédire correctement autant de comtés en se basant simplement sur les pourcentages provinciaux est assez remarquable. Je suis aussi content d'avoir eu QS plutot juste dans Laurier-Dorion et SMSJ, ou Jean-Martin Aussant dans Nicolet-Bécancour.

J'ai souvent dit qu'une des clés de cette élection serait de savoir où sont allés les anciens adéquistes. Il semble en effet que cela a grandement influencé certains comtés. Malheureusement, il ne semble pas y avoir une tendance claire si ce n'est que les anciens députés Adéquistes ont tous conservé une part très importante de leurs votes. À l'inverse, la victoire Libérale dans Beauce-Sud aurait été vraiment difficile à prévoir en regardant 2008 et la variation depuis lors.

Dans les faits, le modèle a bien fonctionné sauf en Montérégie. Cette région semble avoir réagi différemment cette année que par le passée. En particulier, la CAQ n'y a pas vu sa hausse provincial amplifiée autant que c'était le cas pour l'ADQ. Alternativement, le PQ et PLQ y ont plutôt bien résisté. Mais au-delà de ça, il semble y avoir davantage d'effets locaux (ou des candidats). Dans cette seule région, le modèle aurait fait 8 erreurs, un taux bien plus élevé que partout ailleurs.

Au fait, en utilisant un modèle uniforme (donc qui ne tient pas compte de la région ou du candidat sortant) et en faisant l'hypothèses ADQ=CAQ, un tel modèle aurait donné les résultats suivant: PQ: 59, PLQ: 45 et CAQ 20.

Pour conclure, que faudra-t-il améliorer pour le prochain modèle? La première chose sera de mieux identifier la CAQ. Cela sera grandement simplifié grâce aux données de cette élection. Aussi, les sondages locaux étaient plus justes que d'habitude et 2-3 erreurs auraient pu être évitées en incorporant davantage cette information. À l'avenir, je pense faire une moyenne entre mes projections et les sondages locaux lorsqu'il y en a.