Les sondages et les primaires (partie 4) : Les échantillons en question

La capacité des sondages à refléter la "réalité" repose exclusivement sur les techniques d’échantillonnage mises au point dans la première moitié du XXe siècle. Un simple calcul de marges d’erreurs peut très nettement nuancer les résultats d’un sondage.

Outre la question d'une mobilisation difficile à anticiper (cf. partie 3) la  fiabilité des sondages est mise à mal par une autre difficulté : la taille des échantillons de personnes interviewées. Or la capacité des sondages à refléter la "réalité" repose exclusivement sur les techniques d'échantillonnage mises au point dans la première moitié du XXe siècle. Les enquêtés sont représentatifs d'une population plus vaste, à condition d'être sélectionnés selon des principes rigoureux et d'être suffisamment nombreux pour que la marge d'erreur soit la plus faible possible. Les statisticiens disposent en effet d'outils qui leur permettent de mesurer avec précision cette marge. On ne rentrera pas ici dans ces considérations mathématiques, sinon pour souligner que ce calcul statistique vaut pour des échantillons recueillis aléatoirement à partir d'une "base" de sondage censée contenir l'ensemble des personnes appartenant à la population de référence (en l'occurrence ici, les Français inscrits sur les listes électorales). En France, les instituts de sondage travaillent principalement à partir d'une autre méthode d'échantillonnage : la méthode dite des "quotas" dont on considère qu'elle livre des résultats à peu près équivalents à ceux obtenus par la méthode aléatoire qui, elle, est plus coûteuse à mettre en oeuvre. En toute rigueur, on ne devrait donc pas parler de "marges d'erreur" au sujet de sondages réalisés à partir de quotas. Il est cependant de plus en plus fréquent que les sondeurs s'appuient sur ce calcul des marges d'erreur pour établir la qualité de leurs résultats : désormais, l'IFOP, Viavoice, BVA ou LH2 font précéder l'ensemble de leurs rapports d'enquête disponibles sur leur site internet d'un rappel de ces principes statistiques élémentaires.
 
La solidité des données dépend donc principalement du nombre d'interviewés : plus l'échantillon est vaste, plus les résultats "réels" ont de chances d'être voisins des résultats "mesurés". Seulement, enquêter coûte cher. Les instituts de sondage n'étant pas des sociétés philanthropiques mais des entreprises commerciales, ils facturent leurs enquêtes au pro rata du nombre d'interviewés. A moins que les commanditaires soient nombreux ou particulièrement soucieux de la qualité des résultats, il est donc fréquent que les sondages reposent sur des échantillons de petite taille. Cette difficulté est particulièrement marquée lorsque la population enquêtée est restreinte : les sympathisants de gauche susceptibles de voter lors de la primaire ne forment en effet qu'une petite fraction du corps électoral. Les instituts doivent donc arbitrer entre des logiques de coût et des logiques de fiabilité des résultats.
 
Ainsi, l'enquête Opinionway de la fin août est constituée à partir d'un échantillon total de 3202 personnes âgées de 18 ans et plus. Parmi ceux-là, 1311 se disent proches (ou pas trop éloignés) d'un parti de gauche. Or, seuls 17 % de ces derniers se déclarent "certains" d'aller voter lors de la primaire. Il n'y a donc plus que 222 interviewés dont on peut recueillir les intentions de vote. 42 % de ces 222 privilégient la candidature de François Hollande, contre 30 % celle de Martine Aubry. En faisant l'hypothèse que ces électeurs potentiels iront bel et bien voter, on déduit des lois statistiques que ces 42  % s'accompagnent d'une marge d'erreur d'environ 6,9 % (les 30 % adressés à Martine Aubry figurent, eux, dans une fourchette de plus ou moins 6,5 %). Autrement dit, les intentions de vote pour François Hollande se situeraient entre 35 % et 49 %, quand celles pour Martine Aubry seraient comprises entre 23,5 % et 36,5 %. Ces précisions ne remettent donc pas en cause la nette domination du député de Corrèze mais elles invitent à la prudence en matière d'analyse de ces résultats.
 
Autre exemple, une enquête Ipsos réalisée entre le 16 et le 22 août, à partir d'un échantillon initial de 3 677 personnes permettant d'identifier 404 votants potentiels à la primaire socialiste. Ce sondage ne se contente pas de livrer les intentions de vote au premier tour. Il propose aux sondés plusieurs hypothèses de second tour. L'une d'elle montre que François Hollande l'emporterait face à Martine Aubry, avec 53 % des suffrages (contre 47 %). La victoire semble acquise. Mais attardons nous sur certains détails. Sur ces 404 sondés, 91 % s'expriment face à une telle alternative : le résultat ne repose donc plus que sur 368 individus. Or, et c'est à l'honneur de l'institut de fournir ces données, 38 % des "électeurs" de Hollande et 42 % de ceux de Aubry indiquent qu'ils peuvent encore changer d'avis. Seuls 60 % des interviewés qui s'expriment se disent sûrs de leur vote, soit environ 220 personnes. Avec un effectif aussi faible, la marge d'erreur est d'environ 7 %, si bien qu'à la mi-août, le score a priori "réel" de Hollande navigue entre 46 % et 60 %, quand celui de Aubry se situe entre 40 % et 54 %. Apparemment évidente, la victoire de François Hollande devient alors beaucoup plus incertaine.
 
Reste que les sondages ne sont pas des éléments d'information neutres dans un scrutin. Par leur médiatisation et leur circulation dans l'entourage des candidats et dans les foyers des électeurs, ils peuvent contribuer à bousculer l'appréhension d'une élection et modifier le regard porté sur ses différents protagonistes. Ils peuvent aussi amener une équipe de campagne à réorienter sa stratégie. Bref, ils font partie du réel, au point de pouvoir peser sur ce réel. À l'image des anticipations boursières, leurs prophéties ont parfois une dimension "autoréalisatrice". Différentes hypothèses se proposent de rendre compte des effets qu'entraînent la publication de sondages sur l'évolution des résultats électoraux. Comme aucune d'entre elle ne fait véritablement consensus parmi les spécialistes de science politique, on ne peut présumer de l'influence que pourra avoir cette multiplication de sondages sur le verdict de la primaire. Tout au plus peut-on noter que parmi les "électeurs potentiels" identifiés par Opinionway, 50 % indiquent qu'"au moment de voter lors de ces primaires", "ce qui comptera le plus dans [leur] choix", ce sera "la capacité à battre Nicolas Sarkozy" (contre 32 % choisissant "les propositions du candidat" et 18 % "la personnalité du candidat"). Sans accorder trop d'importance à une donnée qu'il faudra naturellement creuser pour en comprendre les ressorts, on peut imaginer que la candidature Hollande bénéficiera sans doute d'un effet de ralliement lié à ses bonnes performances sondagières.