Mode de calcul de l’indicateur

L’indicateur hebdomadaire, qui a été publié le lundi pendant la campagne présidentielle, comprenait TOUS les sondages publiés sur l’élection présidentielle de 2012.

Je dis bien « TOUS » car, sans exhaustivité, nul intérêt de réaliser un tel indicateur, mais aussi parce que de nombreux sites vous proposent, prétendent-ils, tous les sondages alors que c’est faux. Soit ils en oublient beaucoup, soit ils les publient de manière chaotique et incomplète.

Vous pouvez d’ailleurs vous-même verifier mon exhaustivité à l’aide des liens figurant sur ce site vers les 9 instituts de sondage réalisant des enquêtes pour l’élection présidentielle.

Un indicateur agrégé a été également calculé pour le second tour, même s’il restait peu nourri en attendant la désignation du candidat socialiste, une faible proportion des sondages intégrant les hypothèses de second tour.

L’indicateur a été pondéré de la manière suivante:
– en fonction de la taille de l’échantillon, si possible réduit aux seuls électeurs inscrits lorsque l’institut précise leur nombre,
– en fonction du temps, avec un coefficient 1 pour tous les sondages publiés dans la semaine précédente, puis diminution du coefficient d’un palier de 0,15 pour chaque semaine d’antériorité (0,85 / 0,7 / 0,55 / 0,4 / 0,25 / 0,1), ce qui implique une disparition des sondages de la base de l’indicateur lorsqu’ils ont plus de 7 semaines d’ancienneté.

Cette diminution arithmétique du coefficient a été accentuée dès que les sondages ont été plus nombreux et, en tous les cas, après la période des vacances de fin d’année.

Ainsi qu’il a été exposé, la fiabilité des sondeurs, qui ne peut souvent s’apprécier qu’a posteriori, n’est pas prise en compte car elle serait trop arbitraire.

La candidature d’Eva Joly inclut en revanche des données relatives à Nicolas Hulot pour la période mai-juin: l’indicateur est purgé de ces données, qui ne subsistent qu’à titre historique dans le graphique. Il en est de même pour la candidature Morin, qui a « succédé » à la candidature Borloo.

MISE A JOUR DU 18 DECEMBRE 2011:

Il est désormais temps d’actualiser la pondération de notre indicateur en fonction du temps. Le coefficient 1 est maintenu pour tous les sondages publiés dans la semaine précédente. La diminution de ce coefficient va être accentuée au fil du temps, ce qui correspondra à l’accélération de la campagne et à la multiplication progressive des sondages:
– du 19 décembre au 16 janvier: 1 / 0,8 / 0,6 / 0,4 / 0,2
– du 23 janvier au 13 février: 1 / 0,75 / 0,5 / 0,25
– du 20 février au 12 mars: 1 / 0,7 / 0,4 / 0,1
– du 19 mars au 2 avril: 1 / 0,6 / 0,2
– du 9 au 16 avril: 1 / 0,5
– le 20 avril: publication d’un indicateur spécial, actualisé, avec pronostic pour le premier tour,
– du 23 au 30 avril: 1 / 0, seuls les sondages de la dernière semaine sont pris en compte,
– le 4 mai: publication d’un indicateur spécial, actualisé, avec pronostic pour le second tour.

Etant donné la rareté relative des sondages jusqu’en octobre dernier, ce sont les sondages publiés qui étaient retenus. Aujourd’hui, les sondages semblent publiés beaucoup plus rapidement par les médias, et la différence temporelle entre réalisation et publication est très réduite, ce qui ne devrait plus entraîner de difficulté pour l’intégration d’un nouveau sondage dès sa première semaine de « validité ».

Je publierai désormais un graphique actualisé toutes les semaines.

MISE A JOUR DU 21 FEVRIER 2012:

En réalité, pas de mise à jour, mais de l’auto-congratulation ;). En effet, les dernières étapes d’accélération de la pondération des sondages afin de se rapprocher des résultats les plus récents ont correspondu au véritable démarrage de Hollande (Le Bourget, programme et France 2), puis au lancement de la candidature de Sarkozy (déclaration officielle, Marseille).

Le prochain changement correspondra à la validation des 500 signatures et à l’ouverture de la campagne officielle. A priori, je ne devrai donc pas avoir à retoucher l’évolution de cette pondération.

MISE A JOUR DU 27 AVRIL 2012:

Je publie un indicateur intermédiaire au 27 avril, puis un autre au 30 avril, enfin un dernier au 4 mai, afin de pouvoir mesurer l’effet du débat.
Le nouvel indicateur des reports de voix est actualisé en même temps.

20 réactions sur “Mode de calcul de l’indicateur

  1. Si vous allez dans la catégorie « Indicateur », vous trouverez les articles qui commentent l’indicateur et reprennent effectivement un graphique… vous étiez exaucé sans le savoir 😉

    Mais il est vrai que je compte avoir suffisamment de temps pour publier ce graphique chaque semaine à partir d’après-demain.
    Manifestement, nous sommes entrés dans une phase de grande activité sondagière et le paysage bouge…

    Continuez de suivre ce blog: je posterai plus régulièrement à l’approche de la campagne elle-même, c’est promis !

  2. Ca m’intéresse ! Et je suis sûr que ça va intéresser bcp de monde… Il faudrait que ce soit plus graphique pour cela. Allez hop un petit coup de Libre Office là dessus, un copier coller, et en avant ! 🙂

  3. Bonjour !
    La grosse faille dans ses analyses, moyennes et commentaires c’est qu’ils sont faits avec les sondages publiés et non avec les résultats bruts.
    Or les sondages « publiés » sont déjà pondérés par les Instituts avant publication !
    La « pondération » des institut relevant de l’arbitraire, vous ne faites qu’accentuer cet arbitraire, dommage.
    Vraiment, la nouveauté serait d’obtenir les résultats bruts et laisser chacun pondérer comme il le souhaite.

    Exemple de « pondération » arbitraire (même si logique parfois !) des instituts :

    – Pondérer le score brut de Marine Le Pen en fonction du score brut/pondéré/réel de son père en 2002 et 2007.
    Contestable, car les sondés répondent plus facilement qu’ils voteront Marine qu’ils ne répondaient antan qu’ils voteraient Jean-Marie.

    – Pondérer le score brut de Mélenchon en fonction du score brut/pondéré/réel de Robert Hue et Marie-George Buffet en 2002 et 2007.
    Contestable, car Mélenchon n’est pas le candidat du seul PCF, et l’on se sait pas si le « vote utile » jouera en 2010 comme il a joué en 2007.

    – Pondérer le score brut de Bayrou en fonction du score brut/pondéré/réel de 2002 et 2007.
    Ce dernier ayant obtenu 18% en 2007, il lui suffit seulement d’être sur la liste des candidats pour obtenir 5% « publiés’ même si un seul sondé a répondu Bayrou !

    9% pour l’institut le donnant le plus haut la dernière semaine, et 17% réels sortie des urnes pour Arnaud Montebourg aux primaires socialistes, voilà à peu près la marge de « pondération » que se donnent les Instituts…

  4. Vous avez raison, les pondérations des sondeurs sont parfois non négligeables. Il s’agit en fait de redessements, tout simplement car vous avez deux catégories de personnes qui « perturbent » les sondages: ceux qui mentent car ils ne veulent pas avouer une préférence ou ils veulent artificiellement faire « monter » un candidat; ceux qui se mentent et qui reconstituent un passé de votes qu’ils n’ont en réalité pas eu mais dont ils se sont convaincus eux-mêmes…

    Les redressements ont été traditionnellement difficiles avec le vote Jean-Marie Le Pen, constamment sous-évalué et finalement sur-évalué en 2007.
    L’exemple que vous donnez pour Montebourg ne tient en revanche pas: les sondeurs n’avaient pas de référence passée pour « redresser » les résultats… En outre, l’un d’entre eux donnait Montebourg bien au-delà de 10% à la fin.

    Rien n’est parfait et même un sondage « juste » le vendredi d’avant élection pourrait bien être contredit dans le résultat final, tant le vagabondage électoral est désormais prégnant et tant l’incertitude semble forte désormais jusqu’au moement de passer dans l’isoloir pour une frange suffisamment importante de la population pour fausser tout pronostic d’intention de vote…

    Mais nous sommes aussi là pour nous amuser.
    Tout en tentant d’être le mieux informé possible, en intégrant TOUS les sondages. Quant à ma pondération elle est, elle, objective par rapport aux chiffres retraités des sondeurs: elle dépend du nombre de répondants et de l’ancienneté. Certes, la diminution dans le temps est arbitraire, mais elle touche uniformément tous les sondages, donc je n’ajoute pas de distorsion supplémentaire par rapport aux sondeurs eux-mêmes.

  5. Après l’annonce de notre président sortant; je pense pas qu’il remonte dans les sondages; François Hollande pour l’instant se maintient a son niveaux mais en suivant ses prestations a regarder à la loupe rien de nouveaux,il ne s’agit pas de critiqué le résultat des cinq années passée du Président n’a pas été une grande réussite ! mais je ne vois pas
    comme les sondages des médiats qui plafonne 30% pour Hollande 25% Sarkozy et 20% lepen
    dans huit jours les sondages vont se maintenir (mais attention personne le vois arriver où ne veulent pas le voir dans trois semaines

    • Si vous souhaitez effectivement vous abonner, aller sur la page d’accueil et cliquer sur l’onglet « suivre » ou « follow », en haut ou en bas de la page.
      Merci pour votre intérêt.

  6. Question : pourquoi hier soir ,mardi , suivant les médias en ligne , il y avait des % différents
    pour ce dernier sondage IFOP . Certains donné 28,5 Hollande et 28 Sarkosy et d’autres
    exactement l’inverse qui est repris ce matin par tous les médias ? Ce n’est pas une erreur
    « de frappe  » car les % étaient aussi différents pour Mélenchon …..

    • Le sondage à 28,5/28 est le quotidien d’IFOP: il font tourner un échantillon moyen de 900 sur 3 jours (soit 300 nouvelles réponses par jour). Ce sondage quotidien est publié dans Paris-Match et j’ai déjà pu dire combien je regrette qu’il n’apparaisse pas le week-end et que sa présentation varie d’un jour à l’autre (on agrège jusqu’à 5 jours, pour revenir à 3 le lendemain, etc. sans cohérence dans le temps). Je ne publie pas chaque sondage quotidien, bien entendu, mais je publie à intervalles réguliers un article faisant le point sur ce rolling poll depuis sa création.

      Le sondage à 27/28,5 est un sondage périodique, réalisé auprès d’un échantillon plus large (voir mon post sur l’indicateur du 12 mars 2012 et ce sondage IFOP), pour Europe 1, Paris-Match et Public Sénat. Cet échantillon plus large, reprend en partie l’échantillon quotidien, mais seulement sur 2 jours en l’occurrence, et y agrège d’autres personnes, non interrogées dans le quotidien. Comme pour tous les sondages « classiques », non-quotidiens, je le publie de manière détaillée.

      IFOP fait aussi du commerce et on ne peut l’en blâmer… 😉
      En revanche, la présentation médiatique n’est jamais très claire: on ne précise pas la différence, on fait des comparaisons par rapport à des enquêtes « précédentes » qui datent beaucoup, etc. Quelquefois, les lecteurs ne cherchent pas non plus beaucoup: un sondage, on regarde d’abord sa date de réalisation, son échantillon et même le support d’enquête, téléphone ou Internet (même si je ne le fais pas car c’est la 1e campagne présidentielle où il y a vraiment des différences de mise en oeuvre entre instituts; donc on n’a pas de recul suffisant pour interpréter).

  7. Je m’étonne de vos commentaires du jour sur la « presse de gauche » qui parlerait de l’affaire Karachi. Faudrait-il que les journalistes arrêtent de faire du journalisme pendant une campagne électorale ?
    Et puis en l’occurrence, ce sont les familles des victimes qui ont demandé à être reçues par le candidat socialiste. Aurait-il dû leur fermer la porte ? Les journalistes se sont contentés de relayer l’information, et je n’ai pas noté que cette information ait fait la une des journaux.
    La semaine dernière un livre est sorti sur les présumées affaires du PS du Pas de Calais. Son auteur a été invité dans de nombreux médias (y compris des médias perçus comme « de gauche »), et je n’ai pas noté que vous vous soyez offusqué de cette large publicité qui ne rendait pas service à François Hollande.

    Pour ce qui est de l’institut IFOP vice-présidé par Mme Parisot, je m’interroge de plus en plus sur ses méthodes. Je constate que cet institut est celui qui donne systématiquement le score le plus serré entre Hollande et Sarkozy. Sur leur sondage du jour ils ont fait un mixe entre sondage par téléphone et sondage en ligne ce qui me semble un bricolage assez suspect.
    Et j’ai quand même du mal à comprendre la différence abyssale entre ce sondage IFOP et le sondage IPSOS qui date d’une petite dizaine de jours et qui donnait 7,5 pts d’avance à Hollande. Un différentiel de 9 points en 10 jours entre deux instituts, ça reste un mystère d’autant plus que ce qui marque cette campagne c’est une certaine stabilité des courbes. Quand Mélenchon prend 2 points en 2 mois, on en fait un évènement majeur…

    Pourriez-vous nous rappeler quels étaient les meilleurs instituts en 2007 ? (Et le ou les plus mauvais…)

  8. je fais moi la moyenne simple des derniers sondages publiés que j’actuailise en fonction de ces publications : mes résultats sont étrangement proches des vôtres ! voilà mes calculs :

    intentions de vote au 1er tour
    moyenne des 8 1er tour

    Nathalie Arthaud 0,67
    Philippe Poutou 0,56
    Jean-Luc Mélenchon 13,33
    François Hollande 27,28
    Eva Joly 2,28
    TOTAL GAUCHE 44,11

    François Bayrou 11,11

    Nicolas Sarkozy 28,56
    Nicolas Dupont-Aignan 0,89
    Marine Le Pen 15,17
    Jacques Cheminade 0,17
    TOTAL DROITE 44,78

    diff DR/GAUCHE -0,67

    moyenne des 8 2è tour
    François Hollande 54,28
    Nicolas Sarkozy 45,83

    • En effet, mais c’est assez logique et il n’y a rien d’étrange là-dedans, car, ainsi qu’on l’a vu, il y a une réelle convergence des instituts. Cette campagne est malheureusement pauvre en surprises et en retournements de tendances.

      En outre, plus vous avez de sondages publiés par chaque institut, plus ils ont de chances d’être proches.

      Enfin, l’indicateur se rapproche de plus en plus de la moyenne simple au fur et à mesure du temps, dès l’instant où il y a peu d’écarts entre instituts et où chaque institu en est quasiment à une étude publié par semaine.

      Les moyennes mobiles calculées par Monsieur Delorme sur son blog dont j’ai publié le lien sont également très proches.

      Une seule maheureuse conclusion: so boring an election…! qu’est-ce qu’on s’embête cette année…

  9. Pingback: Social science sites of the week

    • Bien sûr, gageons que IPSOS, CSA, TNS-Sofres et Harris seront sollicités. Et puis il y aura l’IFOP quotidien.

      Je publierai tout, comme d’habitude; alors que, dès minuit, les médias ne pourront plus rien dire.

Laisser un commentaire