L’un des aspects les plus analysés des masses de données auxquelles nous avons désormais accès via les médias sociaux et les plateformes numériques est la capacité de ces données à permettre une meilleure modélisation prédictive. L’une des applications les plus évidentes de cela est la capacité de prédire les fluctuations du marché boursier, et il existe divers exemples de la façon dont les données sociales peuvent être utilisées pour bénéficier – même totalement automatiser – les transactions boursières. Mais une autre expérience sociale plus intéressante consiste à analyser si les informations sur les médias sociaux peuvent nous montrer qui va gagner une élection.
En théorie, cela devrait être possible – les données des médias sociaux ne peuvent pas fournir une prédiction précise d’un événement non influencé par l’homme, comme une catastrophe naturelle ou la météo. Mais étant donné que social est « social » – un journal de données virtuel d’interactions humaines – et que tant de personnes dans le monde interagissent et partagent désormais des informations via ces plateformes, il devrait être en mesure de fournir une mesure indicative de tous les processus influencés par l’homme, dont, les élections sont totalement définies par les personnes. Il est donc logique que nous puissions utiliser les médias sociaux comme indicateur des résultats électoraux probables – l’astuce réside dans le comment.
Et le comment implique plusieurs éléments et considérations importants.
Le vote populaire
La première mesure que vous pourriez chercher à utiliser dans un modèle prédictif pour une élection serait le volume global de mentions – si un candidat est souvent mentionné, c’est un bon signe que son message résonne – ou au moins, sa voix atteint beaucoup de gens .
Bien sûr, il existe plusieurs variables à cela, mais des études universitaires antérieures ont montré que le volume de mentions peut jouer un rôle important et indicatif dans les résultats des élections.
Par exemple, une étude de la Dublin City University en 2011 a révélé que le volume de tweets était « la plus grande variable prédictive » dans les résultats des élections, sur la base de leur analyse du sentiment politique et de la modélisation des prédictions.
Leur recherche a indiqué que le volume de mentions était un indicateur plus précis que le sentiment, car le volume représente mieux la popularité relative au sein de la population, tandis que le sentiment peut être réactif et influencé par les réponses à des reportages ou à des événements spécifiques.
Ces résultats ont été repris par une étude menée par l’Université technique de Munich – sur la base de leurs recherches, ils ont constaté que :
« Le simple nombre de tweets reflète les préférences des électeurs et se rapproche des sondages électoraux traditionnels. »
Sur cette base, la mesure de base du volume de tweets pourrait, au moins dans une certaine mesure, être utilisée pour prédire la prochaine élection présidentielle américaine.
Alors, qui suggèrent les chiffres actuels deviendra le 45e Le président des Etats-Unis?
Twitter a récemment publié un nouveau « Élection 2016 Candidat Buzz » tracker qui peut nous fournir ces données.
Si vous deviez utiliser cela, en tant que prédicteur métrique le plus basique et le plus simple, le volume de tweet suggère que Donald Trump est sur la voie de la Maison Blanche.
Cela peut sembler simpliste – cela peut être simpliste – mais comme indiqué, des recherches universitaires antérieures ont révélé que le volume de tweets est l’un des plus gros, sinon les les plus grands indicateurs prédictifs des résultats des élections.
Mais il y a quelques problèmes avec cela.
La campagne présidentielle américaine actuelle nous fournit une étude de cas unique car le candidat en tête, selon le volume de tweets, pourrait en fait être une anomalie politique. Donald Trump avait déjà un énorme compte Twitter avant de commencer sa campagne, et il a une énorme présence internationale en raison de son travail dans les médias. En tant que tel, Trump a sans doute un profil médiatique plus important que tout autre candidat avant lui, du moins à ce stade d’une campagne présidentielle. Pour cette raison, et en raison de la nature conflictuelle de Trump et de son bon sens des médias sociaux (c’est-à-dire qu’il sait comment attirer beaucoup d’attention), les chiffres du volume peuvent en fait être trompeurs – vous penseriez qu’une grande partie de ces mentions serait négative.
Cela étant le cas, nous devrons examiner des qualificatifs supplémentaires pour mieux comprendre la position de Trump auprès des électeurs – alors quelles autres mesures pouvons-nous utiliser ?
Apprécier le sentiment
La détection automatisée des sentiments est un champ de mines, en termes de précision. L’un des plus gros coups contre l’analyse automatisée des sentiments est qu’elle ne peut pas prédire le sarcasme, ce qui peut fausser injustement les résultats – et c’est, sans aucun doute, une considération importante dans le cas de Trump. Mais cela étant noté, et compte tenu du fait que les études susmentionnées ont écarté la valeur du sentiment dans leurs modèles prédictifs, que disent les données sur les deux principaux candidats de la campagne présidentielle américaine actuelle ?
En utilisant un outil de sondage de base appelé HappyGrumpy, nous pouvons voir que le sentiment général pour Donald Trump est en fait considéré comme assez positif.
Bien sûr, vous devez vous demander à quel point de tels sondages sont précis, ce qui est impossible sans revoir la méthodologie complète. Sur le site Web, Happy Grumpy fournit des exemples de leurs précédents succès prédictifs, en utilisant la campagne électorale américaine comme modèle.
Il convient également de noter que ce sondage ne date que du mois dernier et que Trump a constaté une forte baisse des sondages fin avril, selon ces statistiques. Mais même alors, il n’était que légèrement inférieur à la moyenne de Clinton. Et il a rebondi.
Une autre analyse des sentiments n’est pas aussi définitivement en faveur de Trump – une étude de Hootsuite, publiée dans Fortune en avril, a montré que Trump était bien en tête en termes d’impact, mais sa note globale de sentiment est inférieure à celle de Clinton.
Compte tenu des deux, il est difficile de porter un jugement définitif sur les évaluations de sentiment – ce qui signifie également, bien sûr, qu’il est impossible de l’ignorer totalement. La meilleure mesure comparable serait de voir si l’analyse en temps réel de HappyGrumpy tient le coup, comme ils le suggèrent, lors des futurs sondages – si les résultats sont connectés, cela peut être un indicateur valide, bien qu’il soit difficile de l’évaluer par rapport aux résultats contrastés. de l’équipe de Hootsuite pour le moment.
Obtenir du soutien
Donc, si le sentiment automatisé ne peut pas fournir un qualificatif définitif, alors qu’est-ce qui le peut ?
Une autre mesure à considérer est la croissance des abonnés – la combinaison du volume de mentions et de la croissance des abonnés à l’approche des élections canadiennes les plus récentes indiquait à juste titre que Justin Trudeau sortirait triomphant.
Alors que le pourcentage de croissance de Trudeau n’était pas aussi important, les chiffres bruts étaient plus élevés, ce qui suggère que davantage de personnes répondaient à son message et cherchaient à l’entendre.
Alors, comment les deux principaux candidats américains se comparent-ils en termes de croissance du nombre d’abonnés ?
En utilisant Twitter Counter, nous pouvons voir que Trump a gagné 595 777 abonnés au cours du mois dernier.
Hillary Clinton, quant à elle, a gagné 285 541 abonnés au cours de la même période.
Ces chiffres de croissance ne reflètent que les 30 derniers jours, mais d’autres données, publiées via le compte d’analyse du gouvernement de Twitter (@gov) ont reflété la même chose – que Trump gagne plus que Clinton au fil du temps (ils publient régulièrement des mises à jour comme celle-ci après des débats et des événements majeurs) .
Plus grande croissance d’abonnés au cours de #GOPDbate (top 3 de tous les candidats) :
3. @MarcoRubio
– Twitter Gouvernement (@gov) 11 mars 2016
Maintenant, il s’agit d’une analyse assez rudimentaire – une mesure plus précise sera lorsque les candidats finaux seront définis et que la vraie campagne commencera, car les réponses seront plus conformes aux détails et aux discussions politiques. Et encore une fois, cela peut également être faussé par la présence mondiale de Trump – Trump aurait probablement une proportion beaucoup plus importante de soutien international. Mais à titre indicatif, Trump est en tête. Vous pourriez en fait affirmer que Trump est en tête sur toutes les mesures relatives.
Bien qu’il reste encore un long chemin à parcourir et qu’il reste encore beaucoup de campagnes à mener avant d’entrer dans les vraies batailles de la campagne présidentielle de 2016, si les données des médias sociaux – ou les données Twitter plus précisément – doivent être considérées comme un prédicteur de la résultat probable, Donald Trump est en train de gagner.
Bien sûr, vous pouvez effectuer vous-même une analyse similaire avec les autres candidats – à titre de comparaison, Bernie Sanders a ajouté 217 612 abonnés Twitter au cours du mois dernier. Ce ne sont là que des indicateurs de base, et les critiques rejetteraient sans doute tout aussi facilement de telles conclusions. Mais il sera intéressant de voir comment tout cela se passe et si ces mesures indiquent réellement le vainqueur éventuel.