Le premier événement de la semaine sur les médias sociaux est la « mairie Twitter » du président américain Obama, aujourd’hui. Le président répondra aux questions posées via le hashtag #askobama lors d’une discussion animée par Jack Dorsey, co-fondateur de Twitter.
La Maison Blanche a déclaré qu’elle souhaitait que la discussion se concentre sur l’économie, mais M. Obama est sûr de se faire poser toutes sortes de questions lorsqu’il répondra aux questions de la Twitterverse. Mais est-ce que cela va vraiment refléter ce que la nation Twitter veut entendre, ou est-ce que ça va juste être un spectacle politique de chiens et de poneys ?
Je me demandais… serait-il possible d’utiliser des outils analytiques pour prédire quelles questions seraient utilisées aujourd’hui ? Bien sûr, tout se résume au jugement de quelques personnes qui fixent réellement l’ordre du jour, mais au moins sur la base du volume de questions suggérées qui arrivent, ce que devrait la discussion de l’hôtel de ville portera-t-elle?
Notre fidèle membre de la communauté {grow} Dan Holowack était à la hauteur de la tâche. Il a proposé de tester son outil logiciel propriétaire, TwitSprout, pour tenter de prédire l’agenda d’aujourd’hui. Il sera intéressant de voir si les vraies questions de la réunion d’aujourd’hui correspondent aux prédictions de Dan. Voici son analyse :
La mairie et la vérité sur Twitter
Mon équipe est littéralement restée éveillée toute la nuit à analyser plus de 10 000 questions uniques dans les heures qui ont précédé la date limite. Comme vous pouvez le voir, il y a eu une frénésie d’activité croissante :
Recherche de thèmes de tweet
C’est toujours un problème ouvert en intelligence artificielle pour les ordinateurs de « comprendre » le langage humain, même dans des contextes contraints comme celui-ci. Séparer les vraies questions des ordures est donc plus un art qu’une science – nous avons été obligés d’utiliser un tas d’heuristiques pour cette première passe, mais nos tests indiquent qu’elles fonctionnent plutôt bien. Selon cette mesure, un peu moins de 60 % de tous les tweets #AskObama sont de véritables questions.
Une fois que nous avons identifié les questions « légitimes », elles ont été passées à travers d’autres filtres pour combiner des tweets qui ne sont que des retweets ou des citations les uns des autres, afin de ramener la quantité à un niveau plus gérable. Enfin, ces tweets ont été triés par ordre décroissant de popularité et d’influence, et l’un des membres de notre équipe les a parcourus manuellement, les regroupant dans des catégories de haut niveau (« Emplois », « Taxes », etc.) à la main. En additionnant tous les tweets de ces catégories, nous pouvons avoir une idée précise des sujets qui préoccupent les Américains.
Nos prédictions
Pour prédire à quelles questions M. Obama répondra aujourd’hui, il serait bon de savoir comment ils sont choisis. Selon Twitter, l’équipe de Mass Relevance (plus Jack Dorsey) est chargée de la conservation et de la sélection des tweets chanceux. Personne ne peut être sûr de ce à quoi ressemblera son processus de sélection, mais il est prudent de dire que ce sera une combinaison des éléments suivants :
1. Sélection aléatoire: En véritable mode démocratique, tous les tweets pourraient être traités de la même manière et avoir la même chance d’être choisis au hasard. Bien que personne ne puisse se plaindre de l’équité, cela pourrait conduire à des résultats vraiment étranges.
2. Chiffres absolus : Les meilleures questions sont retweetées des centaines de fois, et la crème monte vraiment au sommet. L’équipe pourrait sélectionner les tweets les plus retweetés et RT comme les questions qui préoccupent le plus les Américains.
3. Concours de popularité : Il existe de nombreuses façons de mesurer l’influence sur Twitter, qu’il s’agisse de Klout, du nombre d’abonnés ou de votre tableau de bord TwitSprout. Quelle que soit la façon dont ils choisissent de le mesurer, les questions posées par les personnes les plus importantes pourraient être les plus chanceuses.
4. La politique comme d’habitude : Bien sûr, il n’est pas impossible que la Maison Blanche ait déjà « examiné » une série de questions à partir de ses propres points de discussion, et l’équipe recherche simplement des personnes sur Twitter qui ont posé les mêmes choses.
Nous ne pouvons pas faire grand-chose pour les numéros 1 et 4, mais les informations que nous avons recueillies nous donnent tout ce dont nous avons besoin pour les autres cas. Des questions viendront toujours, mais en supposant que rien de dramatique ne se produise, ce sont les questions les plus populaires et les plus influentes à ce jour.
« Le plus populaire »
Si tout ce qui compte est la quantité, voici les tweets qui ont rassemblé le plus de retweets, de citations et de RT :
#1 (avec 2 907 retweets) : « Envisageriez-vous de légaliser la marijuana pour augmenter vos revenus et économiser l’argent des contribuables en libérant des prisons surpeuplées, des salles d’audience ? »
#2 (avec 1 567 retweets) : « Vous avez dit à plusieurs reprises que les coupes de Bush pour les 2 % devraient expirer. Pouvez-vous promettre de les laisser en 2012 ? »
#3 (avec 750 retweets) : « Monsieur le Président, pourquoi ne devriez-vous pas être tenu responsable de votre prédiction idiote selon laquelle le chômage resterait en dessous de 8 % ? »
« Le plus influent »
Si nous recherchons les tweets des utilisateurs les plus influents – ceux qui ont le plus de Klout et de followers – nous obtenons un ensemble différent (bien qu’ils aient un tweet en commun !)
#1 « Les industries de la technologie et du savoir sont en plein essor, mais les discussions sur les emplois sont toujours centrées sur la fabrication. Pourquoi ne pas être réaliste à propos des emplois ? »
# 2 « Monsieur le Président, pourquoi ne devriez-vous pas être tenu responsable de votre prédiction idiote selon laquelle le chômage resterait en dessous de 8%? »
#3 : « Pourquoi avons-nous 1,5 million d’emplois de moins qu’avant la relance alors que le nombre de guichets automatiques reste inchangé ? »
« Par catégorie »
Grâce à notre regroupement manuel des tweets, nous pouvons également déterminer quelles catégories sont les plus populaires (même si l’équipe choisit un autre tweet spécifique pour le représenter). Il y a toujours un peu de subjectivité dans la prise de certaines décisions ici, mais la plupart de nos résultats ne devraient surprendre personne :
#1 Légalisation de la marijuana (4 911 tweets et retweets au total)
Emplois #2 (2 024 tweets et retweets au total)
#3 Impôts (1 800 tweets et retweets au total)
#4 Économie et plafond de la dette (442 tweets et retweets au total)
La seule surprise est le gagnant de cette catégorie – les lois sur la marijuana. Indépendamment de quel côté de ce débat son opinion tombe, si le président n’aborde pas ce point lors de la discussion de demain, quelqu’un évite les données. Par un glissement de terrain, c’est ce que la Twitterverse veut savoir.
Que se passe-t-il ensuite ?
Il y a beaucoup plus à tirer des données brutes. Nous avons pris tout cela et construit un tableau de bord Obama qui sera mis à jour en continu au cours des prochains jours avec les informations les plus récentes. Les dernières prédictions, la répartition géographique et le nuage de mots du sujet apparaîtront sur l’onglet « #AskObama Insights », le tableau de bord TwitSprout typique d’une page pour le compte @BarackObama apparaîtra sur le deuxième onglet, et un post-mortem de la discussion apparaîtra sur le troisième onglet mercredi soir. Gardez une trace de toutes les informations liées à la mairie qui vous sont fournies par TwitSprout sur ce lien, et contactez-nous à [email protected] avec tout commentaire que vous avez pour l’équipe.
Merci à Dan et à son équipe d’avoir passé une nuit blanche pour produire ce message !