Twitter fournira aux équipes académiques sélectionnées accès total à la conversation publique sur Twitter sur COVID-19 dans le cadre d’un nouvel ensemble de données conçu pour aider à la recherche du virus et de sa propagation.
Plus précisément, Twitter publie un nouveau point de terminaison dans Laboratoires de développement Twitter qui permettra aux développeurs et aux chercheurs d’étudier la conversation publique sur COVID-19 en temps réel.
Selon Twitter:
« Il s’agit d’un ensemble de données unique qui couvre quotidiennement plusieurs dizaines de millions de Tweets et offre un aperçu de l’évolution de la conversation publique mondiale entourant une crise sans précédent. Rendre cet accès disponible gratuitement est l’une des choses les plus uniques et les plus précieuses que Twitter puisse faire dans le monde. se réunit pour protéger nos communautés et chercher des réponses aux défis urgents. «
L’ensemble de données COVID-19 facilitera la recherche sur la manière dont les gens discutent de la pandémie, ce dont ils en discutent, la propagation de la désinformation et des canulars, la prévision de futurs points chauds pour la gestion des soins de santé, et plus encore.
Facebook a également fourni son propre ensemble de données à des fins similaires – plus tôt ce mois-ci, le réseau social a lancé son nouveau COVID-19 le suivi de l’emplacement et les cartes de connectivité individuelles, qui visent à mettre en évidence les endroits où les gens sont le plus connectés et où ils se déplacent, afin d’aider à prédire la propagation potentielle.

Bien que l’ensemble de données de Twitter porte davantage sur la conversation spécifique – ce que des recherches antérieures ont montré peut également être un outil très efficace pour prédire les préoccupations futures.
Le US Geological Survey, par exemple, utilise des données de tweet pour suivre les tremblements de terre et leurs impacts potentiels, tandis que les informations de Tweet ont également été utilisées dans diverses régions pour prédire les troubles civils, et même la criminalité.
Le meilleur exemple dans ce cas, cependant, vient probablement de 2013, lorsque les chercheurs ont montré comment la conversation sur tweet peut être utilisée pour cartographier les épidémies de grippe et aider les autorités sanitaires locales à se préparer afin d’atténuer les impacts.

Selon le document de recherche:
« Notre système a détecté le changement hebdomadaire de direction (croissante ou décroissante) de la prévalence de la grippe avec une précision de 85%, soit une augmentation de près du double par rapport à un modèle plus simple, démontrant l’utilité de distinguer explicitement les tweets d’infection des autres bavardages. »
Dans leurs notes complémentaires, l’équipe de recherche affirme que la surveillance en temps réel des conversations pertinentes via Twitter peut mieux permettre aux cliniciens d’anticiper les poussées de syndrome grippal – «jusqu’à deux semaines avant les stratégies de collecte de données existantes».
C’est le genre de capacité prédictive que Twitter espère faciliter avec ce nouvel accès, mais Twitter sait également qu’il doit être très prudent lorsqu’il autorise une telle utilisation.
La débâcle de Cambridge Analytica sur Facebook a changé le processus à cet égard. L’ensemble de données utilisé par CA provenait à l’origine d’un usage académique, et Twitter, comme toutes les plateformes sociales, est parfaitement conscient de la manière dont ces informations peuvent être utilisées à mauvais escient, si elles tombent entre de mauvaises mains. Pour cette raison, les chercheurs qui cherchent à accéder au nouvel ensemble de données devront postuler via un processus spécifique. Twitter examinera ensuite chaque candidature « pour s’assurer qu’ils soutiennent le bien public ».
L’ensemble de données n’inclut cependant aucun pdes données rivales ou des Tweets protégés, ce n’est donc que du contenu qui a été rendu public. Mais à une telle échelle, les ensembles de données publics peuvent révéler plus que ce que les gens pourraient souhaiter, c’est pourquoi Twitter est extrêmement prudent avec l’accès.
Compte tenu de son utilisation passée, cela pourrait être un ajout précieux et pourrait certainement aider les chercheurs à mieux comprendre la conversation COVID-19, et comment cela se rapporte et est indicatif du chemin du virus.
Les chercheurs qui souhaitent utiliser le nouveau point de terminaison de données tweet doivent postuler via ce formulaire.