Dans mon travail d’aide aux clients à gérer les risques des médias sociaux, le détournement de hashtag sur Twitter revient souvent dans la conversation. Un exemple spectaculaire est l’utilisation récente par l’UKIP du hashtag #WhyImVotingUKIP pour permettre à ses partisans d’expliquer les raisons de leur vote.
Malheureusement pour UKIP, le hashtag a été détourné et a été utilisé par beaucoup comme moyen de se moquer de UKIP. Si vous lisez les nombreux tweets, vous remarquerez qu’ils sont remplis de beaucoup de sarcasmes. Certaines semblent être clairement des blagues sarcastiques, d’autres sont un peu plus difficiles à comprendre s’il s’agit d’une blague ou d’une blague sérieuse. Cela m’a fait réfléchir. Si j’ai du mal à comprendre le sentiment dans certains des tweets, le logiciel de sentiment analytique n’a aucune chance.
Il est largement admis que l’un des éléments les plus difficiles de l’analyse des sentiments est d’identifier le sarcasme. J’ai réfléchi à la façon dont nous pourrions surmonter cet obstacle et, ayant récemment assisté à un événement d’analyse de données, j’ai réfléchi à ce que nous pouvons ajouter d’autre à l’équation pour obtenir un score de sentiment plus précis.
Alors que de nombreuses applications d’analyse des sentiments se concentrent sur l’analyse de tweets individuels, peut-être qu’une analyse plus approfondie des tweets d’un utilisateur peut nous donner une prédiction plus précise du sentiment utilisé et nous aider à identifier le sarcasme. Vous pouvez également creuser plus profondément et superposer d’autres données, telles que les données de vote pour un comté ou un arrondissement particulier, avec les données de géolocalisation qui peuvent avoir été incluses dans le tweet. La combinaison de ces ensembles de données pourrait vous permettre de prédire avec plus de précision si un tweet contient ou non du sarcasme.
Bien sûr, même si ce que je décris est une analyse de données accessibles au public, il est probable que des questions sur la confidentialité des données soient soulevées. Les entreprises doivent être prudentes lorsqu’elles envisagent dans quelle mesure elles exploiteront les données Twitter afin de ne pas perdre la confiance.