Marketing de contenu

Google Flu Trends : Importance de la véracité, le 4e « V » du Big Data

Google Flue et le Big Data

Beaucoup de choses ont été écrites récemment pour critiquer Goolge’s Flu Trends – un service de suivi de la grippe qui prédit l’activité grippale en fonction de termes de recherche spécifiques à l’aide de données de recherche Google agrégées et estime l’activité grippale actuelle dans le monde en temps quasi réel. Pour en savoir plus, lisez Comment cela marche-t-il?

Le magazine Science a récemment publié un article intitulé « The Parabol of Google Flu : Traps in Big Data Analysis » et Steve Lohr a publié un excellent article sur le blog BITS du New York Times intitulé « Google Flu Trends : The Limits of Big Data ».

Il est important de noter que la surestimation de l’activité grippale dans Google Flu Trends n’est PAS une limitation du Big Data ou de l’analyse utilisée pour estimer l’activité grippale, comme certains auteurs l’ont suggéré. Au contraire, il met en évidence l’importance du quatrième « V » du Big Data – Véracité.

Il est souvent mentionné que le Big Data a trois attributs déterminants – trois V comme on les appelle, à savoir le volume de données, la variété des données et la vélocité des données. (pour en savoir plus, consultez le rapport sur les meilleures pratiques de TDWI intitulé Big Data Analytics). Mais cette définition du Big Data passe à côté d’une dimension ou d’un élément très important du Big Data, à savoir la véracité des données.

Je pense que les estimations de Google Flu Trends seront beaucoup plus réalistes si nous devions intégrer la véracité des données, la quatrième dimension du Big Data dans les modèles d’estimation et ajuster les estimations en fonction du « score de véracité ».

En d’autres termes, les estimations inexactes de l’activité grippale telles que rapportées par Google Flu Trends ne sont PAS une limitation du Big Data ou de l’analyse, nous devons plutôt incorporer l’élément de véracité des données dans le modèle d’estimation.

Qu’est-ce que tu penses? Êtes-vous d’accord que les estimations inexactes de l’activité grippale telles que rapportées par Google Flu Trends ne sont PAS une limitation du Big Data ou de l’analyse ?

Crédit photo : Google Flu et Data/shutterstock

Erwan

Rédigé par

Erwan

Erwan, expert digital pour Coeur sur Paris, offre des insights pointus sur le marketing et les réseaux sociaux. Avec une plume vive et une analyse fine, il transforme les complexités du digital en conseils pratiques et tendances à suivre.