Avec l’intérêt croissant pour l’analyse des mégadonnées combiné à la pénurie d’experts abordables et de praticiens qualifiés pour le déploiement et la gestion d’initiatives de mégadonnées, de nombreuses organisations se tournent vers les services gérés pour répondre à leurs besoins. De plus en plus de MSP continuent de développer des services sophistiqués pour le traitement des mégadonnées, ainsi que tous les autres aspects de la gestion et de l’analyse des données.
Le traitement des mégadonnées peut bien fonctionner en tant que services gérés de bout en bout basés sur le cloud qui s’intègrent de manière bidirectionnelle avec les centres de données et les systèmes sur site. Les services de bout en bout peuvent inclure des flux de données en continu, des activités de gestion de données telles que la gouvernance des données et la visualisation et l’analyse de données. L’analyse des mégadonnées sur les infrastructures cloud nécessite une gestion de premier ordre de la sécurité et de la conformité, des domaines que les MSP améliorent actuellement de toute façon pour passer de manière proactive à de nouveaux domaines technologiques demandés par de nombreuses entreprises.
N’oubliez pas : les mégadonnées ne font pas uniquement référence à des données volumineuses ou à évolution rapide qui sont importantes pour les grandes entreprises. De plus en plus d’entreprises de toutes sortes ont besoin d’extraire de la valeur à partir d’une grande variété de sources de données – ces sources sont souvent difficiles et désordonnées pour le traitement de données traditionnel. Ces sources font également partie de l’histoire de l’analyse des « big data » et fournissent souvent des informations précieuses. Les sources de données « désordonnées » incluent : des données multistructurées ou non structurées avec des formats et une sémantique très variables comme le contenu des médias sociaux, les fichiers journaux et les e-mails ; et les données générées par les machines à partir d’appareils médicaux, de capteurs industriels, de machines et de systèmes automatisés et de GPS.
Services de gestion des métadonnées
Une capacité indispensable pour les services de traitement des mégadonnées est la gestion complète des métadonnées. Les métadonnées fournissent des informations sur un élément de données, tel qu’un produit, qui décrivent de manière unique cet élément. Les métadonnées de produit peuvent inclure l’ID de produit, la catégorie de produit, l’ID de fournisseur, la taille ou les dimensions, etc. Un champ comme l’ID de produit est également un moyen de se connecter à d’autres sources de données, à des fins d’intégration. Grâce aux descripteurs de métadonnées, nous pouvons parler d’éléments de données en termes courants, en dehors de l’élément réel, et tirer parti des métadonnées pour intégrer et mieux comprendre des sources de données disparates.
La gestion des métadonnées est l’un des domaines clés d’une gouvernance complète de l’information et des données. Les outils de gouvernance des données agiles sont en demande et toutes sortes de fournisseurs de gestion de données poursuivent cette activité. Alors que les MSP étendent leur présence dans les services de gestion et d’analyse des données, la gestion des métadonnées et la gouvernance des données devraient les intéresser beaucoup. Espérons que la disponibilité de services gérés dans ces domaines rendra la gestion complète des données plus abordable et accessible aux organisations de toutes tailles.
À quoi servent les métadonnées pour l’analyse des mégadonnées
Les métadonnées ne concernent pas seulement l’intégration de données et les entrepôts de données d’entreprise ; pour les autres besoins de l’entreprise, les métadonnées aident à trouver des données lors de la découverte de données et indiquent la manière d’interpréter et d’utiliser correctement les données. Les métadonnées peuvent grandement rationaliser et améliorer les processus de collecte, d’intégration et d’analyse des sources de Big Data. Travailler avec des mégadonnées désordonnées telles que des sources multistructurées signifie que les métadonnées sont essentielles pour comprendre ces données et pour les connecter à d’autres sources de données. Les données multistructurées présentent de nombreuses difficultés – les informations peuvent être extraites, mais pour qu’elles aient un sens et une valeur, des attributs tels que le sentiment, l’objectif et le contexte doivent également être déterminés et corrélés avec les sources de données pour les clients, les produits, etc.
Les sources de données traditionnelles, telles que les données relationnelles, fournissent de nombreuses structures logiques grâce à des métadonnées plus faciles à obtenir. Cependant, les mégadonnées ne contiennent souvent pas beaucoup de métadonnées « natives », de sorte que les métadonnées provenant de sources externes sont essentielles pour libérer le sens. Les mégadonnées peuvent devoir passer par certains processus d’analyse pour construire les débuts des métadonnées. Ensuite, ces métadonnées sont corrélées avec les métadonnées d’autres sources de données pour dériver le modèle logique le plus utile. À mesure que le traitement des mégadonnées évolue, de nouveaux types de métadonnées peuvent apparaître pour répondre aux circonstances particulières des différents types de mégadonnées.
Source de l’image : Princeton Tutorat
Ce message vous a été présenté par IBM pour les MSP et les opinions sont les miennes. Pour en savoir plus sur ce sujet, visitez le PivotPoint d’IBM. Dédié à fournir des informations précieuses de la part des leaders d’opinion de l’industrie, PivotPoint offre une expertise pour vous aider à développer, différencier et faire évoluer votre entreprise.