Tout d’abord : le big data n’est pas seulement difficile à comprendre pour les gens, il est également difficile à traiter pour les ordinateurs. C’est pourquoi Hadoop existe (la plate-forme qui permet les requêtes de données sur plusieurs ordinateurs ou le traitement par lots). C’est la raison pour laquelle les data scientists existent, sans parler de plusieurs programmes comme le Insight Data Science Fellows Program qui transforment des docteurs auparavant universitaires en mathématiciens de premier plan dans le monde des nouveaux médias. C’est aussi pourquoi les startups du big data ont reçu des montants remarquables de financement par capital-risque, et bien qu’il y ait certainement eu une bonne part d’articles affirmant que les VC s’ennuient maintenant avec le big data, les récents 100 millions de dollars et 900 millions de dollars de HortonWorks et Cloudera prouvent le contraire. .
Ajoutez à cela le fait que le domaine des mégadonnées regorge de certains des esprits les plus intelligents, non seulement dans les secteurs de l’informatique ou des médias numériques, mais aussi des neurosciences, de la linguistique, des mathématiques, du trading d’obligations, de la bio-ingénierie – la liste est longue – et il n’est pas surprenant que ce domaine soit intimidant pour le reste d’entre nous. Non pas que nous ne soyons pas aussi intelligents. Après tout, de nombreux dirigeants d’entreprises numériques de nos jours ont gagné leurs ailes pendant la bulle Internet – et beaucoup d’entre eux sont à remercier pour l’ère numérique actuelle.
L’intimidation ne vient pas du manque d’expérience, mais du défi (comme le sont toujours les dirigeants) de rendre ce nouvel actif exploitable – et de ne pas laisser les grandes idées et souvent les grands discours saper cette mission.
La vérité est que les mégadonnées ne sont utiles que si vous leur posez les bonnes questions. Et tous les outils de Big Data ne déchiffreront pas non plus correctement la bonne réponse. Voici les quatre plates-formes, outils et termes de Big Data qui dominent actuellement l’industrie – et qui sont probablement mal utilisés ou confondus.
Il est temps de boucler la boucle de l’information et de faire fonctionner le Big Data pour tous ceux qui l’utilisent – Ph.D. ou pas.
Hadoop
Hadoop est ce que vous obtenez lorsque vous mélangez des milliards de données et que vous devez tester des requêtes et des algorithmes dans un laps de temps raisonnable. C’est le cluster batching, via le cloud, qui est compliqué et assez impressionnant.
Le traitement par lots aide une équipe de développement à tester de nouvelles requêtes et de nouveaux algorithmes, en s’occupant constamment des détails où les tests s’écartent un peu du cours. Au fur et à mesure que des entreprises comme Yahoo!, la société pour laquelle Doug Cutting travaillait lorsqu’il a co-créé Hadoop, ont grandi, elles ont commencé à collecter des ensembles de données trop volumineux pour tenir sur un seul ordinateur. Le clustering d’ordinateurs était la solution – où un ensemble d’ordinateurs connectés fonctionne ensemble de telle manière qu’ils peuvent être considérés comme un système unique.
Cela dit, Hadoop met la puissance d’un cluster d’ordinateurs dans le cloud et permet à une équipe de développement de traiter par lots plusieurs requêtes sur des quantités massives de données (qui ne pourraient jamais être stockées sur un seul ordinateur). Mais, ce que Hadoop crache a généralement besoin d’un data scientist pour le déchiffrer. Il ne s’agit pas de jolies visualisations, mais des programmes comme HortonWorks ou Cloudera peuvent s’ajouter à Hadoop pour faciliter la compréhension de vos données.
Avez-vous besoin d’Hadoop ? Non, sauf si votre entreprise met à l’échelle de grandes quantités de données comme Google ou Yahoo !.
Plateforme de gestion des données
Une plate-forme de gestion de données, ou DMP, est un outil marketing principalement conçu pour alimenter votre serveur publicitaire en données, afin de mieux cibler les audiences sur le Web. Pour la plupart, les DMP, notamment BlueKai, x+1 et Adobe Audiencemanager, profitent aux marques et aux agences, et sont généralement biaisés par les acheteurs. Ils suivent les cookies des utilisateurs sur le Web, collectant des données comportementales à partir des sites qu’un utilisateur a visités avant et après votre site cible. À partir de ces informations, les publicités sont ciblées pour atteindre le bon client au bon moment – par exemple, en leur proposant une publicité pour le dernier livre de Paul Krugman après avoir suivi cet utilisateur dans un de ses articles dans le New York Times.
En d’autres termes, vous pouvez remercier les DMP chaque fois que vous partagez du contenu et commencer à voir des publicités liées à votre partage, par exemple un article sur les soins de santé qui donne au DMP un signal pour vous cibler des publicités liées à la santé.
Un DMP crache essentiellement les données qu’un utilisateur lui donne dans un format plus facile à comprendre afin que les équipes marketing puissent normaliser les comportements des clients particuliers. Pourquoi est-ce utile ? Parce que si vous posez les bonnes questions à un DMP, vous pouvez personnaliser vos annonces ou les articles de votre étagère de manière à encourager votre public ou vos clients à se convertir (que vous considériez une conversion, partager, commenter ou acheter, c’est à vous de décider).
Gestion de la relation client
La gestion de la relation client (CRM) s’est déplacée vers l’espace des mégadonnées. En règle générale, une plate-forme CRM vous aide à créer votre message à votre consommateur via plusieurs canaux d’interaction, notamment les médias sociaux, les newsletters, etc. Mais le big data change la donne en matière de réseaux sociaux. Vous n’avez plus besoin de garder une trace de la fréquence à laquelle quelque chose a été retweeté. Le système le fera pour vous. De plus, il vous montrera à quels moments de la journée vos clients s’engagent le plus, d’où ils viennent, quand ils sont le plus susceptibles d’acheter, quelles autres marques ils aiment (et vous soutiendraient avoir un partenariat avec), et ainsi de suite.
En d’autres termes, la plate-forme CRM d’aujourd’hui vous permet d’adapter l’expérience de votre utilisateur, sur n’importe quel support, à des utilisateurs individuels en fonction de leur identité numérique. C’est un peu comme cette vieille école de pensée dans laquelle vous traitez chaque client comme s’il était le seul. Ce mantra ne se trouve plus uniquement dans les boutiques hors ligne.
Plateforme de données intelligentes
Une plate-forme de données intelligentes est souvent un mélange de plates-formes (comprenant généralement une DMP, un CRM, une plate-forme de billetterie, des évaluations des médias, entre autres) qui intègre des solutions de données essentielles généralement fragmentées dans une entreprise et les agrège en une seule vue – à partir de laquelle des actions peuvent être entreprises.
Par exemple, sur une plateforme de données intelligentes, vous pouvez apprendre que 25% de vos utilisateurs qui se connectent régulièrement « aiment » General Electric sur Facebook. Mieux encore, vous pouvez envoyer par e-mail à cet ensemble de personnes un contenu personnalisé ou des newsletters personnalisées avec la publicité GE – et assurer un retour plus élevé pour votre propre marque. Les plateformes de données intelligentes sont exploitables et ont un retour sur investissement clair.
En d’autres termes, si vous souhaitez mieux comprendre votre public, utilisez une plate-forme de données intelligentes avec connexion sociale pour voir toute leur identité sociale ou professionnelle holistique et comment ils interagissent avec votre contenu de manière visualisée.
Dans l’ensemble, une plate-forme de données intelligente convertit les points de données que vous lui donnez dans un format plus facile à comprendre afin que vous puissiez connecter des points à travers diverses identités de clients dont vous ne saviez pas auparavant qu’ils étaient liés. Pourquoi est-ce utile ? Parce que si vous demandez à une plate-forme de données intelligentes d’utiliser des données CRM pour informer les efforts de prospection ou des données DMP pour informer les efforts de ciblage publicitaire, vous verrez un retour instantané.
Les mégadonnées sont censées nous faciliter la vie – et nous arrivons au point où elles le font vraiment. Mais nous devons tous comprendre la capacité d’action des plates-formes que nous utilisons et permettre au Big Data de changer véritablement notre façon de faire des affaires. C’est notre plus récent actif, et, plus tôt que vous ne le pensez, nous le mettrons au bilan avec un grand nombre vert à côté.
(Démystifier le Big Data / Shutterstock)