Chaque entreprise est désormais une entreprise axée sur les données et l’analyse des données est trop importante pour en limiter l’utilisation aux experts.
Un nouveau rapport de Capgemini, l’un des principaux fournisseurs de services de conseil, de technologie et d’externalisation, indique que les deux tiers des organisations (67 %) interrogées estiment qu’elles risquent de devenir non compétitives si elles n’adoptent pas de nouvelles solutions d’analyse de données.
Alors que les décisions les plus importantes et les plus critiques fondées sur les données devraient probablement être laissées aux scientifiques des données et aux experts métier, ce n’est pas une raison pour refuser aux autres professionnels les connaissances et les renseignements qui peuvent être glanés à partir de l’exploration du Big Data. Mais comment une entreprise permet-elle à ceux qui ne sont pas à l’aise avec la création d’une feuille de calcul avec des tableaux croisés dynamiques de se plonger dans l’analyse des données ? La réponse est simple : donnez-leur des outils puissants conçus pour être conviviaux.
Pouvoir utiliser une application sans jamais lire le manuel est un concept délicieux pour beaucoup de gens, mais les plus enclins à la technique se demanderont si « simple » se traduit par des fonctionnalités limitées. C’est possible, bien sûr, mais le droite Les outils offriront des fonctionnalités robustes avec une interface qui a du sens pour les utilisateurs.
Définir le Big Data
Avant de passer aux solutions, décrivons le Big Data. Pour certains, le terme indique une collection énorme et toujours croissante d’informations utiles. Pour d’autres, il s’agit d’une collection de données non structurées ou de données provenant de sites tels que les médias sociaux, les capteurs et les bases de données publiques. Mais le Big Data, c’est toutes ces choses et bien plus encore : c’est un moyen d’extraire des informations de tous les types de données (grandes, petites, nouvelles, anciennes, numériques, textuelles et images). Le Big Data peut être contenu dans des entrepôts, des lacs, des hubs, des bacs à sable et (malheureusement) des marécages. C’est historique, en temps proche et en temps réel. Et c’est à chaque organisation de définir les avantages que le Big Data peut apporter à ses processus métier.
La plupart des entreprises lancent judicieusement leurs initiatives Big Data en choisissant un ou deux projets où l’analyse des données peut fournir une impulsion mesurable à leurs résultats, à leur efficacité et/ou à leur capacité à gérer les risques plus judicieusement. Une fois que le Big Data a fait ses preuves, d’autres projets sont déployés. De nombreuses entreprises ont désormais mis en place plusieurs initiatives Big Data, et alors que nous avançons à une époque où les données étaient soigneusement structurées et stockées dans des silos, nous devrions également penser à utiliser le Big Data comme une activité quotidienne qui alimente une multitude de décisions commerciales. En d’autres termes, tout le monde est, sera ou devrait être un analyste de données.
Creusez profondément avec une perceuse
La société de recherche industrielle Wikibon déclare que 52% des investissements dans les outils Big Data sont consacrés aux technologies qui ingèrent et organisent les données afin qu’elles puissent être préparées plus efficacement pour l’analyse.
La préparation des données à utiliser avec des outils d’analyse a longtemps été un investissement de temps considérable, avec la le journal Wall Street signalant que les services informatiques de nombreuses organisations consacrent 75 à 80 % de leur énergie à l’ingénierie initiale des données. Le Journal, dans un article sur « Big Data 2.0 » de Randy Bean, poursuit en notant que « les approches Big Data démocratisent l’intégration des données en permettant aux utilisateurs non techniques d’accéder directement aux données dont ils ont besoin pour l’analyse. En conséquence, les entreprises ont plus d’options parmi lesquelles choisir et d’autres approches à envisager. Développer un cadre d’intégration de données efficace devient la première étape pour tirer une valeur commerciale de leurs données. «
Les outils qui fournissent une vue intégrée des données sont tout aussi importants pour la réussite de tout projet Big Data. Parmi les outils disponibles, Apache Drill jouit d’une forte popularité. Drill n’est pas en soi une base de données ; il s’agit d’un moteur de requête autonome qui peut combiner des données provenant de plusieurs sources dans une seule requête.
Drill est bien adapté à l’analyse et aux tâches d’experts telles que l’exploration de données, la découverte, les requêtes de BI ad hoc et les analyses de jour zéro. Il évolue d’un seul ordinateur portable à un grand cluster de serveurs. Les données peuvent être interrogées dans leurs formats natifs, y compris les données imbriquées, les données sans schéma et les données dynamiques. Puisqu’il n’est pas nécessaire de définir et de gérer explicitement les schémas, Drill permet l’exploration de données en libre-service. Il peut être utilisé par quelqu’un dont la description de poste n’inclut pas « scientifique des données » ou « analyste commercial » (bien que les personnes qui n’ont pas travaillé avec des données puissent trouver Drill un peu intimidant).
Explorez facilement avec MicroStrategy Analytics Desktop
MicroStrategy Analytics Desktop a été conçu pour les personnes qui ont besoin de visualiser, d’analyser et de partager des données mais qui n’ont pas l’expérience technique ou les ressources informatiques nécessaires pour effectuer la tâche. Grâce à cette solution d’analyse commerciale en libre-service, n’importe qui peut accéder aux données et les explorer sans l’aide d’un expert. Il y a de fortes chances qu’un utilisateur n’ait même pas besoin de jeter un coup d’œil à un manuel ou aux fichiers d’aide.
Il n’y a pas besoin de scripts complexes. Les utilisateurs peuvent simplement se connecter à une source de données ; découvrir les tendances, les modèles et les anomalies ; puis organisez leurs découvertes en visualisations, affichez-les sur des tableaux de bord interactifs et cliquez même pour partager ces tableaux de bord par e-mail. Cela est vrai même pour les sources de données plus « semi-structurées » telles que les médias sociaux, qui nécessitent normalement plus de travail en amont pour être analysées.
Les données peuvent être glissées et déposées dans des tableaux de bord, et sans effort triées, pivotées, agrégées et analysées statistiquement. Aucune expertise dans les langages d’interrogation de base de données, le calcul, les statistiques, l’apprentissage automatique ou la collecte de données (nettoyage) requise.
Voyez par vous-même dans cette vidéo de démonstration de MicroStrategy Analytics Desktop fonctionnant conjointement avec Apache Drill.
Et si vous souhaitez également un essai pratique de Drill, téléchargez Hadoop Sandbox de MapR avec Apache Drill.