Data Discovery
La data discovery (ou découverte des données en français) est un processus orienté utilisateur qui permet de détecter des modèles et des valeurs aberrantes en naviguant visuellement dans les données ou en appliquant des analyses avancées.
La data discovery exige des compétences en matière de compréhension des relations entre les données et de modélisation des données pour révéler des informations utiles au business.
La découverte des données, un enjeu pour les entreprises
Les capacités d’intégration et de préparation des données aident les utilisateurs professionnels à se connecter aux sources de données pertinentes de l’entreprise et aux sources de données externes (par exemple, celles fournies par les partenaires). Les données devenant de plus en plus complexes, les utilisateurs ont besoin de fonctions flexibles pour pouvoir y accéder efficacement et les préparer à l’analyse.
Des types de visualisation interactifs et nouveaux permettent aux décideurs de voir, en un instant, les grandes tendances, ainsi que de repérer les valeurs aberrantes.
Les visualisations font appel aux capacités de reconnaissance des formes de notre cerveau pour assimiler les informations d’un seul coup d’œil. Les utilisateurs ont plus de facilité à trouver des informations et à détecter les valeurs aberrantes si les données sont présentées sous forme de tableaux et de graphiques sur une seule page, plutôt que d’être noyées dans des tableaux s’étendant sur plusieurs pages.
L’analyse visuelle est une fonctionnalité importante, de plus en plus recherchée par les entreprises qui souhaitent que les décideurs disposent de moyens plus efficaces pour absorber les données et agir en conséquence.
En outre, les fonctions analytiques avancées fournissent des informations statistiques sur les données que les utilisateurs peuvent utiliser pour des analyses plus sophistiquées et orientées vers les modèles. C’est un défi de fournir des fonctions statistiques avancées prêtes à l’emploi aux utilisateurs professionnels et d’obtenir des résultats appropriés sans avoir à écrire de code.
Des outils de plus en plus demandés et utilisés
Les conseils que les utilisateurs peuvent attendre des principaux outils de data discovery d’aujourd’hui ont permis non seulement d’accéder à des fonctions avancées, mais aussi de suggérer automatiquement des algorithmes appropriés pour résoudre certains problèmes commerciaux et d’évaluer les résultats de différents algorithmes.
Ce domaine a fait l’objet de nombreux investissements, tant de la part des éditeurs que des clients, ces dernières années.
Cette nouvelle approche axée sur les données vise à aller au-delà du simple reporting et du suivi des performances de l’organisation, qui ont constitué le cœur des initiatives traditionnelles de BI. L’objectif est d’exploiter toute la valeur des données non seulement pour améliorer la prise de décision, mais aussi pour avoir un impact direct sur l’optimisation des processus commerciaux et pour alimenter de nouveaux modèles commerciaux.
La forte demande de ces outils reflète une évolution considérable du monde de la BI vers une utilisation accrue des données et l’extraction d’informations et de modèles à partir de celles-ci.
Cela signifie que les décisions opérationnelles et la planification à long terme sont basées sur les données et les idées. Pour que cela fonctionne, les employés ont besoin d’informations pertinentes et fiables en temps voulu.
La numérisation exige la démocratisation de l’utilisation des données pour permettre au plus grand nombre d’employés possible de révéler des idées dans les données de l’entreprise ou externes. Pour garantir une boucle fermée d’utilisation de l’information, les outils de découverte de données doivent avant tout être considérés comme complémentaires à la BI traditionnelle.
Des concepts tels que la gouvernance sont importants pour garantir la réutilisation des informations issues du processus de découverte de données. De même, des solutions orientées utilisateur sont nécessaires pour fournir aux professionnels une boîte à outils appropriée pour l’analyse des données.