Data quality
La qualité des données (data quality en anglais) est une mesure de l’état des données basée sur des facteurs tels que l’exactitude, l’exhaustivité, la cohérence et la fiabilité. La mesure des niveaux de qualité des données peut aider les organisations à identifier les erreurs d’informations qui doivent être résolues et à évaluer si les données de leurs systèmes informatiques sont aptes à servir l’objectif visé.
La qualité des données, un réel enjeu pour les entreprises
L’importance de la data quality dans les systèmes d’entreprise s’est accrue car le traitement des données est devenu plus étroitement lié aux opérations commerciales. De même, les organisations utilisent de plus en plus l’analyse des données pour prendre des décisions commerciales. La gestion de leur qualité est donc une composante essentielle du processus global de gestion des données. De plus, les efforts d’amélioration de la data quality ont souvent un lien avec les programmes de gouvernance des données, dont le but est de garantir qu’elles soient formatées et utilisées de manière cohérente dans toute l’organisation.
Les mauvaises données peuvent avoir des conséquences importantes pour les entreprises. En effet, elles sont souvent à l’origine de problèmes opérationnels, d’analyses inexactes et de stratégies commerciales mal conçues. Parmi les exemples de dommages économiques que ce manque de qualité peut causer, citons les dépenses supplémentaires liées à l’expédition de produits à des adresses inexactes, les opportunités de vente perdues en raison de dossiers clients erronés ou incomplets, et les amendes pour des rapports financiers ou de conformité réglementaire incorrects.
En outre, un manque de confiance dans les données, de la part des dirigeants d’entreprise et des responsables commerciaux, est souvent cité comme l’un des principaux obstacles à l’utilisation de la veille économique (BI) et des outils d’analyse pour améliorer la prise de décision.
Quels sont les critères d’évaluation ?
L’exactitude des données est un attribut essentiel à leur qualité. Pour éviter les problèmes de traitement des transactions dans les systèmes opérationnels et les résultats erronés dans les applications analytiques, les données utilisées doivent être correctes. Celles qui sont inexactes doivent être identifiées, documentées et corrigées afin que les dirigeants, les analystes de données et les autres utilisateurs finaux puissent travailler avec de bonnes informations.
D’autres aspects, ou dimensions, sont des éléments importants d’une bonne qualité des données. C’est le cas notamment de :
– l’exhaustivité : les ensembles de données comportent tous les éléments qu’ils devraient contenir ;
– la cohérence : il n’y a pas de conflit entre les mêmes valeurs de données dans différents systèmes ou ensembles de données ;
– l’absence de doublons dans les bases de données ;
– l’actualité : les données ont été mises à jour si nécessaire ;
– la conformité aux formats de données standard créés par une organisation.
Le respect de tous ces facteurs permet de produire des ensembles de données fiables et dignes de confiance.
Pour déterminer le niveau de qualité de leurs données, les organisations réalisent généralement une cartographie de leurs actifs afin de mesurer leur exactitude, leur unicité et leur validité.
D’un point de vue financier, le maintien de niveaux élevés de qualité des données permet aux entreprises de réduire le coût de l’identification et de la correction des mauvaises données dans leurs systèmes. Elles sont également en mesure d’éviter les erreurs opérationnelles et les pannes de processus d’affaires qui peuvent augmenter les dépenses d’exploitation et réduire les revenus.