La gouvernance des données : par où commencer?
✍Charlotte Ledoux & Louis Schieber / Temps de lecture : 10 minutes
Vous avez du mal à trouver la donnée, et même lorsque vous y parvenez, elle est hébergée dans plusieurs systèmes avec des noms de colonnes et des formats différents. Les dialogues avec vos collaborateurs ressemblent parfois à “La colonne HRT_M_01 de ton extract correspond bien à la B31 dans le fichier Client?”. Vous souhaitez entamer une démarche de gouvernance des données, mais par où commencer ?
La gouvernance des données, en bref
Une donnée gouvernée c’est quoi ? Il s’agit d’une donnée accessible, compréhensible et de qualité pour que les utilisateurs et les projets puissent en exploiter tout le potentiel. Au service de quoi ? Des objectifs business de l’entreprise en étant au plus près des besoins des utilisateurs de la donnée.
Les objectifs de la gouvernance des données sont ambitieux et complexes. Pour les atteindre, elle doit d’abord être considérée comme un sujet d’entreprise. Ressort fondamental d’une transformation profonde, ce changement d’état d’esprit est un prérequis capital avant d’entamer une démarche de data gouvernance. La première responsabilité des leaders de l’organisation est de véhiculer une conviction profonde : la donnée est un asset dont la responsabilité est tenue en transverse par l’ensemble des fonctions de l’entreprise.
Pourquoi est-ce si difficile ?
Un tel programme de transformation, qui impacte l’ensemble des fonctions de l’entreprise, est difficile à implémenter et à maintenir dans le temps. Gouverner les données d’une entreprise est un défi qui peut prendre plusieurs années. L’expérience prouve que les débuts sont souvent difficiles, que les espoirs ne résistent pas longtemps aux premières déconvenues, et ce, malgré des investissements conséquents.
Nombreux sont les risques qui pèsent sur la mise en place d’une gouvernance des données efficace et adaptée au contexte de l’organisation :
• Placer la gouvernance des données sous la seule responsabilité des équipes IT. Au contraire, elle doit prendre racine partout dans l’organisation. Les métiers sont tous concernés et ils ont chacun une responsabilité forte : reprendre possession de leurs données.
• Échouer à démontrer de la valeur à gouverner les données. Mesurer le ROI de la gouvernance des données n’est pas chose facile. Néanmoins, l’exercice est capital pour éveiller les consciences et créer les conditions du changement.
• Silotter une vision de la gouvernance des données par métier ou par système. A l’inverse, développer une compréhension globale du patrimoine de données et partager une vision commune sur la façon de gérer les données entre les différentes entités sont deux étapes fondamentales pour harmoniser les pratiques et progresser collectivement.
• Marginaliser les initiatives de la gouvernance des données. Si les nouveaux dispositifs et processus mis en place pour assurer la gouvernance des données ne font pas partie intégrante des activités de l’entreprise, celle-ci reviendra lentement mais sûrement à ses anciens comportements.
• Tout mener de front. Les enjeux de la gouvernance des données sont multiples : réglementaire, organisationnel, technologique… Surcharger les agendas des collaborateurs du jour au lendemain avec une multitude de nouvelles tâches relatives à la gouvernance des données est le meilleur moyen de tuer dans l’œuf les initiatives. Attention à ne pas sous estimer le temps nécessaire pour parvenir à des résultats concrets. Elaborer une feuille de route claire, validée par toutes les parties prenantes et ponctuée de jalons pour mesurer les progrès et capitaliser dessus est un passage obligatoire.
• Imaginer que les outils sont la solution à tous les problèmes. Au mieux, ils seront un fer de lance efficace pour certaines initiatives, mais ils ne pourront jamais répondre à toutes les problématiques. Construire un programme de gouvernance des données autour d’un outil c’est prendre le risque de ne pas s’attaquer à l’origine des problèmes. L’outillage n’intervient que pour optimiser des processus déjà existants.
Commencer par définir un cadre méthodologique en mesure d’être implémenté
Les questions sont nombreuses pour trouver le bon angle d’attaque et relever l’ensemble des défis tout en limitant les risques. “Comment engager les collaborateurs dans le changement ? Quels objectifs se fixer ? Dans quel horizon temporel ?” sont autant de questions à traiter pour éviter que le programme ne tombe à l’eau à la première difficulté.
Dans un premier temps, il est primordial de conduire une phase d’entretien avec les différentes fonctions de l’entreprise pour comprendre l’existant, identifier les spécificités de l’organisation et les attentes en matière de gouvernance des données.
Dans un second temps, une série d’ateliers permettra d’alimenter, dans une logique de co-construction, la formalisation d’un cadre méthodologique cible pour la gouvernance des données. Ce cadre méthodologique se construit autour de 5 piliers principaux, qui feront chacun l’objet d’un ou plusieurs ateliers :
- Des rôles dédiés à la gouvernance des données : la littérature sur les rôles, bien que complète, est souvent disparate. Les responsabilités d’un data owner ou d’un data steward varient selon les organisations. L’enjeu ici est de parvenir à formaliser des fiches de rôles en adéquation avec le modèle d’organisation et la culture de l’entreprise. Il faut s’attacher à impliquer dans le processus de définition de ces rôles ceux qui seront amenés à les porter et construire ensemble leur futur métier. Sans compter que cette phase d’itération pour ajuster le périmètre de chaque rôle est le premier pas d’une conduite au changement réussie. On distingue quatre rôles principaux que l’on retrouve dans la plupart des programmes de gouvernance :
- Le Chief Data Officer : il s’assure de la bonne définition et de la mise en place du cadre de gouvernance des données à l’échelle de l’entreprise. Il propose et pilote des projets stratégiques et/ou transverses en la matière, travaille avec les sponsors métiers et l’IT pour hiérarchiser et résoudre les problématiques rencontrées.
- Le data manager : il est garant, sur un périmètre de données, de la mise en œuvre des processus et principes définis par la gouvernance de la donnée. Il contrôle l’application des contraintes réglementaires et anime la gouvernance des données sur son périmètre.
- Le data steward : il gère et administre opérationnellement tous les aspects d’un sous-ensemble de données. Il porte la responsabilité du contrôle technique des données : les aspects de sécurité, de qualité et d’accessibilité.
- Le data owner : il est le référent métier de sa donnée pour toute l’entreprise. Il est garant des définitions métiers et des référentiels associés. Il délivre les autorisations d’accès à la donnée, en lien avec des cas d’usage identifiés.
Dans le cas d’organisations complexes, pour mieux faire coïncider les rôles avec les compétences déjà en place ou pour mettre l’accent sur un enjeu critique pour l’entreprise, d’autres rôles peuvent être considérés comme le Data Quality Manager en charge de la qualité sur un périmètre de données.
- Des organes de gouvernance : mettre en place des comités, sans les multiplier, avec des mandats clairs. Au niveau stratégique, l’objectif est de faire vivre et d’optimiser le cadre méthodologique dans le temps en suivant une logique itérative. Mais aussi d’engager les sponsors du programme pour faire un état des lieux des avancées. Il est important de maintenir un lien avec les décideurs sur le long terme pour démontrer la valeur créée, débloquer des situations en cas de besoin et faire rayonner la gouvernance dans toute l’organisation. Au niveau opérationnel, ils sont essentiels pour gagner en efficacité et atteindre les objectifs fixés. Il s’agit par exemple de mettre en place un one to one hebdomadaire entre le data owner et son data steward pour définir et suivre ensemble un plan des actions à mener sur sa donnée.
- Des principes et des normes : fils conducteurs du programme, ils concrétisent les convictions de l’organisation pour sa gouvernance des données. Le processus de définition des grands principes de la gouvernance doit se jouer à un niveau stratégique. Ils permettent avant tout de garantir un mode de fonctionnement partagé dans toute l’entreprise via l’établissement de règles et de normes communes.
- Des processus : essentiels au bon fonctionnement du programme de gouvernance, ils mettent en musique les règles et les normes de la gouvernance pour atteindre les objectifs d’accessibilité, de qualité, de sécurité et de conformité réglementaire de la donnée. Pour chacun de ces objectifs, un ou plusieurs processus sont à définir avec des actions et des rôles en responsabilité sur ces actions.
- Les systèmes d’information et les outils : ce sont les moyens techniques à mettre en œuvre pour supporter les ambitions de la gouvernance. D’une part via la maîtrise des systèmes de collecte, d’exposition et d’utilisation de la donnée en respectant les standards de sécurité de l’architecture IT. D’autre part via la mise en place d’outils dédiés à la gouvernance des données. Le marché fourmille d’outils de plus en plus performants pour documenter la donnée et monitorer son niveau de maturité (data dictionary, data management system…).
C’est ce cadre méthodologique qui devra permettre de redonner aux métiers la main sur leur donnée, mais plus encore, d’accompagner le changement et de le faire vivre. La question de l’implémentabilité du cadre méthodologique se pose au moment même où il est pensé, et les concepteurs doivent en permanence prendre en considération ce paramètre. Nous avons trop souvent déploré des programmes de gouvernance impossibles à déployer sur le terrain. Des solutions existent pour remédier à ce problème :
- Définir une organisation flexible en mesure d’absorber les contraintes des différents métiers. La capacité du programme à être implémenté dans l’ensemble des métiers, à tous les niveaux et dans différents contextes est cruciale pour remporter l’adhésion des parties prenantes. Cette flexibilité peut se concrétiser à travers l’instauration de règles simples comme, par exemple, la possibilité de faire supporter par une même personne deux rôles différents si ses compétences le permettent (ex : un data owner avec des compétences techniques peut aussi faire office de data steward le temps de la mise en œuvre).
- Définir une organisation évolutive à même de se transformer à mesure que progresse le déploiement. L’une des solutions consiste à mettre en place une unité centrale pour piloter le programme en transverse et accompagner l’implémentation : du premier cas d’usage jusqu’à la vision cible. Cette unité garantit la cohérence tout au long du déploiement et assure la bonne intégration des nouvelles ressources.
- Ne pas sous estimer la charge et définir des rôles dédiés à 100% pour éviter que les contraintes opérationnelles quotidiennes ne prennent le pas sur les tâches consacrées à la gouvernance des données. A l’exception du Data Owner qui doit conserver un ancrage opérationnel pour maintenir une compréhension fonctionnelle de sa donnée et être en mesure d’exprimer les besoins. La gouvernance représente environ 50% de sa charge de travail, le temps d’initier la documentation fonctionnelle de sa donnée, puis 20% pour assurer le suivi.
Poursuivre par un cas d’usage pour créer la première étincelle
Une fois la cible définie, notre démarche consiste à la mettre en application sur un cas d’usage réel. Cela permet de tester et d’ajuster la cible au mieux en prenant en compte les retours d’un panel plus large d’interlocuteurs. Le cas d’usage doit cibler une problématique métier et un périmètre de données précis associé. Voici quelques exemples de critères permettant la sélection du cas d’usage : visibilité en interne du sujet, parties prenantes identifiées, convaincues et disponibles, cas mesurable avec un KPI défini, impact métier élevé à court terme…
Le périmètre choisi concerne en général une ou plusieurs données (suivant la durée du cas d’usage) utilisées largement dans l’entreprise et pas uniquement pour un projet data science. Le but est bien d’amorcer la pompe avec un périmètre réduit sur lequel la probabilité de succès en un temps court est élevée. Par exemple, un cas d’usage possible est de se concentrer sur la donnée chiffre d’affaires. C’est une donnée clé de l’entreprise, très visible, pour laquelle les gains espérés sont forts : donnée plus simple à agréger au niveau Pays, reportings plus fiables, etc… Un autre exemple rencontré est de travailler sur les données poids et dimensions des articles. Les leviers de gains sont multiples pour ces données notamment dans le secteur du Retail : les caractéristiques de taille de boîte peuvent être erronées ce qui génère des problèmes de blocage dans les entrepôts, des frais de port peuvent être erronés sur le site ce qui engendre des frais de livraison si élevés que les clients décident d’annuler leurs commandes (ventes perdues).
Les ateliers menés sur ce cas d’application permettront de projeter des collaborateurs sur chaque rôle, de dérouler l’un des processus cibles sur la donnée (mise en qualité par exemple) et de lancer des premières actions concrètes sur la donnée. Un data owner aura été identifié afin de prendre le lead et participer activement aux ateliers et au suivi des premières actions.
Adopter une double approche pour réussir le passage à l’échelle
Le premier volet est une approche “quick-win” basée sur les données extrêmement prioritaires avec de forts enjeux business. L’implémentation se fait par le bas en repartant de l’objet métier et donc du data owner. Après avoir documenté les objets métiers (définition de l’objet métier, des seuils de qualité, liste des usages potentiels…), l’objectif est d’obtenir des résultats rapidement sur les données physiques, en lançant des actions en collaboration avec le Data steward, les équipes techniques et/ou le Product owner suivant les rôles définis précédemment.
Le second volet consiste au “scale-up”, c’est-à-dire au passage à l’échelle en repartant de la vision macro du patrimoine de données : il est nécessaire de cartographier les données pour délimiter les périmètres et responsabilités associées, et surtout prioriser les périmètres avant de nommer des data managers en charge d’implémenter le cadre méthodologique de la gouvernance sur leur périmètre.
Ces 2 approches sont complémentaires et viendront s’alimenter mutuellement, chaque fois qu’un périmètre sera cartographié et défini comme prioritaire, il pourra être lancé en mode “quick-win”. De même les chantiers quick-win permettront d’alimenter la cartographie à un niveau plus détaillé avec les niveaux de qualité, les sources de données etc…
Le succès du passage à l’échelle repose également sur la mise en œuvre d’une conduite du changement consistante, incluant notamment les aspects suivants :
- Validation des rôles de manière itérative et collégiale avec quelques membres clés de l’organisation de data gouvernance, puis mise à jour des fiches de poste en collaboration avec le département RH
- Mettre en place un plan de communication avec des restitutions officielles menées par le Head of data gouv, des sondages / mails, des vidéos (celle-ci par exemple décrit l’importance de gouverner les données poids et dimensions chez Décathlon https://www.youtube.com/watch?v=YDaIXuzuyAo). Le lancement du programme doit en effet être officialisé, la communication est cruciale pour la mise en œuvre et pour accompagner le changement. Une communication pertinente et bien rythmée permettra notamment de motiver les équipes, diffuser les premiers succès et mettre en place la communauté naissante de Data Owners.
- Définition d’un plan de formation avec différents modules et parcours adaptés aux rôles et aux compétences nécessaires
Finalement le passage par le cas d’usage constitue une rampe de lancement de l’ensemble du programme et permet de tester la cible proposée sans l’imposer aux collaborateurs.
Nous vous donnons rendez-vous pour un prochain article dans quelques mois sur un retour d’expérience sur ce sujet en collaboration avec Décathlon !