Data Strategy
25/08/2023

Data Sharing : de l'empirisme à la maturité


Auteur : Fouad TALAOUIT
Temps de lecture : 5 minutes
Quantmetry.com : Data Sharing : de l'empirisme à la maturité

Vanté de longue date comme un puissant levier d’innovation et de création de valeur, le data sharing est encore peu pratiqué. Sortant peu à peu de l’artisanat, il gagne aujourd’hui en maturité pour remplir enfin ses promesses. Explications avec Fouad Talaouit, consultant spécialisé dans l’architecture et la gouvernance des données, et la transformation des entreprises via la data et l’IA.

Bien plus que la simple communication d’un jeu de données dans le cadre d’une collaboration ponctuelle, le partage de données (data sharing) consiste à diffuser de façon systématique et organisée des données que l’on possède auprès d’un écosystème.

On peut distinguer quatre grands modèles :

  • Data broker & Marketplace : le fournisseur (broker) récolte les données, les traite pour les rendre exploitables, et les met à la disposition de tiers via une marketplace (dont il peut être, ou non, l’opérateur) ; 
  • Mutual Data Sharing : la partage de données s’effectue entre deux organisations, sans l’intermédiation d’une place de marché ; les termes du partage sont négociés de gré à gré (engagements de service, réciprocité, tarif…) ; 
  • Collaborative Chain : deux organisations, ou plus, mettent leurs données en commun pour travailler conjointement dessus ;
  • Hub : une entité centralisatrice organise la collecte et la diffusion des données au sein d’un écosystème.

Quel que soit le mode de partage, les risques encourus sont identiques :

  • Risques juridiques : on doit s’assurer que l’on a bien le droit de partager les données et d’en proposer l’utilisation (RGPD, données sous licence…) ;
  • Risques éthiques : il faut envisager et prévenir les impacts que ce partage pourrait avoir sur les parties prenantes (personnes, entreprises, environnement…) ;
  • Risques de réputation : partager de mauvaises données, ou à de mauvaises personnes, peut rejaillir négativement sur l’organisation ;
  • Risques commerciaux : en partageant certaines données, l’entreprise pourrait révéler ses secrets ou ses projets, et fragiliser sa position concurrentielle ;
  • Risques de sécurité : à travers les données qu’elle révèle, l’entreprise peut s’exposer à de nouvelles menaces, IT et non IT.

S’il impératif de prendre en compte ces risques bien réels, ils ne doivent cependant pas occulter les nombreux bénéfices que peut engendrer le partage de données. Ceux-ci différent selon la place que l’on occupe dans l’écosystème :

  • Le Data Holder : en monétisant ses données, il peut générer un revenu supplémentaire. Selon les termes du partage, il peut aussi bénéficier du talent des consommateurs de données et de ce qu’ils en auront tiré : innovation, solutions business, gains d’efficacité…  Enfin, ce peut aussi être un moyen de réduire les coûts grâce à la mutualisation (des ressources technologiques, des compétences…) et d’accélérer le time-to-market ;
  • Le Data Consumer : les données auxquelles il a accès peuvent nourrir ses processus (de décision, d’optimisation, d’innovation, opérationnels…), entrer dans ses produits et ses services, ou encore lui permettre de développer de nouvelles compétences ;
  • Les intermédiaires : ils peuvent faire de la distribution de données une activité à part entière, élargir autour d’elles leur palette de services ; cela peut aussi leur permettre de contribuer à des objectifs plus vastes, par exemple structurer et développer un écosystème ou une filière sectorielle ;
  • La société : elle peut espérer des retombées positives en termes d’innovation, de création d’emploi et de valeur, d’amélioration de la qualité des produits et des commerciaux services, de réduction des impacts environnementaux…

Chacun de ces modèles présente en revanche ses défis spécifiques :

Dans le modèle du Data broker, la principale difficulté tient au passage d’une donnée exclusivement interne à une donnée destinée au monde extérieur. La donnée devient un produit et doit, de ce fait, faire l’objet d’un questionnement en ce sens : À qui et à quoi va-t-elle servir ? Quelle doit être sa qualité ? Quel seront son prix et son mode de distribution ? Comment les clients connaîtront-ils son existence, auront-ils le désir de l’acquérir et les convaincra-t-on de le faire ? Enfin, l’entreprise a-t-elle la capacité à la produire de façon industrielle, depuis son extraction et son raffinage jusqu’à sa diffusion (surtout si c’est une donnée en temps réel) ? Techniquement, plusieurs modèles sont envisageables : par l’envoi de fichiers plats, par accès direct via des API, ou via la diffusion de rapports.

Le modèle collaboratif se heurte, quant à lui, à trois grands écueils : le manque de confiance entre les acteurs ; les coûts et les difficultés de la mise en œuvre ; la délicate évaluation du ROI pour les différentes parties. Pour les surmonter, il faut donc aborder en commun des enjeux de gouvernance, de partage des coûts et de la valeur, de contractualisation, de compétences et d’outillage. Concrètement, la collaboration passera par la mise en place d’un « trust space », un terrain neutre où les acteurs partageront sur un pied d’égalité un modèle de donnée, des outils et des assets communs. Tout ceci n’est cependant possible que si chacun est convaincu que la data est matériau que l’on gagne à forger ensemble. 

Enfin, dans le modèle du hub, le défi n°1 est d’obtenir la contribution de ceux qui détiennent des données. Cela passe par de la persuasion, par des incentives, par les injonctions des plus grands donneurs d’ordre, voire par une obligation légale comme dans le cas du Health Data Hub français. Avec des données d’origine extrêmement diverses, se posent aussi des questions majeures de standardisation et de passage à l’échelle : comment le hub peut-il absorber sa croissance pour converger vers un modèle cohérent et performant ? S’il y parvient, en revanche, les bénéfices peuvent être considérables : innovation et synergies démultipliées, transparence de l’écosystème, fin des rentes de situation et effacement des barrières à l’entrée pour les nouveaux acteurs, développement d’une culture collective propice à la collaboration…

En définitive, quel que soit le modèle, la donnée ne peut être partagée que si l’on prend toute la mesure de ce que signifie sa diffusion en dehors de l’organisation. Elle doit être considérée comme un produit à part entière, avec toutes les exigences et les précautions que cela suppose. Cet état d’esprit doit être développé au sein des métiers comme de l’IT, qui doivent collaborer étroitement pour mettre en place, en priorité, une gouvernance et un espace dédié, ni tout à fait dans l’entreprise, ni tout à fait au dehors. En ce qui concerne plus spécifiquement l’IT, elle doit penser son infrastructure data sous la forme d’un data-stack-as-a-service car l’entreprise et ses métiers pourront être amenés à jouer différents rôles, dans différents modèles.


Fouad TALAOUIT
Fouad TALAOUIT

Data & Solution Architect chez Euronext

Aller en haut