Recherche et développement
24/08/2023

L’Open Source, vecteur annoncé de la démocratisation de l’IA


Auteur : Sylvain Corlay
Temps de lecture : 4 minutes
Quantmetry.com : L’Open Source, vecteur annoncé de la démocratisation de l’IA

Les logiciels de l’écosystème open source Jupyter sont aujourd’hui des standards mondialement utilisés par la communauté du calcul scientifique. En pointe sur ce projet, l’éditeur français QuantStack démontre la viabilité du modèle open source, qui pourrait jouer rôle majeur dans la diffusion de l’IA. Explications avec Sylvain Corlay, président et fondateur de QuantStack.

Le carnet numérique Jupyter Notebook s’est imposé comme l’un des outils favoris des data scientists et des chercheurs à qui il est plus particulièrement destiné. À la différence d’un développeur d’application, par exemple, l’ingénieur ne produit pas une solution, il la cherche. Il est donc dans une démarche d’exploration, alternant réflexion, essais et apprentissage. Jupyter Notebook outille ce processus itératif en réunissant dans une même interface code, visualisation des résultats et commentaires. Adopté par les centres de calcul intensif et les laboratoires de recherche, intégré par les géants du numérique dans leurs plateformes, utilisé dans les bureaux d’étude des plus grandes entreprises, Jupyter Notebook compte à ce jour 10 à 20 millions d’utilisateurs dans le monde.

Ce succès, Jupyter Notebook le doit à ses fonctionnalités et son ergonomie, mais aussi à son modèle de diffusion. Comme le reste de l’écosystème Jupyter, il est 100% open source, publié sous licence BSD, et libre d’utilisation pour tous. La gratuité est bien sûr un argument de poids, notamment dans les mondes éducatifs et universitaires, mais ce n’est pas le seul. Pour des applications scientifiques, sensibles et de haut niveau, la transparence du code et la possibilité de l’adapter à ses besoins sont également déterminantes. Enfin, la vitalité de la communauté des développeurs et des utilisateurs favorise son essor grâce à un bouche à oreille positif.

Soutenu par l’organisme NumFOCUS, Jupyter est développé, comme tous les projets open source, par une communauté de développeurs volontaires. Avec une particularité cependant : depuis 2021, 70 % des contributions ont été réalisées par les collaborateurs d’une seule société, la startup parisienne QuantStack.

Comme elle, de nombreuses entreprises fondent leur activité sur un logiciel qu’elles ne font pas payer. Pour générer malgré tout des revenus, il existe différents modèles, mais tous ne sont pas sans faiblesses. L’un des plus répandus, le freemium, consiste à diffuser gratuitement une version basique et à faire payer des extensions plus avancées. Mais si un membre de la communauté souhaite développer une fonctionnalité proche d’un module payant, l’entreprise se trouve en concurrence avec son propre projet. Pour éviter cette situation, les freemiums s’abritent derrière des licences complexes, qui, en fin de compte, ne sont pas de l’open source en sens strict.

Avec le modèle SaaS, également prisé, l’éditeur ne fait pas payer le logiciel, mais sa mise à disposition. Cette fois, la difficulté est qu’il devient tributaire des tarifs de son hébergeur et qu’il peut avoir du mal à conserver sa marge, surtout pour les applications gourmandes en calcul. Pour équilibrer les exigences économiques et celles du projet, un modèle qui a fait ses preuves est celui adopté, par exemple, par Red Hat pour Linux. L’éditeur dissocie clairement son activité de développement logiciel, non lucrative, de ses activités de conseil, qui constituent sa branche commerciale. Dans ce modèle, qui est aussi celui de QuantStack, la valeur réside d’abord dans l’expertise des personnes, généralement des développeurs de très haut niveau, très demandés sur le marché. Au-delà de leur rémunération, il faut donc veiller à l’épanouissement de ces collaborateurs, par exemple en les créditant personnellement de leurs réalisations.

Cultiver l’implication individuelle des développeurs et celle, collective, de la communauté avec une gouvernance ouverte est la clé pour entretenir l’intérêt dans la solution et un flux constant d’innovations. Premier averti, l’éditeur peut alors bâtir en amont son offre de services sur les nouveautés en gestation.

Ainsi, plusieurs projets émergents dessinent d’ores et déjà l’avenir de Jupyter et donc de QuantStack. S’exécutant directement dans le navigateur, JupyterLyte offre, en contrepartie de quelques limitations, des perspectives très intéressantes en matière de passage à l’échelle.

En France, il est le moteur du projet Capytale, destiné à l’enseignement de Python au lycée et qui compte aujourd’hui 500 000 utilisateurs. Si l’on veut donner au plus grand nombre la possibilité d’apprendre à coder, surtout dans les pays en pleine explosion démographique comme le Nigéria, ce mode de distribution, découplé du serveur, sera impératif. Autre avantage : la pérennité. Quand des calculs sont mentionnés dans des publications scientifiques, il faudra être en mesure de les refaire dans le futur, ce que garantit une telle approche, au contraire de codes taillés pour un type particulier d’architecture matérielle (x86).

Autre projet prometteur de l’écosystème Jupyter, JupyterCAD s’appuie sur les fondations souples, ouvertes et robustes de Jupyter pour bâtir une nouvelle génération d’outils professionnels collaboratifs. JupyterCAD pourra être utilisé pour l’édition de textes, de modèles CAO, de produits graphiques, et même intégrer des agents artificiels (IA générative) au renfort des collaborateurs humains.

Comme le montre Jupyter, quand il se fonde sur un business model rigoureux et vertueux, l’open source est un puissant levier d’innovation et de diffusion à grande échelle. Pour ne pas rester l’apanage de quelques riches entreprises,  l’IA, qui partage beaucoup des exigences du calcul scientifique, devra sans doute en faire elle aussi le vecteur de sa démocratisation.


Sylvain Corlay
Sylvain Corlay

Président et fondateur de QuantStack, Membre du board de NumFOCUS, Membre du comité de direction du projet Jupyter

Aller en haut