Groupe 4 – Formation, consolidation, diffusion et valorisation
Mots-clés
formation, logiciels, données, banc d’essais, partage de méthodes, mise en commun d’outils, diffusion grand public, vulgarisation, conseil, startup, partenariats socio-économiques.
Introduction
Les dernières itérations des feuilles de route ont permis de dégager les grandes idées, fédérer la communauté et spécifier les grandes questions et les grands thèmes. La mission initiale du RNSC (Réseau National des Systèmes Complexes) était d’essaimer en créant des instituts des Systèmes Complexes sur le territoire français. Nous pouvons estimer aujourd’hui que cette mission est un succès, avec la création de 6 instituts : ISC-PIF (Paris), XSYS (Toulouse), IXXI (Lyon), ISCN (Le Havre), MISC (Orléans – Tours), Strasbourg, une action internationale (Campus Numérique des Systèmes Complexes), et des Réseaux Thématiques.
Il s’agit maintenant de consolider le réseau, diffuser la connaissance et les outils, et le valoriser auprès des acteurs publics et du monde économique. Les interactions diffuses et continues entre ces différents modes d’échange à l’intérieur comme avec l’extérieur de la communauté des système complexes nous ont conduit à segmenter les actions à mener selon 3 grands champs en fonction principalement du public auquel ils s’adressent et de leur temporalité. Ces 3 champs sont 1/ l’enseignement académique, 2/ les événements de consolidations et 3/ les partenariats de valorisation avec le monde socio-économique, étant entendu que ces modes d’interaction agissent de concert et en synergie. Il nous a semblé pertinent d’associer les actions de diffusion, de vulgarisation et de communication avec le grand public, avec les sessions de consolidations afin qu’elles puissent bénéficier du caractère événementiel et informel associé à la délivrance et la mise en commun d’outils ou de méthodes partagés par la communauté.
Nous proposons ainsi les orientations suivantes pour mettre en œuvre ces objectifs:
- l’enseignement académique, par la formation initiale et continue vers l’intérieur et l’extérieur de la communauté SC.
- la consolidation, par la mise en commun entre les ISC et les partenaires, d’outils, de méthodes, de services, d’infra-structures, et leur diffusion auprès d’un plus large public (vulgarisation et animations socio-culturelles associées aux temps forts des événements de consolidation).
- la valorisation, grâce à la mise en œuvre de formation continue, de prestations de conseils, de partenariats contractuels ou encore de la création de “start-up”s vers et avec la sphère socio-économique.
Formation(s)
Nous avons considéré le mot “formation” en un sens très large : introduction aux concepts fondamentaux, aux problématiques, aux méthodes et aux outils via l’enseignement initial traditionnel et la formation continue.
État des lieux
Enseignement existant
- Des formations au niveau master existent déjà. Par exemple, celle de l’IXXI-ENS Lyon.
- La formation master Système Complexe Erasmus-mundus en collaboration avec l’école Polytechnique
- Le Campus Numérique des systèmes complexes [CS-DC])(https://www.cs-dc.org/)
Formation continue
Les JEDI sont des sessions courtes (une journée maximum) pour former aux outils développés en interne par l’ISC-PIF ou à des outils utiles à la communauté SC.
Les écoles d’été MAPS regroupe pendant une semaine des apprentis modélisateurs et les sensibilise à la modélisation multi-agent.
École de physique des Houches Complex Networks Thematic School
Défis
Enseignement
Nécessité de la mise en œuvre de parcours d’enseignement académique afin d’avoir des étudiants se distinguant par leur formation des autres disciplines. C’est une étape nécessaire vers l’ouverture de formation académique spécifique en systèmes complexes pour favoriser l’interdisciplinarité autour des thématiques couvertes par les SC.
Niveaux ciblés: licence, IUT, école d’ingénieur, master, PhD
Les deux questions majeures sont: à quel niveau académique et quel syllabus?
Quel syllabus? Un enseignement systèmes complexes ou un enseignement interdisciplinaire? Au niveau actuel il est difficile d’imaginer un enseignement purement systèmes complexes. Donc, pour le moment on pourrait commencer avec un enseignement interdisciplinaire: on partirait d’un problème nécessitant une intervention de plusieurs disciplines et on sensibiliserait les étudiants aux données et à la connaissance des données, puis on présenterait les outils pour modéliser, analyser et simuler ces données. On traiterait plusieurs problèmes issues de différentes interdisciplines pour créer une ouverture d’esprit.
Par exemple: chaque année on travaille sur des outils issue d’une discipline “dure” (physique, mathématique, informatique) appliqués à des exercices et des données issues de disciplines “molles”.
On propose en parallèle un enseignement plus généraliste donné par des spécialistes en philosophie, histoire des sciences, linguistique, episthemiologie.
Quel niveau académique? Le manque d’expérience d’enseignement purement systèmes complexes nous amène à proposer une entrée académique mineur-majeur avec une intervention soit au niveau licence soit au niveau master. En première année l’enseignement généraliste serait proposé, à partir de la deuxième on traite des problèmes interdisciplinaires en fonction des outils et des connaissances traités respectivement dans les majeures. De coup, les étudiants sont obligés de travailler en groupe interdisciplinaire parce que individuellement ils n’ont pas la vision globale nécessaire pour traiter le problème. Ils vont donc apprendre leur discipline par les enseignements et des notions d’autres disciplines par le travail de groupe au sein de l’enseignement proposé dans la mineure interdisciplinaire.
Programme: interdisciplinarité, travaux communs et thématiques croisées autour des données, analyse de données et modélisation/simulation.
Implémentation: à la carte, package horaire proposé par les ISC individuellement ou ensemble. (à clarifier?)
Étudiants concernés: toutes les disciplines
Pérennisation: stockage des cours, mise à disposition sur les sites ISC, école doctorale des systèmes complexes?
Exemple: “Prospective Study Program National University of Singapore”
Les étudiants de différentes disciplines niveau licence et master y suivent sous forme de ‘mineur’, un programme interdisciplinaire offert par des intervenants de différents départements. Le programme repose sur des liants entre disciplines (maths appliquées, physique appliquée, biologie des systèmes,) ou un enseignement décliné en gestion de données, analyse de données, modélisation et simulation.
Formation continue
Cibles:
- ISC
- Académiques
- Partenaires: Industries et organismes publics
Échelle de temps:
- au fil de l’eau: Jedi, formation CNRS, journées IXXI
- Ritualiser: école d’été, de printemps
Type d’actions:
- Workshop: techniques/utilisation d’outils (logiciel, traitement de données, représentation, etc.)
- Meeting: thématiques croisées
- Groupe de travail: traitement d’un problème spécifique.
Par exemple pour une formation Industrie/Académique:
Service aux entreprises: soumettre aux étudiants une question/un problème issue du monde économique et industriel pour tester et valoriser leurs expertises auprès des industries/institutions/public, en s’inspirant aux Semaines d’Etude Maths-Entreprises organisées par l’AMIES.
Moyens:
- Intégration des écoles d’été dans les formations offertes par les grands organismes (EMBO, FEBS, etc.)
- Écoles doctorales
- Labellisation: les ISC pourraient envisager de demander un label européen pour valoriser la formation en systèmes complexes. Cette labellisation permet d’accéder à des soutiens financiers, une visibilité européenne et introduit une notion de qualité des formations.
Consolidation
Les différents instituts ont orienté leurs recherches et ont créé au cours de leur développement des outils pour mettre en œuvre des méthodes innovantes dans ces directions de recherches. Nous faisons ici un tour d’horizon des réalisations mutualisées de ces Instituts et nous proposons des axes de consolidations plus forts.
Après l’effort de l’essaimage des Instituts des Systèmes Complexes, doit venir le temps de la cohérence et de la mutualisation. Cette mise en commun doit être un médium pour définir les Systèmes Complexes, référencer les outils existants, mettre en commun les ressources de calcul et les ressources humaines. Au fil des années, les ISC ont développé des outils permettant de mieux observer, modéliser, simuler des systèmes complexes. Ils ont été pensés pour être génériques et transdisciplinaires.
État des lieux
Systèmes complexes à l’international
Complex system Society (http://cssociety.org/home)
Young Researchers Network on complex system (http://yrncs.cssociety.org/)
Outils mutualisés
Les expérimentations systèmes complexes mettent en jeu des simulations lourdes en temps de calcul. Un effort de mutualisation des ressources de calcul a été initié dès 2008 avec l’acquisition de machines pour le calcul sur grille de calcul ( EGI ) par l’ISC-PIF. Des investissements logiciels pour permettre l’utilisation automatisé de ces ressources ont été mis en place (OpenMOLE). Cette mutualisation répond bien au type de simulations réalisées dans la communauté: des batchs de simulations très importants sont réalisés en pic, laissant ensuite les infrastructures disponibles pour le reste de la communauté On observe depuis 10 ans une montée en charge de l’utilisation de ces ressources sans encore arriver à une adoption massive. Cette adoption massive est étroitement liée à l’adoption des outils de calculs distribués. L’un n’ira pas sans l’autre.
Pour le moment, la mise en commun des outils et des méthodes se fait se fait depuis chaque ISC vers ses propres partenaires.
Liste des plateformes de calcul
Bioemergences
Bioemergences est une plateforme regroupant des outils d’observation multiéchelles et multi-modales dans le cadre d’une modélisation de processus biologiques. USR3695 / ISCPIF
Gama
La plateforme Gama est une plateforme de modélisation agent permettant de décrire des règles d’interactions, de simuler et de visualiser des modèles multiagents. Gama est développée de concert par 5 entités université de Rouen, université de Toulouse, université d’Hanoi, université Paris Sud, université de Can Tho
GarganText
GarganText est une plateforme de data mining qui permet de rechercher des cooccurrences de termes dans un corpus de textes et de générer une carte interactive de proximités des termes. Elle permet par exemple de générer un état de l’art en quelques secondes selon une base d’articles. Son développement a été impulsé et financé par l’ISC-PIF
Graphstream
Graphstream est une librairie Java pour la modélisation et l’analyse de graphes dynamiques. Elle a été développée par l’Université du Havre en collaboration avec l’Institut des Systèmes Complexes en Normandie
LinkrBrain
LinkrBrain est un outil en ligne pour l’exploration et la visualisation de données neurologiques.
Multivac
est une plateforme permettant d’accéder à de grandes quantités de données sous la forme d’API. Elle met à disposition des outils de traitement parallèle de ces données de manière polymorphe (Hadoop, Spark, etc). Elle a permis de générer des applications pour étudier le climat, les élections présidentielles 2017, etc. Son développement a été impulsé et financé par l’ISC-PIF
OpenMOLE
OpenMOLE est une plateforme d’exploration des modèles numériques. Initialement développée pour l’étude des modèles de systèmes complexes stochastiques, elle permet une approche générique pour explorer, optimiser et réaliser des analyses de sensibilité sur les modèles. OpenMOLE permet aussi de distribuer la charge de calcul des expériences numériques sur une grande variété d’architectures de calcul haute performance (serveur, cluster, grille de calcul, cloud, etc.). Son développement a été impulsé et financé par l’Institut des Systèmes Complexes Paris Ile de France (ISC-PIF)
A part les infrastructures logiciel, des lieux de travail mutualisés permettent des échanges entre les chercheurs du domaine. Par exemple, l’ISC-PIF permet la réservation de salles de réunion, salles de séminaires (jusqu’à 60 personnes) et auditorium pour conférences (130 personnes).
Vulgarisation / communication
Des manifestations mettant en évidence le lien entre l’approche systèmes complexes et des problèmes de la vie quotidienne permettront , de sensibiliser le grand public à nos travaux et susciter des nouvelles vocations d’une part, et de mettre en évidence l’apport d’une démarche pluridisciplinaire de l’autre. On pourrait s’inspirer de la “Caravane des Sciences” animé au Maroc par le Réseau international de recherche en théorie des systèmes regroupant neuf centres de recherche de huit Universités marocaines
et de nombreux centres de recherche dans le monde (http://www.theoriedessystemes.net).
La communauté SC participe deja à:
- Fête de la Science
- Articles de presse, journal télévisé (intervention sur TF1 deux jours avant le second tour de l’élection présidentielle) autour de l’outil politoscope (https://politoscope.org/press/).
Défis
La mise en commun des outils maison et des outils préconisés devrait être renforcée entre les ISCs à l’échelle nationale. L’objectif est double: nous connaître mieux nous-mêmes: que font les autres dans la communauté ? et également mieux orienter les personnes s’intéressant aux SC en leur donnant des points d’entrée cohérents avec leurs centres d’intérêt.
Promouvoir les outils
Nous avons une connaissance partielle des outils développés par les autres instituts. Nous en avons fait une liste non exhaustive dans le paragraphe précédent. Nous préconisons cependant la création d’un point d’entrée dynamique recensant ces outils. Un site web mutualisé semble indiqué. Il pourrait permettre également de recommander des technologies. Citons de manière non exhaustive:
- Netlogo: Plateforme de modélisation multiagent permettant de faire prototyper rapidement un modèle multiagent par des non-informaticiens
- Gephi pour la visualisation des graphes complexes.
- Spark: framework de calcul distribué pour l’exploration de données massives.
Faire apparaître et mettre à jour ces recommandations dans une vitrine mutualisée permettrait d’avoir une vue à jour.
Promouvoir des pratiques
Un outil pour la communauté : une base de documents “hal”
Permettre le dépôt avant publication de documents de recherche juste terminée sur une sous-section de la base de données “HyperArchives en ligne” du Cnrs. Ceci permettrait de renforcer l’identité de la communauté des Systèmes Complexes.
Réaliser et publier des datasets
Rôle des ISC: encourager et accompagner les partenaires dans la réalisation des datasets.
Cet accompagnement peut se traduire par:
- une aide méthodologique: quelles sont les informations à fournir pour bien documenter la production du dataset ?
- une aide thématique: quels sont les datasets d’autres communautés qui peuvent servir un autre cas d’usage ? Peut-on s’en inspirer ?
- une aide technique: Proposer des solutions d’hébergement des données, des solutions de présentation et d’accès aux données.
Produire des données / du code pour le bien commun:
La réalisation de jeux de données à un coût. Il faut trouver un mode de rémunération qui permet de gratifier le producteur de données tout en garantissant que la donnée produite reste libre et gratuite. La gratification ne doit aller qu’au producteur de la donnée pour éviter le problème récurent des rentiers de la donnée. Les avancées en termes de cryptoéconomie (blockchain) laissent entrevoir un large champ d’investigation en ce domaine: des producteurs de données pourraient répondre à un appel à production de données via une certification contractuelle dans la blockchain servant de tiers de confiance. Le producteur serait rémunéré après validation pour sa production seule.
L’objectif ici est de traiter la donnée comme faisant partie prenante d’un ensemble de composants contribuant à la démarche scientifique, et doit donc être disponible pour permettre à la science d’être reproduite.
Pour faciliter le croisement des communautés, les données comme les programmes doivent être ouverts, mais cet aspect va parfois à l’encontre des politiques internes des partenaires. Une offre de conseil et d’accompagnement peut s’avérer nécessaire afin de présenter des modes opératoires rendant compatible la mise à disposition ouverte des données ou des codes tout en garantissant une viabilité économique (conseil, expertise ?)
Piloter la réalisation de benchmarks
La maîtrise d’une base de données permet ensuite une confrontation aux modèles issus d’autres communautés. À la façon de la communauté de traitement d’images, une base de données a un intérêt pour quelqu’un qui développe un nouvel outil et a besoin de le confronter au réel existant. Il lui suffit de contacter le responsable de la base de données (supposé bien connu !) afin d’avoir en retour la performance de son simulateur. Ce type d’intervention peut donner lieu à une rémunération à définir.
Proposer des plateformes d’évaluation comparée des algorithmes sur un jeu de donnée connu et partagé. Les ISC peuvent fournir l’infrastructure nécessaire à l’évaluation (automatique) des codes soumis sur des datasets privés, la publication des résultats. Example: Kitti, Pascal VOC
Un défi : renforcer le réseau européen
Aux États-Unis, la biologie des réseaux, est fortement intégrée à la discipline “Science des Réseaux”, ce qui lui donne de fait une reconnaissance claire dans la communauté des biologistes. Ce n’est pas aussi évidemment dans la communauté française. Le réseau des systèmes complexes peut-il être amené à jouer un tel rôle vis-à-vis des équipes de recherche qui participent de ses travaux ?
Mise en commun d’infrastructures
En matière d’infrastructure technique, élargir l’offre pour mieux répondre à la diversité des besoins et prendre en compte que bien souvent, il n’y a pas chez les partenaires de moyens humains pour faire l’installation et la maintenance de “couches informatiques” nécessaires à, mais pas centrales dans le cadre des travaux de recherche. Exemple: Grille de calcul – > outil intégré de calcul distribué. Cloud: outil d’infrastructure, sur lequel tout est à bâtir. Il manque des niveaux intermédiaires (en s’inspirant des grands fournisseurs de service cloud): PAAS, Plateform as a Service et SAAS, Software as a Service.
Vulgarisation / communication
La définition des termes liée aux systèmes complexes fait souvent débat. Il est pourtant nécessaire de s’accorder sur une vision que la communauté veut donner de ces termes. La communication autour de ces définitions doit donc pouvoir prendre plusieurs formes afin d’adresser ces différentes perspectives, échelles et niveaux de difficulté.
Au-delà de l’aspect formation en enseignement, la communication autour des systèmes complexes doit être l’objet d’un travail de vulgarisation, travail qui doit exploiter le multimédia (textes, dessins, vidéos) et les références multiples à des domaines d’applications divers (différentes “recettes” ou cas d’usage mettant en oeuvre une même méthode).
Cet effort de vulgarisation devrait être pris en charge par l’ensemble des instituts, à la fois sur le plan financier et en termes de production scientifique.
Valorisation
État des lieux
On remarque qu’il y a une dissymétrie entre la production académique (codes, outils, données…) et le réel transfert aux partenaires. Il est donc le temps de réfléchir aux moyens de promotion de ce transfert.
Dans la Section Consolidation on a mis en avant des bonnes pratiques à promouvoir pour augmenter la visibilité de la production au sein de la communauté SC et donc, à partir de ce travail et de l’inventaire des besoins des partenaires, on pourra optimiser la valorisation et le transfert vers les partenaires.
Défis
Un défi de service : l’audit complexité
Est-ce qu’on peut déterminer des critères qui permettent de définir la complexité pour que les partenaires sachent quand faire appel à la communauté des systèmes complexes? Ici on fait une analogie à l’audit qualité.
Une dynamique de transfert, pour arriver à se placer sur le marché
Les réseaux des Systèmes Complexes jouent-ils vis-à-vis de la recherche scientifique le rôle d’une direction de programme dans l’industrie ? On sait que ces grands comptes chargés de développer des systèmes artificiels “compliqués” comme une automobile ou un avion s’organisent sous une forme matricielle. D’une part, les directions de spécialités comme l’automatique, la mécanique, l’électromagnétisme, etc.) et d’autre part les directions de programme : un programme est associé au développement d’un produit commercialisé par l’entreprise ; il s’appuie sur les compétences existantes, suscite aussi des améliorations des compétences et a une durée de vie finie par nature. Avec un changement d’échelle qu’il conviendrait de définir, on peut se poser la question de savoir si des structures comme les ISC (ou l’INRIA qui a mis en place depuis longtemps une structure de recherche par projet) jouent le rôle d’une direction de programme dans le monde industriel. Ceci se caractérise par le fait d’admettre qu’un chercheur dans un laboratoire de Systèmes Complexes n’est pas le meilleur expert d’une discipline comme l’analyse des modèles, la statistique, l’optimisation ou la mise en œuvre informatique (il peut aller chercher l’information dans les laboratoires de spécialité) mais est capable de prendre en charge une question posée par un acteur social (monde politique, économique et social) et d’apporter des réponses qui peuvent se traduire par des “break through” économiques.
De plus, suite au succès d’un projet et à la demande d’utilisateurs issus du monde économique et administratif, est-ce qu’on peut arriver à la création de “start-up”s, sur le modèle des sociétés de service issues de l’INRIA? Même si les données sont publiques et les outils de simulation sont dans le domaine public, le savoir-faire acquis au cours des exploitations permet de gagner un temps indispensable pour des utilisations ultérieures. Si on prend comme référence les niveaux de maturité technologique ou “Technology Readiness Level”, il s’agit de passer typiquement du niveau 3-4 (le prototype qui fonctionne) au niveau 5-6 (participation à un futur produit qui sera commercialisé). La mise en place de structures commerciales est naturelle dans cette perspective.
Valoriser les logiciels
Le développement d’outils comme Gargentext ou OpenMOLE est typiquement le résultat de cinq années de travail pour une équipe de deux ou trois chercheurs et ingénieurs. Le passage du développement à l’exploitation au service de nouvelles demandes peut induire un changement dans la façon de travailler. En particulier, le transfert de l’outil logiciel de son concepteur initial à une équipe chargée de l’entretenir, ou même commercialiser son utilisation. Bien entendu, ce type d’action demande des moyens humains spécifiques à mettre en place.
D’un point de vue humain, l’industrialisation ou même la simple consolidation d’un code de recherche par une équipe tierce peut être mal vécue (égo, dépossession de son travail) et peut être source de frictions. Le partage d’expérience, et les exemples inter communautaire peuvent aider ce processus nécessaire.
Valoriser les bases de données
Savoir passer d’une base de données gérée au niveau personnel à un outil partagé par une communauté. Le développement d’une base de connaissances est toujours un travail de longue haleine. La tentation pour une équipe qui a créé une telle base est grande de la conserver pour elle. On peut s’inspirer ici de l’expérience des biologistes et dépasser les réticences. Les expériences de rayons X afin de déterminer la structure des protéines demandent un effort expérimental très important. Comment partager ces données en rendant justice aux équipes qui les ont produites ? Une solution proposée par les biologistes (référence ?) est la suivante : la base de données devient publique, mais si elle est utilisée pour des travaux ultérieurs, l’utilisateur se doit de citer les travaux de ceux qui ont transmis leurs données. Un type de création de Bien Commun qui doit pouvoir être transposé aux Systèmes Complexes.
Conclusion
Une instance interinstitut, le RNSC par exemple, doit pouvoir fédérer les efforts de mutualisation et de vulgarisation afin de rendre plus lisible et cohérente notre vision de la discipline. Les objectifs sont multiples: i) mieux nous connaître entre instituts (nos forces, nos faiblesses, nos redondances), ii) mieux communiquer sur ce que nous sommes collectivement capables de proposer.
Nous préconisons donc la création d’un site web, coordonné par le haut, mais alimenté par les instituts. Il devrait y figurer la liste des instituts avec un lien vers leurs sites respectifs, des définitions communes des termes systèmes complexes (idéalement illustrés par des textes, dessins ou success-stories), une liste dynamique des outils mutualisés avec un renvoi pour leur apprentissage, une liste dynamique des formations à venir dans les différents instituts (où idéalement la localisation des formations sont croisées), la possibilité pour chaque laboratoire satellite d’écrire une page pour décrire sa contribution ou sa success-story SC, la liste dynamique des publications scientifiques système complexe, cette présente feuille de route. Cette liste n’est pas limitative.