Plateforme – Reconstruction de dynamiques multi-échelles
2.1.3.1. Plateforme – cognition sociale – application à l’analyse de corpus électroniques
Coordinator:
David Chavalarias (CNRS)
Contributors:
David Chavalarias (CNRS), Jean-Philippe Cointet (INRA SenS), Camille Roth (CNRS), Carla Taramasco
Introduction
Du fait du déploiement d’une partie de l’activité sociale sur des médias numériques (publications scientifiques, archives de brevets, voire page web ou blogs, etc…) nous disposons aujourd’hui de très larges corpus électroniques qui constituent le support d’un savoir distribué. Ce savoir est élaboré localement par des individus et des communautés qui créent par leurs
contributions des liens entre des éléments de connaissance.
L’objectif de cette plateforme est de développer des méthodes de reconstruction et de visualisation de ce savoir distribué :
1) par l’identification de modules reflétant la structure des domaines d’activité des communautés, 2) par des visualisations de l’articulation de ces modules
3) par la reconstruction de leurs dynamiques.
L’ambition est de fournir pour les corpus numériques un outil équivalent à ce que ‘Google Earth’ est à la cartographie.
Ces différents axes de recherche seront développés au sein d’équipes interdisciplinaires comportant des spécialistes des domaines d’application. Ceux-ci pourront s’appuyer sur ces reconstructions multi-niveau de leurs projets de recherche pour développer de nouvelles approches tout en apportant des éléments de validation de la reconstruction en question. Outre l’aspect théorique du problème de la reconstruction des dynamiques multi-échelles, cette plateforme nécessitera un investissement important dans la constitution de large bases de données et dans le déploiement de moyens de calcul distribués.
En particulier, cette plateforme pourra comporter les axes suivants :
2.1.3.1. Cartographie de la science et reconstruction des dynamiques des paradigmes scientifiques.
La question de la visualisation de l’organisation de la science et de ses différents paradigmes n’est pas seulement épistémologique mais devient une nécessité pratique face à l’accroissement exponentiel de la production scientifique. Nous manquons aujourd’hui d’une vision claire de la manière dont s’articulent les différents champs de recherche scientifique, que ce soit au niveau du chercheur désireux d’identifier le contexte scientifique d’une question, d’une institution qui souhaite avoir une vision globale sur une question donnée (par exemple la thématique du réchauffement climatique) ou du décideur qui doit se faire une idée de la science en marche afin de mieux choisir les outils d’aide au développement de telle ou telle branche de la science. Cet axe de recherche développera des méthodes de cartographie de la science à grande échelle et de visualisation de ses dynamiques muti-niveaux afin par exemple de pouvoir détecter les champs scientifiques émergents.
Cette étude pourra être couplée à une analyse longitudinale des carrières individuelles, des réseaux sociaux de la recherche et des institutions ouvrant ainsi des opportunités d’analyse pour les sciences de gestion, la sociologie (science studies ou sociologie politique), mais également pour les décideurs de politiques scientifiques.
2.3.1.2. Nouveaux outils de navigation.
La reconstruction mutli-échelle de connaissances extraites d’un ensemble de documents issus d’un corpus vivant est également une opportunité pour développer des outils de navigation inédits. Les structures émergentes exhibées par de nouvelles méthodes d’analyse statistiques permettent de naviguer à travers ces gigantesques corpus d’une façon intuitive puisque les motifs de haut-niveau et leurs articulations apparaissent comme des propriétés naturelles du système tant au niveau des connaissances les plus fines qu’aux niveaux de généralité supérieurs. Ces outils pourront par exemple être implémentés sur des archives électroniques telles que HAL ou arxiv et accroître la vitesse et la pertinence de la recherche d’informations.
2.3.1.3. Innovation et veille scientifique.
Les méthodes de cartographie et de reconstruction de dynamiques peuvent être appliquées au corpus des brevets qui exhibe une structure similaire aux corpus des publications scientifiques : titres, mots-clés, résumé les textes complets. Il devient alors possible de tracer une carte multi-
niveaux des thématiques couvertes par les brevets, repérer les domaines porteurs et les niches éventuelles. Le fait que certains brevets s’appuient sur d’autres de manière explicite et que ceux-ci sont catégorisés de manière thématique permettra également de visualiser la diffusion de l’innovation dans les différentes sphères technologiques et d’en faire une analyse longitudinale. Enfin, ce type de méthodes appliquées aux corpus des brevets pourrait aboutir à de nouvelles manières d’évaluer la valeur d’un nouveau brevet.
2.1.3.4. Découverte scientifique et extraction de connaissances.
Les méthodes de détection de modules peuvent également être appliquées à des problématiques d’extraction de connaissance. Cette plateforme se propose développer par exemple l’extraction d’informations concernant les réseaux des gènes et de protéines à partir d’une analyse automatique des publications en biologie d’une part, et de l’analyse des données concernant les co- expressions des gênes (données issues de mesures par micro-array par exemple) d’autre part. Cela permettrait de produire des cartes à grande échelle de modules fonctionnels en biologie.
2.1.3.5. Détection de tendances à partir des bases de requête dans les navigateurs.
Les requêtes effectuées dans les navigateurs sont une source d’informations très importante sur ce que les gens recherchent. Les bases de données concernant les requêtes dans les navigateurs peuvent aussi donner lieu à une analyse utilisant les mêmes méthodes de cartographie dynamique que pour les corpus électroniques. Des outils bien plus performants de détection de tendances que ceux proposés par Google par exemple (google trends, qui est déjà utilisé à des fins de marketing) pourront être proposés. En couplant cela à des analyses géographiques cela ouvrira également des perspectives concernant la détection précoce de préoccupations sociales comme par exemple le déclenchement d’une épidémie.