Posts

Plateforme – Reconstruction de dynamiques multi-échelles

2.1.3.1. Plateforme – cognition sociale – application à l’analyse de corpus électroniques

Coordinator:

David Chavalarias (CNRS)

Contributors:

David Chavalarias (CNRS), Jean-Philippe Cointet (INRA SenS), Camille Roth (CNRS), Carla Taramasco

Introduction

Du fait du déploiement d’une partie de l’activité sociale sur des médias numériques (publications scientifiques, archives de brevets, voire page web ou blogs, etc…) nous disposons aujourd’hui de très larges corpus électroniques qui constituent le support d’un savoir distribué. Ce savoir est élaboré localement par des individus et des communautés qui créent par leurs

contributions des liens entre des éléments de connaissance.

L’objectif de cette plateforme est de développer des méthodes de reconstruction et de visualisation de ce savoir distribué :
1) par l’identification de modules reflétant la structure des domaines d’activité des communautés, 2) par des visualisations de l’articulation de ces modules
3) par la reconstruction de leurs dynamiques.

L’ambition est de fournir pour les corpus numériques un outil équivalent à ce que ‘Google Earth’ est à la cartographie.

Ces différents axes de recherche seront développés au sein d’équipes interdisciplinaires comportant des spécialistes des domaines d’application. Ceux-ci pourront s’appuyer sur ces reconstructions multi-niveau de leurs projets de recherche pour développer de nouvelles approches tout en apportant des éléments de validation de la reconstruction en question. Outre l’aspect théorique du problème de la reconstruction des dynamiques multi-échelles, cette plateforme nécessitera un investissement important dans la constitution de large bases de données et dans le déploiement de moyens de calcul distribués.
En particulier, cette plateforme pourra comporter les axes suivants :

2.1.3.1. Cartographie de la science et reconstruction des dynamiques des paradigmes scientifiques.

La question de la visualisation de l’organisation de la science et de ses différents paradigmes n’est pas seulement épistémologique mais devient une nécessité pratique face à l’accroissement exponentiel de la production scientifique. Nous manquons aujourd’hui d’une vision claire de la manière dont s’articulent les différents champs de recherche scientifique, que ce soit au niveau du chercheur désireux d’identifier le contexte scientifique d’une question, d’une institution qui souhaite avoir une vision globale sur une question donnée (par exemple la thématique du réchauffement climatique) ou du décideur qui doit se faire une idée de la science en marche afin de mieux choisir les outils d’aide au développement de telle ou telle branche de la science. Cet axe de recherche développera des méthodes de cartographie de la science à grande échelle et de visualisation de ses dynamiques muti-niveaux afin par exemple de pouvoir détecter les champs scientifiques émergents.

Cette étude pourra être couplée à une analyse longitudinale des carrières individuelles, des réseaux sociaux de la recherche et des institutions ouvrant ainsi des opportunités d’analyse pour les sciences de gestion, la sociologie (science studies ou sociologie politique), mais également pour les décideurs de politiques scientifiques.

2.3.1.2. Nouveaux outils de navigation.

La reconstruction mutli-échelle de connaissances extraites d’un ensemble de documents issus d’un corpus vivant est également une opportunité pour développer des outils de navigation inédits. Les structures émergentes exhibées par de nouvelles méthodes d’analyse statistiques permettent de naviguer à travers ces gigantesques corpus d’une façon intuitive puisque les motifs de haut-niveau et leurs articulations apparaissent comme des propriétés naturelles du système tant au niveau des connaissances les plus fines qu’aux niveaux de généralité supérieurs. Ces outils pourront par exemple être implémentés sur des archives électroniques telles que HAL ou arxiv et accroître la vitesse et la pertinence de la recherche d’informations.

2.3.1.3. Innovation et veille scientifique.

Les méthodes de cartographie et de reconstruction de dynamiques peuvent être appliquées au corpus des brevets qui exhibe une structure similaire aux corpus des publications scientifiques : titres, mots-clés, résumé les textes complets. Il devient alors possible de tracer une carte multi-

niveaux des thématiques couvertes par les brevets, repérer les domaines porteurs et les niches éventuelles. Le fait que certains brevets s’appuient sur d’autres de manière explicite et que ceux-ci sont catégorisés de manière thématique permettra également de visualiser la diffusion de l’innovation dans les différentes sphères technologiques et d’en faire une analyse longitudinale. Enfin, ce type de méthodes appliquées aux corpus des brevets pourrait aboutir à de nouvelles manières d’évaluer la valeur d’un nouveau brevet.

2.1.3.4. Découverte scientifique et extraction de connaissances.

Les méthodes de détection de modules peuvent également être appliquées à des problématiques d’extraction de connaissance. Cette plateforme se propose développer par exemple l’extraction d’informations concernant les réseaux des gènes et de protéines à partir d’une analyse automatique des publications en biologie d’une part, et de l’analyse des données concernant les co- expressions des gênes (données issues de mesures par micro-array par exemple) d’autre part. Cela permettrait de produire des cartes à grande échelle de modules fonctionnels en biologie.

2.1.3.5. Détection de tendances à partir des bases de requête dans les navigateurs.

Les requêtes effectuées dans les navigateurs sont une source d’informations très importante sur ce que les gens recherchent. Les bases de données concernant les requêtes dans les navigateurs peuvent aussi donner lieu à une analyse utilisant les mêmes méthodes de cartographie dynamique que pour les corpus électroniques. Des outils bien plus performants de détection de tendances que ceux proposés par Google par exemple (google trends, qui est déjà utilisé à des fins de marketing) pourront être proposés. En couplant cela à des analyses géographiques cela ouvrira également des perspectives concernant la détection précoce de préoccupations sociales comme par exemple le déclenchement d’une épidémie.

De la cognition individuelle à la cognition sociale

De la cognition individuelle à la cognition sociale

Rapporteur : David Chavalarias (Institut des systèmes complexes de Paris Île-de-France/CNRS).

Contributeurs : Paul Bourgine (École polytechnique), David Chavalarias (Institut des systèmes complexes de Paris Île-de-France/CNRS), Jean-Philippe Cointet (Institut des systèmes complexes de Paris Île-de-France/INRA), Camille Roth (CAMS).

Mots clés : dynamiques sociales, modélisation des critères de décision, mesures quantitatives sociales, cognition sociale, hétérogénéité interindividuelle.

Introduction
La cognition signifie, au sens large, le traitement de l’information, incluant tous les aspects comme, par exemple, les processus d’interprétation. Un système cognitif est donc un système de traitement de l’information. Il peut être intégré dans un seul individu ou réparti sur un grand nombre de personnes. On parlera alors de cognition individuelle ou de cognition distribuée. La cognition sociale est une cognition distribuée sur l’ensemble des individus d’une société en interaction au sein d’un réseau social. La cognition individuelle peut, elle aussi, être considérée comme une cognition distribuée sur un réseau neuronal.

Dans les réseaux sociaux, lorsque une information atteint les agents, son contenu est traité par le réseau social, produisant d’autres informations et d’autres liens sociaux à la suite de série d’interactions. Ce processus de cognition sociale pourrait ainsi conduire à une transformation du réseau social.

Aussi bien au niveau individuel que collectif, les processus cognitifs obéissent à de fortes contraintes : rien ne peut être fait par des individus en dehors de ce qu’ils savent faire seuls ou en interaction avec les autres ; rien ne peut être anticipé en dehors de ce qu’ils peuvent prévoir seuls ou en interagissant avec les autres. De la même façon, la structure du réseau et la nature des interactions agissent comme de fortes contraintes sur les processus cognitifs. De nouveaux protocoles apparaissent et permettent de décrire ou de quantifier ces contraintes aux niveaux infra-individuel, individuel et collectif, de manière à suggérer, à leur tour, de nouveaux modèles. La migration rapide des interactions sociales vers les médias numériques permet la collecte massive de données sur la cognition sociale du point de vue de ses processus (la structure spatiale des interactions, des distributions temporelles, etc.) et de ses produits (documents électroniques en ligne, données sur les utilisateurs, etc.). La coexistence de ces deux phénomènes ouvre aujourd’hui de nouvelles perspectives pour l’étude de la cognition individuelle et sociale sur la base de l’analyse comparative avec des données empiriques. Cela devrait être un axe majeur des initiatives de recherche pour une meilleure compréhension de l’évolution de nos sociétés.

Grands défis

  • Cognition individuelle, contraintes cognitives et processus de décision
  • Modéliser les dynamiques des communautés scientifiques
  • Société de l’internet, l’internet de la société

 


2.5.1. Cognition individuelle, contraintes cognitives et processus de décision

La relation entre les processus cognitifs de haut niveau et de bas niveau reste problématique : le lien entre les processus dynamiques dans le réseau neuronal et les processus symboliques étudiés par la psychologie ou la linguistique sont encore mal compris. Une voie prometteuse consiste à explorer de manière beaucoup plus attentive les dynamiques spatio-temporelles mésoscopiques comme, par exemple, les colonnes corticales, les assemblées de neurones synchrones (ou, plus généralement, polysynchrones). Ces dynamiques spatio-temporelles peuvent servir de véritables révélateurs des processus symboliques. Un travail d’exploration théorique et méthodologique, de même qu’un partage des données au sein de très grandes bases munies de leurs métadonnées, est incontournable pour aboutir à une meilleure compréhension du passage entre processus dynamiques et processus symboliques.

Une avancée notable dans ce grand défi permettrait non seulement d’unifier un aspect essentiel des sciences cognitives, mais aussi de renforcer le lancement de la nouvelle discipline de la neuro-économie : l’observation de l’activité neuronale renouvelle l’étude du comportement du sujet face à la « nature » ou dans ses interactions stratégiques et sociales avec les autres. Cela permettrait aussi de revisiter, du point de vue de l’économie cognitive, la théorie de la décision, et aussi la théorie des jeux traditionnelle, y compris les concepts de « préférence » et d’« utilité » qui constituent la base de la théorie économique.


2.5.2. Modéliser les dynamiques des communautés scientifiques

Les communautés scientifiques constituent un espace privilégié pour l’étude de la cognition sociale car la structure des réseaux impliqués (organisation en équipes, réseaux de collaboration, réseaux de coauteurs, réseaux de citations) et la production de ces communautés (colloques, revues, articles) sont connues sous leurs formes dynamiques. Pour échanger des concepts, ces communautés développent un langage propre dont l’évolution reflète leur activité.
Ceci permet de poser des questions très précises sur la manière dont les communautés scientifiques traitent collectivement l’information, et pour n’en citer que quelques-unes : comment sont adoptés les nouveaux concepts ou les nouvelles thématiques ? Quelles sont les structures remarquables dans la diffusion des innovations (effets de prestige, de traditions locales, etc.) ? Quel est l’effet de la répartition des individus en communautés ou bien de la création de liens entre communautés sur le développement de la connaissance ? Quelles sont les relations entre trajectoires individuelles et évolutions des communautés ? Quels outils développer pour visualiser dynamiquement l’évolution des paradigmes scientifiques en intégrant au fur et à mesure le flux des productions scientifiques ?

Exemples :

  • émergence et diffusion de nouveaux concepts dans les bases de données bibliographiques,
  • détection de champs scientifiques émergents,
  • dynamique des réseaux de collaboration,
  • comparaison des orientations scientifiques entre communautés ou organismes distincts.

2.5.3. Société de l’internet, l’internet de la société

La quantité d’informations archivées sur Internet aura bientôt largement dépassé celle qui est stockée sur support papier. Internet rassemble aujourd’hui des espaces de stockage de connaissances de types très variés (articles, encyclopédies, etc.). Il s’agit aussi d’un lieu de discussion (blogs, forums), de commerce (sites d’enchères, de vente et de troc), de référencement (autant pour les individus à travers les pages personnelles que pour les institutions ou les entreprises), et il sert aussi de mémoire externe pour les réseaux de relations (réseaux d’amis, groupes de travail, etc.). Il est en outre un « agenda universel » annonçant des centaines de milliers d’événements par jour. Quels changements ce nouvel outil est-il en train d’apporter aux processus de cognition sociale (nouvelles formes de rencontre, nouvelles formes d’échange, nouvelles formes de débat, nouvelles formes d’élaboration collective de connaissances) ? Pour la première fois, toutes ces données sont empiriquement exploitables avec une très grande précision spatio-temporelle. Comment utiliser ces nouvelles sources d’information pour mieux comprendre les dynamiques sociales et nous munir d’outils pour visualiser la complexité de l’activité sociale révélée par Internet ? Un défi majeur est de transformer l’information brute disponible sur Internet en des flux structurés d’informations permettant de visualiser, de modéliser et de reconstruire de manière multi-échelle les processus de cognition sociale à l’œuvre sur la toile.

Exemples :

  • impact des blogs dans les débats politiques et citoyens,
  • nouvelles dynamiques pour l’élaboration collective de connaissances (Wikipedia, logiciels libres, etc.),
  • mesure de propagation d’émotion collective suite à un événement social important via le nombre de requêtes (Google trends, par exemple),
  • étude comparative des différences culturelles via les informations géolocalisées (sémantique des pages Web, tags, requêtes dans les moteurs de recherche, etc.), reconstruction des territoires culturels,
  • formation de communautés épistémiques et réseaux d’amis.