Elle est pas belle la vie?
Marie-Caroline Cotel, Vincent Thomas, Vincent Chevrier, Christine Bourjot, Henri Schroeder
In Cognito (2008), 3(2), 49-62
Beaucoup d'espèces actuelles vivent en sociétés, ce phénomène reflète l'avantage évolutif que confère la vie en groupe. Cependant, cette situation donne naissance à des facteurs opposés qui façonnent les comportements sociaux : d'un côté le groupe offre de meilleures chances de survie ; de l’autre côté, il peut générer des compétitions inter-individuelles en son sein. La conciliation de ces facteurs s'est faite dans 2 voies évolutives distinctes :
- les comportements sociaux avec des individus spécialisés regroupés en castes tels qu'on les rencontre dans les sociétés d'insectes essentiellement,
- les comportements sociaux extrêmement complexes et flexibles tels qu'on les
observe dans la majorité des sociétés de Mammifères.
Cette deuxième solution requiert de la cognition sociale, c’est-à-dire une capacité à construire des représentations des relations qui unissent les membres du groupe et à utiliser ces représentations de manière flexible pour parvenir à un comportement social (Adolphs, 2001 ; Rilling et al., 2002 ; Takahashi, 2005).
Le cerveau confère un avantage non négligeable pour la survie en permettant aux organismes d'extraire des schémas complexes qui aident à prédire des changements d'environnement .
Or, l'environnement social est généralement plus complexe que l'environnement physique, moins prédictible et plus réactif aux comportements de ses composantes. L'idée communément admise aujourd'hui est que ce sont ces facteurs, et spécialement la réciprocité inhérente aux comportements, qui ont dirigé l'évolution des capacités cognitives.
La cognition sociale contrôle à la fois les comportements automatiques et volontaires en prenant part à divers processus qui modulent la réponse comportementale : la mémoire, la prise de décision, l'attention, la motivation et les émotions sont les composantes qui se trouvent recrutées pour produire un comportement en adéquation avec les stimuli socialement pertinents que perçoit l'organisme.
Dans le contexte expérimental qui nous intéresse, les arguments qui permettent de qualifier le Rat d'espèce cognitive sont multiples :
- C’est un mammifère doté d'une architecture cérébrale complexe qui lui permet de réaliser des tâches cognitives diverses (apprentissage et localisation spatiale).
- Il dispose d'un système de communication sophistiqué basé sur l'utilisation de
signaux sensoriels qui lui permettent d'identifier ses congénères, de trouver des
sources de nourriture et d'alerter le groupe de la présence de prédateurs.
- Une observation plus poussée des individus en situation révèle la formation de « couples » composés d'un T qui ramène des croquettes exclusivement pour un NT particulier.
On observe également que ce dernier « incite » son congénère dans le tunnel en le poussant vers l'aquarium. Une étude non publiée réalisée dans le laboratoire de Neurosciences Comportementales a mis en évidence des patterns de réponses EEG spécifiques plus fortes lorsqu'on présente l'odeur du transporteur à son non-transporteur associé, en comparaison avec les autres membres du groupe expérimental.
Ces quelques arguments nous permettent donc de penser que le rat est une espèce douée d'une forme relativement élaborée de cognition sociale, ce qui nous fournit un élément pour dire que la différenciation sociale observée dans ce modèle expérimental pourrait être comparable à l'élaboration d'une structure sociale chez l’Homme.
3. HAMELIN : système multi-agent de simulation
3.1. Description
L'intérêt de la modélisation multi-agent dans la compréhension des mécanismes sous-jacents au phénomène de différenciation sociale est qu'elle offre un cadre conceptuel permettant la représentation et la simulation de systèmes complexes faisant intervenir différentes entités en interaction entre elles et avec leur environnement, les caractéristiques globales du système ne découlant pas directement des propriétés des entités qui le composent.
Les informaticiens de
l’équipe MAIA du LORIA à Nancy ont donc développé un simulateur multi-agent pour lequel est postulé le fait qu'il est possible d'obtenir le même type d'organisation que chez les rats en n'attribuant aucune cognition aux agents (Thomas et al., 2002, 2004).
Cette hypothèse est d'un grand intérêt pour la biologie puisqu'un résultat positif invaliderait l'idée selon laquelle la cognition sociale est une aptitude indispensable à la mise en place d'une organisation au sein des groupes de rats.
Ce simulateur, dénommé Hamelin, fonctionne sur la base de deux modèles connus : les réponses à seuil (Theraulaz et al., 1998) et les hiérarchies de dominance (Hemelrijk, 1996).
3.1.1. Éléments constitutifs du simulateur
L'environnement — Il doit permettre l'apparition de la spécialisation tout en restant très simple, c'est pourquoi il est défini comme abstrait, sans topologie et caractérisé uniquement par les croquettes et la longueur de l'aquarium. Les croquettes sont définies par leur coefficient de fourniture énergétique, t h. , où t est le temps nécessaire à la consommation d'une croquette entière, et h la quantité d'énergie absorbée par unité de temps lors de la consommation de la croquette.
Quant à la longueur de l'aquarium, elle ne sert qu'à calculer un rapport exprimant la contrainte environnementale n (n = t / temps nécessaire pour ramener une croquette).
Les agents — Ils sont caractérisés par un état interne composé de 3 variables indépendantes (principe de parcimonie) : (a) la faim, h , qui constitue l'élément de motivation de l'agent, est incrémentée si l'agent n'ingère pas de nourriture, (b) la force de l'agent, f , qui définit son aptitude à gagner un combat avec un autre agent, et (c) l'anxiété vis-à-vis de l'eau, q , qui définit la propension de l'agent à plonger.
Une quatrième variable, dénommée Food , représente la quantité de nourriture possédée par un agent. Bien qu’externe à l’agent, cette variable le caractérise par rapport aux autres dans le sens où elle identifie cet agent comme étant en possession de nourriture.
Sur la base de cette variable, un agent peut ainsi percevoir la présence de croquettes et identifier leur possesseur.
Les items comportementaux — Chaque agent peut effectuer 3 actions : plonger, voler ou consommer la nourriture. Les deux premières sont déclenchées de manière stochastique, la décision dépendant d'une part, d'une probabilité calculée en fonction de l’état interne de l’agent, et d'autre part, de la possession ou non d’une croquette.
Rappelons que les agents savent seulement s’ils possèdent une croquette et, si ce n’est pas le cas, quel agent en a une. Une fois le comportement déclenché, les coefficients de renforcement modifient l’état interne des agents, leur permettant d’apprendre et de moduler leurs comportements futurs en fonction de leur expérience.
3.1.2. Modélisation des items comportementaux
Le plongeon — Il est envisagé dès que l’agent ne possède plus de croquette. La loi de probabilité le gouvernant est une réponse à seuil qui tient compte des niveaux d’anxiété q et de faim h
Une fois la décision prise, le rat plonge et ramène une croquette, il est alors en
possession d’une ressource,
On applique un coefficient de renforcement de l’anxiété vis-à-vis de l’eau de telle sorte que celle-ci soit diminuée :
Avec un paramètre global de renforcement du coefficient d’anxiété.
Ainsi, l’agent apprend à réagir plus rapidement pour un niveau de faim h identique.
Ce coefficient est responsable de l’adaptation individuelle et de la mise en place de la distribution des tâches dans le groupe. Les agents qui ne plongent pas voient leur niveau d’anxiété augmenter selon le principe suivant :
un paramètre global d’augmentation du coefficient d’anxiété (1000 étant le degré d’anxiété le plus élevé possible). Ainsi, plus l'agent a faim, plus il sera enclin à plonger, et plus il est anxieux, plus il y sera réticent.
Le vol — Il se déclenche lorsqu'un agent Agr ne possède pas de croquette et qu'il perçoit la présence d’une ressource au niveau d'un autre agent Vic. Cette configuration déclenche automatiquement l’attaque de l’agent Agr en direction de l’agent Vic.
Le résultat du conflit est déterminé de manière stochastique en tenant compte de la force f des deux protagonistes. La probabilité qu'a Agr de voler la croquette à Vic est calculée selon un modèle de hiérarchie de dominance,
Si l’action réussit, l’agresseur récupère la quantité de nourriture que la victime n’a pas encore mangée :
Si c’est le cas alternatif qui se produit, rien ne se passe au niveau des flux de
ressource. Les forces des deux agents inter agissants sont recalculées selon les règles de dominance (Hemelrijk, 1996) :
, un paramètre global de renforcement de la hiérarchie de dominance. Agr Gagne est un booléen qui prend 1 comme valeur si l’initiateur de l’attaque gagne et 0 dans le cas contraire.
Le vainqueur du combat voit donc sa force augmenter alors que celle du vaincu diminue d’un coefficient de renforcement.
La consommation de nourriture — elle est déclenchée automatiquement dès qu’un agent possède une croquette. Elle a pour conséquence de faire diminuer la faim de l’individu et la taille de la ressource :
Dans le cas où l’agent ne possède pas de croquette, sa faim augmente :
3.2. Déroulement de la simulation
La simulation consiste à faire évoluer le système de cycle en cycle, un cycle correspondant au temps nécessaire pour transporter une croquette du distributeur à la cage. Le schéma général d’un cycle de simulation est défini comme suit, les valeurs des paramètres du système étant fixées avant le démarrage de la simulation :
1) début de la simulation ;
2) considérer successivement l'item Plongeon de tous les agents et décider de celui qui va aller au distributeur ;
3) deux groupes d'agents sont créés : les possesseurs de nourriture et les non possesseurs
4) sélectionner aléatoirement un agent de chaque groupe et les confronter selon
es lois de hiérarchies de dominance, répéter jusqu’à ce que le groupe possesseurs soit vide ;
5) tester chaque agent pour l’item relatif à la consommation de nourriture ;
6) cycle suivant : aller à l’étape 2.
3.3. Résultats
Le résultat le plus remarquable est que ce système aboutit à une différenciation du groupe similaire aux observations biologiques. En effet, sur un total de 100 simulations à 6 agents réalisées avec les mêmes conditions initiales, près de 60 % des simulations font apparaître une différenciation au niveau du groupe entre 3 agents Transporteurs et 3 Non-Transporteurs, le reste ayant abouti à des groupes de 2 T et 4 NT.
Dans tous les cas, le niveau de faim de tous les agents est resté très proche de 0. Au niveau des caractéristiques individuelles, les T présentent des niveaux d’anxiété q et de force f faibles, le contraire étant observé chez les NT.
Par ailleurs, des simulations plus poussées ont montré qu’il était possible de redifférencier un groupe constitué d’agents de même statut. Par contre, la différenciation observée avec le simulateur n’est pas stable dans le temps puisque des inversions de statut pour un agent donné ont pu être mises en évidence, phénomène qui n’est jamais observé dans le modèle biologique.
Pour avoir une présentation plus détaillée des résultats, le lecteur est invité à consulter les références Thomas et al. (2002) et Thomas et al. (2004).
4. Discussion-Conclusion
Les résultats obtenus avec le modèle Hamelin montrent que, dans l'état actuel de son développement, il présente les principales caractéristiques de la réalité biologique (émergence d'une différenciation sociale entre des T et des NT et dans des proportions identiques, néodifférenciation de groupes constitués de 6 agents de même statut), ceci en l'absence du facteur « cognition sociale ».
Ce système est caractérisé au niveau individuel par un besoin à satisfaire (la faim) et par une difficulté d’accès à la ressource qui permet de satisfaire ce besoin (plonger pour obtenir de la nourriture et la manger). Par rapport à son propre besoin, chaque agent peut accéder à la ressource de deux manières : (a) plonger et prendre une croquette de nourriture dans la mangeoire, ou (b) voler la nourriture à un agent qui en possède.
Initialement, les agents sont indifférenciés quant au mode d’accès à la ressource.
L’apparition de la contrainte environnementale entre le groupe et la source de nourriture (l’eau) induit une dynamique collective qui conduit à l’émergence d’une organisation de ces agents : pour obtenir la nourriture, certains vont se spécialiser dans le plongeon et le transport de nourriture (les agents T) alors que les autres obtiendront leur nourriture en interagissant avec les premiers (les agents NT).
Le processus qui conduit à la spécialisation est construit par couplage entre deux mécanismes de renforcement : plus un agent accède à la ressource par l’un de ces deux moyens, plus il a tendance à utiliser (et à réussir avec) ce moyen.
Le premier de ces mécanismes de renforcement est celui des réponses à seuil. Il favorise l’utilisation de l’accès direct à la source de nourriture et renforce la décision de plonger à chaque fois que l’agent réussit à obtenir de la nourriture.
Le second mécanisme construit une hiérarchie de dominance entre deux agents et renforce les différences interindividuelles quant à l’obtention de la nourriture par le vol.
Le couplage de ces deux mécanismes fait qu’ils s’influencent mutuellement et
conduisent à l’apparition de profils spécialisés.
Si les résultats in silico montrent que les agents peuvent exprimer les deux profils observés in vivo, le simulateur Hamelin présente actuellement un certain nombre de limites :
- Plusieurs milliers d'itérations sont nécessaires dans le simulateur pour parvenir à ce résultat alors qu’environ 600 cycles (40 croquettes/ jour/ groupe pendant 15 jours) suffisent dans le modèle biologique, ce qui nous pousse à émettre l’hypothèse de l’existence d’un « catalyseur » au sein de ce dernier.
- L’inversion de statut pour un agent en cours d'expérience : ce phénomène n'est jamais observé in vivo.
Ce problème pourrait être lié à l'absence de cognition sociale dans le modèle virtuel. En effet, dans la réalité biologique, chaque individu acquiert un statut et le conserve du fait des interactions sociales qu'il a avec ses congénères, ce que semblent prouver les observations telles que 'existence de « couples » T/NT sur la base d'une reconnaissance olfactive et l'expression de comportements d'incitation de la part d'un NT en direction d'un T au niveau du tunnel.
La pression sociale exercée par le groupe sur un individu le maintiendrait alors dans le statut qu'il a acquis. Les interactions ne sont ainsi en rien des actes faits au hasard mais semblent dus au fait que chaque animal est capable de construire une représentation globale de son groupe et de situer précisément le rôle de chacun au sein de celui-ci.
Des phénomènes tels que les comportements d’incitation ne sont actuellement pas modélisés par Hamelin.
- Le principe de tirage au sort des agents entrant en conflit pour la nourriture dans chacun des deux groupes d'agents (T et NT) n’a pas de fondement biologique.
Les résultats de la simulation montrent que ce principe mène à l’apparition de situations aberrantes aboutissant à des réappropriations successives de la même croquette, phénomène qui n’est jamais observé dans le modèle in vivo.
L’observation comportementale a ainsi montré que le rat qui obtient la nourriture en la volant oriente son comportement vers un possesseur de nourriture en ayant une représentation précise des capacités de défense de son congénère (Krafft et al., 1994).
C’est ainsi que l’on peut observer l’apparition au sein de groupes de rats de « couples préférentiels » en terme d’échanges de nourriture constitués d’un T et d’un NT.
- L’émergence des profils TA et TR tels que l’on peut les caractériser dans le modèle biologique n’a pour l’instant jamais été étudiée dans le cadre de la simulation.
Dans ce cas, se posera la question du rôle joué par l'anxiété d'un individu vis-à-vis de la contrainte sociale (la présence des autres agents) dans l’apparition des profils TA et TR.
La prise en compte du facteur cognition sociale dans la simulation nous semble être un élément pertinent pour répondre globalement à chacune de ces limites même s’il est possible d’envisager des solutions au cas par cas. De plus, ces solutions ponctuelles, pour certaines d’entre elles, n’ont pas été testées et on ne connaît rien de leur impact éventuel sur le fonctionnement global du système.
En conclusion, le modèle Hamelin permet de simuler avec efficacité la différenciation sociale telle qu'elle est observée dans des groupes de rats confrontés à la situation de difficulté d'accès à la nourriture. Il constitue ainsi un outil précieux pour mieux appréhender les mécanismes sous-jacents à l'émergence de cette structure et en particulier, le rôle de la cognition sociale. Si Hamelin permet de reproduire ce phénomène en l'absence de cette forme de cognition, l'apparition de phénomènes qui ne sont jamais observés in vivo (inversion spontanée des statuts sociaux en cours d'expérience) suggère qu'elle constitue une limite importante à l'émergence et à la persistance de cette organisation sociale permettant à l'ensemble du groupe de s’adapter face à la contrainte environnementale.
Compte-tenu de cette limite, une perspective importante de ce travail est l’introduction de facteurs explicites de nature cognitive au niveau de la modélisation des agents dans Hamelin de manière à ce que chaque agent puisse avoir une représentation explicite des autres membres du groupe et exprimer ainsi un comportement social au meilleur bénéfice.
Ce travail souligne également l’intérêt du recours à la modélisation multi-agent pour valider ou non des hypothèses relatives à une meilleure compréhension des phénomènes collectifs.
Ainsi sera-t-il fait.
et ce rat fait autonome
Christian Hivert