5. Négociation dans les systèmes multi-agents
5.2 Critères d'évaluation des protocoles de négociation

5.2.1 Choix d'un protocole

Le choix du protocole est très important, surtout parce qu'un protocole ou un autre peut imposer un certain comportement (préféré) aux agents. Si les agents sont coopératifs, le concepteur peut imposer une certaine stratégie aux agents afin d'avoir le comportement global désiré dans la société d'agents. Si les agents sont egocentrés ou compétitifs, chaque agent est libre de choisir sa propre stratégie, notamment la stratégie qui lui apporte la plus grande utilité. Dans ce contexte, il est important de connaître les critères d'évaluation des protocoles au moment de la conception ou du choix du protocole. Pour démontrer l'importance de ces critères, on va prendre l'exemple donné par Rosenschein et Zlotkin (1988). Supposons que des ingénieurs d'IBM, Apple et Toshiba se rencontrent et veulent concevoir des agents assistants électroniques personnels capables d'interagir et planifier des réunions communes. Pour que les agents personnels de chaque compagnie puissent interagir, les ingénieurs doivent décider le protocole à suivre.

Un des ingénieurs dit:
"Si on choisit le protocole A, les agents seront capables d'arriver à un accord très vite. La solution trouvée peut ne pas être optimale mais elle sera obtenue très vite"
Un autre dit:
"C'est vrai, mais il est important aussi qu'un agent ne puisse pas être manipulé par les autres agents. Dans ce cas, le protocole B sera peut-être meilleur."
Et encore un autre ingénieur dit:
"Pour moi, le critère le plus important est d'avoir l'utilité moyenne la plus grande pour tous les agents. Quel protocole faut-t-il choisir dans ce cas?"

L'exemple cité montre qu'un protocole a certaines propriétés qui peuvent être évaluées en fonction de divers critères.

Une approche à la négociation est celle étudiée par la théorie des jeux. Dans cette approche, l'utilité est le seul paramètre considéré par les agents et on suppose que les agents peuvent sélectionner la meilleure stratégie en considérant toutes les interactions possibles. Cette approche a permis de donner des définitions précises pour les critères d'évaluation des protocoles et des règles pour choisir, d'une manière stratégique, la stratégie à suivre dans la l'interaction.

Considérons le problème, bien connu dans la théorie des jeux, appelé "Le dilemme du prisonnier". Dans ce problème il y a deux prisonniers qui sont accusés d'avoir commis un crime. Ils sont détenus dans des cellules séparées et ils ne peuvent pas communiquer entre eux. On leurs dit que si un d'eux avoue le crime et l'autre n'avoue pas, celui qui avoue sera libéré alors que l'autre restera en prison pour 5 ans. Si les deux avouent en même temps, ils seront emprisonnés pour une période 2 ans alors que si aucun des deux ne reconnaît le crime ils seront emprisonnés pour 3 ans. Le dilemme du prisonnier est qu'il ne sait pas quoi faire: avouer ou dénoncer, ce qu'on appelle défection (D) - ou se taire, ce qu'on appelle coopération (C). Si on considère les paires d'actions que les prisonniers peuvent faire (DD, DC, CD, et CC) et si on affecte des utilités (ou des gains) aux résultats possibles de ces actions, on peut décrire le jeu par la matrice des gains présentée figure 2, matrice commune aux parties impliquées dans la négociation.

  Jouer colonne
Coopération Défection
Jouer ligne Coopération 3 , 3 0 , 5
Défection 5 , 0 2 , 2
Figure 2. Matrice des gains dans le dilemme du prisonnier

Dans la matrice de la figure 2, le premier chiffre dans une cellule représente l'utilité pour le prisonnier/joueur ligne alors que la deuxième chiffre représente l'utilité pour le joueur colonne. Alors, les utilités pour les deux prisonniers sont:

Joueur colonne

uc(CC) = 3, uc(DC) = 5, uc(CD) = 0, uc(DD) =2

Joueur ligne

ul(CC) = 3, ul(DC) = 0, ul(CD) = 5, ul(DD) = 2

 

Comme les prisonniers sont des agents egocentrés et, on le suppose, rationnels, chaque prisonnier choisira donc l'alternative qui maximisera son utilité. En raisonnant sur les valeurs d'utilité mentionnées plus haut, les deux prisonniers choisiront d'avouer, (situation DD), ce qui va leur rapporter, a chacun d'entre eux, un gain de 2.

Question: Comment raisonne un prisonnier (agent) rationnel pour arriver à la conclusion qu'il faut dénoncer?

 

Cliquer ici pour voir la réponse.

<< Section précédente Table de matières Section suivante >>

Politechnica University of Bucharest - 2002