5. Négociation dans les systèmes multi-agents
5.2 Critères d'évaluation des protocoles de négociation
5.2.1 Choix d'un protocole
Le choix du protocole est très important, surtout parce qu'un
protocole ou un autre peut imposer un certain comportement (préféré)
aux agents. Si les agents sont coopératifs, le concepteur peut
imposer une certaine stratégie aux agents afin d'avoir le comportement
global désiré dans la société d'agents. Si
les agents sont egocentrés ou compétitifs, chaque agent
est libre de choisir sa propre stratégie, notamment la stratégie
qui lui apporte la plus grande utilité. Dans ce contexte, il est
important de connaître les critères
d'évaluation des protocoles au moment de la conception
ou du choix du protocole. Pour démontrer l'importance de ces critères,
on va prendre l'exemple donné par Rosenschein
et Zlotkin (1988). Supposons que des ingénieurs d'IBM,
Apple et Toshiba se rencontrent et veulent concevoir des agents assistants
électroniques personnels capables d'interagir et planifier des
réunions communes. Pour que les agents personnels de chaque compagnie
puissent interagir, les ingénieurs doivent décider le protocole
à suivre.
Un des ingénieurs dit:
"Si on choisit le protocole A, les agents seront capables d'arriver
à un accord très vite. La solution trouvée peut ne
pas être optimale mais elle sera obtenue très vite"
Un autre dit:
"C'est vrai, mais il est important aussi qu'un agent ne puisse
pas être manipulé par les autres agents. Dans ce cas, le
protocole B sera peut-être meilleur."
Et encore un autre ingénieur dit:
"Pour moi, le critère le plus important est d'avoir l'utilité
moyenne la plus grande pour tous les agents. Quel protocole faut-t-il
choisir dans ce cas?"
L'exemple cité montre qu'un protocole a certaines propriétés
qui peuvent être évaluées en fonction de divers critères.
Une approche à la négociation est celle étudiée
par la théorie des jeux. Dans
cette approche, l'utilité est le seul paramètre considéré
par les agents et on suppose que les agents peuvent sélectionner
la meilleure stratégie en considérant toutes les interactions
possibles. Cette approche a permis de donner des définitions précises
pour les critères d'évaluation des protocoles et des règles
pour choisir, d'une manière stratégique, la stratégie
à suivre dans la l'interaction.
Considérons le problème, bien connu dans la théorie
des jeux, appelé "Le dilemme du prisonnier".
Dans ce problème il y a deux prisonniers qui sont accusés
d'avoir commis un crime. Ils sont détenus dans des cellules séparées
et ils ne peuvent pas communiquer entre eux. On leurs dit que si un d'eux
avoue le crime et l'autre n'avoue pas, celui qui avoue sera libéré
alors que l'autre restera en prison pour 5 ans. Si les deux avouent en
même temps, ils seront emprisonnés pour une période
2 ans alors que si aucun des deux ne reconnaît le crime ils seront
emprisonnés pour 3 ans. Le dilemme du prisonnier est qu'il ne sait
pas quoi faire: avouer ou dénoncer, ce qu'on appelle défection
(D) - ou se taire, ce qu'on appelle coopération (C). Si on considère
les paires d'actions que les prisonniers peuvent faire (DD, DC, CD, et
CC) et si on affecte des utilités (ou des gains) aux résultats
possibles de ces actions, on peut décrire le jeu par la matrice
des gains présentée figure 2, matrice commune aux parties
impliquées dans la négociation.
|
Jouer
colonne |
Coopération |
Défection |
Jouer ligne |
Coopération |
3 , 3 |
0 , 5 |
Défection |
5 , 0 |
2 , 2 |
Figure 2. Matrice des gains dans le dilemme du prisonnier
Dans la matrice de la figure 2, le premier chiffre dans une cellule représente
l'utilité pour le prisonnier/joueur ligne alors que la deuxième
chiffre représente l'utilité pour le joueur colonne. Alors,
les utilités pour les deux prisonniers sont:
Joueur colonne
uc(CC) = 3, uc(DC) = 5, uc(CD) = 0, uc(DD) =2 |
Joueur ligne
ul(CC) = 3, ul(DC) = 0, ul(CD) = 5, ul(DD) = 2 |
Comme les prisonniers sont des agents egocentrés et, on le suppose,
rationnels, chaque prisonnier choisira donc l'alternative qui maximisera
son utilité. En raisonnant sur les valeurs d'utilité mentionnées
plus haut, les deux prisonniers choisiront d'avouer, (situation DD), ce
qui va leur rapporter, a chacun d'entre eux, un gain de 2.
Question:
Comment raisonne un prisonnier (agent) rationnel pour arriver à
la conclusion qu'il faut dénoncer?
Cliquer ici pour voir
la réponse.
|