Monetary Payoff and Utility Function in Adaptive Learning Models
Lorsque des joueurs jouent à répétition au même jeu ou à des jeux semblables (jeux de coordination, jeux d’adoption de nouvelles technologies, jeux de choix de produits), ils peuvent apprendre de leurs expériences et améliorer leur stratégie dans l’avenir. Ce comportement d’apprentissage a d’importantes conséquences économiques. Il détermine l’issue du jeu et la rapidité avec laquelle elle est atteinte.
Étant donné l’importance des comportements d’apprentissage des joueurs, les économistes ont proposé divers modèles adaptatifs pour les analyser. Ces modèles sont habituellement estimés et testés à l’aide de données expérimentales. Les économistes font généralement l’hypothèse que la préférence des individus – ou leur utilité – est égale à la récompense pécuniaire qu’ils obtiennent. Or, il est possible que cette hypothèse soit erronée, puisque les joueurs ne sont pas nécessairement indifférents à l’égard du risque, le spectre des préférences en la matière allant de l’aversion à l’inclination.
J’analyse les conséquences du caractère artificiel de cette hypothèse et propose une méthode pour s’en affranchir. J’applique ensuite la méthode à un ensemble existant de données expérimentales. Il ressort des résultats de l’estimation que l’utilité n’est pas forcément égale à la récompense pécuniaire. L’acceptation de cette hypothèse par les chercheurs les conduit à tirer des conclusions inexactes quant aux comportements d’apprentissage des joueurs, à savoir qu’ils peuvent se tromper dans leur estimation de la vitesse d’apprentissage et leurs prévisions de l’issue ultime du jeu. La méthode que je propose dans cette étude permet aux chercheurs d’obtenir des estimations plus justes.