Estimating Policy Functions in Payments Systems Using Reinforcement Learning Document de travail du personnel 2021-7 Pablo S. Castro, Ajit Desai, Han Du, Rodney J. Garratt, Francisco Rivadeneyra Nous montrons que les techniques d’apprentissage par renforcement permettent d’estimer les fonctions de réaction optimale des banques qui participent aux systèmes de paiement de grande valeur – un jeu stratégique du monde réel caractérisé par des informations incomplètes. Type(s) de contenu : Travaux de recherche du personnel, Documents de travail du personnel Sujet(s) : Institutions financières, Monnaies numériques et technologies financières, Réglementation et politiques relatives au système financier, Systèmes de compensation et de règlement des paiements Code(s) JEL : A, A1, A12, C, C7, D, D8, D83, E, E4, E42, E5, E58