The Bank of Canada 2015 Retailer Survey on the Cost of Payment Methods: Nonresponse
Dans l’enquête que la Banque du Canada a menée en 2015 sur les coûts des différents modes de paiement pour les détaillants, la non-réponse est un défi majeur. Elle se présente sous deux formes dans l’enquête en question : la non-réponse totale (une entreprise ne participe pas du tout à l’enquête) et la non-réponse partielle (une entreprise ne répond pas à certaines questions de l’enquête). Ces deux formes peuvent causer un biais dans les calculs statistiques tels que les moyennes et les totaux pondérés de différentes variables. Dans ce rapport technique, nous analysons les solutions qui permettraient de régler le problème des non-réponses dans les données d’enquête. Pour résoudre celui de la non-réponse totale, nous proposons d’ajuster les probabilités de réponse : ces dernières sont modélisées par régression logistique (le recours à une approche par grappes est également envisagé) et servent à la construction d’une série de pondérations d’enquête. Quant au problème de la non-réponse partielle, nous proposons de le résoudre par imputation. À cet effet, nous utilisons des algorithmes d’apprentissage automatique tels que « gradient boosting machine » et « extreme gradient boosting » pour prédire les valeurs manquantes des variables d’intérêt.