Identifying Nascent High-Growth Firms Using Machine Learning
Les chercheurs étudient depuis des décennies la question de savoir comment prédire quelles entreprises vont connaître une croissance rapide et pour quelles raisons. Les entreprises qui croissent rapidement sont susceptibles d’introduire des innovations, de lancer de nouveaux produits ou de mettre en place des processus inédits (Kogan et autres, 2017), de devenir des entreprises phares (Haltiwanger et autres, 2013) et d’avoir une incidence sur la part globale du travail (Autor et autres, 2020; De Loecker et autres, 2020). Nous explorons l’utilisation de techniques d’apprentissage automatique supervisé pour cerner un groupe d’entreprises émergentes à forte croissance en nous basant sur des données administratives sur les entreprises canadiennes. Nous appliquons un ensemble d’algorithmes d’apprentissage automatique supervisé (modèle du filet élastique, forêt aléatoire et réseau neuronal) pour déterminer si un vaste éventail de variables concernant des entreprises canadiennes – données sur la situation financière et l’emploi tirées des déclarations fiscales, données descriptives (p. ex., secteur, emplacement géographique) et indicateurs de complexité (p. ex., activités industrielles multiples, détention par des étrangers) – peuvent prédire celles qui afficheront une forte croissance au cours des trois années à venir. Les résultats obtenus donnent à penser que les classifieurs d’apprentissage automatique peuvent sélectionner un sous-groupe d’entreprises émergentes composé d’une majorité d’entreprises qui enregistrent réellement une croissance élevée et d’autres qui, même en ayant des attributs similaires, n’ont pas réussi à atteindre un fort niveau de croissance.