Une équipe de statisticiens de l’université d’Innsbruck, en Autriche, dirigée par le professeur Achim Zeileis, a construit un modèle d’intelligence artificielle qui reproduit l’ensemble du tournoi encore et encore, en suivant le calendrier officiel de la FIFA, les prolongations et les séances de tirs au but. Le résultat de son exécution 100,000 fois donne quelque chose de concret : l’Espagne est l’équipe nationale qui a le plus de chances de soulever le trophée, avec une probabilité de 14.5%, suivie de près par l’Angleterre et la France, toutes deux à 12.4%, puis l’Allemagne à 11.2%.
Ce qui frappe, c’est que l’Argentine et le Portugal apparaissent plus loin que beaucoup ne l’attendraient : les champions du monde atteignent 8.2% et les Portugais 8.9%. Pourquoi si peu ? Les chercheurs eux-mêmes l’expliquent : le nouveau format à 48 équipes et davantage de tours à élimination directe répartissent les chances entre plus d’équipes nationales, réduisant les avantages historiques des puissances traditionnelles.

Le modèle ne devine pas : il traite les matchs des équipes nationales des huit dernières années, les cotes des bookmakers, les valeurs de marché de Transfermarkt, le classement FIFA, et même le PIB par habitant de chaque pays. Tout cela alimente un système de « forêt aléatoire », une technique qui combine des milliers d’arbres de décision entraînés sur des données depuis la Coupe du monde 2006. Comme le disent les auteurs, c’est comme lancer des dés pipés : chaque équipe a des probabilités différentes de marquer selon son niveau et son adversaire.
