Big data et prédictions: humanisme et libre arbitre

Le sport n’est évidemment pas le seul concerné par la nécessité de la prédiction. Cette dernière a toujours été une mission des administrations et des entreprises. (Photo, AFP)
Le sport n’est évidemment pas le seul concerné par la nécessité de la prédiction. Cette dernière a toujours été une mission des administrations et des entreprises. (Photo, AFP)
Short Url
Publié le Mardi 25 mai 2021

Big data et prédictions: humanisme et libre arbitre

Big data et prédictions: humanisme et libre arbitre
  • La prédiction sportive ne date pas d’hier: c’est au Britannique Charles Deep, commandant de la Royal Air Force, que l’on doit les premiers relevés statistiques dans le football, en 1950
  • Aujourd’hui, toutes les disciplines sportives se prêtent au jeu des prédictions et quittent progressivement le champ de la statistique

Une de nos dernières tribunes portait sur les promesses de l’intelligence artificielle dans le sport et les risques liés à la prédiction des résultats des matchs. Elle a suscité plusieurs questions et commentaires. Derrière l’humour et la culture générale des lecteurs d’Arabnews.fr – «Le football est un sport qui se joue à onze contre onze, et à la fin, c'est l'Allemagne qui gagne», ou encore: «L'oracle d'Oberhausen était un poulpe et non un projet Google» –, nous avons noté une volonté de comprendre les mécanismes de la prédiction. Car, au-delà du sport, ce sont les questions de la prédictibilité de notre futur et de celle du développement de nos communautés qui étaient posées.

La prédiction sportive ne date pas d’hier: c’est au Britannique Charles Deep, commandant de la Royal Air Force, que l’on doit les premiers relevés statistiques dans le football, en 1950. Avec une rigueur militaire, il catégorisa d’abord tous les gestes d’un match – passes, tirs, contres, fautes, récupérations… – et les comptabilisa par équipe, puis par joueur. Définition des objectifs, typologie puis quantification. Ce sont aujourd’hui les trois premières étapes de tout projet d’intelligence artificielle, les suivantes étant la préparation et le nettoyage des données, l’analyse et l’exploration, puis le choix du modèle d’apprentissage. Mais nous étions à l’époque uniquement dans une approche statistique et ce sont d’ailleurs les sports collectifs, les plus populaires, qui eurent les premiers les faveurs des statisticiens et des fans. 

Aujourd’hui, toutes les disciplines sportives se prêtent au jeu des prédictions et quittent progressivement le champ de la statistique. Les données collectées s’enrichissent en débordant du domaine purement technique et elles intègrent la météo, la qualité du terrain, l'heure de la tenue du match ou le fait que la partie se joue à domicile ou non. La prédiction s’enrichit également de données subjectives.

Les algorithmes de machine learning (une technologie d’apprentissage) font ainsi appel à cette «sagesse des foules» chère à James Surowiecki: grâce au traitement du langage naturel (programmation neurolinguistique ou PNL), ils recueillent et analysent l'opinion des supporters, les avis exprimés par les internautes sur les réseaux sociaux et les requêtes dans les moteurs de recherche. L’établissement des règles heuristiques s’appuient dorénavant sur un spectre extrêmement large de données, sportives et non sportives.

Des chercheurs, comme le professeur Wladimir Andreff, suggèrent en effet la prise en compte des critères socio-économiques comme le PIB par habitant, la culture sportive, la masse salariale des équipes ou «l’effet pays-hôte», entre autres, pour prédire les vainqueurs de grandes compétitions internationales. Ce sont ces données qui sont utilisées pour prédire le nombre de médailles par pays[1] aux Jeux olympiques.

Gouverner, c’est prévoir. Et pour prévoir, il fallut d’abord compter, mesurer et garder la trace, puis analyser, projeter et décider.

Le sport n’est évidemment pas le seul concerné par la nécessité de la prédiction. Cette dernière a toujours été une mission des administrations et des entreprises. Gouverner, c’est prévoir. Et pour prévoir, il fallut d’abord compter, mesurer et garder la trace, puis analyser, projeter et décider. Ces impératifs commencèrent probablement autour du IVe millénaire avant notre ère, quand la complexité des activités de nos ancêtres exigea de fiabiliser leurs capacités de mémorisation. Impératifs toujours d’actualité dans nos communautés aujourd’hui.

L’accessibilité des données, les capacités croissantes de calcul et le développement des sciences sociales pressent les gouvernements du monde entier dans leurs stratégies données/big data et le développement de ressources prospectives. Au Moyen-Orient, la création de l'Autorité saoudienne des données et de l'intelligence artificielle (SDAIA) et celle du ministère de l’Intelligence artificielle aux Émirats arabes unis témoignent de l’ambition des dirigeants de soutenir un marché qui serait estimé à 320 milliards de dollars américains (selon une étude PWC; 1 dollar = 0,82 euro). «Data is the new oil»: les données seraient le nouveau pétrole.

Devant la course technologique des États-Unis et de la Chine, la Fédération de Russie fut une des premières à comprendre que derrière les enjeux économiques existait surtout un enjeu de souveraineté technologique. Cette prise de conscience est maintenant généralisée et il est donc essentiel de réfléchir sérieusement aux questions que cela va nous poser.

Tout d’abord, les lois de Metcalfe (effet de réseau) et celle de Moore (capacité de calcul) nous obligent à penser de manière exponentielle, alors même que l’être humain a longtemps (toujours?) pensé linéairement: demain ne sera plus l’évolution logique et linéaire de ce qui était avant-hier, hier et aujourd’hui. La mondialisation, l’uniformisation des produits et services, voire de nos cultures, la dématérialisation ont bouleversé nos communautés de manière massive et brutale.

Ensuite, la pandémie de Covid-19 a montré les limites des projections et d’une discipline habituellement discrète mais qui fut poussée à ses limites: la modélisation. Grand public comme décideurs politiques, nous fûmes tous confrontés à la grande variabilité des prévisions, qui aurait été liée aux modèles utilisés (SIR, Seir, stochastiques...), mais aussi de qualification des données, de choix et d’étalonnages du modèle.

Comment concilier alors l’exponentielle complexité et la nécessité de projeter et de prédire? C’est l’objectif de la «cliodynamique», un nouveau champ d'études interdisciplinaire associant histoire, modélisation mathématique des processus sociaux-historiques sur le long terme, sociologie, analyse de bases de données, démographie et asabiyya (en arabe: عصبية), la «cohésion sociale». Ce concept, utilisé par le philosophe arabe du Moyen Âge Ibn Khaldoun, désigne la solidarité sociale et met l’accent sur l’unité, la conscience groupale.

Mais nous devons rester méfiants: s'il est effectivement possible de tirer des leçons du passé, établir des lois générales historiques est plus délicat et l’échec du darwinisme social doit nous inciter à la prudence. Nous devons donner du crédit à une certaine approche rationaliste, tout en restant fidèles aux enseignements de l’humanisme arabe (Ibn Khaldoun) et à une pensée de l’âme individuelle (saint Augustin). C’est le seul moyen de ne pas réduire les humains à des points de données et à des équations, et de faire en sorte que big data ne signifie pas Big Brother.

 

 

Philippe Blanchard a été directeur au Comité international olympique puis il fut en charge du dossier technique de Dubai Expo 2020. Passionné par les méga-événements, les enjeux de société et la technologie, il dirige maintenant Futurous, les Jeux de l’innovation et des sports et esports du futur.

 

[1] https://www.gracenote.com/virtual-medal-table/