Où en sont les agents conversationnels IA à base de LLM pour la recherche en mathématiques ? Ils sont nombreux : ChatGPT, Claude, Gemini, Grok, DeepSeek, ... La situation évolue très vite, et le plus simple est de demander à ces agents eux-mêmes une synthèse sur l'état des choses. Mais cela ne répond qu'à travers des réputations et des comparatifs sur des problèmes standardisés, qui ne sont pas forcément ceux qui intéressent un mathématicien donné. Rien ne vaut l'expérimentation directe et approfondie. Les meilleures versions actuelles de ChatGPT semblent constituer l'outil le plus satisfaisant du moment pour un usage mathématique sérieux. La société OpenAI, qui commercialise ce produit à prix relativement modique, ne divulgue pas les détails de l'architecture utilisée, probablement massive en termes de nombre de paramètres et de GPU. Toutes ces ressources ne sont pas utilisées systématiquement et en même temps. La tendance actuelle, interne comme externe, est à l'usage d'agents spécialisés et orchestrés.
Ce ChatGPT a manifestement été optimisé pour être utile aux mathématiciens, tout en restant générique. Loin de se réduire à une simple sortie aléatoire la plus probable sachant le contexte et au vu de la statistique apprise, il possède un niveau plus subtil d'abstraction, peut par exemple décider d'écrire des scripts pour vérifier numériquement ou symboliquement une formule, rechercher sur le web, faire de l'OCR, procéder par itération au moyen d'essais et d'erreurs, etc. Les mathématiques, qui sont avant tout un langage, sont très bien adaptées à cette approche tokenisante, car les données d'apprentissage sont claires et fournies, et la valeur déductive est explicite. Le résultat est que ChatGPT est plus informé et virtuose que beaucoup de mathématiciens vivants. Voici quelques usages :
- Dialogue avec le savoir. Depuis le début du siècle, nous avons pris l'habitude d'explorer le savoir avec Google Search, et cela constituait déjà une révolution en comparaison de l'exploration physique du monde du papier. L'information était déjà massive et quasi-instantanée, et cela posait déjà de sérieux problèmes à la société. Avec ChatGPT, un nouveau cap est franchi, et nous pouvons désormais littéralement dialoguer avec le savoir, dans notre langue préférée, avec un degré d'efficacité hors du commun.
- Exploration d'idées. ChatGPT est un assistant capable d'explorer les idées qu'on lui propose, en utilisant son immense savoir, et de rédiger le produit de cette exploration. Sa virtuosité en la matière dépasse le langage mathématique, il sait parler toutes les langues, LaTeX, Python, et Lean compris, et traduire avec aisance. On ne compte plus les questions de recherche mathématique du quotidien qu'il a permis de résoudre. Il continue à faire des erreurs, variées, comme les humains. Cette dimension aléatoire, qu'il partage avec l'humain, déroute les habitués que nous sommes du déterminisme informatique. ChatGPT s'inscrit dans cette informatique qui a depuis longtemps fait de nous des mathématiciens augmentés.
- Audit. Auditer les productions de ChatGPT ne fait rêver personne, et il n'est vraiment pas simple de cultiver l'art du questionnement efficace. En revanche, ChatGPT peut auditer ses propres productions, celles de ses semblables, et surtout celles des humains. On ne compte plus les erreurs, petites ou grandes, découvertes dans les codes informatiques, parfois critiques, mais aussi dans la production mathématique humaine. Il ne fait aucun doute que ChatGPT bien utilisé permet d'augmenter la qualité de la technologie et de la science. Un exemple inattendu est celui des preuves de faux dans les systèmes de formalisation, oeuvres humaines imparfaites.
L'automatisation des mathématiques n'est bien sûr qu'un aspect de l'automatisation potentielle de toutes les activités humaines, toutes. Cette révolution s'accompagne de grandes questions à sa démesure : ressources consommées, captation du savoir, remplacement des humains, etc. Elle est à placer dans la fresque historique du machinisme, passant par la vis sans fin, le boulier, la pascaline, le métier à tisser, la machine à vapeur, les moteurs, l'ordinateur, ... Ce machinisme n'a pas uniquement pour but de soulager l'humain, il vise aussi la performance. Quid du futur ? Les textes de prospective ne manquent pas, y compris chez les patrons de l'industrie de l'IA. Il est difficile de prédire les lendemains les plus plausibles. La société n'évolue pas que de manière progressive, elle traverse des moments de rupture, des inattendus, et des crises plus ou moins amples. Voilà longtemps que l'informatique dépasse en puissance les humains, de bien des manières, comme l'avait entrevu John von Neumann, en s'inspirant parfois de la biologie. Mais la véritable convergence de l'informatique et de la biologie, qui le fascinait tant, attend encore son heure.
L'IA est tellement bouleversante que les positionnements individuels et institutionnels peuvent être extrêmes, peu nuancés, mal informés, voire contre-productifs. Il est bien difficile d'avoir la tête dans les étoiles et les pieds sur terre, de se remettre en question. Il est quoi qu'il en soit crucial de continuer à former et à informer, pour éclairer les décisions individuelles et collectives. Voici quelques actions menées par le département de mathématiques et applications de l'École normale supérieure pour vivre avec le temps présent :
- Contribution continue au développement du Centre Sciences des Données
- Accueil du séminaire Turing à ses débuts pour augmenter la visibilité de la thématique
- Exposés précoces aux séminaires sur la formalisation & IA pour les maths
- Introduction d'un cours de formalisation, et bientôt d'IA pour les maths
- Lancement du séminaire parisien Automath sur la formalisation & IA pour les maths
Prospective de quelques puissants.
