Press "Enter" to skip to content

Libres pensées d'un mathématicien ordinaire Posts

ChatGPT

Tunnel numérique

Où en sont les agents conversationnels IA à base de LLM pour la recherche en mathématiques ? Ils sont nombreux : ChatGPT, Claude, Gemini, Grok, ... La situation évolue très vite, et le plus simple est de demander à ces agents eux-mêmes une synthèse d'actualité. Mais cela ne répond qu'à travers des réputations et des comparatifs sur des problèmes standardisés, qui ne sont pas forcément ceux qui intéressent un mathématicien donné. Rien ne vaut l'expérimentation directe et approfondie. Les meilleures versions actuelles de ChatGPT semblent constituer l'outil le plus satisfaisant du moment pour un usage mathématique sérieux. La société OpenAI, qui commercialise ce produit, à prix modique, ne divulgue pas les détails de l'architecture utilisée, probablement massive en nombre de paramètres et de GPU, pour l'entraînement comme pour l'inférence. Toutes ces ressources ne sont pas utilisées systématiquement et en même temps. La tendance actuelle, interne comme externe, est à l'usage d'agents spécialisés et orchestrés.

De l'autre côté de l'océan pacifique, les multiples modèles chinois, à la fois économes et à poids ouverts comme GLM (Z.ai), Qwen (Alibaba), ou DeepSeek, sont de plus en plus performants. Des versions simplifiées ou réduites sont utilisables en inférence sur des machines locales équipées d'un GPU, peu différentes d'un PC de gaming de quelques milliers d'euros. Certains acteurs annoncent l'arrivée de modèles puissants sur des machines ordinaires dans un futur proche.

ChatGPT a manifestement été optimisé pour être utile aux mathématiciens, tout en restant générique. Loin de se réduire à une simple sortie aléatoire la plus probable sachant le contexte et au vu de la statistique apprise, il possède un niveau plus subtil d'abstraction, peut par exemple décider d'écrire des scripts pour vérifier numériquement ou symboliquement une formule, rechercher sur le web, faire de l'OCR, procéder par itération au moyen d'essais et d'erreurs, etc. Les mathématiques, qui sont avant tout un langage, sont très bien adaptées à cette approche tokenisante, car les données d'apprentissage sont claires et fournies, et la valeur déductive est explicite. Le résultat est que ChatGPT est à présent plus informé et virtuose que bien de mathématiciens vivants. Voici quelques usages :

  • Dialogue avec le savoir. Depuis le début du siècle, nous avons pris l'habitude d'explorer le savoir avec Google Search, et cela constituait déjà une révolution en comparaison de l'exploration physique du monde du papier. L'information était déjà massive et quasi-instantanée, et cela posait déjà de sérieux problèmes à la société, décuplés dix ans plus tard par les smartphones. Avec ChatGPT, un nouveau cap est franchi, et nous pouvons désormais littéralement dialoguer avec le savoir, dans notre langue. En l'espace d'un siècle, l'interaction avec les machines est passée du langage machine au langage humain.
  • Exploration d'idées. ChatGPT s'inscrit dans cette informatique qui a depuis longtemps fait de nous des mathématiciens augmentés. Cet assistant est capable d'explorer les idées qu'on lui propose, en utilisant son immense savoir, de manière élaborée. Sa virtuosité en la matière dépasse le langage mathématique, il maîtrise toutes les langues, LaTeX, Python, et Lean compris, et traduit avec aisance. On ne compte plus les questions de recherche mathématique du quotidien qu'il a permis de faire progresser. Il continue à faire des erreurs, comme les mathématiciens. Cette dimension aléatoire, qu'il partage avec l'humain, déroute les habitués que nous sommes du déterminisme informatique.
  • Audit. Auditer les productions de ChatGPT ne fait rêver personne, et il n'est vraiment pas simple de cultiver l'art du questionnement efficace. En revanche, ChatGPT peut auditer ses propres productions, celles de ses semblables, et surtout celles des humains. On ne compte plus les erreurs, petites ou grandes, découvertes dans le code source des logiciels, parfois critiques, mais aussi dans la production mathématique humaine. Il ne fait aucun doute que ChatGPT bien utilisé permet d'augmenter la qualité de la technologie et de la science. Un exemple inattendu est celui des preuves de faux dans les systèmes de formalisation, oeuvres humaines imparfaites.

L'automatisation des mathématiques n'est bien sûr qu'un aspect de l'automatisation potentielle de toutes les activités humaines. Cette révolution s'accompagne de grandes questions à sa démesure : ressources consommées, captation du savoir, remplacement des humains, etc. Elle est à placer dans la fresque historique du machinisme, passant par la vis sans fin, le boulier, la pascaline, le métier à tisser, la machine à vapeur, les moteurs, l'ordinateur, ... Ce machinisme n'a pas uniquement pour but de soulager l'humain, il vise aussi la performance. Quid du futur ? Les textes de prospective ne manquent pas, y compris chez les patrons de l'industrie de l'IA. Il est difficile de prédire les lendemains les plus plausibles. La société n'évolue pas que de manière progressive, elle traverse des moments de rupture, des inattendus, et des crises plus ou moins amples. Voilà longtemps que l'informatique dépasse en puissance les humains, de bien des manières, comme l'avait entrevu John von Neumann, en s'inspirant parfois de la biologie. Mais la véritable convergence de l'informatique et de la biologie, qui le fascinait tant, attend encore son heure.

L'IA est tellement déstabilisante que les positionnements individuels et institutionnels peuvent être extrêmes, peu nuancés, mal informés, voire contre-productifs. Il est difficile d'avoir la tête dans les étoiles et les pieds sur terre. La situation force à philosopher, ce qui n'est pas dans les habitudes de tous. Il est quoi qu'il en soit crucial de continuer à former et à informer, pour éclairer les décisions individuelles et collectives. Voici quelques actions menées par le département de mathématiques et applications de l'École normale supérieure pour vivre avec le temps présent :

  • Contribution continue au développement du Centre Sciences des Données
  • Accueil du séminaire Turing à ses débuts pour augmenter la visibilité de la thématique
  • Exposés précoces aux séminaires sur la formalisation & IA pour les maths
  • Introduction d'un cours de formalisation, et bientôt d'IA pour les maths
  • Lancement du séminaire parisien Automath sur la formalisation & IA pour les maths

Prospective et actualité.

Leave a Comment
Syntax · Style · .