Press "Enter" to skip to content

Libres pensées d'un mathématicien ordinaire Posts

Formation à distance

Cohen brothers movie "A serious man"

La formation à distance s’impose à tous avec brutalité en ces temps de lutte contre l’épidémie de coronavirus. Le numérique n’est pas une fin en soi. C’est un moyen pour soutenir le distanciel, qui a ses avantages et ses inconvénients. Ce billet vise à promouvoir l’idée d’une pédagogie à distance inversée, numérique et frugale, qui prend son temps, et qui n’en fait pas trop.

Avertissement. Ce billet concerne surtout la formation des adultes à l’université voire en master.

Précarité. Certains étudiants sont dans une situation précaire, peu propice au travail, ou sont mal équipés. Cela concerne également certains enseignants, notamment des doctorants.

Connectivité. Certains étudiants ou enseignants ont une connectivité inexistante ou faible, qui passe bien souvent par un abonnement mobile avec un forfait data limité. D’autre part, la montée en puissance du télétravail pèse sur les serveurs des établissements d’éducation, mais aussi sur ceux des géants américains du numérique, les GAFAM, surtout sur G et M avec leurs bouquets de services G Suite et Office 365 respectivement.

Frugalité. Dans ce contexte de tension et de saturation, la promotion de la frugalité numérique s’impose comme une évidence. Cela passe notamment par la modération de l’usage de la vidéo pour la pédagogie ou la conférence en ligne. Rappelons-le, la vidéo consomme beaucoup plus que l’audio, qui consomme beaucoup plus que la messagerie texte. La frugalité numérique s’inscrit naturellement dans une démarche plus générale de consommation raisonnée des ressources. La frugalité rend le numérique plus éthique, plus durable, plus responsable.

Décrochage. Il est bien connu que la formation à distance s’accompagne d’un risque de décrochage élevé : perte de motivation, découragement, … Ce phénomène est aussi ancien que la formation à distance, et ceux qui ont travaillé ou étudié au Centre National d’Enseignement à Distance (CNED) connaissent bien le problème. Les moyens de lutte contre le décrochage distanciel sont également connus. Un planning précis et un suivi rigoureux en font partie.

Charge. Un autre travers dans lequel peut facilement tomber le formateur à distance est celui de donner trop de travail aux étudiants. Bien doser la charge de travail est un art délicat, qui, idéalement, se pratique dynamiquement en tenant compte de l’évolution de chaque étudiant.

Inversion. Plutôt que de consacrer le temps d’interaction avec les étudiants à une transmission essentiellement unidirectionnelle du savoir, il est possible de leur fournir du matériel pédagogique accessible qu’ils étudient sans l’enseignant, à leur rythme, et de consacrer le temps d’interaction à répondre à leurs questions. C’est la pédagogie inversée : les cours à la maison et les devoirs en classe. Cela nécessite en pratique la préparation d’un matériel pédagogique conséquent et adapté. La pédagogie inversée s’oppose au cours magistral en présentiel, mais pas au cours magistral enregistré. Elle est compatible avec l’animation de travaux dirigés, et peut même gagner en puissance lorsque les corrigés des exercices sont fournis à l’avance.

Lenteur. Le monde actuel est rapide, réactif, instantané, zappeur, synchrone, et l’omniprésence du numérique a sa part de responsabilité dans cet état de fait. Or l’apprentissage nécessite bien souvent une concentration, une profondeur, une statique, un asynchronisme, qui tirent plutôt vers la lenteur. Restaurer un peu de lenteur pour la pédagogie aujourd’hui passe par la régulation du caractère instantané de certains usages courants du numérique. Cela revient à promouvoir une forme de qualité au détriment d’une forme de quantité.

Teams. Avec Microsoft Teams, la tentation est grande pour les enseignants de coller le plus possible à leur pratique antérieure en présentiel, en utilisant essentiellement la visioconférence.  Tentons au contraire de détailler une mise en œuvre possible d’une pédagogie inversée numérique frugale avec une équipe Teams. L’usage de canaux pour les discussions de messagerie entre étudiants et enseignants est utile, au format texte, et de temps en temps audio ou vidéo. Des canaux privés peuvent naturellement accueillir les discussions entre enseignants d’une part, et entre étudiants d’autre part. La mise en place d’une visioconférence chaleureuse au début du cours pour expliquer les règles du jeu aux étudiants est utile également. Dans les fichiers électroniques partagés, des notes de cours, des exercices, et surtout un planning détaillé. Plutôt que d’utiliser beaucoup de visioconférence pour un cours en mode synchrone, dont le rythme sera de toute façon toujours trop ou pas assez élevé, mieux vaut peut-être consacrer ce temps à rédiger les corrigés des exercices, à suivre les étudiants, à échanger en ligne avec eux par messagerie, et cela n’empêche pas un peu d’audio ou de vidéo régulièrement. Les enseignants les plus cadrants peuvent même organiser de courts rendez-vous de suivi, réguliers et obligatoires pour les étudiants, afin de juguler le décrochage.

Les enseignants on développé de nombreuses pratiques. Certains partagent leur écran pour commenter un PDF/PPT et pointer à la souris, d’autres se filment écrivant au tableau ou sur du papier, tandis que d’autres encore disposent d’une tablette. Notons enfin que l’outil Microsoft OneNote est utile pour les formules mathématiques. GoodNotes a du succès sur Apple iPad.

Dauphine. Plusieurs de mes collègues ont mis en œuvre des variantes de ce qui est décrit ici.

Libre. Il est possible d’imiter un peu Teams par un couplage de Mattermost avec Jitsi ou BBB.

Personnel. J’ai suivi durant mon adolescence l’enseignement à distance dispensé par le CNED. C’était avant la diffusion massive de l’informatique et d’Internet dans le grand public, avec son world wide web, sa visioconférence, et ses messageries instantanées. Tout passait à l’époque par le courrier postal, à des années lumières de Teams. On recevait le matériel papier et un planning au début. Il y avait régulièrement des devoirs à rendre qui étaient corrigés et commentés par les enseignants. L’aller-retour prenait des semaines, un autre temps. Je n’étais pas majeur, mes parents veillaient de près ou de loin à ce que le décrochage ne s’installe pas.

À propos du lycée, de la maturité, et en oubliant un instant la frugalité :

À lire également.

Leave a Comment

Libres pensées d’un confiné

Paul Magendie - La cage ouverte.
Paul Magendie (1978 – ) – La cage ouverte.

Il faut se rendre à l’évidence, le mathématicien ordinaire est confiné. Ses libres pensées aussi.

Confinement. Il y a ceux qui sont sortis sans faire attention et ceux qui avaient peur de sortir.

Démocraties. On a beaucoup comparé la gestion de crise faite en Corée et en Italie. Les italiens auraient massivement répandu la maladie en quittant les agglomérations pour se réfugier à la campagne dans leur famille ou chez des amis, faisant passer l’individualisme avant le sens du collectif. Liberté individuelle, contrôle social, différence culturelle ?

Pics. Le confinement, qui vise à réduire le pic sur les hôpitaux, produit des pics sur le numérique.

Prison. Le confinement permet à tous de faire l’expérience d’une forme de prison l’espace de quelques semaines. C’est peut-être le moment de relire Surveiller et punir de Michel Foucault.

Numérique. On parlait d’informatique, il faudrait dire à présent numérique. Pourquoi pas.

Police. Le numérique n’est pas une fin en soi. C’est, sur le plan technologique, un moyen, instrumentalisé par le capitalisme, le libéralisme, mais aussi par les états, dictatoriaux ou démocratiques, par les anarchismes et les subversions, par les organisations petites et grandes. Il sert à la fois à maintenir l’ordre et à organiser le désordre, à contrôler les individus et leurs interactions. Cela peut faire penser à une analyse de Michel Foucault sur la justice et la police.

Épidémie.

Liquidateurs. Chernobyl, mini-série créée par Craig Mazin et réalisée par Johan Renck.

Surveillance. 1984, par Georges Orwell.

Axe du mal. Mondialisation, marchandisation, asservissement, surveillance, numérisation.

Catéchismes. C’est ce qui m’irrite le plus intellectuellement, quel que soit le sujet.

Géomètre. Louis Antoine, devenu aveugle, puis mathématicien, géomètre. Auto-déconfinement.

Disparitions. Cet hiver : George Steiner, Freeman Dyson, Jean Ginibre.

Sociologues et mathématiciens. Déconstruction, rapport à l’absolu. Une proximité ?

ZRR. C-pas-ça. Il s’agit de zones de résistances et de régulations, un concept forgé dans ma cuisine ce matin, avant le café. C’est un peu à cela qu’a ressemblé parfois Paris-Dauphine du point de vue du vice-président en charge du numérique que je suis encore pour quelques mois.

Frugalité. Pour dispenser leur formation à distance, certains enseignants on rendu disponible leur matériel pédagogique écrit sous forme électronique, accompagné d’un planning détaillé, et interagissent avec les étudiants par messagerie instantanée. Ils ne font pas appel à la vidéo en ligne. Voilà donc une pédagogie inversée numérique frugale.

Révolution. La révolution numérique forcée du moment va durablement nous transformer. Le télétravail, la formation à distance, et les séminaires en ligne vont massivement entrer dans les mœurs. Le bilan carbone total ne sera pas facile à chiffrer. Le bilan sur la qualité de vie au travail ne sera pas forcément facile à faire non plus, entre le numérique subi et le numérique choisi. Les questions de l’éthique du numérique et de son caractère durable vont se poser à tous.

Auditions. La saison des auditions aux postes d’enseignants-chercheurs va bientôt commencer. Certains soutiennent que la visioconférence généralisée induirait des inégalités de traitement entre candidats. Et si c’était le contraire ? En effet, cette population n’a en général pas de problèmes d’équipement ou de connectivité. De plus la visioconférence met tous les candidats sur un pied d’égalité quelque soit leur lieu de résidence. Enfin la visioconférence permet d’éviter les déplacements, et tout ce qu’ils induisent en matière de stress, de pollution, et de nuisance.

Distance. Le numérique déshumanise et humanise à la fois, impose sa distance spécifique.

Humanité. Espèce super-prédatrice confinée sur terre. La prise de conscience collective progresse, mais le tabou de la reproduction perdure. À quand la fin du natalisme français ?

GAFAM. Le télétravail monte en puissance en Europe et aux États-Unis, et pèse sur les GAFAM. Nous ne sommes pas à l’abri d’une dégradation de service du côté de O365/Azure, même si les serveurs et centres de données sont différents, et que Microsoft assure que son PCA passe d’abord par une dégradation de service pour les utilisateurs des versions gratuites, et une priorisation des organisations gouvernementales, de santé, et d’urgence. Idem chez Google.

Pouf pouf pouf. L’avenir passera peut-être par la rencontre tumultueuse du capitalisme, du libéralisme, de l’éthique, du durable, de la quête de sens, du numérique. Certains l’ont déjà anticipé et explicité, comme Marie Ekeland. Paris-Dauphine a un rôle voire des rôles clés à jouer dans ce tournant mondial majeur qui marquera le siècle, autour des sciences des organisations.

Leave a Comment

Paris-Dauphine : coronavirus et numérique

Tunnel numérique

La crise du coronavirus entraîne une révolution numérique forcée pour beaucoup d’entre nous, petits et grands. Les acteurs du numérique sont également très fortement sollicités depuis la fermeture des établissements et la mise en place des mesures de confinement. Le grand nombre de connexions en France et plus généralement en Europe a saturé de nombreux serveurs et réseaux, aussi bien dans les établissements d’éducation que chez les géants du numérique comme Facebook et Microsoft. 

Paris-Dauphine s’est remarquablement mobilisée pour cette révolution du télétravail et de  la formation à distance. Dans le cadre du plan de continuité d’activité de l’établissement, des ordinateurs portables ont été configurés en un temps record et distribués aux personnels concernés. La direction du numérique et la direction de la formation et de la vie étudiante ont étoffé – notamment depuis les grèves récentes – le portail des services numériques, qui permet à tous d’accéder facilement aux services numériques pour la visioconférence et la formation à distance, ainsi qu’à des tutoriels pour prendre en main les outils. Le support aux utilisateurs est assuré avec ces outils par des agents en télétravail. La transformation numérique à l’œuvre à Paris-Dauphine depuis plusieurs années porte là ses fruits. La semaine qui vient de s’écouler a été riche de sollicitations, d’engagements, d’expérimentations, de découvertes. 

Mais sur le plan du numérique, Paris-Dauphine ne vit pas cette crise comme la plupart des autres universités françaises. L’essentiel de la charge se situe entre les utilisateurs, qui sont chez eux, et les serveurs des fournisseurs de services Microsoft Office 365 et Blackboard, qui sont hébergés dans les nuages (cloud). Les serveurs hébergés à l’université sont donc relativement épargnés, et continuent à fournir les autres services importants SIFAC, Apogée, Win-paie, …,  rendus accessibles aux agents dauphinois en télétravail de diverses manières. L‘outil Teams, inspiré de Slack mais intégré à Office 365, remporte un franc succès. Il incorpore visioconférence, téléphonie, messagerie instantanée, télédiffusion, et travail collaboratif en mode projet. Teams est par ailleurs la première application Microsoft rendue disponible sous Linux. 

Les semaines qui viennent seront spéciales. Nous en sortirons transformés. 

Note personnelle. Loin de moi l’idée que cette crise est réjouissante et permettra d’atteindre un numérique enchanté. Le numérique contraint que nous vivons nous fait aussi regretter les relations humaines directes. De nombreuses personnes sont dans la détresse ou le dénuement. J’ai bien conscience des difficultés de tous, du tragique de la situation. Simplement je pense qu’il faut aussi tirer parti de la crise, ne pas céder à la psychose. Le numérique permet de maintenir le lien entre êtres humains, de mieux les organiser, de faire circuler l’information vitale.  

 – o –

Pics. Le confinement de la population a pour but d’étaler le pic de sollicitation des hôpitaux et a pour effet de créer des pics de sollicitation du numérique. 

Modélisation. Pour la gestion de la crise, les autorités sont à l’écoute des scientifiques, et notamment semble-t-il de l’équipe de Neil Ferguson, professeur britannique de mathématiques pour la biologie spécialisé en épidémiologie, physicien théoricien de formation. Mon collègue Gabriel Turinici du Ceremade s’intéresse à la modélisation mathématique en épidémiologie et à ses liens avec la théorie des jeux. Des ressources sur les mathématiques de l’épidémiologie sont disponibles sur florilège.

– o –

Nuages. L’informatique dans les nuages (cloud) et les plateformes IaaS/PaaS/SaaS transforment l’informatique depuis une quinzaine d’années, et tous les acteurs finissent par s’y mettre, y compris l’AMUE. Les bouquets de services proposés par les GAFAM américains ont peu pénétré les usages officiels des universités françaises, pour des raisons idéologiques, symboliques, politiques, et culturelles. L’argument du Cloud Act ne résiste pas vraiment à une analyse factuelle. Une industrie européenne aussi stratégique qu’Airbus a adopté G Suite, l’analogue de chez Google de l’Office 365 de Microsoft. D’autre part la cryptographie peut garantir la confidentialité et la « privacy » lorsque cela est nécessaire. En matière de souveraineté, faut-il aussi rappeler que le matériel réseau est américain, coréen, chinois, partout, qu’Internet ne fonctionnerait pas sans routeurs Cisco et Huawei ? D’autre part, il y a le shadow-IT : le taux de pénétration parmi les étudiants, administratifs, enseignants, et chercheurs des services gratuits de Gmail, Whatsapp, Dropbox, etc, est phénoménal et ne fait de secret pour personne, alors même que pour les versions gratuites, tout le monde sait que les utilisateurs payent avec leur données. Il est vrai que ces logiciels et services sont de qualité. Il y a enfin l’usage massif des téléphone intelligents, dont les logiciels et matériels sont américains, chinois, coréens, japonais, et sont fortement reliés aux services des GAFAM. En vérité, ce jeu de dupes souligne en creux l’incapacité durable de l’Europe à mettre en place une industrie du numérique de premier ordre, aussi bien sur les plans du logiciel, du matériel, que de l’hébergement.

Dauphine. À Paris-Dauphine, mon prédécesseur Henri Isaac, sur les conseils de François Madjlessi exaspéré par les défaillances de Zimbra par rapport aux solutions cloud, et au vu de l’expertise de Miguel Membrado, a émis à la fin de son mandat le souhait d’une transition vers Office 365, dont l’offre pour l’éducation est imbattable. Après analyse approfondie, il m’a semblé clair à mon tour que ce choix était le mieux adapté, à même d’accompagner notre transformation numérique dans l’interoperabilité et au meilleur niveau de qualité et de richesse. Choisir G Suite – plus mature à l’époque – aurait produit une rupture sur la bureautique et donc une difficulté importante dans l’accompagnement au changement de l’essentiel de nos utilisateurs. Cette décision, qu’il a fallu défendre avec conviction en interne comme en externe, a fait partie intégrante du grand chantier de transformation du numérique que nous avons mené sur plusieurs années. Office 365 apporte sécurité, fiabilité, disponibilité, qualité, et  interopérabilité. La transformation numérique à Dauphine ne se réduit pas à Office 365, et comprend une mise en qualité des infrastructures et des modes d’organisation, une transformation de la direction des systèmes d’information en direction du numérique, et un  portefeuille de projets conséquent. Paris-Dauphine fait partie des premiers établissements à avoir mis en place et peaufiné un plan de reprise d’activité et un plan de continuité d’activité pour ses systèmes d’information, bien avant la crise du coronavirus. Des développements logiciels ou numériques ambitieux ou innovants ont été menés, incluant notamment la dématérialisation de processus administratifs, l’apprentissage pair à pair, et le coaching virtuel. Cela a été rendu possible grâce notamment à l’externalisation de ce qui n’est pas spécifique à l’université comme la gestion de la messagerie, des sites web, où le codage logiciel. Ce recentrage a permis de mieux soutenir l’accompagnement aux usages du numérique pour gagner en qualité sur tous les tableaux. Ainsi, et contrairement à ce que l’on pourrait croire, Dauphine continue à investir sur le numérique, bien plus que les autres universités, mais pas de la même manière. Sa situation  numérique actuelle reflète sa double nature d’université française et de grande école, et son positionnement autour des sciences des organisations. Ici comme ailleurs, la transformation numérique est difficile et semée d’embûches. Même si beaucoup reste encore à faire, on peut se demander quelles sont les clés de la réussite. Sans doute une vision, du sens, un cap, du temps, de la rigueur, une analyse dialectique, et une forme de résilience socio-psychologique.

Données. Ces dernières années ont vu l’émergence de la question de la régulation des données en qualité et structuration, mais aussi en terme de sécurité et confidentialité. Paris-Dauphine place ces sujets au cœur de son organisation. En particulier l’authentification unique d’accès aux services numériques y compris Office 365 se fait à la fois à Dauphine et dans un cloud PaaS.

Logiciels libres. On m’a souvent interrogé sur la contradiction apparente entre mon tropisme pour les logiciels libres et ma défense d’Office 365 à Paris-Dauphine. Je suis effectivement grand amateur de logiciels libres, et j’utilise GNU/Linux sur pratiquement toutes mes machines depuis plus de vingt ans maintenant. J’apprécie beaucoup Debian et Ubuntu, qui rendent concret et utile une forme de rêve anarchiste. Mais j’utilise également Google Android par sens du pratique, et Microsoft Windows sur un Surface Pro par curiosité et pour mieux comprendre ce que cela veut dire pour les utilisateurs. J’utilise enfin l’essentiel du bouquet de services d’Office 365 via l’interface web dans un navigateur. Je sais l’importance de l’absolu, du paradigme, de l’idéal, mais je sais aussi l’importance du pragmatisme pour les choix collectifs, et je n’ai pas l’esprit dogmatique ou religieux. Le choix d’Office 365 me semble être optimal globalement pour Paris-Dauphine, lorsque l’on vise la transformation massive des usages du numérique au meilleur niveau et aux standards des communautés SHS. Ma propre communauté des mathématiques et de l’informatique me semble tout à fait adaptable à la situation. Ma position est plus proche du pragmatisme d’un Linus Torvalds ou Rémy Card que du fanatisme d’un Richard Stallman. Pourtant j’ai été adhérent à la FSF, dont j’apprécie le rôle de pôle politique. J’ai également été secrétaire d’une association d’utilisateurs de Linux, avec beaucoup d’enthousiasme. J’ai rédigé des documentations, codé, enseigné, aidé des amis, des collègues, installé et administré des serveurs dans des foyers, des labos, des départements, fait changer les choix par défaut de jury de concours, bref, j’ai agi localement pour contribuer au changement global. Je pense que les logiciels libres jouent un rôle, ont une place, et transforment même les géants. Qui aurait cru par exemple qu’un jour Microsoft contribuerait au noyau Linux et envisagerait une version Linux de son navigateur Edge par ailleurs basé sur le moteur libre Chromium soutenu par Google ?

Mot de la fin. La qualité est un facteur clé dans les usages. L’éthique et le durable montent en puissance. L’avenir sera-t-il à un numérique choisi plutôt que de subi comme le dit la Fing ?

À lire aussi.

6 Comments

Coupling, divergences, and Markov kernels

Coupling (British TV series)
Coupling (British TV series)

Let \( {{(X_t)}_{t\geq0}} \) be a Markov process on a state space \( {E} \). Let us define

\[ P_t(x,\cdot)=\mathrm{Law}(X_t\mid X_0=x),\quad x\in E, t\geq0. \]

It follows that if \( {X_0\sim\mu} \) then \( {X_t\sim\mu P_t} \) where

\[ \mu P_t = \int P_t(x,\cdot)\mathrm{d}\mu(x). \]

In this post a divergence between probability measures \( {\mu} \) and \( {\nu} \) on \( {E} \) is a quantitative way to measure the difference between \( {\mu} \) and \( {\nu} \). A divergence can be a distance such as the total variation or the Wasserstein distance. We study nice examples later on.

Suppose that for some divergence between probability measures and for some quantity \( {\varphi_t(x,y)} \) which depends on \( {x,y,t} \) we have, typically by using a coupling,

\[ \mathrm{div}(P_t(x,\cdot),P_t(y,\cdot)) \leq\varphi_t(x,y). \]

In this post, we explain how to deduce that for all probability measures \( {\mu,\nu} \),

\[ \mathrm{div}(\mu P_t,\nu P_t) \leq\int\varphi_t(x,y)\mathrm{d}\mu(x)\mathrm{d}\nu(y). \]

The initial inequality corresponds to take \( {\mu=\delta_x} \) and \( {\nu=\delta_y} \). All this is about notions of couplings, divergences, and functional inequalities.

Coupling. Let \( {\mathcal{P}(E)} \) be the set of proability measures on \( {E} \). If \( {\mu} \) and \( {\nu} \) are in \( {\mathcal{P}(E)} \), then a coupling of \( {\mu} \) and \( {\nu} \) is an element \( {\pi} \) of \( {\mathcal{P}(E\times E)} \) with marginal distributions \( {\mu} \) and \( {\nu} \). The set of couplings is convex, and is not empty since it contains the product measure \( {\mu\otimes\nu} \).

Supremum divergence. Let \( {\mathcal{F}} \) be a class of bounded functions \( {E\rightarrow[0,+\infty)} \). For all \( {\mu,\nu\in\mathcal{P}(E)} \), we define the quantity

\[ \mathrm{div}_{\mathcal{F}}(\mu,\nu) =\sup_{f\in\mathcal{F}}\int f\mathrm{d}(\mu-\nu)\in(-\infty,+\infty]. \]

This is not necessarily a distance. We give nice examples later.

Inequality. Let \( {P:E\rightarrow\mathcal{P}(E)} \) be a Markov kernel. Recall that for all \( {\mu\in\mathcal{P}(\mu)} \), \( {\mu P\in\mathcal{P}(E)} \) is defined by \( {\mu P=\int P(x,\cdot)\mathrm{d}\mu(x)} \). Then, for all \( {\mu} \) and \( {\nu} \) in \( {\mathcal{P}(E)} \),

\[ \mathrm{div}_{\mathcal{F}}(\mu P,\nu P) \leq \inf_\pi\int \mathrm{div}_{\mathcal{F}}(P(x,\cdot),P(y,\cdot))\mathrm{d}\pi(x,y) \]

where the infimum runs over all couplings of \( {\mu} \) and \( {\nu} \). Taking \( {\pi=\mu\otimes\nu} \) gives

\[ \mathrm{div}_{\mathcal{F}}(\mu P,\nu P) \leq \int \mathrm{div}_{\mathcal{F}}(P(x,\cdot),P(y,\cdot))\mathrm{d}\mu(x)\mathrm{d}\nu(x), \]

and in particular

\[ \mathrm{div}_{\mathcal{F}}(\mu P,\nu P) \leq \sup_{x,y}\mathrm{div}_{\mathcal{F}}(P(x,\cdot),P(y,\cdot)). \]

A proof. The idea is to introduce a coupling and then to proceed by conditioning or desintegration. Namely, if \( {\pi} \) is a coupling of \( {\mu} \) and \( {\nu} \), for instance \( {\mu\otimes\nu} \), then

\[ \int f\mathrm{d}(\mu P-\nu P) =\int\Bigr(\int f\mathrm{d}(P(x,\cdot)-P(y,\cdot))\Bigr)\mathrm{d}\pi(x,y). \]

As a consequence,

\[ \sup_{f\in\mathcal{F}}\int f\mathrm{d}(\mu P-\nu P) \leq \int\Bigr(\sup_{f\in\mathcal{F}}\int f\mathrm{d}(P(x,\cdot)-P(y,\cdot))\Bigr)\mathrm{d}\pi(x,y). \]

This gives the desired inequality.

Infimum divergence. For a given map \( {c:E\times E\rightarrow[0,+\infty]} \) that we call a cost, we define, for all \( {\mu} \) and \( {\nu} \) in \( {\mathcal{P}(E)} \),

\[ \mathrm{div}_c(\mu,\nu)=\inf_\pi\int c(x,y)\mathrm{d}\pi(x,y)\in[0,+\infty] \]

where the infimum runs over all couplings of \( {\mu} \) and \( {\nu} \). This is also known as the transportation or coupling distance, even if it is not necessarily a distance. We give nice examples later on.

Inequality. For all Markov kernel \( {P:E\mapsto\mathcal{P}(E)} \) and all \( {\mu} \) and \( {\nu} \) in \( {\mathcal{P}(E)} \),

\[ \mathrm{div}_c(\mu P,\nu P) \leq\inf_\pi\int \mathrm{div}_c(P(x,\cdot),P(y,\cdot))\mathrm{d}\pi(x,y), \]

where the infimum runs over all couplings of \( {\mu} \) and \( {\nu} \). Taking \( {\pi=\mu\otimes\nu} \) gives

\[ \mathrm{div}_c(\mu P,\nu P) \leq\int \mathrm{div}_c(P(x,\cdot),P(y,\cdot))\mathrm{d}\mu(x)\nu(y), \]

and in particular

\[ \mathrm{div}_c(\mu P,\nu P) \leq\sup_{x,y} \mathrm{div}_c(P(x,\cdot),P(y,\cdot)). \]

A proof. Let \( {\pi_{x,y}} \) be a coupling of \( {P(x,\cdot)} \) and \( {P(y,\cdot)} \). Then \( {\int\pi_{x,y}(\cdot,\cdot)\mathrm{d}\mu(x)\mathrm{d}\nu(y)} \) is a coupling of \( {\mu P} \) and \( {\nu P} \). Indeed, for instance for the first marginal, we have

\[ \begin{array}{rcl} \int_{y’}\int_{x,y}\pi_{x,y}(\cdot,\mathrm{d}y’)\mathrm{d}\mu(x)\mathrm{d}\nu(y) &=&\int_{x,y}\int_{y’}\pi_{x,y}(\cdot,\mathrm{d}y’)\mathrm{d}\mu(x)\mathrm{d}\nu(y)\\ &=&\int_{x,y}P_x(\cdot)\mathrm{d}\mu(x)\mathrm{d}\nu(y)\\ &=&\mu P. \end{array} \]

Now, for all \( {\varepsilon>0} \) there exists a coupling \( {\pi_{x,y}} \) of \( {P(x,\cdot)} \) and \( {P(y,\cdot)} \) such that

\[ \begin{array}{rcl} \int_{x’,y’} c(x’,y’)\mathrm{d}\pi_{x,y}(x’,y’)-\varepsilon &\leq&\inf_{\pi}\int c(x’,y’)\mathrm{d}\pi_{x,y}(x’,y’)\\ &=&\mathrm{div}_c(P(x,\cdot),P(y,\cdot)), \end{array} \]

and thus

\[ \mathrm{div}_c(\mu P,\nu P) -\varepsilon \leq\int \mathrm{div}_c(P(x,\cdot),P(y,\cdot))\mathrm{d}\mu(x)\mathrm{d}\nu(y). \]

This gives the desired inequality.

Playing with Markov kernels. Let us consider the identity Markov kernel defined by

\[ P(x,\cdot)=\delta_x\quad\mbox{for all}\quad x\in E. \]

Then \( {\mu P=\mu} \) for all \( {\mu\in\mathcal{P}(E)} \), hence the name. Next, since \( {\mathrm{div}_c(\delta_x,\delta_y)=c(x,y)} \), the inequality above for the infimum divergence gives in this case the tautology \( {\mathrm{div}_c(\mu,\nu)=\mathrm{div}_c(\mu,\nu)} \). In contrast, the inequality for the supremum divergence gives

\[ \mathrm{div}_{\mathcal{F}}(\mu,\nu) \leq \inf_\pi\int c(x,y)\mathrm{d}\pi(x,y) =\mathrm{div}_c(\mu,\nu) \]

where the infimum runs over all couplings of \( {\mu} \) and \( {\nu} \) and where the cost is

\[ c(x,y) =\mathrm{div}_{\mathcal{F}}(\delta_x,\delta_y) =\sup_{f\in\mathcal{F}}(f(x)-f(y)). \]

Kantorovich-Rubinstein duality. When the cost \( {(x,y)\mapsto c(x,y)} \) is a distance making \( {E} \) a metric space, this duality theorem states that

\[ \mathrm{div}_c =\mathrm{div}_{\mathcal{F}} \]

where \( {\mathcal{F}} \) is the class of functions \( {f:E\rightarrow\mathbb{R}} \) such that

\[ \left\Vert f\right\Vert_{\mathrm{Lip}} =\sup_{x\neq y}\frac{|f(x)-f(y)|}{c(x,y)} \leq1. \]

In the case of the discrete distance \( {c(x,y)=\mathbf{1}_{x\neq y}} \), this identity becomes

\[ \inf_{\substack{(X,Y)\\X\sim\mu\\Y\sim\nu}}\mathbb{P}(X\neq Y) =\sup_{\substack{f:E\rightarrow\mathbb{R}\\\left\Vert f\right\Vert_\infty\leq 1/2}}\int f\mathrm{d}(\mu-\nu) \]

and this matches the total variation distance

\[ \left\Vert \mu-\nu\right\Vert_{\mathrm{TV}} =\sup_{B\subset E}|\mu(B)-\mu(B)| \]

(all right, \( {\geq} \) is immediate, while \( {\leq} \) requires approximation/structure on \( {E} \)).

Bounded-Lipschitz or Fortet-Mourier distance. Still when \( {E} \) is a metric space, it corresponds to \( {\mathrm{div}_{\mathcal{F}}} \) when \( {\mathcal{F}} \) is the class of \( {f:E\rightarrow\mathbb{E}} \) such that

\[ \left\Vert f\right\Vert_{\mathrm{Lip}}\leq1\quad\mbox{(implies continuity)}\quad \mbox{and}\quad\left\Vert f\right\Vert_\infty\leq1. \]

(Monge-Kantorovich-)Wasserstein distances. When \( {E} \) is a metric space equipped with a distance \( {d} \), and when \( {p\in[1,\infty)} \), the \( {W_p} \) distance is defined by

\[ W_p(\mu,\nu)=\mathrm{div}_c(\mu,\nu)^{1/p} \quad\mbox{with}\quad c(x,y)=d(x,y)^p. \]

It is finite when \( {\mu} \) and \( {\nu} \) have finite \( {p} \)-th order moment in the sense that for some (and thus any) \( {x\in E} \) we have \( {\int d(x,y)^p\mathrm{d}\mu(y)<\infty} \) and \( {\int d(x,y)^p\mathrm{d}\nu(y)<\infty} \). On this subset of \( {\mathcal{P}(E)} \), \( {W_p} \) turns out indeed to be a true distance.

In the case \( {p=1} \), the Kantorovich-Rubinstein duality can be used for \( {W_1=\mathrm{div}_c} \) with \( {c(x,y)=d(x,y)} \) since it is a distance on \( {E} \), giving \( {W_1=\mathrm{div}_{\mathcal{F}}} \) where \( {\mathcal{F}} \) is the class of bounded (this condition can be relaxed) and Lipschitz functions \( {f:E\rightarrow\mathbb{R}} \) with \( {\left\Vert f\right\Vert_{\mathrm{Lip}}\leq1} \).

When \( {p\neq 1} \), the cost is no longer a distance, but we have still the variational formula

\[ W_p(\mu,\nu)=\sup\left(\int f\mathrm{d}\mu-\int g\mathrm{d}\nu\right)^{1/p} \]

where the supremum runs over all bounded and Lipschitz \( {f,g:E\rightarrow\mathbb{R}} \) such that \( {f(x)-g(y)\leq d(x,y)^p} \). In other words

\[ W_p(\mu,\nu)=\sup\left(\int Q(f)\mathrm{d}\mu-\int f\mathrm{d}\nu\right)^{1/p} \]

where the supremum runs over bounded Lipschitz \( {f:E\rightarrow\mathbb{R}} \) and where \( {Q(f)} \) is the infimum convolution of \( {f} \) with \( {\left|\cdot\right|^p} \) defined by

\[ Q(f)(x)=\inf_{y\in E}\Bigr(f(y)+d(x,y)^p\Bigr). \]

Note tha \( {W_p} \) defines the same topology than the Zolotarev distance \( {\mathrm{div}_{\mathcal{F}}^{1/p}} \) where \( {\mathcal{F}} \) is the class of functions with growth at most like \( {d^p(x,\cdot)} \) for some arbitrary \( {x} \). They coincide when \( {p=1} \) and differ metrically when \( {p\neq1} \).

Trend to the equilibrium. In the study of the trend to the equilibrium / long time behavior of the Markov process \( {X} \), we have typically \( {\lim_{t\rightarrow\infty}\varphi_t(x,y)=0} \) for all \( {x,y} \). Also, if \( {\nu} \) is invariant, meaning that \( {\nu P_t=\nu} \) for all \( {t} \), then

\[ \mathrm{div}(\mu P_t,\nu)\leq\int\varphi_t(x,y)\mathrm{d}\mu(x)\mathrm{d}\nu(y) \underset{t\rightarrow\infty}{\longrightarrow}0 \]

provided that \( {\sup_t\varphi_t} \) is \( {\mu\otimes\nu} \) integrable (dominated convergence).

Further reading.

Leave a Comment
Syntax · Style · .