Press "Enter" to skip to content

Month: November 2020

Pierre-Louis Lions – Dans la tête d’un mathématicien

Pierre-Louis Lions - Dans la tête d'un mathématicien
Couverture du livre paru en 2020.

J’ai appris récemment via un billet de ma collègue Isabelle Catto que Pierre-Louis Lions venait d’écrire un livre intitulé « Dans la tête d’un mathématicien ». Les publications non scientifiques de cette rockstar de l’analyse non-linéaire sont si rares que je me suis empressé, par curiosité, de me procurer un exemplaire. Il ne s’agit pas d’un roman ou de littérature, l’intérêt du livre est ailleurs. On y découvre une personnalité scientifique de premier plan, à la fois puissante et séduisante, passionnée, pleine d’humour, axée sur le concret. On y découvre également une histoire personnelle riche et étonnante, assez éclairante. On y découvre enfin les analyses et opinions de Pierre-Louis Lions sur toutes sortes de sujets, y compris sur des questions d’actualité.  Sa liberté de pensée et d’expression, souvent loin des conformismes habituels, fait vraiment plaisir intellectuellement. À titre d’exemple, sa position sur le réchauffement climatique et sur le nucléaire, courageuse, rejoint celle de Jean-Marc Jancovici, à rebrousse poil d’un dogme symbolique de l’écologie politique actuelle. Sa position sur la réforme LRU est tout aussi courageuse et à contre-courant. De manière générale, PL² s’intéresse avec sérieux à toutes sortes de thèmes en rapport avec les sciences et les technologies, sans avoir la prétention de tout comprendre, fait appel à son intuition et expérience de chercheur et de modélisateur, prône à la fois la recherche de haut niveau et les approches globales, et n’hésite pas à penser par lui-même, à donner son avis. Ce livre donne envie d’en savoir plus, d’engager la discussion, de lire, de penser.

Le passage sur ses grandes découvertes en analyse non-linéaire, sa manière de les relier à des motivations concrètes, et le peut-être trop bref récit de ses collaborations est véritablement passionné et passionnant : mécanique des fluides et solutions de viscosité pour les équations de Hamilton-Jacobi avec Michael Crandall, mécanique quantique et atomique et principe de concentration-compacité suite à une inspiration de Srinivasa Varadhan resté dans l’ombre, théorie cinétique des gaz et approche de DiPerna-Lions pour l’équation de Boltzmann, etc.

Les célébrités sont souvent en décalage avec leur image publique, et c’est par ce type de livre très personnel qu’un rééquilibrage devient possible, qu’une sorte de réhumanisation s’opère avec tout ce que cela comporte. Mais ceci ne vaut ici que pour le peuple des mathématiciens, car les célébrités des mathématiques sont rarement des célébrités tout court. Ce type de livre permet aussi et surtout au grand public de découvrir un mathématicien de premier plan en action.

Tout comme Cédric Villani, Pierre-Louis Lions est une singularité dans le paysage des mathématiques, mais une singularité à la fois en prise avec le réel et à l’écart des médias – ne pas manquer le chapitre Lady Gaga et moi, à déguster avant ou après Théorème vivant. (*)

Rares sont les mathématiciens du niveau de Pierre-Louis Lions à avoir une telle passion pour les mathématiques appliquées. Ce livre en est d’autant plus bienvenu, et mérite d’être lu par tous ceux qui souhaitent en savoir plus sur les mathématiciens et les mathématiques de haut niveau.

À propos de mathématiciens et de mathématiques appliquées ou non, connaissez-vous le savoureux texte intitulé Souvenirs d’un évalué médiocre du truculent Bernard Beauzamy ?

(*) Attention, le passage sur Cédric Villani peut choquer certaines personnes sensibles.

Voici enfin un brin de Led Zeppelin pour vibrer avec la génération née dans les années 1950.

Led Zeppelin
Robert Plant (gauche) et Jimmy Page (droite) en concert à Chicago pendant la tournée nord-américaine de 1977. La guitare de Plant est une Gibson EDS-1275.

Last Updated on 2021-03-18

Leave a Comment

Sub-Gaussian tail bound for local martingales

Herman Chernoff
Herman Chernoff (1923 – ) One of the first to play with exponential Markov inequalities in the 1950s. He was not aware of the work of Harald Cramér in the 1930s!

This post is devoted to a sub-Gaussian tail bound and exponential square integrability for local martingales, taken from my master course on stochastic calculus.

Sub-Gaussian tail bound and exponential square integrability for local martingales. Let \( {M={(M_t)}_{t\geq0}} \) be a continuous local martingale issued from the origin. Then for all \( {t,K,r\geq0} \),

\[ \mathbb{P}\Bigr(\sup_{s\in[0,t]}|M_s|\geq r, \langle M\rangle_t\leq K\Bigr) \leq2\mathrm{e}^{-\frac{r^2}{2K}}, \]

and in particular, if \( {\langle M\rangle_t\leq Ct} \) then

\[ \mathbb{P}\Bigr(\sup_{s\in[0,t]}|M_s|\geq r\Bigr) \leq2\mathrm{e}^{-\frac{r^2}{2Ct}} \]

and, for all \( {\alpha<\frac{1}{2Ct}} \),

\[ \mathbb{E}\Bigr(\mathrm{e}^{\alpha\sup_{s\in[0,t]}|M_s|^2}\Bigr)<\infty. \]

The condition \( {\langle M\rangle_t\leq Ct} \) is a comparison to Brownian motion for which equality holds.

Proof. For all \( {\lambda,t\geq0} \), the Doléans-Dade exponential

\[ X^\lambda ={\Bigr(\mathrm{e}^{\lambda M_t-\frac{\lambda^2}{2}\langle M\rangle_t}\Bigr)}_{t\geq0} \]

is a positive super-martingale with \( {X^\lambda_0=1} \) and \( {\mathbb{E}X^\lambda_t\leq1} \) for all \( {t\geq0} \). For all \( {t,\lambda,r,K\geq0} \), by using the maximal inequality for the super-martingale \( {X^\lambda} \) in the last step,

\[ \begin{array}{rcl} \mathbb{P}\Bigr(\langle M\rangle_t\leq K,\sup_{0\leq s\leq t}M_s\geq r\Bigr) &\leq&\mathbb{P}\Bigr(\langle M\rangle_t\leq K,\sup_{0\leq s\leq t}X^\lambda_s\geq\mathrm{e}^{\lambda r-\frac{\lambda^2}{2}K}\Bigr) \\ &\leq&\mathbb{P}\Bigr(\sup_{0\leq s\leq t}X^\lambda_s\geq\mathrm{e}^{\lambda r-\frac{\lambda^2}{2}K}\Bigr)\\ &\leq&\mathbb{E}(X^\lambda_0)\mathrm{e}^{-\lambda r+\frac{\lambda^2}{2}K} =\mathrm{e}^{-\lambda r+\frac{\lambda^2}{2}K}. \end{array} \]

Taking \( {\lambda=r/K} \) gives

\[ \mathbb{P}\Bigr(\langle M\rangle_t\leq K,\sup_{0\leq s\leq t}M_s\geq r\Bigr) \leq\mathrm{e}^{-\frac{r^2}{2K}}. \]

The same reasoning for \( {-M} \) instead of \( {M} \) provides (note that \( {\langle -M\rangle=\langle M\rangle} \) obviously)

\[ \mathbb{P}\Bigr(\langle M\rangle_t\leq K,\sup_{0\leq s\leq t}(-M_s)\geq r\Bigr) \leq\mathrm{e}^{-\frac{r^2}{2K}}. \]

The union bound (hence the prefactor \( {2} \)) gives then the first desired inequality. The exponential square integrability comes from the usual link between tail bound and integrability, namely if \( {X=\sup_{s\in[0,t]}|M_s|} \), \( {U(x)=\mathrm{e}^{\alpha x^2}} \), \( {\alpha<\frac{1}{2Kt}} \), then, by Fubini-Tonelli,

\[ \begin{array}{rcl} \mathbb{E}(U(X)) &=&\mathbb{E}\Bigr(\int_0^XU'(x)\mathrm{d}x\Bigr)\\ &=&\mathbb{E}\Bigr(\int_0^\infty\mathbf{1}_{x\leq X}U'(x)\mathrm{d}x\Bigr)\\ &=&\int_0^\infty U'(x)\mathbb{P}(X\geq x)\mathrm{d}x\  &\leq&\int_0^\infty2\alpha x\mathrm{e}^{\alpha x^2}\mathrm{e}^{-\frac{x^2}{2Kt}}\mathrm{d}x <\infty. \end{array} \]

Doob maximal inequality for super-martingales. If \( {M} \) is a continuous super-martingale, then for all \( {t\geq0} \) and \( {\lambda>0} \), denoting \( {M^-=\max(0,-M)} \),

\[ \mathbb{P}\Bigr(\max_{s\in[0,t]}|M_s|\geq\lambda\Bigr) \leq\frac{\mathbb{E}(M_0)+2\mathbb{E}(M^-_t)}{\lambda}. \]

In particular when \( {M} \) is non-negative then \( {\mathbb{E}(M^-)=0} \) and the upper bound is \( {\frac{\mathbb{E}(M_0)}{\lambda}} \).

Proof. Let us define the bounded stopping time

\[ T=t\wedge \inf\{s\in[0,t]:M_s\geq \lambda\}. \]

We have \( {M_T\in\mathrm{L}^1} \) since \( {|M_T|\leq\max(|M_0|,|M_t|,\lambda)} \). By the Doob stopping theorem for the sub-martingale \( {-M} \) and the bounded stopping times \( {0} \) and \( {T} \) that satisfy \( {M_0\in\mathrm{L}^1} \) and \( {M_T\in\mathrm{L}^1} \), we get

\[ \mathbb{E}(M_0) \geq\mathbb{E}(M_T) \geq \lambda\mathbb{P}(\max_{s\in[0,t]}M_s\geq \lambda) +\mathbb{E}(M_t\mathbf{1}_{\max_{s\in[0,t]}M_s<\lambda}) \]

hence, recalling that \( {M^-=\max(-M,0)} \),

\[ \lambda\mathbb{P}(\max_{s\in[0,t]}M_s\geq \lambda) \leq \mathbb{E}(M_0)+\mathbb{E}(M^-_t). \]

This produces the desired inequality when \( {M} \) is non-negative. For the general case, we observe that the Jensen inequality for the nondecreasing convex function \( {u\in\mathbb{R}\mapsto\max(u,0)} \) and the sub-martingale \( {-M} \) shows that \( {M^-} \) is a sub-martingale. Thus, by the Doop maximal inequality for non-negative sub-martingales,

\[ \lambda\mathbb{P}(\max_{s\in[0,t]}M^-_s\geq \lambda) \leq\mathbb{E}(M^-_t). \]

Finally, putting both inequalities together gives

\[ \lambda\mathbb{P}(\max_{s\in[0,t]}|M_s|\geq \lambda) \leq \lambda\mathbb{P}(\max_{s\in[0,t]}M_s\geq \lambda) +\lambda\mathbb{P}(\max_{s\in[0,t]}M^-_s\geq \lambda) \leq\mathbb{E}(M_0)+2\mathbb{E}(M^-_t). \]

Doob maximal inequalities. Let \( {M} \) be a continuous process.

  1. If \( {M} \) is a martingale or a non-negative sub-martingale then for all \( {p\geq1} \), \( {t\geq0} \), \( {\lambda>0} \),

    \[ \mathbb{P}\Bigr(\max_{s\in[0,t]}|M_s|\geq\lambda\Bigr) \leq\frac{\mathbb{E}(|M_t|^p)}{\lambda^p}. \]

  2. If \( {M} \) is a martingale then for all \( {p>1} \) and \( {t\geq0} \),

    \[ \mathbb{E}\Bigr(\max_{s\in[0,t]}|M_s|^p\Bigr) \leq\Bigr(\frac{p}{p-1}\Bigr)^p\mathbb{E}(|M_t|^p) \]

    in other words

    \[ \Bigr\|\max_{s\in[0,t]}|M_s|\Bigr\|_p\leq\frac{p}{p-1}\|M_t\|_p. \]

    In particular if \( {M_t\in\mathrm{L}^p} \) then \( {M^*_t=\max_{s\in[0,t]}M_s\in\mathrm{L}^p} \).

Comments. This inequality allows to control the tail of the supremum by the moment at the terminal time. It is a continuous time martingale version of the simpler Kolmogorov maximal inequality for sums of independent and identically distributed random variables. Note that \( {q=1/(1-1/p)=p/(p-1)} \) is the Hölder conjugate of \( {p} \) namely \( {1/p+1/q=1} \). The inequality is often used with \( {p=2} \), for which \( {(p/(p-1))^p=4} \).

Proof. We can always assume that the right hand side is finite, otherwise the inequalities are trivial.

  1. If \( {M} \) is a martingale, then by the Jensen inequality for the convex function \( {u\in\mathbb{R}\mapsto |u|^p} \), the process \( {|M|^p} \) is a sub-martingale. Similarly, If \( {M} \) is a non-negative sub-martingale then, since \( {u\in[0,+\infty)\mapsto u^p} \) is convex and non-decreasing it follows that \( {M^p=|M|^p} \) is a sub-martingale. Therefore in all cases \( {{(|M_s|^p)}_{s\in[0,t]}} \) is a sub-martingale. Let us define the bounded stopping time

    \[ T=t\wedge \inf\{s\geq0:|M_s|\geq\lambda\}. \]

    Note that \( {|M_T|\leq\max(|M_0|,\lambda)} \) and thus \( {M_T\in\mathrm{L}^1} \). The Doob stopping theorem for the sub-martingale \( {|M|^p} \) and the bounded stopping times \( {T} \) and \( {t} \) that satisfy \( {T\leq t} \) gives

    \[ \mathbb{E}(|M_T|^p)\leq\mathbb{E}(|M_t|^p). \]

    On the other hand the definition of \( {T} \) gives

    \[ |M_T|^p \geq\lambda^p\mathbf{1}_{\max_{s\in[0,t]}|M_s|\geq\lambda} +|M_t|^p\mathbf{1}_{\max_{s\in[0,t]}|M_s|<\lambda}\\ \geq\lambda^p\mathbf{1}_{\max_{s\in[0,t]}|M_s|\geq\lambda}. \]

    It remains to combine these inequalities to get the desired result.

  2. If we introduce for all \( {n\geq1} \) the “localization” stopping time

    \[ T_n=t\wedge\inf\{s\geq0:|M_s|\geq n\}, \]

    then the desired inequality for the bounded sub-martingale \( {{(|M_{s\wedge T_n}|)}_{s\in[0,t]}} \) would give

    \[ \mathbb{E}(\max_{s\in[0,t]}|M_{s\wedge T_n}|^p) \leq\left(\frac{p}{p-1}\right)^p\mathbb{E}(|M_t|^p), \]

    and the desired result for \( {{(M_s)}_{s\in[0,t]}} \) would then follow by monotone convergence theorem. Thus this shows that we can assume without loss of generality that \( {{(|M_s|)}_{s\in[0,t]}} \) is bounded, in particular that \( {\mathbb{E}(\max_{s\in[0,t]}|M_s|^p)<\infty} \). This a martingale localization argument! The previous proof gives

    \[ \mathbb{P}(\max_{s\in[0,t]}|M_s|\geq\lambda) \leq\frac{\mathbb{E}(|M_t|\mathbf{1}_{\max_{s\in[0,t]}|M_s|\geq\lambda})}{\lambda} \]

    for all \( {\lambda>0} \), and thus

    \[ \int_0^\infty\lambda^{p-1} \mathbb{P}(\max_{s\in[0,t]}|M_s|\geq\lambda)\mathrm{d}\lambda \leq \int_0^\infty\lambda^{p-2} \mathbb{E}(|M_t|\mathbf{1}_{\max_{s\in[0,t]}|M_s|\geq\lambda})\mathrm{d}\lambda. \]

    Now the Fubini-Tonelli theorem gives

    \[ \int_0^\infty\lambda^{p-1}\mathbb{P}(\max_{s\in[0,t]}|M_s|\geq\lambda)\mathrm{d}\lambda =\mathbb{E}\int_0^{\max_{s\in[0,t]}|M_s|}\lambda^{p-1}\mathrm{d}\lambda =\frac{1}{p}\mathbb{E}(\max_{s\in[0,t]}|M_s|^p). \]

    and similarly (here we need \( {p>1} \))

    \[ \int_0^\infty\lambda^{p-2}\mathbb{E}(|M_t|\mathbf{1}_{\max_{s\in[0,t]}|M_s|\geq\lambda)})\mathrm{d}\lambda =\frac{1}{p-1}\mathbb{E}(|M_t|\max_{s\in[0,t]}|M_s|^{p-1}). \]

    Combining all this gives

    \[ \mathbb{E}(\max_{s\in[0,t]}|M_s|^p) \leq\frac{p}{p-1} \mathbb{E}(M_t\max_{s\in[0,t]}|M_s|^{p-1}). \]

    But since the Hölder inequality gives

    \[ \mathbb{E}(|M_t|\max_{s\in[0,t]}|M_s|^{p-1}) \leq\mathbb{E}(|M_t|^p)^{1/p}\mathbb{E}(\max_{s\in[0,t]}|M_s|^p)^{\frac{p-1}{p}}, \]

    we obtain

    \[ \mathbb{E}(\max_{s\in[0,t]}|M_s|^p) \leq\frac{p}{p-1}\mathbb{E}(|M_t|^p)^{1/p}\mathbb{E}(\max_{s\in[0,t]}|M_s|^p)^{\frac{p-1}{p}}. \]

    Consequently, since \( {\mathbb{E}(\max_{s\in[0,t]}|M_s|^p)<\infty} \), we obtain the desired inequality.

Doob stopping theorem for sub-martingales. If \( {M} \) is a continuous sub-martingale and \( {S} \) and \( {T} \) are bounded stopping times such that \( {S\leq T,\quad M_S\in\mathrm{L}^1,\quad M_T\in\mathrm{L}^1} \), then

\[ \mathbb{E}(M_S)\leq\mathbb{E}(M_T). \]

Proof. We proceed as in the proof of the Doob stopping theorem for martingales, by assuming first that \( {S} \) and \( {T} \) take their values in the finite set \( {\{t_1,\ldots,t_n\}} \) where \( {t_1<\cdots<t_n} \). In this case \( {M_T} \) and \( {M_S} \) are in \( {\mathrm{L}^1} \) automatically. The inequality \( {S\leq T} \) gives \( {\mathbf{1}_{S\geq t}\leq\mathbf{1}_{T\geq t}} \) for all \( {t} \). Using this fact and the sub-martingale property of \( {M} \), we get

\[ \begin{array}{rcl} \mathbb{E}(M_S) &=&\mathbb{E}(M_0) +\mathbb{E}\Big(\sum_{k=1}^n\overbrace{\mathbb{E}(M_{t_k}-M_{t_{k-1}}\mid\mathcal{F}_{t_{k-1}})}^{\geq0}\mathbf{1}_{S\geq t_k}\Bigr)\\ &\leq&\mathbb{E}(M_0) +\mathbb{E}\Big(\sum_{k=1}^n\mathbb{E}(M_{t_k}-M_{t_{k-1}}\mid\mathcal{F}_{t_{k-1}})\mathbf{1}_{T\geq t_k}\Bigr)\\ &=&\mathbb{E}(M_T). \end{array} \]

More generally, when \( {S} \) and \( {T} \) are arbitrary bounded stopping times satisfying \( {S\leq T} \), we proceed by approximation as in the proof of the Doob stopping for martingales, using again the sub-martingale nature of \( {M} \) to get uniform integrability.

Doob stopping theorem for martingales. If \( {M} \) is a continuous martingale and \( {T:\Omega\rightarrow[0,+\infty]} \) is a stopping time then \( {{(M_{t\wedge T})}_{t\geq0}} \) is a martingale: for all \( {t\geq0} \) and \( {s\in[0,t]} \), we have

\[ M_{t\wedge T}\in\mathrm{L}^1 \quad\text{and}\quad \mathbb{E}(M_{t\wedge T}\mid\mathcal{F}_s)=M_{s\wedge T}. \]

Moreover, if \( {T} \) is bounded, or if \( {T} \) is almost surely finite and \( {{(M_{t\wedge T})}_{t\geq0}} \) is uniformly integrable (for instance dominated by an integrable random variable), then

\[ M_T\in\mathrm{L}^1 \quad\text{and}\quad \mathbb{E}(M_T)=\mathbb{E}(M_0). \]

Comments. The most important is that \( {{(M_{t\wedge T})}_{t\geq0}} \) is a martingale. We have always \( {\lim_{t\rightarrow\infty}M_{T\wedge t}\mathbf{1}_{T<\infty}=M_T\mathbf{1}_{T<\infty}} \) almost surely. When \( {T<\infty} \) almost surely we could use what we know on \( {M} \) and \( {T} \) to deduce by monotone or dominated convergence that this holds in \( {\mathrm{L}^1} \), giving \( {\mathbb{E}(M_T)=\mathbb{E}(\lim_{t\rightarrow\infty}M_{t\wedge T})=\lim_{t\rightarrow\infty}\mathbb{E}(M_{t\wedge T})=\mathbb{E}(M_0)} \).

The theorem states that this is automatically the case when \( {T} \) is bounded or when \( {M^T} \) is uniformly integrable. Furthermore, if \( {M^T} \) is uniformly integrable then it can be shown that \( {M_\infty} \) exists, giving a sense to \( {M_T} \) even on \( {\{T=\infty\}} \), and then \( {\mathbb{E}(M_T)=\mathbb{E}(M_0)} \).

Proof. Let assume first that \( {T} \) takes a finite number of values \( {t_1<\cdots<t_n} \). Let us show that \( {M_T\in\mathrm{L}^1} \) and \( {\mathbb{E}(M_T)=\mathbb{E}(M_0)} \). We have \( {M_T=\sum_{k=1}^nM_{t_k}\mathbf{1}_{T=t_k}\in\mathrm{L}^1} \), and moreover, using

\[ \{T\geq t_k\}=(\cup_{i=1}^{k-1}\{T=t_i\})^c\in\mathcal{F}_{t_{k-1}}, \]

and the martingale property \( {\mathbb{E}(M_{t_k}-M_{t_{k-1}}\mid\mathcal{F}_{t_{k-1}})=0} \), for all \( {k} \), we get

\[ \mathbb{E}(M_T) =\mathbb{E}(M_0) +\mathbb{E}\Big(\sum_{k=1}^n\mathbb{E}(M_{t_k}-M_{t_{k-1}}\mid\mathcal{F}_{t_{k-1}})\mathbf{1}_{T\geq t_k}\Bigr) =\mathbb{E}(M_0). \]

Suppose now that \( {T} \) takes an infinite number of values but is bounded by some constant \( {C} \). For all \( {n\geq0} \), we approximate \( {T} \) by the piecewise constant random variable (discretization of \( {[0,C]} \)).

\[ T_n=C\mathbf{1}_{T=C}+\sum_{k=1}^{n}t_{k}\mathbf{1}_{t_{k-1}\leq T<t_{k}} \quad\text{where}\quad t_k=t_{n,k}=C\frac{k}{n}. \]

This is a stopping time since for all \( {t\geq0} \), \( {\{T_n\leq t\}=\{T_n\leq\lfloor t\rfloor\}\in\mathcal{F}_{\lfloor t\rfloor}} \), which reduces the problem to a discrete \( {t} \), and then for all integer \( {m\geq0} \), we have that \( {\{T_n=m\} =\varnothing\in\mathcal{F}_0} \) if \( {m\not\in\{t_{k}:1\leq k\leq n\}} \), while \( {\{T_n=m\}=\{T=C\}\in\mathcal{F}_C} \) if \( {m=C} \), and

\[ \{T_n=m\} =\{T<t_{k-1}\}^c\cap\{T<t_{k}\}\in\mathcal{F}_{t_{k}} \]

if \( {m=t_{k}} \), \( {1\leq k\leq n} \), where we used the fact that for all \( {t\geq0} \),

\[ \{T=t\}=\{T\leq t\}\cap\{T<t\}^c=\{T\leq t\}\cap\cap_{r=1}^\infty\{T>t-1/r\}\in\mathcal{F}_t. \]

Since \( {T_n} \) takes a finite number of values, the previous step gives \( {\mathbb{E}(M_{T_n})=\mathbb{E}(M_0)} \). On the other hand, almost surely, \( {T_n\rightarrow T} \) as \( {n\rightarrow\infty} \). Since \( {M} \) is continuous, it follows that almost surely \( {M_{T_n}\rightarrow M_T} \) as \( {n\rightarrow\infty} \). Let us show now that \( {{(M_{T_n})}_{n\geq1}} \) is uniformly integrable. Since for all \( {n\geq0} \), \( {T_n} \) takes its values in a finite set \( {t_1<\cdots<t_{m_n}\leq C} \), the martingale property and the Jensen inequality give, for all \( {R>0} \),

\[ \begin{array}{rcl} \mathbb{E}(|M_C|\mathbf{1}_{|M_{T_n}|\geq R}) &=&\sum_k\mathbb{E}(|M_C|\mathbf{1}_{|M_{t_k}|\geq R,T_n=t_k})\\ &=&\sum_k\mathbb{E}(\mathbb{E}(|M_C|\mid\mathcal{F}_{t_k})\mathbf{1}_{|M_{t_k}|\geq R,T_n=t_k})\\ &\geq&\sum_k\mathbb{E}(|\mathbb{E}(M_C\mid\mathcal{F}_{t_k})|\mathbf{1}_{|M_{t_k}|\geq R,T_n=t_k})\\ &=&\sum_k\mathbb{E}(|M_{t_k}|\mathbf{1}_{|M_{t_k}|\geq R,T_n=t_k})\\ &=&\mathbb{E}(|M_{T_n}|\mathbf{1}_{|M_{T_n}|\geq R}). \end{array} \]

Now \( {M} \) is continuous and thus locally bounded, and \( {M_C\in\mathrm{L}^1} \), thus, by dominated convergence,

\[ \sup_n\mathbb{E}(|M_{T_n}|\mathbf{1}_{|M_{T_n}|>R}) \leq\mathbb{E}(|M_C|\mathbf{1}_{\sup_{s\in[0,C]}|M_s|\geq R}) \underset{R\rightarrow\infty}{\longrightarrow}0. \]

Therefore \( {{(M_{T_n})}_{n\geq0}} \) is uniformly integrable. As a consequence

\[ \overset{\mathrm{a.s.}}{\lim_{n\rightarrow\infty}}M_{T_n}=M_T\in\mathrm{L}^1 \quad\text{and}\quad \mathbb{E}(M_T)=\lim_{n\rightarrow\infty}\mathbb{E}(M_{T_n})=\mathbb{E}(M_0). \]

Let us suppose now that \( {T} \) is an arbitrary stopping time. For all \( {0\leq s\leq t} \) and \( {A\in\mathcal{F}_s} \), the random variable \( {S=s\mathbf{1}_A+t\mathbf{1}_{A^c}} \) is a (finite) stopping time, and what precedes for the finite stopping time \( {t\wedge T\wedge S} \) gives \( {M_{t\wedge T\wedge S}\in\mathrm{L}^1} \) and \( {\mathbb{E}(M_{t\wedge T\wedge S})=\mathbb{E}(M_0)} \). Now, using the definition of \( {S} \), we have

\[ \mathbb{E}(M_0) =\mathbb{E}(M_{t\wedge T\wedge S}) =\mathbb{E}(\mathbf{1}_AM_{s\wedge T}) +\mathbb{E}(\mathbf{1}_{A^c}M_{t\wedge T}) =\mathbb{E}(\mathbf{1}_A(M_{s\wedge T}-M_{t\wedge T}))+\mathbb{E}(M_{t\wedge T}). \]

Since \( {\mathbb{E}(M_{t\wedge T})=\mathbb{E}(M_0)} \), we get the martingale property for \( {{(M_{t\wedge T})}_{t\geq0}} \), namely

\[ \mathbb{E}((M_{t\wedge T}-M_{s\wedge T})\mathbf{1}_A)=0. \]

Finally, suppose that \( {T<\infty} \) almost surely and \( {{(M_{t\wedge T})}_{t\geq0}} \) is uniformly integrable. The random variable \( {M_T} \) is well defined and \( {\lim_{t\rightarrow\infty}M_{t\wedge T}=M_T} \) almost surely because \( {M} \) is continuous. Furthermore, since \( {{(M_{t\wedge T})}_{t\geq0}} \) is uniformly integrable, it follows that \( {M_T\in\mathrm{L}^1} \) and \( {\lim_{t\rightarrow\infty}M_{t\wedge T}=M_T} \) in \( {\mathrm{L}^1} \). In particular \( {\mathbb{E}(M_0)\underset{\forall t}{=}\mathbb{E}(M_{t\wedge T})=\lim_{t\rightarrow\infty}\mathbb{E}(M_{t\wedge T})=\mathbb{E}(M_T)} \). Further reading in the same spirit.

Last Updated on 2020-12-03

2 Comments

Modélisation et analyse quantitative

Allegory of the Vanity of Earthly Things
Allegory of the Vanity of Earthly Things

Ce billet est une version longue et en français d’un billet précédent publié en anglais au printemps dernier. Il s’agit d’une contribution au livre collectif pluridisciplinaire « Covid-19 : regards croisés sur la crise » en cours de préparation à l’université Paris-Dauphine. Le texte fait un peu plus de 10 000 caractères et le résumé environ 1000 caractères, espaces compris.

Résumé. La pandémie de coronavirus actuelle et sa gestion sont des sujets d’étude intéressants à bien des égards. Si l’on se penche sur l’histoire récente et moins récente, cette pandémie en elle-même apparaît pour l’instant comme plutôt ordinaire, alors que les réponses politiques le sont moins. On observe en particulier, au-delà de l’aversion au risque et d’un mimétisme international, un certain rôle joué par l’analyse quantitative de risque pour la décision, basée sur la modélisation en épidémiologie. Ce texte regroupe des libres pensées sur ce qu’est la modélisation mathématique ou informatique, ce qu’elle n’est pas, le rôle qu’elle a, qu’elle a eu, et qu’elle pourrait avoir. Le propos est d’apporter un contrepoint critique et historique aux tentations utilitaristes qui sous-tendent la modélisation et l’analyse quantitative, exacerbées par la crise du coronavirus que nous vivons.

La modélisation mathématique réussit remarquablement à prédire, avec un haut degré de précision, le comportement de nombreux phénomènes naturels, comme par exemple, et très concrètement, la trajectoire des satellites ou la propagation du son et de la lumière. La modélisation mathématique joue indéniablement un rôle clé dans la plupart des champs technologiques actuels, souvent à travers la physique et l’informatique. Ses nombreux succès ont un impact considérable, concret et positif, sur notre vie quotidienne. Comment expliquer un tel succès de la mathématisation du monde ? Quelle est la nature du lien entre mathématiques et monde physique ? Ces questions occupent les penseurs depuis l’antiquité. Les plus grands esprits s’y attardent, comme le prix Nobel de physique Eugene Wigner, et son célèbre « The unreasonable effectiveness of mathematics in the natural sciences » publié en 1960, ou le grand mathématicien et informaticien Richard Hamming, et son « The unreasonable effectiveness of mathematics » publié en 1980. Sans vraiment apporter de réponse sur le fond, ces articles dessinent les contours d’une fascinante réussite, qui passe par une quantification et une mécanisation des phénomènes naturels.

D’un autre côté, il se trouve que les mécanismes de nombreux phénomènes naturels quantifiables ne sont pas bien compris, et même lorsqu’ils sont bien compris à une certaine échelle, leur modélisation mathématique n’est en général qu’une approximation parfois grossière de leur complexité et subtilité, qui peut beaucoup manquer de précision. L’approximation peut également provenir de l’analyse mathématique et numérique du modèle en lui-même, ainsi que du manque de données pour l’ajuster. Tous ces aspects sont bien connus des mathématiciens, qui ont coutume de dire que tous les modèles sont faux, mais que certains sont utiles. Ces limitations de la modélisation mathématique des phénomènes naturels, liées au caractère simpliste voire caricatural de la mathématisation et numérisation du monde, font contrepoint. L’ingénieur Derek Abbott a publié en 2013 un article remarqué sur ce sujet, intitulé « The reasonable ineffectiveness of mathematics », une sorte de pied de nez à l’arrogance de ceux d’Eugène Wigner et Richard Hamming.

Le cas de la météorologie est particulièrement intéressant. Les mécanismes des phénomènes naturels sous-jacents sont relativement bien compris et sont modélisés mathématiquement notamment par les équations de la mécanique des fluides, liées à l’une des plus grandes questions de physique mathématique. Malheureusement, la sensibilité de ces équations aux perturbations rend la prédiction relativement limitée, malgré les progrès remarquables réalisés dans l’analyse numérique et la puissance de calcul, et malgré l’énorme quantité de données collectées par télédétection par satellite. Les prévisions météorologiques à moyen/long terme restent inaccessibles.

La situation est pire encore pour les sciences sociales comme l’économie ou la sociologie, pour lesquelles nous n’avons pas l’analogue des équations de la mécanique des fluides. Historiquement, l’analyse quantitative des phénomènes sociaux a d’abord été abordée à l’aide de données statistiques, notamment par Adolphe Quetelet, qui a produit entre autres études son célèbre « Sur l’homme et le développement de ses facultés, ou Essai de physique sociale » (1835). Quetelet a découvert une mécanique, une régularité des phénomènes aléatoires, ouvrant la voie à la modélisation mathématique des systèmes désordonnés et à leur prévisibilité. L’idée fondamentale est que ce sont les distributions statistiques ou les lois de probabilités qui sont justiciables d’une mécanique et d’une prédiction, et non pas les phénomènes aléatoires au niveau individuel. Cette distinction entre comportement microscopique ou individuel et comportement macroscopique ou de population pose également le problème philosophique du libre arbitre. Adolphe Quetelet, héritier de Pierre-Simon de Laplace, n’était pas le seul scientifique du dix-neuvième siècle à explorer une vision mécaniste de la nature, les plus célèbres étant peut-être Charles Darwin et Ludwig Boltzmann, dont les idées révolutionnaires ont été longtemps fort controversées avant d’être intégrées dans le corpus scientifique. La mécanisation des systèmes désordonnés amorcée à l’époque a conduit aux grands succès de la théorie des probabilités et de la statistique que nous connaissons tous aujourd’hui, qui sont également au cœur de la physique statistique, de la mécanique quantique, et de la théorie de l’information. Mais les sciences sociales restent malgré tout bien trop complexes pour de nombreux aspects. Les limitations de la modélisation pour l’économie mais aussi la difficulté de l’analyse des données sont abordées par exemple par Thomas Piketty dans « Le Capital au XXIe siècle » (Seuil, 2013).

Le formidable développement de la numérisation, des ordinateurs, des bases de données massives, et des réseaux a conduit à une utilisation généralisée de la modélisation et des algorithmes, bien au-delà des périmètres habituels. Cela a également stimulé le développement de divers types d’apprentissage automatique, produisant des succès parfois étonnants dont on ne comprend pas forcément les tenants et les aboutissants. Ce type de traitement algorithmique des données est toujours considéré comme de la modélisation mais peut différer de la modélisation habituelle en ce qu’il peut produire des prédictions empiriques sans compréhension.

Qu’en est-il de l’épidémiologie ? Il s’avère que les mécanismes biologiques et médicaux des épidémies virales ne sont pas bien compris par les scientifiques pour l’instant, même si la science progresse à l’occasion de chaque épidémie. La modélisation mathématique ou informatique développée en épidémiologie incorpore au mieux ce qui est connu. Elle reste cependant limitée pour la prédiction, et le problème ne se réduit pas à la collecte de données, à la sensibilité des modèles, ou à la complexité des phénomènes. En particulier, cela produit une analyse des risques discutable pour la prise de décision. On pourrait alternativement utiliser les statistiques historiques des épidémies pour produire des prédictions, au moins de nature qualitative ou phénoménologique, mais cela est également relativement limité. Nous sommes donc condamnés à vivre pour l’instant avec d’importantes incertitudes. C’est quelque peu difficile à accepter pour nos sociétés actuelles, dont l’aversion au risque est importante, et dont le rapport à la fin de vie est bouleversé.

La modélisation en épidémiologie n’en demeure pas moins intéressante pour explorer les phénomènes, les hypothèses, faire avancer notre compréhension des mécanismes et de leurs effets. La modélisation permet également la conception d’indicateurs quantitatifs avancés et l’organisation générale des moyens. La controverse fait partie de la science, mais le temps d’élaboration de la science reste cependant bien différent du temps de la décision, du temps politique ou médiatique.

D’autre part, force est de constater qu’en ces temps d’hyperspécialisation, nos scientifiques ne sont plus vraiment philosophes, tandis que nos philosophes ne sont plus vraiment scientifiques. Quant à nos décideurs et à nos journalistes, ils ne sont bien souvent ni l’un ni l’autre. C’est donc aussi de pluridisciplinarité et de pensées croisées, autant à l’échelle individuelle que collective, dont nous avons besoin. Les jeunes esprits y sont réceptifs, et cela peut inspirer et étoffer nos formations universitaires. On a coutume de dire que l’esprit critique et le sens de l’histoire sont essentiels à la science et à sa diffusion. À la fin du seizième siècle, les horoscopes du grand astronome Johannes Kepler, l’un des plus grands scientifiques de tous les temps, étaient très prisés des puissants qui l’employaient, et Kepler lui-même était persuadé que l’astrologie pouvait devenir une science au même titre que l’astronomie. Certaines des prédictions astrologiques de Kepler se sont révélées exactes. L’aventure scientifique depuis cette époque incite les scientifiques à la prudence et à l’humilité, à ne pas devenir de simples marchands de certitudes au service des puissants. Servir des scénarios issus de modélisations approximatives ne risque-t-il pas d’alimenter la peur ou l’insouciance, de produire des excès regrettables y compris pour la science ?

Toujours à propos d’histoire, et concernant la pandémie de coronavirus du printemps 2020 en France, examinons le graphique de l’INSEE qui superpose les courbes de mortalité totale de périodes passées marquantes, notamment la canicule de l’été 2003, des grippes saisonnières des années récentes, et la grippe dite de Hong Kong, qui a frappé la France à l’hiver 1969-1970 dans une quasi-indifférence générale. La chose la plus frappante est peut-être la similarité en forme et en taille entre le pic de cette grippe de Hong Kong et celui de l’épidémie de coronavirus du printemps 2020. En 2020, un confinement de la population a été organisé, par mimétisme international et au vu des prédictions issues de modélisations en épidémiologie. Comment en évaluer l’efficacité globale et la pertinence ? La démarche scientifique est assez limitée car il n’est pas possible de répéter l’expérience en contrôlant les paramètres. L’effet sur les accidents de la route, souvent évoqué, est bien réel mais une simple règle de trois révèle que cela ne change pas énormément les choses quantitativement. La médecine a certainement évolué entre les deux époques. D’autre part, la population française en 1969-1970 était bien plus petite et bien plus jeune qu’en 2020. L’essentiel des décès en question concerne les personnes âgées, pour partie en établissement spécialisé. Notons également que la grippe dite espagnole en fin de première guerre mondiale – absente du graphique – a plutôt tué les jeunes adultes, par surinfection bactérienne, avant l’ère des antibiotiques. Tout cela souligne aussi bien la tentation et la difficulté à comparer à travers le temps. Une analyse du même type pourrait aussi être menée à travers l’espace. Ces phénomènes extrêmes et récurrents sont encore plus complexes et hétérogènes que les crues des fleuves dont les bassins évoluent. Il s’agit là d’un problème majeur de l’analyse de données à travers le temps et l’espace. La principale difficulté à laquelle est confronté Thomas Piketty dans son travail sur le capital est précisément l’hétérogénéité spatio-temporelle des données statistiques concernant l’économie.

Mortalité comparée
Mortalité comparée. Superposition des courbes de décès, en France, tout le long de l‘année, pour chaque année depuis 2010, ainsi que pour certaines années exceptionnelles plus lointaines dans le passé. Le grand pic en jaune, au milieu, est celui de la canicule de l’été 2003, accompagné de plusieurs petits pics des canicules d‘autres étés. Le grand pic rouge à gauche est celui de l‘épidémie du coronavirus du printemps 2020. Le grand pic bleu, essentiellement à droite, est celui de la grippe dite de Hong Kong de l’hiver 1969-1970, environné de plusieurs petits pics des grippes d‘autres hivers. Source : Statistiques sur les décès : le mode d’emploi des données de l’Insee en 7 questions/réponses, blog de l’INSEE.

 

Last Updated on 2021-03-15

Leave a Comment
Syntax · Style · .