Press "Enter" to skip to content

Month: June 2010

Some few moments with the problem of moments

\[ \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{+\infty}\!x^{2n}e^{-\frac{x^2}{2}}\,dx =\frac{(2n)!}{n!2^n}. \]

This post in an invitation to the moments problem, taken from old notes. Let \( {P} \) be a probability distribution on \( {\mathbb{R}} \). The sequence of absolute moments \( {(M_n)} \) of \( {P} \) is given for every \( {n\in\mathbb{N}} \) by

\[ M_n=\int_{\mathbb{R}}\!|x|^n\,dP(x)\in[0,\infty]. \]

When \( {M_n<\infty} \), the associated moment \( {m_n} \) is given by

\[ m_n=\int_{\mathbb{R}}\!x^n\,dP(x), \]

and we have \( {|m_n|\leq M_n} \). The sequence of moments \( {(m_n)} \) of \( {P} \) is well defined if and only if \( {P} \) has finite absolute moments, in other words if and only if \( {\mathbb{R}[X]\subset\mathrm{L}^1(P)} \). Notice that \( {(M_n)=(m_n)} \) when \( {P} \) is supported in \( {\mathbb{R}_+} \). We say that a probability distribution \( {P} \) on \( {\mathbb{R}} \) (resp. \( {\mathbb{R}_+} \)) is characterized by its moments if and only if \( {P} \) is the unique probability distribution on \( {\mathbb{R}} \) (resp. \( {\mathbb{R}_+} \)) with sequence of moments \( {(m_n)} \). Moments problems go back probably to Tchebychev, Markov, and Stieltjes, and can be subdivided into several subproblems including:

  1. existence. under which condition a sequence of real numbers \( {(m_n)} \) is the sequence of moments of a probability distribution?
  2. uniqueness. under which condition a probability distribution is characterized by its moments?
  3. structure. how to describe the convex set of all probability distributions sharing the same sequence of moments?

Notice that existence and uniqueness problems are in general sensitive to additional constraints. For the moments problem, uniqueness on \( {\mathbb{R}_+} \) does not imply uniqueness on \( {\mathbb{R}} \), whereas existence on \( {\mathbb{R}} \) does not imply existence on \( {\mathbb{R}_+} \). Stieltjes studied moments problems on \( {\mathbb{R}_+} \). He obtained a necessary and sufficient condition for existence, and studied uniqueness. His methods involve for instance continuous fractions. Later, Hamburger continued the work of Stieltjes and studied moments problems on \( {\mathbb{R}} \). Actually, moments problems were studied by many people including among others Marcel Riesz, Krein, Hausdorff, Hamburger, and Carleman. Nowadays, there is less activity around moments problems, but one may read Simon and also Diaconis and Freedman for a revival.

1. Existence

The moments problem is a linear problem, with a positivity constraint. The following result is due to Hamburger.

Theorem 1 (Hamburger) A sequence \( {(m_n)} \) of real numbers is the sequence of moments of a probability distribution on the real line if and only if the infinite Hankel matrix

\[ H= \begin{pmatrix} m_0 & m_1 & m_2 & \cdots \\ m_1 & m_2 & m_3 & \cdots \\ m_2 & m_3 & m_4 & \cdots \\ \vdots & \vdots & \vdots & \ddots \end{pmatrix} \]

is positive definite: \( {\sum_{n,n’}m_{n+n’}u_n\overline{u}_{n’}\geq0} \) for any sequence \( {(u_n)} \) of complex numbers such that \( {u_n=0} \) except for a finitely many values of \( {n} \).

Notice that \( {H_{n,n’}=m_{n+n’}} \) and that the condition on \( {H} \) means that every finite square submatrix of \( {H} \) is positive definite. There exists a necessary and sufficient condition it terms of matrices for the Stieltjes moment problem. The reader will find more details on Stietljes and Hamburger moments problems in Shohat and Tamarkin, Akhiezer, and Krein and Nudel’man.

2. Uniqueness

One can derive sufficient conditions for uniqueness in terms of Hankel determinants. We give in the sequel some aspects of a more general approach based on quasi-analytic functions. In the sequel, and unless explicitly mentioned, we consider uniqueness on \( {\mathbb{R}} \), not on \( {\mathbb{R}_+} \). Following Hausdorff, the density of the polynomials for the uniform topology (Weierstass-Bernstein theorem) implies that any probability distribution \( {P} \) supported in a compact interval \( {[a,b]\subset\mathbb{R}} \) is characterized by its moments.

Remark 1 (A counter-example by C.C. Heyde) The log-normal distribution is not characterized by its moments. Namely, a real random variable \( {X} \) follows the log-normal distribution if and only if \( {\log(X)} \) is a standard Gaussian distribution. The associated Lebesgue density is \( {x\mapsto (2\pi)^{-1/2}x^{-1}\exp(-(\log(x))^2/2)\mathbf{1}_{\mathbb{R}_+}(x)} \). Now, for any fixed real number \( {a\in[-1,+1]} \), let us consider the Lebesgue density \( {f_a} \) defined by \( {f_a(x)=f(x)(1+a\sin(2\pi\log(x)))} \) for every \( {x\in\mathbb{R}} \). It turns out that \( {f} \) and \( {f_a} \) share the same sequence of moments, see for instance page 227 in Feller.

The following result is due to Tchakaloff, see also Bayer and Teichmann.

Theorem 2 (Tchakaloff, Bayer and Teichmann) Let \( {P} \) be a probability distribution on \( {\mathbb{R}^d} \) with some finite absolute moments: \( {\max_{1\leq k\leq n}M_n<\infty} \) for some integer \( {n\geq1} \). Let \( {\mathbb{R}_n[X]} \) be the vector space of polynomial functions of total degree less than of equal to \( {n} \). Then there exists a finitely supported probability distribution \( {P_k=p_1\delta{x_1}+\cdots+p_k\delta{x_k}} \) with \( {\mathrm{supp}(P_k)=\{x_1,\dots,x_k\}\subset\mathrm{supp}(P)} \) and \( {k\leq\mathrm{Dim}\mathbb{R}_n[X]} \) such that for every \( {f\in\mathbb{R}_n[X]} \),

\[ \int_{\mathbb{R}^d}\!f(x)\,dP(x) =\int_{\mathbb{R}^d}\!f(x)\,dP_k(x)=\sum_{i=1}^k p_if(x_i). \]

Proof: The proof uses basic separation properties of convex sets, the extremal points theorem of Minkowski-Carathéodory, and the transformation of the measure into a measure on the space of polynomials of bounded degree. This kind of result is also referred as quadrature of cubature formulas. See also Putinar and Curto and Fialkow. There a link between Hamburger moments problems and the density of polynomials in Lebesgue spaces, see for instance Stoyanov, Bakan, Bakan, Berg, Fialkow and Petrovic, and Stochel, Szafraniec, Putinar, Vasilescu. ☐

Theorem 3 (Analycity of the Fourier transform and the moments problem) Let \( {P} \) be a probability distribution on \( {\mathbb{R}} \) with well defined moments \( {(m_n)} \) and Fourier transform \( {\varphi_P} \). The following propositions are equivalent.

  1. \( {\varphi_P} \) is analytic on a neighborhood of the origin;
  2. \( {\varphi_P} \) is analytic on \( {\mathbb{R}} \);
  3. \( {\varlimsup_n \left(\frac{1}{n!}|m_n|\right)^{\frac{1}{n}}<\infty} \).

Moreover, if they hold true, then \( {P} \) is characterized by its moments \( {(m_n)} \). It is the case in particular when \( {P} \) is compactly supported or when

\[ \varlimsup_n \frac{1}{n}|m_n|^{\frac{1}{n}}<\infty. \]

.

Proof: For every \( {n} \), we have \( {M_n<\infty} \), and thus \( {\varphi_P} \) is \( {n} \) times differentiable on \( {\mathbb{R}} \). Moreover \( {\varphi^{(n)}_P} \) is continuous on \( {\mathbb{R}} \) and for every \( {t\in\mathbb{R}} \),

\[ \varphi^{(n)}_P(t)=\int_{\mathbb{R}}\!(ix)^ne^{itx}\,dP(x). \]

In particular, \( {\varphi_P^{(n)}(0)=i^n m_n} \), and the Taylor series of \( {\varphi_P} \) at the origin is determined by the sequence \( {(m_n)} \). Recall that the radius of convergence \( {r} \) of the power series \( {\sum_{n}a_n z^n} \) associated to the sequence of complex numbers \( {(a_n)} \) is given by the Hadamard formula

\[ r^{-1}=\varlimsup_n |a_n|^{\frac{1}{n}}, \]

and consequently, 1\( {\Leftrightarrow} \)2 (just take \( {a_n=i^n m_n/n!} \)). In the other hand, for any \( {n\in\mathbb{N}} \) and any \( {s,t\in\mathbb{R}} \), we have

\[ e^{isx} \left(e^{itx}-1-\frac{itx}{1!}-\cdots-\frac{(itx)^{n-1}}{(n-1)!}\right) \leq \frac{|tx|^n}{n!}, \]

see for instance p. 512 and 514 in Feller, and thus, for any \( {n\in\mathbb{N}} \) and any \( {s,t\in\mathbb{R}} \),

\[ \left(\varphi_P(s+t)-\varphi_P(s)-\frac{t}{1!}\varphi_P'(s)-\cdots-\frac{t^{n-1}}{(n-1)!}\varphi^{(n-1)}_P(s)\right) \leq m_n \frac{|t|^n}{n!}, \]

which implies 1 \( {\Leftrightarrow} \) 2. By the Stirling formula, if \( {\varlimsup_n \frac{1}{n}|m_n|^{\frac{1}{n}}<\infty} \) then condition 3 holds true. If \( {P} \) is compactly supported, then \( {\sup_n |m_n| <\infty} \) and thus condition 3 holds true. Suppose now that conditions 13 hold true. From condition 2, the analytic continuation principle states that \( {\varphi_P} \) admits a maximal simply connected analytic continuation to a neighborhood of \( {\mathbb{R}} \) in \( {\mathbb{C}} \), which is thus holomorphic. Next, the sequence of moments \( {(m_n)} \) uniquely characterizes the Taylor series at the origin, and thus uniquely characterizes the analytic continuation of \( {\varphi_P} \) by virtue of the isolated zeros theorem. In particular, the sequence of moments characterizes the function \( {\varphi_P} \) on \( {\mathbb{R}} \), and thus \( {P} \) by virtue of the the Cramér-Wold theorem. ☐

It turns out that a probability distribution on \( {\mathbb{R}} \) can be characterized by its moments without having an analytic Fourier transform. Actually, in view of the moments problem, the main useful property here regarding analycity is that an analytic function on \( {\mathbb{R}} \) is uniquely determined by its value and the values of all its derivatives at the origin. Quasi-analytic functions have this property. These functions where introduced by Borel and Hadamard, and where later brilliantly studied by Denjoy and Carleman, see for instance the memoir of Carleman, or chapter 19 in Rudin and section 4.2 in Bélisle, Massé, and Ransford. The Carleman condition appearing below is strictly weaker than the Hadamard condition.

For any sequence of positive real numbers \( {(c_n)} \) and any bounded interval \( {[a,b]\subset\mathbb{R}} \), we denote by \( {\mathcal{C}([a,b],(c_n))} \) the class of infinitely differentiable functions \( {f:[a,b]\subset\mathbb{R}\rightarrow\mathbb{C}} \) such that

\[ \sup_{[a,b]}|f^{(n)}|\leq r^n c_n \]

for any \( {n\in\mathbb{N}} \) and for some positive real constant \( {r} \) which may depend on \( {f} \). The Hadamard problem consists in finding conditions on \( {(c_n)} \) such that any couple of functions \( {f} \) and \( {g} \) in \( {\mathcal{C}([a,b],(c_n))} \) that are equal together with all their derivatives at some fixed point of \( {[a,b]} \) are equal on the whole interval \( {[a,b]} \). Such functions are called quasi-analytic. The analytic functions on \( {[a,b]} \) correspond to the class \( {\mathcal{C}([a,b],(n!))} \).

Theorem 4 (Denjoy-Carleman characterization of quasi-analycity) For any sequence of positive real numbers \( {(c_n)} \) and any bounded interval \( {[a,b]\subset\mathbb{R}} \), the class \( {\mathcal{C}([a,b],(c_n))} \) is quasi-analytic if and only if

\[ \sum_{n=1}^\infty \left(\inf_{k\geq n}|c_k|^\frac{1}{k}\right)^{-1}=\infty. \]

Analycity implies quasi-analycity but the converse if false. The Carleman condition is satisfied if the Hadamard condition is satisfied.

Corollary 5 (Carleman condition for the moments problem) Let \( {P} \) be a probability distribution on \( {\mathbb{R}} \) with finite absolute moments \( {(M_n)} \) and moments \( {(m_n)} \). If at least one of the following conditions is satisfied

  1. \( {\sum_{n=1}^\infty {M_{2n}}^{-\frac{1}{2n}}=\infty} \);
  2. \( {\sum_{n=1}^\infty {M_{n}}^{-\frac{1}{n}}=\infty} \);
  3. \( {\sum_{n=1}^\infty |m_{n}|^{-\frac{1}{n}}=\infty} \)

then \( {P} \) is characterized by its moments.

Proof: We have \( {|m_n|\leq M_n} \) for every \( {n\in\mathbb{N}} \). In the other hand, the elementary bound

\[ 2|u|^{2n+1}\leq|u|^{2n}+|u|^{2n+2} \]

valid for every \( {u\in\mathbb{R}} \) and \( {n\in\mathbb{N}} \) implies that

\[ 2M_{2n}^{2n+1}\leq M_{2n}+M_{2n+2} \]

for every \( {n\in\mathbb{N}} \). Consequently, we obtain the following cascading Carleman like conditions:

\[ \sum_{n=1}^\infty {M_{2n}}^{-\frac{1}{2n}}=\infty \quad\Rightarrow\quad \sum_{n=1}^\infty {M_{n}}^{-\frac{1}{n}}=\infty \quad\Rightarrow\quad \sum_{n=1}^\infty|m_{n}|^{-\frac{1}{n}}=\infty. \]

They imply that \( {\varphi_P} \) is quasi-analytic, and that it is characterized by the sequence \( {(m_n)} \) since \( {\varphi_P^{(n)}(t)=(it)^n m_n} \) for every \( {n\in\mathbb{N}} \) and \( {t\in\mathbb{R}} \). The desired result follows then from the Denjoy-Carleman theorem with \( {c_n=|m_n|} \) by using the bound \( {\inf_{k\geq n} c_k\leq c_n} \). ☐

If \( {\varphi_P} \) is analytic on a neighborhood of the origin then the Hadamard condition \( {\varlimsup_n n^{-1}|m_n|^{\frac{1}{n}}<\infty} \) holds true and implies the Carleman condition \( {\sum_{n=1}^\infty |m_n|^{-\frac{1}{n}}=\infty} \).

Let us move now to the multivariate moment problem. We define the sequence of absolute moments \( {(M_n)} \) of a probability distribution \( {P} \) on \( {\mathbb{R}^d} \) with \( {d>1} \) by

\[ M_n=\int_{\mathbb{R}^d}\!\left\Vert x\right\Vert^n\,dP(x)\in[0,\infty] \]

for any \( {n\in\mathbb{N}} \). If \( {P_{\left\Vert\cdot\right\Vert}} \) denotes the image distribution of \( {P} \) by the map \( {x\mapsto\left\Vert x\right\Vert} \), then \( {P_{\left\Vert\cdot\right\Vert}} \) is a probability distribution on \( {\mathbb{R}_+} \) with sequence of moments \( {(M_n)} \). By using Hölder inequality, if \( {M_n<\infty} \) for every \( {n\in\mathbb{N}} \), then for any multi-index \( {k\in\mathbb{N}^d} \), one can define the moment \( {m_k} \) of \( {P} \) by

\[ m_k=m_{k_1,\ldots,k_d}=\int_{\mathbb{R}^d}\!x_1^{k_1}\cdots x_d^{k_d}\,dP(x). \]

We say that \( {P} \) is characterized by its moments if and only if \( {P} \) is the unique probability distribution on \( {\mathbb{R}^d} \) with moments \( {(m_k)} \). Notice that when \( {M_n<\infty} \) for every \( {n\in\mathbb{N}} \), the Fourier transform \( {\varphi_P} \) is infinitely Fréchet differentiable on \( {\mathbb{R}^d} \) and for every \( {t\in\mathbb{R}^d} \) and \( {k\in\mathbb{N}^d} \),

\[ \partial^{k_1}_{t_1}\cdots\partial^{k_d}_{t_d}\varphi_P(t_1,\ldots,t_d)= i^{k_1+\cdots+k_d}t_1^{k_1}\cdots t_d^{k_d} m_k. \]

It is delicate to make use of analycity in dimension strictly bigger than \( {1} \) due to the lack of multidimensional isolated zeros theorem (e.g. Hartog type phenomena). In some sense, the Carleman moments condition turns out to be more flexible. If \( {P} \) is a law on \( {\mathbb{R}^d} \) and \( {X\sim P} \) and \( {x\in\mathbb{R}^d} \) then we denote by \( {P_{\left<x\right>}} \) the law of the real random variable \( {\left<x,X\right>} \).

Theorem 6 (Multidimensional case) Let \( {P} \) be a probability distribution on \( {\mathbb{R}^d} \) with Fourier transform \( {\varphi_P} \) and finite absolute moments \( {(M_n)} \) and moments \( {(m_k)} \). If at least one the following propositions hold true

  1. \( {P_{\left<x\right>}} \) is characterized by its moments for every \( {x\in\mathbb{S}(\mathbb{R}^d)} \);
  2. \( {P} \) satisfies to the Carleman condition

    \[ \sum_{n=1}^\infty \left(M_{n}\right)^{-\frac{1}{n}}=\infty; \]

  3. for every \( {x\in\mathbb{S}(\mathbb{R}^d)} \), the function \( {t\in\mathbb{R}\mapsto\varphi_P(tx)} \) is analytic on \( {\mathbb{R}} \);

then \( {P} \) is characterized by its moments \( {(m_k)} \).

Proof: For every \( {x\in\mathbb{S}(\mathbb{R}^d)} \), the moments of the unidimensional probability distribution \( {P_{\left<x\right>}} \) are uniquely determined by the sequence \( {(m_k)} \) since for every \( {n\in\mathbb{N}} \),

\[ \int_{\mathbb{R}}\!u^n\,dP_{\left<x\right>}(u)=\int_{\mathbb{R}}\!\left<x,y\right>^n\,dP(y) =\sum_{k_1+\cdots+k_d=n}\binom{n}{k_1\cdots k_d} x_1^{k_1}\cdots x_d^{k_d}m_{k_1,\ldots,k_d}. \]

By the Cramér-Wold theorem, 1 \( {\Rightarrow} \) \( {P} \) is characterized by \( {(m_k)} \). 2\( {\Rightarrow} \)1. For every \( {x\in\mathbb{S}(\mathbb{R}^d)} \), the unidimensional probability distribution \( {P_{\left<x\right>}} \) satisfies in turn to the Carleman condition since for every \( {n\in\mathbb{N}} \),

\[ \int_{\mathbb{R}}\!|u|^n\,dP_{\left<x\right>}(u)= \int_{\mathbb{R}^d}\!|\left<x,y\right>|^n\,dP(y) \leq \left\Vert x\right\Vert^{n}\int_{\mathbb{R}^d}\!\left\Vert y\right\Vert^{n}\,dP(y) =M_n, \]

3\( {\Rightarrow} \)1. We have For every \( {x\in\mathbb{S}(\mathbb{R}^d)} \), \( {\varphi_{P_{\left<x\right>}}(t)=\varphi_P(tx)} \) for every \( {t\in\mathbb{R}} \). ☐

1 Comment

Piecewise Deterministic Markov Processes

Vector field

Piecewise Deterministic Markov Processes (PDMP) constitute a very natural class of non-diffusion stochastic processes popularized by Mark H. A. Davis (he is now doing mainly mathematical finance). A PDMP \( {(X_t)_{t\geq0}} \) with state space \( {E} \) is a stochastic process built from three ingredients:

  • Deterministic flow \( {\Phi:E\times\mathbb{R}_+\rightarrow E} \)
  • Delay field \( {\lambda:E\rightarrow\mathbb{R}_+} \)
  • Jump Kernel \( {K:E\times E\rightarrow[0,1]} \)

Starting from \( {X_0=x} \), the process follows the deterministic flow up to the random time \( {T_1} \) such that

\[ \int_0^{T_1}\!\lambda(\Phi(x,s))\,ds=E_1\sim\mathcal{E}(1). \]

Then it jumps to state \( {y} \) with law \( {K(\Phi(x,T_1),\cdot)} \). The same mechanism is then used starting from \( {y} \), etc. This explicit sample paths construction allows to simulate the process. If the deterministic flows have infinitesimal form \( {G} \), then the infinitesimal generator of the process \( {(X_t)_{t\geq0}} \) takes the transport-jump form

\[ (Lf)(x) = (Gf)(x)+\lambda(x)\int\!(f(y)-f(x))K(x,dy). \]

This class of stochastic processes is more general than compound Poisson processes and basic queues, and includes also jump processes over vector fields. It appears in numerous modelling situations, such as in biology (cellular mass), physics (polymers length), computer science (TCP window size), reliability (workload and repairable systems), finance.

Bertrand Cloez will start his PhD (2010-2013) on these subjects. Here is a list of natural questions:

  • Non-explosion \( {T_\infty=\infty} \) a.s. and ergodicity \( {X_t\rightarrow\mu} \) (see e.g. Last and Costa and Dufour)
  • Speed of convergence \( {d(X_t,\mu)\leq\varphi(X_0,t)} \) (see e.g. Fontbona, Guérin, Malrieu)
  • Forward and backward couplings and perfect simulation
  • Long time behavior of additive functionals \( {t^{-1}\int_0^tf(X_s)\,ds} \)
  • Statistical estimation of the ingredients \( {\Phi} \), \( {\lambda} \), \( {K} \)
  • Optimal stopping and control (see e.g. Goreac)
  • Equilibrium regularity by mean of Hörmander type conditions
  • Branching and transport-fragmentation PDEs (see e.g. Perthame)
  • Links with growth-fragmentation (see e.g. Bertoin)
  • Links with genealogical limit theorems (see e.g. Bansaye, Delmas, and Tran)
Leave a Comment

Souvenirs d’un évalué médiocre

AERS logo

Ce texte de Bernard Beauzamy, intitulé Souvenirs d’un évalué médiocre, est paru dans La Recherche 226 (1991) 1432–1433. C’est mon collègue Alain Pajor qui me l’a mis sous les yeux, un jour de grand rangement. Du même auteur, on pourra également lire Souvenirs d’un invité lamentable, 169 (1985) 1100–1101 et Souvenirs d’un mathématicien écologiste, 306 (1998) 117–118. By the same author, but in English, you may also read Real Life Mathematics, Irish Math. Soc. Bulletin 48 (2002) 43–46. Beauzamy presents himself as follows: “I grew up in pure mathematics: after a Ph.D. under the supervision of Laurent Schwartz in 1976, I worked in functional analysis (geometry of Banach spaces, Operator Theory, polynomials). I was appointed as Professor at the University of Lyon (France) in 1979 and, during many years, like most mathematicians, I managed to conciliate research, teaching duties and Ph.D. supervision (altogether, I directed 23 theses). But, in 1995, I decided to leave my Professor position at the University and to start a company, named “Société de Calcul Mathématique, SA” (in short, SCM).

Castigam ridendo mores !

Le métier de mathématicien, qu’on l’exerce bien ou mal, offre matière à de nombreuses évaluations. Chacun de nous est souvent prié de donner son avis sur d’autres, ce qui est plaisant et procure un agréable sentiment d’importance, et les autres de donner leur avis sur nous, ce qui est plus inquiétant.

Un soir, vers 21h, le téléphone sonne. « Salut, c’est Machin. Dis-donc, j’ai trois candidats à classer sur un poste de prof de troisième zone à l’Université d’Auvergne maritime. Est-ce que tu peux m’aider ? Tu peux me dire ce que tu penses de X, Y, et Z ? Ils sont en Géométrie des Banach. C’est bien ta specialité, non ? »

Ainsi mis en cause, je peux difficilement m’esquiver. Je pourrais arguer que j’ai quitté cette spécialité en 1980, que de nouvelles têtes ont pu apparaître (c’est peu probable), des résultats nouveaux être démontrés (c’est presque impossible), mais c’est inutile : mon interlocuteur veut un avis.

Le choix parait délicat. X et Z ont à peu prés mon âge, et Y est un peu plus jeune et a été mon élève ; j’ai vu le nom de X associé à quelques publications, que je n’ai évidemment pas lues, et P., de l’Académie des Sciences de Pologne, m’a dit beaucoup de bien de lui lorsqu’il est venu dîner chez moi ; il est vrai que X est son élève.

Vaincu, j’explique que X a une bonne réputation scientifique et une grande originalité de pensée, qu’il travaille “dans les méthodes volumiques et probabilistes dans les espaces de dimension finie”, précision qui comble d’aise mon correspondant et lui montre qu’il est tombé sur le véritable spécialiste, froid et objectif, dont il avait besoin. J’omets d’ajouter que si j’ai moi-même quitté la Géométrie des Espaces de Banach, c’est précisément parce qu’elle s’orientait dans cette direction, que je juge oiseuse et artificielle. Il ne faut pas tout mélanger.

Qu’importent, du reste, ces pauvres considérations ? Ni X, ni Y, ni Z n’auront le poste. Parmi Les candidats, il y en a un qui représente les Équations aux Derivées Partielles, et qui donc bénéficiera de l’appui de ce puissant groupe d’influence.

La semaine passée, j’ai reçu un article sur lequel on me priait de donner mon avis. Était-il digne de publication dans le prestigieux Journal of Functional Analysis ? J’étais bien entendu libre de mon opinion, mais l’éditeur joignait une longue lettre, dans laquelle il expliquait que le journal avait beaucoup d’articles en attente, qu’il fallait être strict quant au niveau, que cet auteur avait déjà publié un article sur ce sujet (article qui était joint, ainsi que le rapport écrit à son propos). Bref on sentait que, s’il l’avait osé, il aurait dessiné une petite case, et écrit : « Si Vous voulez que l’article soit refusé, mettez une croix dans la case. Sinon, faites un rapport ».

Mes propres articles n’échappent pas au processus. Il y a deux ou trois ans, j’avais adressé un manuscrit à une revue suédoise, Acta Mathematica. L’éditeur de l’époque, Lars Hörmander, m’a répondu fort aimablement qu’il regrettait de ne pouvoir le publier, parce que la revue avait accepté un autre article de théorie des opérateurs l’année précédente. J’ai répondu, presqu’aussi aimablement, que Acta Mathematica publiait à longueur d’année des résultats sur les fonctions analytiques, et ne se sentait pas, en ce domaine, tenu a des quotas. Par ailleurs, ajouté-je, je n’étais nullement pressé : il pouvait différer la publication à l’année suivante. L’humanité, en effet, avait attendu pendant 500 000 ans mes résultats sur les orbites des opérateurs, et pouvait probablement attendre une année de plus. Elle ne témoignait du reste aucune impatience.

À l’inverse, il y a des referree très rapides. Je me souviens avoir envoyé à une revue polonaise un article qui était peut-être un peu technique, mais certainement très intéressant. Moins d’un mois après, je reçois un petit mot de l’éditeur : « cher Prof. Beauzamy, dans votre article, en p. 1, vous devriez écrire deg P plutôt que d° P ». Je réponds suavement : « cher Prof. P., je vous remercie beaucoup pour votre remarque j’attendrai le rapport du referree pour faire l’ensemble des modifications qu’il demandera; j’y inclurai celle-ci ». On me répond aussitôt : « C’était le rapport du referree ». J’ai compris que je n’avais plus guère de lecteurs, et qu’il était temps de changer de sujet.

Le choix du sujet de travail est un art difficile, non point du fait de la difficulté intrinsèque des problèmes qui s’y posent, mais en fonction de l’attitude de la communauté mathématique. Si le sujet est difficile et technique, vous en serez l’unique spécialiste, on vous laissera en paix mais on vous isolera d’un coup de « c’est bien beau, mais a quoi cela peut-il servir ? », et si le sujet est simple et utilisable, on le considérera comme évident et on le méprisera. On a le choix entre l’isolement et le mépris, étant entendu que certains individus particulièrement doués parviennent a obtenir les deux.

Il y a quelques années, j’ai lu dans le Mathematical Intelligencer une interview de Sir Michael Atiyah, dans lequel il déclarait sans précautions excessives que certains théorèmes sur les séries de Fourier, quoique bien difficiles, étaient d’une faible utilité. J’étais en Suède à l’époque, et Lennart Carleson n’était pas très content. Il devait cependant avoir quelques amis puisque, peu de temps après, l’Union Mathématique Internationale lui a décerné une médaille pour l’importance et les conséquences de ses travaux sur les dites séries. Comme dit un proverbe tibétain : « Autant de moines, autant de religions ».

Chez Koestler ou chez Sartre, on voit des militants sacrifiés à leur engagement, lorsque le parti change de politique. Il en va de même chez nous : tel domaine, qui était considéré comme noble à l’époque où tel mandarin était au faîte de sa gloire, est soudain méprisé lorsqu’il quitte la scène ; ses élèves sont frappés d’ostracisme. Le domaine revient-il à la mode, porté sur les vagues de l’informatique ? Il se crée de nouveaux spécialistes ; les précédents restent enterrés. Une bonne réputation est difficile à acquérir, une mauvaise difficile à perdre.

Invité-je chez moi un mathematicien roumain ? Je ne puis échapper à une classification complète, linéaire, de tous les mathématiciens roumains, y compris les émigrés, les élèves et leurs descendants. Reçois-je un indien ? Il ne manquera pas de m’expliquer que l’équipe du Tata Institute est la plus forte, mais qu’ils ont un peu baissé ces derniers temps. Israël jouit d’une place enviable, même parmi les petits pays à fort potentiel scientifique. Si nous déjeunons en compagnie d’un de leurs ressortissants dans l’un de ces charmants petits restaurants qui fleurissent aux alentours de Jussieu, nous aurons à débattre de l’épineuse question : « à qui, de X ou de Y, convenait-il d’accorder la chaire vacante à Jerusalem ? » En Suède, on discutera sans doute autour de moi d’une question semblable, en ajoutant cette petite note de délicatesse : nul ne se soucie vraiment de mon opinion.

Il est difficile de vivre en toute sérénité dans une atmosphère où l’évaluation est partout présente. Une équipe d’analyse fonctionnelle, célèbre par la haute qualité de ses résultats, était renommée pour son exigence et son sens aigu de la distinction des élites. Pour trouver grâce aux yeux de ses directeurs, il fallait non seulement discerner presque instantanément quelque merveilleuse propriété du troisième dual de l’espace de Tzirelson, mais encore être capable de démontrer que cette propriété était la meilleure possible, que tous les espaces qui la possédaient étaient peu ou prou isomorphes à ce troisième dual, sauf un qui l’était à son carré. En échange de ces menus travaux, les directeurs offraient leur considération, à titre temporaire – il faut être prudent. Lorsque l’informatique arriva, il ne se trouva bientôt plus personne pour se livrer à d’aussi grandioses méditations.

L’évaluation des travaux de chacun est chose nécessaire, dans des situations précises : promotions, candidatures, publications, etc ; je ne fais nullement l’apologie d’un égalitarisme que je réprouve. Mais une évaluation permanente, indiscrète, larvée, devient insupportable. Je n’ai ni besoin ni envie d’apprendre de M. que X. n’est pas aussi bon mathématicien que Y. voulait me le faire croire la semaine d’avant ; et je sais pertinemment que M., X. et Y. s’accorderont à trouver que dans mon dernier article le $latex \varepsilon$ n’a pas été découpé avec toute la virtuosité requise.

L’évaluation des institutions aussi est chose nécessaire. Il est souhaitable, pour juger de l’attribution des crédits, des postes, des subventions, des équipements, d’avoir une idée aussi juste que possible de la qualité de production scientifique des départements de recherche ou des laboratoires. Nous subissons donc des évaluations de toute nature, y compris celles des barbus syndiqués, émissaires obligés du C.N.R.S. Mais où sont les crédits, les postes, les subventions et les équipements ? Nous voulons bien rendre des comptes, payer a posteriori le prix de la liberté et de l’indépendance. Mais où sont la liberté et l’indépendance ?

Sans doute pouvons-nous en rire. Je conserve pieusement un lourd dossier où je serre les évaluations médiocres dont j’ai été l’objet : celles où l’on me dit que je ne conviens pas à tel emploi, où l’on affirme que je ne mérite pas telle promotion, où l’on assure que je n’ai aucun droit à tel équipement. Et encore ne sont-ce là que celles qui m’ont été communiquées : les autres sont pires. Mais sur les jeunes, l’effet dissuasif est très fort : lorsqu’on commence la recherche, on n’a jamais la certitude d’y réussir. Et si l’on n’est pas un chercheur de tout premier niveau, on ne bénéficiera d’aucun appui de la part de la communauté mathématique.

Je me souviens du passage à la télévision de l’un de ces pontes, qui représentent ce que l’élite a de plus arrogant et de plus prétentieux. Interrogé sur un livre qu’il venait d’écrire, et qu’il avait modestement intitulé « L’honneur de l’esprit humain », il déclarait avec simplicité que, chaque année, cinq chercheurs tout au plus faisaient réellement progresser la science.

Stupides et dangereuses idées d’une espèce déclinante ! Nous avons besoin, à tous les niveaux, de davantage de mathématiciens, y compris bien sûr de mathématiciens médiocres. Je regrette même de n’être pas plus médiocre que je ne suis, pour donner davantage de poids à mon propos !

Pendant que nous jaugeons, estimons, soupesons nos étudiants, décourageant ceux qui voudraient nous rejoindre et renvoyant ceux qui l’ont déjà fait, qui enseigne les mathématiques dans les départements de chimie, d’économie, de physique, dans les écoles de commerce, les conservatoires, les instituts ? Pas des universitaires, pas les gens sur-qualifies que nous formons et à qui nous n’avons rien a offrir. Ce sont des chimistes, des économistes, des physiciens, des anciens élèves d’une vague école de commerce ou d’ingénieurs ; ils auront des qualifications bien moindres et des salaires plus élevés.

Dans un siècle où les mathématiques jouent un rôle de plus en plus important, alors que nous jouissons d’une place de tout premier plan sur la scène scientifique internationale, nous avons réussi ce tour de force, que je crois unique dans les annales de l’Histoire, que de disparaître à peu près complètement de la scène sociale. Nous ne représentons plus rien. D’autres que nous prennent les décisions qui nous concernent ; nous les avons laissés faire. On en arrive même à se demander, ici et là dans la presse, s’il ne faut pas revoir l’importance des mathématiques dans l’enseignement. Peut-être est-il temps de se soucier de notre propre survie ? Laissons la conclusion à Baudelaire :

Des quais froids de la Seine aux bords brillants du Gange,

Le troupeau mortel saute et se pâme, sans voir

Dans un trou du plafond, la trompette de l’Ange,

Sinistrement béante, ainsi qu’un tromblon noir.

Leave a Comment

Éternelle humanité…

Charles Hermite photoThomas Stieltjes photo

Lettre d’Hermite à Stieltjes du 11 mars 1887. Vous avez le don précieux de la clarté, aussi je comprends sans efforts tout ce que vous faites , tandis que j’ai beaucoup de peine à lire les mémoires excellents d’ailleurs de Poincaré et d’autres.

Lettre d’Hermite à Stieltjes du 15 mai 1889. “J’ai reçu de l’Université de Stockholm la demande officielle de faire connaître mon opinion sur les travaux scientifiques de Madame Kowalewski et les titres que ces travaux peuvent lui donner d’être engagée définitivement et pour toute sa vie comme professeur ordinaire à l’Université. Les mémoires de Mme Kowalewski étant écrits en allemand, sauf celui qui a été couronné récemment par l’Académie des Sciences, je viens vous demander de me sortir d’anxiété, de me tirer d’un extrême embarras pour répondre à ce qu’on me demande. Madame Kowalewski mérite autant d’estime pour sa modestie, la dignité et l’élévation de son caractère que pour son merveilleux talent d’Analyste ; Mr Mittag-Leffler m’a fait savoir cependant que le grand retentissement du prix de l’Académie des Sciences a provoqué chez plusieurs personnes un sentiment d’envie et de jalousie contre lequel il est nécessaire de la défendre, et j’ai recours à vous pour me donner le moyen de remplir cette tâche. Il y a urgence, il faudrait que le rapport demandé soit envoyé à Stockholm avant le 24 mai ; voudriez-vous donc me fournir l’indication que vous jugeriez digne d’être signalée à l’attention des Géomètres, dans les travaux suivants : [[…]] Étendez-vous sur ceux de ces mémoires qui vous auront le plus intéressé, en ne me donnant que quelques mots sur les autres, je me chargerai du mémoire sur la rotation. Vous voyez, mon cher ami, que, au-dessus de l’intérêt mathématique, il s’agit d’une situation singulière, douloureuse et brillante, en même temps, d’une femme professeur dans une Université !”

Lettre de Stieltjes à Hermite du 16 mai 1889. Je ne vous dissimulerai pas que votre demande relative aux mémoires de Mme Kowalewski me cause quelque embarras, mais comme je vois qu’il y a urgence, je ferai de mon mieux, et je tâcherai de ne point dire des sottises (il est bien entendu que je ne me pose pas en juge compétent). Je vous avouerai aussi qu’en général il me répugne un peu de juger les travaux d’autrui et le même sentiment me fait prendre en horreur les examens. Il est bien lamentable qu’il soit nécessaire de prendre la défense de Mme Kowalewski et cela fait peu d’honneur aux Suédois. Je vous avertis d’avance que je pourrai dire à peine quelque chose des mémoires dans les tomes 4 et 6 des Acta. Je connais à peu près bien le premier (sur la réduction des intégrales abéliennes) où le sujet est exposé d’une manière très lucide, mais je sais que ce sujet a été l’objet de beaucoup d’autres travaux, et ceux-là je ne les connais pas du tout. Comme Mr Picard est parmi les auteurs qui ont approfondi le plus ce sujet, je me permets de le nomner ici. En tout cas moi je ne pourrai pas vous dire beaucoup sur ce mémoire et je m’attacherai surtout aux mémoires dans les Astr. Nachrichten et dans le Journal de Crelle tome 80.

Lettre d’Hermite à Stieltjes du 7 avril 1890. Mr Jordan, qui ne cite jamais à moins d’une faveur particulière, ne mentionne ni Mr Pochhammer ni mes leçons qu’il a eues certainement sous les yeux, car sa méthode est au fond la mienne, présentée sous une forme plus générale. J’ai aussi fait, le premier, dans ces leçons (Résumé du Cours d’Analyse, École Impériale Polytechnique, 1868-1869, p. 2-8) une étude spéciale de l’intégrale $latex \int_a^b\! f'(x)dx/(1+f^2(x))$ et il me la prend sans prévenir (C. Jordan, Cours d’analyse de l’École polytechnique, volume II, Paris, 1883, p. 64-66), mais je m’en soucie fort peu. Darboux, qui a été pillé avec grand profit, n’est pas absolument content ; ni lui ni moi ne nous plaindrons, Mr Jordan au fond est un excellent homme et son 3ème volume (1887) m’a rendu les plus grands services, de sorte qu’il convient de passer légèrement sur le défaut des citations.

Lettre d’Hermite à Stieltjes du 17 janvier 1891. Pour moi, j’ai donné bien des sujets de thèse, mais personne ne m’a jamais fait un bout de calcul et à l’avenir, comme par le passé, je ne dois compter que sur moi seul.

Lettre d’Hermite à Stieltjes du 10 mai 1892.Peut-être vous intéressera-t-il d’apprendre que la Section de Géométrie a décidé de proposer à l’Académie M. Sophus Lie, comme successeur de Kronecker, à la place de membre correspondant. J’ai quelque regret qu’on ait repoussé Fuchs ou Lipschitz, dont j’ai pris la défense, mais sans pouvoir insister.

Lettre de Stieltjes à Hermite du 19 septembre 1892.Ce cours autographié (de Felix Klein) est bien curieux, l’auteur semble vouloir donner un compte rendu juste et impartial de la découverte des fonctions fuchsiennes et il arrive facilement à s’en attribuer la plus grande part, sans se douter, à ce qu’il paraît, qu’il était bien la personne la moins désignée pour écrire cette histoire d’une manière impartiale. M. Klein est certainement un géomètre d’un grand talent qui est bien au-dessus de mes éloges, et il reconnaît clairement le mérite de ses propres travaux. Je n’y vois pas de mal et je veux bien que ce ne soit que de la clairvoyance. Mais il me paraît que cette clairvoyance lui manque trop facilement dès qu’il parle des travaux des autres. Du reste ce cours autographié n’est pas dans le commerce et n’a pas ainsi été publié franchement.

Lettre d’Hermite à Stieltjes du 27 septembre 1892. Ce que vous me dites de Mr Klein concorde absolument avec l’opinion qu’on a de lui [[ … ]] ; mais comme il trouve le moyen de produire grâce à des collaborateurs !”.

Source : Extraits de Partie inédite de la correspondance d’Hermite avec Stieltjes, Cahier du séminaire d’histoire des mathématiques, tome 4 (1983), p. 75-87. Les références se rapportent aux pages de la Correspondance d’Hermite et de Stieltjes, Paris, Gauthier-Villars (1905). “En décembre 1970, Madame Jean Willey, fille d’Émile Picard et petite-fille de Charles Hermite, a permis de consulter les papiers d’Hermite qui se trouvaient à cette époque chez elle. Parmi ceux-ci figurait la partie inédite de la correspondance d’Hermite avec Stieltjes, recopiée probablement pour Émile Picard par les éditeurs de la correspondance B. Baillaud et H. Bourget. Depuis cette époque, elle a été confiée aux Archives de l’Académie des Sciences de Paris.” On rapporte cette réflexion d’Hermite à son gendre Émile Picard durant un repas de famille : “pendant que vous alliez au congrès  ́écouter les théorèmes des autres,  moi j’en démontrais”.

Leave a Comment