Convexité...3. Fonctions convexes de plusieurs variables. C. Inégalités de convexité ....

26
Convexité A. Ensembles convexes . 1. Propriétés affines. 2. Propriétés géométriques. B. Fonctions convexes . 1. Propriétés générales. 2. Fonctions convexes d’une variable réelle. 3. Fonctions convexes de plusieurs variables. C. Inégalités de convexité . Pierre-Jean Hormière ___________ La notion de convexité remonte à Archimède ; celui-ci remarque que le centre de gravité d’un corps convexe est situé à l’intérieur de ce dernier, et qu’un convexe inclus dans un autre a un périmètre plus petit. Mais il fallut attendre Fourier, Poinsot et Cauchy pour que cette notion refasse surface. Développée par Minkowski, Jensen et Aleksandrov, la convexité, étude des ensembles et des fonctions convexes, constitue une branche de la géométrie et de l’analyse qui unifie des phénomènes à première vue totalement dissemblables, et intervient à divers niveaux dans des branches très variées des mathématiques : géométrie affine, inégalités intervenant en analyse classique, théorie des nombres, problèmes combinatoires relatifs aux polyèdres, théorie des graphes, espaces normés et analyse fonctionnelle, programmation linéaire et programmation convexe, théorie des jeux, économie mathématique... A. Ensembles convexes . 1. Propriétés affines . Dans ce §, E désigne un espace affine réel, E l’espace vectoriel associé. S’ils sont de dimension finie, ils seront alors automatiquement munis de leur topologie naturelle, définie par une quelconque des normes de E. Dans le cas général, si l’on munit E d’une norme x ||x|| , E est alors aussitôt muni de la distance d(x, y) = || y - x || associée. 1.1. Définitions, premières propriétés . Définition 1 : Un ensemble A inclus dans E est dit convexe si 2200(x, y) A 2 [x, y] A, autrement dit si 2200(x, y) A 2 2200λ [0, 1] λ.x + (1).y A. Géométriquement, A est convexe ssi A est stable par chacune des homothéties hom(x, λ), où x décrit A et λ décrit [0, 1]. Définition 2 : Si (x 1 , ..., x p ) est un p-uplet de points de A, on appelle combinaison convexe des x i tout x Erreur ! Signet non défini.E tel que x = = p i i i x 1 . λ , où λ 1 , ... ,λ p sont 0 et de somme 1, autrement dit tout barycentre des x i affecté de masses positives et non toutes nulles. Notons pour simplifier Σ p = { (λ 1 , ... , λ p ) R + p ; = p i i 1 λ = 1 }. Dessiner Σ p pour p {1, 2, 3, 4}.

Transcript of Convexité...3. Fonctions convexes de plusieurs variables. C. Inégalités de convexité ....

  • Convexité

    A. Ensembles convexes.

    1. Propriétés affines.

    2. Propriétés géométriques.

    B. Fonctions convexes.

    1. Propriétés générales.

    2. Fonctions convexes d’une variable réelle.

    3. Fonctions convexes de plusieurs variables.

    C. Inégalités de convexité.

    Pierre-Jean Hormière

    ___________

    La notion de convexité remonte à Archimède ; celui-ci remarque que le centre de gravité d’un corps convexe est situé à l’intérieur de ce dernier, et qu’un convexe inclus dans un autre a un périmètre plus petit. Mais il fallut attendre Fourier, Poinsot et Cauchy pour que cette notion refasse surface. Développée par Minkowski, Jensen et Aleksandrov, la convexité, étude des ensembles et des fonctions convexes, constitue une branche de la géométrie et de l’analyse qui unifie des phénomènes à première vue totalement dissemblables, et intervient à divers niveaux dans des branches très variées des mathématiques : géométrie affine, inégalités intervenant en analyse classique, théorie des nombres, problèmes combinatoires relatifs aux polyèdres, théorie des graphes, espaces normés et analyse fonctionnelle, programmation linéaire et programmation convexe, théorie des jeux, économie mathématique...

    A. Ensembles convexes. 1. Propriétés affines. Dans ce §, EEEE désigne un espace affine réel, E l’espace vectoriel associé. S’ils sont de dimension finie, ils seront alors automatiquement munis de leur topologie naturelle, définie par une quelconque des normes de E. Dans le cas général, si l’on munit E d’une norme x → ||x|| , EEEE est alors aussitôt muni de la distance d(x, y) = || y − x || associée. 1.1. Définitions, premières propriétés.

    Définition 1 : Un ensemble A inclus dans E est dit convexe si ∀(x, y) ∈ A2 [x, y] ⊂ A, autrement dit si ∀(x, y) ∈ A2 ∀λ ∈ [0, 1] λ.x + (1−λ).y ∈ A. Géométriquement, A est convexe ssi A est stable par chacune des homothéties hom(x, λ), où x décrit A et λ décrit [0, 1].

    Définition 2 : Si (x1, ..., xp) est un p-uplet de points de A, on appelle combinaison convexe des xi

    tout x ∈ Erreur ! Signet non défini.EEEE tel que x = ∑=

    p

    iii x

    1

    .λ , où λ1, ... ,λp sont ≥ 0 et de somme 1,

    autrement dit tout barycentre des xi affecté de masses positives et non toutes nulles.

    Notons pour simplifier Σp = { (λ1, ... , λp) ∈ R+p ; ∑=

    p

    ii

    1

    λ = 1 }. Dessiner Σp pour p ∈ {1, 2, 3, 4}.

  • 2

    Proposition 1 : Si A est convexe, toute combinaison convexe de points de A appartient à A.

    Proposition 2 : L’intersection d’une famille quelconque de parties convexes est une partie convexe.

    Définition 3 : Étant donnée une partie X de EEEE, on appelle enveloppe convexe1 de X l’intersection de tous les ensembles convexes contenant X. On la note co(X) ; c’est la plus petite partie convexe de EEEEcontenant X.

    Proposition 4 : co(X) est l’ensemble des combinaisons convexes de toutes les familles finies de points de X.

    Définition 4 : La dimension du convexe A est la dimension du sous-espace affine qu’il engendre.

    Si l’on choisit un point a ∈ A, alors dim A est le rang de la famille de vecteurs ax = x − a ∈ E, lorsque x décrit A ; ce rang est indépendant de a.

    Proposition 5 : Soient E E E E et FFFF deux espaces affines, f une application affine EEEE → FFFF. L’image par f d’un convexe de EEEE et l’image réciproque par f d’un convexe de FFFF sont des ensembles convexes. 1.2. Exemples d’ensembles convexes.

    1) Si EEEE est une droite affine, les parties convexes de EEEE sont les intervalles en tous genres.

    2) Tout sous-espace affine de EEEE est une partie convexe. Si u est une forme affine sur EEEE, les demi-espaces { x ∈ EEEE ; u(x) ≥ α } et { x ∈ EEEE ; u(x) > α } sont des convexes. Lorsque E est de dimension finie, u est continue et ces espaces sont resp. fermés et ouverts ; ce résultat reste vrai plus généralement si E est normé, et si u est continue.

    Définition 5 : On appelle polyèdre convexe une partie qui est intersection finie de demi-espaces fermés, et polytope un polyèdre convexe compact d’intérieur non vide.

    Cette dernière définition suppose EEEE muni de la distance associée à une norme sur E. (Un théorème de Riesz implique qu’en dimension infinie un compact est toujours d’intérieur vide, de sorte que les polytopes n’existent qu’en dimension finie.)

    3) Simplexes de Rp.

    Il s’agit des ensembles Σp = {(λ1, ..., λp)∈ R+p ; ∑=

    p

    ii

    1

    λ = 1} et ∆p = {(λ1, ... , λp)∈ R+p ; ∑=

    p

    ii

    1

    λ ≤ 1}.

    Σp est l’enveloppe convexe des vecteurs ei de la base canonique, ∆p est celle des ei et de O. Ils sont de dimensions resp. p − 1 et p. Quel lien y-a-t-il entre ∆p et Σp+1 ?

    4) Boules. Soit || || une norme sur E, d(x, y) = || y − x || la distance associée sur E. Alors les boules B(a, r) et B'(a, r) sont des ensembles convexes dans E.

    5) Matrices stochastiques.

    Exercice 1 : La matrice A = (aij ) ∈ Mn(R) est stochastique si les aij ≥ 0 et si (∀i) ∑=

    n

    jija

    1

    = 1.

    1) Montrer que l’ensemble Sn des matrices stochastiques d’ordre n est un convexe compact, stable pour la multiplication. Quelle est sa dimension? 2) Une matrice stochastique est dite 0-1 si ses éléments sont tous égaux à 0 ou 1 ; montrer que les matrices stochastiques 0-1 sont les points extrêmaux de Sn. Montrer qu’ils forment une partie stable pour la multiplication, et indiquer un algorithme décomposant une matrice stochastique comme combi-naison convexe des points extrémaux. Étudier le cas n = 2. 3) Soit A une matrice stochastique ; montrer que 1 ∈ Sp A ⊂ { z ∈ C ; |z| ≤ 1 }.

    6) Cônes convexes.

    1 En anglais, convex hull.

  • 3

    Définition 6 : On appelle cône de sommet O toute partie C de E telle que (∀x∈C) (∀λ > 0) λ.x∈ C. Du coup, C est un cône convexe ssi ∀(x, y) ∈ C2 (∀λ > 0) λ.x ∈ C et x + y ∈ C. Exemples de cônes convexes :

    1) Si a1, ..., ap sont p vecteurs de E , {∑=

    p

    iii a

    1

    .λ ; (λ1, ... ,λp) ∈ R+p } est un cône convexe, et c’est

    le plus petit cône convexe contenant les ak. Généraliser à une partie quelconque de E. 2) Les semi-normes, les normes sur E forment des cônes convexes ; les produits scalaires sur E également. 3) Les matrices Mn(R+) à éléments ≥ 0 forment un cône convexe fermé stable par produit. 4) Les matrices symétriques positives, i.e. telles que tx.A.x ≥ 0 (∀x ∈ Rn) forment un cône convexe fermé Sn+(R) dans l’espace vectoriel Sn(R) des matrices symétriques réelles ; les matrices symétriques définies positives forment un cône convexe ouvert Sn++(R) ; c’est l’intérieur du précédent. Résultats analogues pour les matrices hermitiennes complexes.

    Exercice 2 : Soit C un cône convexe contenant 0 (on dit : pointé). 1) Montrer que le sous-espace vectoriel qu’il engendre est C + (–C), noté aussi C − C ; 2) Montrer que C ∩ (−C) est le plus grand sous-espace vectoriel contenu dans C. On dit que C est saillant si C ∩ (−C) = {0}.

    Exercice 3 : Espaces vectoriels ordonnés.

    Une relation d’ordre ≤ sur E est dite compatible avec la structure vectorielle si elle vérifie : ∀(x, y, z) ∈ E3 ∀λ ≥ 0 x ≤ y ⇒ x + z ≤ y + z et λ.x ≤ λ.y. Un espace vectoriel muni d’une telle relation est appelé espace vectoriel ordonné. 1) Montrer que si E est un espace vectoriel ordonné, P = {x ∈ E ; x ≥ 0} est un cône convexe pointé saillant. 2) Réciproquement, soit P un cône convexe pointé saillant ; montrer qu’il existe une unique relation d’ordre compatible avec la structure vectorielle telle que P soit l’ensemble des vecteurs positifs. 3) Comment se traduit sur P le fait que ≤ soit un ordre total ? 1.3. Deux résultats classiques.

    Théorème de Gauss-Lucas : Soit P ∈ C[X] un polynôme complexe de degré n ≥ 1. Les racines de P' appartiennent à l’enveloppe convexe de l’ensemble des racines de P.

    Preuve : Factorisons P dans C[X] : P(z) = a∏=

    −r

    i

    mi

    izz1

    )( , où Z(P) = { z1, ..., zr } est l’ensemble des

    zéros de P. Les zi d’ordre mi ≥ 2 sont racines de P', d’ordre mi − 1.

    Les autres racines de P' vérifient : 0 = )()'(

    zPzP

    = ∑= −

    r

    i i

    i

    zzm

    1

    (dérivée logarithmique d’un produit).

    Cela équivaut à : 0 =∑=

    r

    i 1 ²ii

    zzm−

    .(z − zi) . Bref, c’est une égalité de la forme : 0 = ∑=

    r

    iii MM

    1

    .α ,

    où les αi sont > 0, Mi est le point d’affixe zi et M celui d’affixe z. On conclut aussitôt.

    Remarque : Lorsque P est réel et scindé dans R, on peut conclure par Rolle. Si l’on ordonne les racines de sorte que z1 < ... < zr , Rolle fait apparaître une racine de P' entre les zi, soit r− 1 en tout, à quoi il faut ajouter les racines multiples de P : le compte est bon.

    ¶ Exercice 4 : 1) Soit P ∈ C[X], admettant deux racines réelles distinctes et tel que P’’ divise P. Montrer que P est simplement scindé, puis que les racines de P sont réelles. 2) Trouver tous les polynômes P ∈ C[X] tels que P’’ divise P.

  • 4

    Exercice 5 : Soit P ∈ C[X] de degré 3, de racines a, b et c. Montrer que les racines de P’ sont des points intérieurs et isogonaux dans le triangle abc.

    Théorème de Caratheodory 2 : Soit EEEE un espace affine de dimension n, X une partie de EEEE. Alors co(X) est l’ensemble des combinaisons convexes des (n + 1)-uplets de points de X.

    Preuve : L’idée consiste à montrer que si x ∈ co(X) est combinaison convexe de r points de X, avec r > n+1, alors x est combinaison convexe de r−1 points de X. En réïtérant cet argument il finira par être combinaison convexe de n + 1 points.

    Soit donc x = ir

    ii x.

    1∑

    =λ , où r > n + 1, les λi sont > 0, et ∑

    =

    r

    ii

    1

    λ = 1.

    Les xi sont affinement dépendants, en ce sens que ∃(β1, ..., βr) ≠ (0, ..., 0) ir

    ii x.

    1∑

    =β = 0 et ∑

    =

    r

    ii

    1

    β = 0.

    (considérer les vecteurs 21xx , ..., rxx1 ). On en déduit : (∀θ ∈ R) x = iir

    ii x)...(

    1

    βθλ +∑=

    .

    On a bien sûr )..(1

    i

    r

    ii βθλ +∑

    == 1, et l’on peut s’arranger pour que les λi + θ.βi soient tous ≥ 0 : il

    suffit de choisir max{ −i

    i

    βλ

    ; βi < 0} ≤ θ ≤ min{ −i

    i

    βλ

    ; βi > 0} , et si l’on prend pour θ l’une des

    valeurs extrêmes, l’un des coefficients est nul.

    Corollaire : Sous les mêmes hypothèses, si X est compacte, co(X) l’est aussi. Exercice 6 : Somme de Minkowski.

    1) Si A et B sont deux convexes, pour tous réels α et β ≥ 0 de somme 1, α.A + β.B est convexe. 2) Dessiner α.A + β.B lorsque A et B sont des plaques triangulaires dans le plan, etc.

    Exercice 7 : Lemme de Kakutani.

    Soient C1 et C2 deux convexes non vides de EEEE, tels que C1 ∪ C2 ≠ EEEE, et x ∉ C1 ∪ C2. On note Γi = co(Ci ∪ {x}). Montrer que l’un au moins des ensembles Γ1 ∩ C2 et Γ2 ∩ C1 est vide.

    2. Propriétés géométriques. Les convexes possèdent de nombreuses propriétés géométriques, qu’il n’est pas question de citer toutes. Dans ce § nous supposerons E muni d’une norme. 2.1. Propriétés topologiques des convexes.

    Exercice 1 : convexité et milieux.

    1) Soit C une partie de E vérifiant (x, y) ∈ C2 ⇒ 2

    yx+ ∈ C. C est-elle convexe ?

    2) Montrer qu’il en est ainsi lorsque E est un evn, et C est fermée.

    Exercice 2 : généralités.

    1) Montrer que si C est convexe, il en est de même de son adhérence C . En déduire que l’adhérence de l’enveloppe convexe de X est le plus petit convexe fermé contenant X : on l’appelle enveloppe convexe fermée de X. 2) Si C est convexe, il en est de même de son intérieur Int C.

    2 Constantin Caratheodory (1873-1950), mathématicien allemand d’origine grecque, fut d’abord ingénieur en Egypte, et se tourna vers les mathématiques en 1900. Il enseigna à Hanovre, Breslau, Göttingen et Berlin, puis à Smyrne et Athènes de 1920 à 1924, avant de se fixer à Munich. Il fit des travaux en théorie de la mesure, calcul des variations, et axiomatisa les fondements de la thermodynamique et de la relativité.

  • 5

    3) Si C est un convexe ≠ ∅, montrer que Int C = Int(Adh C) et Adh C = Adh(Int C) et : Fr C = Fr(Adh C) = Fr(Int C) .

    Exercice 3 : règle de simplification.

    On se place dans un evn E. 1) Montrer que si B est convexe fermé et C borné, alors : A + C ⊂ B + C ⇒ A ⊂ B. 2) En déduire que si A et B sont convexes fermés et C borné, alors A + C = B + C ⇒ A = B. 3) En déduire que le monoïde additif des convexes compacts est régulier. [ Indication : écrire a + c1 = b1 + c2 , a + c2 = b2 + c3 , etc. ]

    Exercice 4 : jauge d’un convexe.

    Soit K un convexe borné contenant 0 dans son intérieur.

    Pour tout x ∈ E, on pose jK(x) = inf{ λ > 0 ; λx ∈ K }. Montrer que l’application jK : E → R

    + est

    bien définie et vérifie jK(x) = 0 ⇔ x = 0 , ∀α ≥ 0 jK(α.x) = α.jK(x) , jK(x + y) ≤ jK(x) + jK(y) . Montrer que si, de plus K = −K, alors jK est une norme, et jK(x) < 1 ⇒ x ∈ K ⇒ jK(x) ≤ 1.

    Exercice 5 : convexes compacts du plan et coordonnées cartésiennes.

    Soit (O, i , j ) un repère orthonormé du plan euclidien PPPP.

    1) Soient I = [a, b] un segment de R, f : I → R concave continue et g : I → R convexe continue telles que g ≤ f. Montrer que K = {(x, y) ; x ∈ I et g(x) ≤ y ≤ f(x)} est un convexe compact, d’intérieur non vide ssi f ≠ g. 2) Réciproquement, soient K un convexe compact d’intérieur non vide3 du plan, [a, b] le segment projection orthogonale de K sur x’Ox. Montrer qu’il existe deux fonctions continues f et g : I → R , f concave, g convexe, telles que g ≤ f , f ≠ g et K = { (x, y) ; x ∈ I et g(x) ≤ y ≤ f(x) }.

    Exercice 6 : convexes compacts du plan et coordonnées polaires.

    1) Montrer que les convexes compacts d’intérieur vide de PPPP sont les segments de droite.

    2) Désormais, K désigne un convexe compact d’intérieur ≠ ∅, et on choisit O∈Int K. Soit (O, i , j ) un repère orthonormé. Pour tout θ∈R, on note u (θ) = cos(θ). i + sin(θ). j et D(θ) = R+.u (θ).

    a) Montrer que ∀θ ∈ R ∃!M(θ) ∈ PPPP−{O} [O, M( θ)] = K ∩ D(θ).

    b) Montrer que Fr(K) = { M(θ) ; θ ∈ R } et Int(K) = UR

    MO∈θ

    θ)[(,[ .

    3) On pose OM (θ) = r(θ).u (θ) , et ϕ(θ) = )(

    1θr .

    a) Montrer que r est 2π-périodique, continue et dérivable à droite et à gauche en tout point. b) Montrer que ∀θ1, θ2, θ3Erreur ! Signet non défini. ∈ R : θ1 < θ2 < θ3 < θ1 + π ⇒ ϕ(θ1).sin(θ3 − θ2) + ϕ(θ2).sin(θ1 − θ3) + ϕ(θ3).sin(θ2 − θ1) ≥ 0. [ Ind. : On cherchera l’équation polaire de la droite M(θ1)M(θ3). ] (cf. B.2.4.)

    Exercice 7 : équation tangentielle de certains convexes compacts.

    Soit p une fonction de classe C2 2π-périodique R → R, vérifiant : (∀θ ∈ R) p(θ) + p’’(θ) > 0.

    Dans le plan euclidien orienté rapporté au repère orthonormé (O, i , j ), on note :

    (u (θ),v (θ)) le repère radial : u (θ) = cos(θ). i + sin(θ). j , v (θ) = u (θ + 2π )

    D(θ) la droite d’équation x.cos θ + y.sin θ − p(θ) = 0 D’(θ) la droite d’équation − x.sin θ + y.cos θ − p’(θ) = 0 .

    3 De tels ensembles sont parfois appelés « corps convexes ».

  • 6

    1) Montrer que D(θ) ∩ D’(θ) est un singleton {M(θ)}. Soit Γ l’arc paramétré décrit par M(θ). Montrer qu’il est de classe C

    1. Reconnaître la tangente et la normale en M(θ) à Γ.

    2) Montrer que Γ−{M( θ)} est contenu dans l’un des demi-plans ouverts délimités par D(θ).

    3) On note Π+(θ) le demi-plan { (x, y) ; x.cos θ + y.sin θ ≤ p(θ) }.

    Montrer que Iθ

    θ)(+Π est un convexe compact K d’intérieur non vide, de frontière Γ.

    Exercice 8 : Trouver toutes les partitions d’un plan affine en deux ensembles convexes.

    Exercice 9 : Soit E un espace normé de dimension finie, C un convexe non borné de E. Montrer que C contient une demi-droite. [ Indication : quitte à se limiter à l’espace engendré par C et à translater, on peut supposer que Int C

    est non vide et contient O. Soit (yn) une suite de points de C tendant vers +∞ en norme. Considérer une valeur d’adhérence de la suite (yn/||yn||). ]

    Exercice 10 : un théorème de point fixe.

    Soit E un evn, K un convexe compact, f : K → K vérifiant : ∀(x, y)∈K2 ||f(x) − f(y)|| ≤ ||x − y||. Montrer que f possède au moins un point fixe.

    [ Indication : Fixer w ∈ K, et considérer fn définie sur K par fn(x) = (1 − n1 ).f(x) +

    nw .]

    Cet énoncé devient faux si on oublie l’hypothèse K convexe (penser à une rotation du cercle) ou compact (penser à une translation de R). Il reste vrai si l’on suppose f seulement continue de K dans K : théorème dû à Schauder. 2.2. Points extrémaux.

    Définition : Soit A un ensemble convexe. Un point x de A est dit extrémal s’il vérifie l’une des conditions équivalentes suivantes :

    (E1) ∀(y, z) ∈ A×A x = 2

    zy+ ⇒ x = y = z ;

    (E2) Il n’existe pas d’intervalle ouvert ]y , z[ contenant x et contenu dans A ; (E3) A−{x} est convexe.

    Proposition : Les points extrêmaux de A sont des points frontières ; réciproque fausse en général.

    Exercice 11 : Déterminer les points extrêmaux des convexes rencontrés en 1.2.

    Exercice 12 : Soit A = {(x, y, 0) ; x2 + y

    2 = 1} et B = {(1, 0, ±1)}. Déterminer co(A∪B) dans R3, et

    ses points extrémaux. L’ensemble de ces points est-il fermé ?

    Exercice 13 : Soit S une partie de E, C = co(S). Montrer que tout point extrémal de C appartient nécessairement à S.

    Exercice 14 : Soit E un espace euclidien, S(E) (resp. S+(E)), l’ensemble des endomorphismes symétriques (resp. positifs) de E. Montrer que K = { u ∈ Erreur ! Signet non défini.S+(E) ; tr u = 1 } est un convexe compact de S(E), que K = co(P) où P est l’ensemble des orthoprojecteurs de rang 1, et que P est l’ensemble des points extrémaux de K.

    Exercice 15 : Soit C un convexe. Une partie convexe F de C est appelée face (ou partie extrémale) de C si elle vérifie : [ (x, y) ∈ C2 et (∃α ∈]0, 1[) α.x + (1 − α).y ∈ F ] ⇒ [x , y] ⊂ F. 1) Quelles sont les faces d’une plaque triangulaire ? 2) Montrer que F face de C ⇒ C − F est convexe , la réciproque étant fausse.

    Théorème de Minkowski : Tout convexe compact d’un espace vectoriel réel de dimension finie est l’enveloppe convexe fermée de l’ensemble de ses points extrêmaux.

  • 7

    Preuve : On pourra vérifier ce théorème à titre d’exercice sur chacun des exemples rencontrés en 1.2., et le montrer pour les convexes compacts du plan. Une preuve par récurrence sur la dimension est donnée par Monasse (Cours de taupe, p. 140), une autre dans Hörmander, p. 43. Ce théorème a été généralisé en dimension infinie par Krein-Milman. 2.3. Le théorème de projection convexe de F. Riesz.

    Les théorèmes ici réunis sont établis dans le chapitre relatif aux espaces préhilbertiens.

    Rappelons qu’un espace préhilbertien E est un K -espace vectoriel muni d’une forme bilinéaire symétrique positive si K = R, sesquilinéaire hermitienne positive si K = C. Cette forme est notée

    (x | y) et la semi-norme associée ||x|| = )( xx .

    Une partie A de E est dite séparée si : ∀(x, y)∈A2 || x − y || = 0 ⇒ x = y.

    Théorème de Riesz : Soit E un espace préhilbertien, C une partie convexe séparée et complète non vide. Pour tout x ∈ E, il existe un unique point y ∈ C tel que d(x, C) = ||x − y|| . Ce point est aussi l’unique point de C tel que : (∀z ∈ C) Re(x − y | z − y) ≤ 0 (*) . y est appelé projection convexe de x sur C. L’application pC : x ∈ E → y ∈ C est 1-lipschitzienne, donc continue.

    Lorsque K = R, la condition (*) s’interprète géo-métriquement ainsi : le meilleur approximant y de x dans C est le seul point tel que l’angle xyz soit obtus pour tout z ∈ C.

    Exercice 16 : Soient E un espace euclidien, (Ci)1≤i≤N N convexes fermés tels que C = IN

    iiC

    1=soit

    non vide. On note pi la projection convexe sur Ci. On se propose de construire une suite de points tendant vers un point de C.

    Soit (un) la suite définie par : u0 ∈ E , un+1 = N1 ∑

    =

    N

    i

    ni up1

    )( .

    1) Montrer (∀n) (∀i) (∀c ∈ Ci) d(un , Ci)2 ≤ || c − un ||

    2 − || pi(un) − c ||

    2.

    2) Montrer (∀n) (∀v∈ E) || un+1 − v ||2 ≤

    N1 .∑

    =

    N

    i 1

    || pi(un) − c ||2.

    3) En déduire (∀n) (∀c ∈ C) N1 .∑

    =

    N

    iin Cud

    1

    )²,( ≤ || c − un ||2 − || c − un+1 ||

    2.

    4) Que dire de la suite ( || c − un ||2

    ) ? En déduire (∀i) limn d(un , Ci) = 0 .

    5) Démontrer que l’on peut extraire de (un) une suite convergente, vers un û∈C.

    6) Montrer que la suite (un) est convergente. (Ind. : Si υ est une autre valeur d’adhérence, considérer a = limn || û − un ||

    2 − || υ − un ||

    2 ).

    7) Application : méthode de Cimmino.

    Soient A ∈ Gln(R), A.x = b, li la i-ème ligne de A, bi la i-ème coordonnée de b, et Ci = { x ∈ Rn ; li.x = bi}. Que donne l’algorithme précédant ?

    Voici quelques applications du théorème de Riesz :

    Théorème de Hahn-Banach : Soit E un espace de Hilbert réel. Toute partie convexe fermée C de E est l'intersection des demi-espaces fermés contenant C.

    Preuve : À tout x ∈ E − C associons le demi-espace fermé Hx = { z ∈ E ; (x − pC(x) | z − pC(x)) ≤ 0 }.

  • 8

    Je dis que C = ICEx

    xH−∈

    , et l’on conclut aussitôt.

    Les deux cas particuliers les plus importants du théorème de Riesz concernent le cas des sous-espaces vectoriels et celui des cônes convexes fermés.

    Théorème : Soit E un espace préhilbertien, F un sous-espace vectoriel séparé et complet. Tout x∈E admet un meilleur approximant y ∈ F ; c’est l’unique point tel que x − y ∈ F⊥. L’application P qui à x associe y est un projecteur continu d’image F, et de noyau F⊥ ; et l’on a E = F ⊕ F⊥.

    Définition : Soit E un espace de Hilbert réel, C un cône convexe fermé de sommet O. On appelle cône polaire de C : C° = { u ∈ E ; (∀x ∈ C) (u|x) ≤ 0}. C’est un cône convexe fermé de sommet O.

    Lorsque C est un sous-espace vectoriel fermé, C° = C⊥ .

    Théorème (Farkas, 1902) : Sous les hypothèses précédentes, C°° = C.

    Cet énoncé établit une dualité entre les cônes convexes fermés de E, prolongeant la dualité entre un sous-espace fermé et son orthogonal. Il est le point de départ de la programmation linéaire. Exercice 17 : Soit C = { x = (x1, ..., xn) ∈ Rn ; x1 ≤ x2 ≤ ... ≤ xn }.

    1) Montrer que C est un cône convexe fermé. Représenter C sous la forme C = { x ∈ Rn ; (x | di) ≤ 0 pour 1 ≤ i ≤ p } , où les di sont à déterminer. 2) Démontrer que le cône polaire de C est : C° = { y = (y1, ..., yn) ∈ Rn ; y1 ≥ 0 , y1 + y2 ≥ 0 , ... , y1+ ... + yn−1 ≥ 0 , y1+ ... + yn = 0 }.

    3) Déduire de ce qui précède des vecteurs a1, ... , aq tels que C = { ∑=

    q

    iii a

    1

    .λ ; (λ1, ..., λq)∈R+q }.

    4) Mêmes questions avec K = { x = (x1, ..., xn) ∈ Rn ; 0 ≤ x1 ≤ x2 ≤ ... ≤ xn }.

    Exercice 18 : Cônes à faces.

    Soient E un R-espace vectoriel de dimension n, c1,... ,cr r vecteurs de E.

    1) Montrer que le plus petit cône convexe qui les contient est : C = {∑=

    r

    iii c

    1

    .λ ; λi ≥ 0 } .

    2) On se propose de montrer que C est fermé. i) Montrer ce résultat lorsque les ci sont libres ;

    ii) On suppose les ci liés : ∑=

    r

    iii c

    1

    .α = 0 , où les αi sont non tous nuls.

    Montrer que si x = ∑=

    r

    iii c

    1

    .λ , λi ≥ 0 , alors x = ∑=

    +r

    iiii c

    1

    )..( αθλ , pour tout θ.

    Comment faut-il choisir θ pour que λi + θ.αi ≥ 0 (∀i) et que l’un d’eux soit nul ? Conclure.

    Dans l’ex. suivant, on note x ≥ 0, resp. A ≥ 0, les vecteurs, resp. les matrices, à coefficients ≥ 0.

    Exercice 19 : Soient A ∈ MR(n, p) une matrice réelle à n lignes et p colonnes, b ∈ Rn. Montrer l’équivalence :

    i) Il existe x ∈ Rp tel que A.x = b et x ≥ 0 ; ii) Pour tout y ∈ Rn on a l’implication ty.A ≥ 0 ⇒ ty.b ≥ 0 . (théorème de Farkas-Minkowski, 1902).

    Exercice 20 : Dans E euclidien, soient u1, ..., up, v des vecteurs. Montrer l’équivalence :

    i) (∃x ∈ E) [ (∀i) (ui | x) ≥ 0 ] ⇒ (v | x) ≥ 0 ;

  • 9

    ii) ∃(λ1,..., λp) ∈ R+p v = ∑=

    p

    iii u

    1

    .λ .

    2.4. Périmètres, aires et volumes.

    Définition : Un corps convexe est un convexe compact d’intérieur non vide.

    Comment mesurer le contour et le volume d’un corps convexe ? Compte tenu de sa forme simple, point n’est besoin de recourir à la mesure de Lebesgue. Limitons-nous ici au plan.

    Exercice 20 : périmètre, aire d’un corps convexe.

    1) Soient P et Q deux polygones convexes, L(P) et L(Q) leurs périmètres. Montrer que P ⊂ Q ⇒ L(P) ≤ L(Q).

    Soit K un corps convexe. On appelle périmètre de K :

    L(K) = sup { L(P) ; P polygone convexe inclus dans K }

    2) a) Montrer que tout corps convexe a un périmètre fini et > 0. b) Montrer que K ⊂ K’ ⇒ L(K) ≤ L(K’). c) Comparer L(K) et L(K’) si K et K’ sont isométriques, resp. homothétiques.

    3) Soit K un corps convexe. Montrer que :

    sup { Aire(P) ; P polygone convexe ⊂ K } = inf { Aire(P) ; P polygone convexe ⊃ K } Cette valeur commune est appelée aire de K, et notée A(K).

    4) Exemple : Soient I = [a, b] un segment de R, f et g : I → R continues, f concave, g convexe telles que g ≤ f , f ≠ g. K = { (x, y) ; x ∈ I et g(x) ≤ y ≤ f(x) } est alors un corps convexe.

    Démontrer que l’aire et le périmètre de K sont donnés par les formules :

    A(K) = ∫ −b

    adxxgxf )).()(( , où f − g est concave continue

    L(K) = f(a) − g(a) + f(b) − g(b) + ∫ +b

    ag dxxf .)²('1 + ∫ +

    b

    ag dxxg .)²('1

    Exercice 21 : formule de Cauchy.

    Soit K un corps convexe du plan euclidien E. On rapporte E à un repère orthonormé (O,i , j ), et,

    pour tout θ ∈ R, on note u (θ) = cos θ. i + sin θ. j .

    On appelle épaisseur de K dans la direction u (θ), et on note eK(θ) la longueur de la projection

    orthogonale de K sur toute droite parallèle à u (θ). 1) Montrer que la fonction θ → eK(θ) est continue, et que le périmètre de K est donné par :

    L(K) = 21 ∫

    πθθ

    2

    0).( deK .

    Commencer par le cas où K est un polygone convexe, puis démontrer (ou admettre) le lemme d’approximation suivant : pour tout λ∈]0, 1[ et tout point O intérieur à K, il existe un polygone convexe P tel que Hom(O, λ).K ⊂ P ⊂ K.

    2) Applications :

    a) Croissance du périmètre : Si K et K’ sont deux corps convexes, K ⊂ K’ ⇒ L(K) ≤ L(K’). 4 b) Additivité du périmètre pour la somme de Minkowski. Si K et K’ sont deux corps convexes, K + K’ aussi, et L(K + K’) = L(K) + L(K’).

    c) Périmètre des roues.

    4 Ce résultat, déjà mentionné par Archimède, ne fut établi que par Cauchy.

  • 10

    Soit K une roue, c’est-à-dire un corps convexe d’épaisseur constante d. Montrer que L(K) = πd. Exemple : Soit ABC un triangle équilatéral de côté a, K l’intersection des disques fermés de centres A, B et C, et de rayon a. Montrer que K est une roue (roue de Reuleaux).5

    d) Caractérisation extrêmale des roues. Soit K un corps convexe de diamètre d.

    Montrer que 2d < L(K) ≤ πd, et que L(K) = πd ssi K est une roue.

    3) On suppose le compact K donné par une équation tangentielle comme en § 2.1., ex 7.

    Montrer que son épaisseur dans la direction u (θ) est donnée par eK(θ) = p(θ) + p(θ + π), et retrouver la formule de Cauchy. Exercice 22 : formule de Steiner-Minkowski.

    Soit K un corps convexe du plan euclidien E. Pour tout r ≥ 0, on note V(K, r) = { x ∈E ; d(x, K) ≤ r } son épaississement de rayon r. 1) Montrer que V(K, r) = K + B’(O, r) ; en déduire que c’est un corps convexe.

    2) Montrer que l’aire de V(K, r) est un trinôme en r, de la forme T(r) = π.r2 + L(K).r + A(K) a) lorsque K est un polygone convexe.

    b) lorsque ∂K peut être paramétrée de manière C2 ; cas d’un disque elliptique ? c) lorsque K est quelconque.

    3) Application : Montrer que L(K) = limr→0 r1 (A(V(K, r)) − A(K)).

    Exercice 23 : formule de Brunn-Minkowski .

    Soient K et L deux corps convexes du plan euclidien E.

    On se propose de montrer que la fonction f : t → )).1(.( LtKtA −+ est concave sur [0, 1] :

    Cela implique )).1(.( LtKtA −+ ≥ t. )(KA + (1 − t). )(LA (1)

    En particulier )2

    ( LKA + ≥ 21 .[ )(KA + )(LA ] (2).

    1) Montrer que f est continue. En déduire que (2) implique (1), puis la concavité de f. Il suffit donc de montrer (2).

    2) Montrer que ∀λ, µ > 0 ∀α, β ≥ 0 (λ + µ).( λα + µ

    β ) ≥ ( βα + )2.

    3) Soit C = 2

    LK+ . On reprend les notations de l’exercice 1 : soient [a, b], [c, d] les projections de

    K et L sur l’axe x’Ox, f(x) la longueur de la section de K par la verticale d’abscisse x ∈ [a, b], g(x) la longueur de la section de L par la verticale d’abscisse x ∈ [c, d],

    h(x) la longueur de la section de C par la verticale d’abscisse x ∈ [2ba+ ,

    2dc+ ]

    Montrer que ∀x ∈ [2ba+ ,

    2dc+ ] h(x) ≥

    2)()( xgxf +

    .

    4) On pose ∀x ∈ [a, b] ϕ(x) = )(

    1KA ∫

    x

    adttf ).( et ∀x ∈ [c, d] ψ(x) =

    )(1LA ∫

    x

    cdttg ).( .

    Montrer que ϕ est une bijection de classe C1 strictement croissante de [a, b] sur [0, 1], à dérivées > 0 sur ]a, b[. Soient p et q les bijections réciproques de ϕ et ψ.

    5 Le problème de Capes 1983 étudie les roues, et en donne d’autres exemples.

  • 11

    5) On a A(C) = ∫+

    +

    2/)(

    2/)().(

    dc

    badxxh . Faire le changement de variable x =

    2)()( uqup +

    dans cette inté-

    grale. En déduire A(C) ≥ 41 ∫ ++

    1

    0).

    ))(()(

    ))(()(

    )).((())((( duuqgLA

    upfKA

    uqgupf , et conclure à l’aide de 2)

    Exercice 24 : inégalité isopérimétrique.

    Soit K un corps convexe plan. Montrer que L(K)2 ≥ 4πA(K) , à l’aide des formules de Steiner-

    Minkowski et de Brunn-Minkowski. Remarques : 1) Les résultats précédents sont établis pour des polygones, puis étendus aux corps convexes par des méthodes d’approximation. On peut aussi les établir, au moins partiellement, en définissant K comme enveloppe de droites, et en utilisant les séries de Fourier (cf. chap. sur ce sujet). 2) Ces exercices sont le point de départ de toute une série de généralisations en dimension n, d’une part en direction des volumes des polytopes, c’est-à-dire des polyèdres convexes compacts d’intérieur non vide, en dim. finie, d’autre part en direction des convexes compacts d’intérieur non vide plus généraux. Je renvoie à Berger, Géométrie, § 12.2 et 12.3. 2.5. Théorème de Minkowski.

    Le résultat qui suit est le premier résultat de la géométrie des nombres, fondée par Minkowski.

    Probème : théorème de Minkowski.

    Le plan R2 est muni de sa structure euclidienne usuelle, et rapporté à sa base canonique (O, i , j ).

    1) Soit C une partie compacte, convexe, symétrique par rapport à O, S l’aire de C. On suppose que C ne contient aucun point à coordonnées entières autres que O.

    a) Montrer que les parties C(n, p) = ni + p j +21 C , où (n, p) décrit Z2, sont 2 à 2 disjointes.

    b) Soient δ le diamètre de C, k un entier ≥ δ/4. Montrer que pour tout entier m ≥ k, on a :

    (m − k)2 S ≤ 4m2 (Minorer le nombre de parties C(n, p) contenues dans le carré [−m, m]×[−m, m]).

    2) Déduire de ce qui précède le résultat suivant : « Soit C une partie de R2, compacte, convexe,

    symétrique par rapport à O, d’aire S ≥ 4. C contient au moins un point à coordonnées entières autre que O. » [ Commencer par S > 4 ].

    3) Applications.

    a) Soient a > 0, ac − b2 > 0, k > 0, C = {(x, y) ∈ R2 ; ax2 + 2bxy + cy2 ≤ k}. Si πk ≥ 4 ²bac− , C contient un point M ∈ Z2−{(0, 0)}. b) Soient p, q, r, s, A, B six réels tels que A > 0, B > 0 et 0 < | ps − qr | ≤ AB. Montrer que l’ensemble C = { (x, y) ∈ R2 ; | px + qy | ≤ A, | rx + sy | ≤ B } contient un point M ∈ Z2−{(0, 0)}. Remarque : C. L. Siegel a donné en 1935 une très belle preuve de ce théorème, basée sur les séries de Fourier de deux variables, et plus précisément sur la formule de Parseval appliquée à la fonction caractéristique de la réunion des C(n, p). 2.6. Aspects combinatoires : Euler, Helly.

    Problème : formule d’Euler (1752).

    1) Soit P un polytope en dimension 3, S le nombre des sommets, A le nombre d’arêtes, F le nombre des faces de P. Montrer la formule d’Euler : S − A + F = 2.

    2) Vérifier cette formule pour le tétraèdre, le cube, l’octaèdre, l’icosaèdre, le dodécaèdre.

  • 12

    3) Soit P un polytope «combinatoirement régulier» en ce sens que chaque sommet appartient à un nombre constant r de faces, et chaque face a un nombre constant s de sommets.

    a) Etablir que 2.A = S.r = F.s . En déduire r1 +

    s1 =

    21 +

    A1 .

    b) En déduire que le couple (r, s) ne peut prendre qu’un nombre fini de valeurs : en fait, 5 valeurs seulement. Quelles sont les valeurs correspondantes de S, A et F ?

    Preuve : Il faudrait commencer par définir ces notions ! Cela fait, il y a deux méthodes classiques pour établir la formule d’Euler :

    soit effectuer une projection stéréographique de pôle M très voisin de l’une des faces, et extérieur à P, de façon à obtenir un contour polygonal plan, et effectuer des calculs d’angles.

    soit illuminer P en mettant une bougie à l’intérieur, et considérer sa projection sur un contour sphérique englobant P ; mais il faut alors utiliser la formule d’Albert Girard donnant l’aire d’un triangle sphérique.

    B. Fonctions convexes. 1. Propriétés générales.

    Définition 4 : Soit A une partie convexe de EEEE. Une fonction f : A → R est dite convexe si : ∀(x, y) ∈ A×A ∀λ ∈ [0, 1] f(λ.x + (1 − λ).y) ≤ λ.f(x) + (1 − λ).f(y) . f est dite strictement convexe si : ∀(x, y) ∈ A×A x ≠ y ⇒ ∀λ ∈ ]0, 1[ f(λ.x + (1 − λ).y) < λ.f(x) + (1 − λ).f(y) . f est dite concave (resp. strictement concave) si −f l’est, et affine si elle est convexe et concave.

    Proposition 1 : Si f est convexe, on a les inégalités de convexité :

    ∀(x1, ..., xp) ∈ Ap ∀(λ1, ...,λp) ∈ Σp f( ∑=

    p

    iii x

    1

    .λ ) ≤ )(.1∑

    =

    p

    iii xfλ .

    De plus, si f est strictement convexe et si les λi sont tous > 0, alors :

    f( ∑=

    p

    iii x

    1

    .λ ) = )(.1∑

    =

    p

    iii xfλ ⇒ x1 = ... = xp .

    Interprétations géométriques :

    1) Supposons d’abord E = R. A est alors un intervalle de R de nature quelconque, et f est convexe ssi le graphe de f se trouve sous chacune de ses cordes. Plus précisément, si x < y, entre x et y, le graphe de f est au-dessous de la corde [M(x, f(x)) M(y, f(y))], et il est au-dessus de cette corde à l’extérieur de [x, y], en vertu de la propriété suivante laissée en exercice (voir aussi § 2.1. prop 1) : ∀(x, y) ∈ A×A ∀λ ∈Erreur ! Signet non défini. ]−∞, 0]∪[1, +∞[ λ.x + (1−λ).y∈A ⇒ f(λ.x + (1−λ).y) ≥ λ.f(x) + (1−λ).f(y) .

    2) Appelons épigraphe de f l’ensemble Epi(f) = { (x, y) ∈ A× R ; y ≥ f(x) }, autrement dit la partie du plan ou de l’espace située au-dessus du graphe. Alors on a la caractérisation simple :

    Proposition 2 : f est convexe si et seulement si Epi(f) est une partie convexe de E×R.

  • 13

    Proposition 3 : Si f1,... , fp sont des fonctions convexes sur A, et si les αi sont ≥ 0, alors :

    ip

    ii f∑

    =1α et sup1≤i≤p fi sont convexes.

    Enfin, une limite simple de fonctions convexes est convexe.

    Preuve : Les deux assertions peuvent se montrer directement ; la deuxième découle aussi de ce que :

    Epi(sup fi) = Ipi

    ifEpi≤≤1

    )( . Elle s’étend aussitôt à l’enveloppe supérieure d’une famille quelconque de

    fonctions convexes (fi), majorées. La dernière assertion est facile.

    Exemples.

    1) La fonction x → x2 est strictement convexe sur R. 2) La fonction x → |x| est convexe, non strictement, sur R. 3) Si E est un espace vectoriel, toute norme ou semi-norme x → ||x|| est convexe sur E. Si F est un sous-espace de E, ou un convexe, pour tout x ∈ EErreur ! Signet non défini., y → d(x, y) = ||x – y|| est convexe de E dans R+.

    Exercice : Soit ABC un vrai triangle du plan euclidien. Montrer que la fonction M → MA+MB+MC est strictement convexe, et coercive. Conséquences ?

    4) La fonction f : (x, y) → x2 + y2 est strictement convexe ; la surface z = x2 + y2 est un paraboloïde de révolution. Plus généralement z = px

    2 + qy

    2 (p et q > 0) est un paraboloïde elliptique.

    5) Plus galt, si x → ||x|| est une norme euclidienne sur E, x → ||x||2 est strictement convexe. 6) La fonction de Lotka-Volterra f(x, y) = x − ln x + y − ln y est strictement convexe sur (R*+)².

    Exercice : Représenter la surface d’équation z = f(x, y), déterminer le minimum de f. Représenter les courbes de niveau f(x, y) = c, pour c ≥ 2.

    Exercice : Soient A une partie convexe de E, f une fonction : A → R. On définit g : A → R par :

    g(x) = inf { )(.1∑

    =

    p

    iii xfλ ; x = ∑

    =

    p

    iii x

    1

    .λ , x1, ..., xp ∈ A, ∑=

    p

    ii

    1

    λ = 1 et λi ≥ 0 } .

    Montrer que g est la plus grande des fonctions convexes ≤ f. Montrer que l’épigraphe de g contient l’enveloppe convexe de celui de f, mais peut être plus gros.

    Exercice : Soit A une partie convexe de l’evn E, f : A → R une fonction vérifiant :

    ∀(x , y) ∈ A×A f(2

    yx+) ≤

    2)()( yfxf +

    . f est -elle convexe ? Même question si f est continue ?

    Exercice : Soit A une partie convexe non vide d’un evn E.

    1) Montrer que f : x → d(x , A) est une fonction convexe sur E. 2) Montrer que g : x → −d(x , E−A) est une fonction convexe sur A. [Indication : on pourra utiliser l’exercice précédent ; traiter le cas où Int(A) = ∅ ; sinon, distinguer selon que x ∈ Fr(A) ou x ∈ Int(A), et noter que B(x , d(x, E−A)) ⊂ A.] 3) On définit h : E → R par : h(x) = d(x , A) si x ∈ E−A , h(x) = − d(x , E−A) sinon. a) Montrer que ∀(x, y) ∈ E×E | h(x) − h(y) | ≤ 2 ||x − y|| ; b) Montrer que ∀(x, y) ∈ (E−A)×A d(x , A) + d(y , E−A) ≤ ||x − y|| ; c) En déduire que ∀(x, y) ∈ E2 | h(x) − h(y) | ≤ ||x − y|| ; d) Montrer que ∀x ∈ E h(x) = infy∈A { ||x − y|| − d(y , E−A) } .

    Exercice : tout minimum local est un minimum global.

    Soit A une partie convexe non vide d’un evn E (ou de l’espace affine associé), f : A → R une fonction convexe. On suppose que f(ξ) ≤ f(x) pour tout x ∈ A tel que ||x − ξ|| ≤ r , r > 0.

  • 14

    Montrer que f(ξ) ≤ f(x) pour tout x ∈ A

    2. Fonctions convexes d’une variable réelle.

    Dans tout ce §, I désigne un intervalle de R non réduit à un point.

    2.1. Propriétés topologiques et différentielles.

    Une fonction convexe f : I → R n’est pas toujours continue, ni dérivable, comme le montre l’exemple de f(x) = |x| si |x| < 1, f(±1) = 2. Toutefois elle possède de nombreuses propriétés topo-logiques et différentielles, qui découlent de la :

    Proposition 1 : Soit f une fonction : I → R. Les propriétés suivantes sont équivalentes : i) f est convexe ;

    ii) xy

    xfyf−− )()(

    ≤ xz

    xfzf−− )()(

    ≤ yz

    yfzf−− )()(

    pour x < y < z dans I ;

    iii) Pour tout a∈I, la fonction pa : x → axafxf

    −− )()(

    est croissante dans I − {a} ;

    iv) On a )()()(

    111

    zfyfxfzyx ≥ 0 pour tous x < y < z dans I.

    Remarque : Une fonction convexe est non strictement convexe ssi elle est affine sur un certain sous-intervalle de I non réduit à un point.

    Théorème 2 : Soit f une fonction convexe : I → R. i) En tout point a intérieur à I, f est continue, admet une dérivée à droite et à gauche finies, et : f'g(a) ≤ f'd(a) ;

    ii) Si a et b sont intérieurs à I, a < b, on a f'g(a) ≤ f'd(a) ≤ abafbf

    −− )()( ≤ f'g(b) ≤ f'd(b) ;

    f est lipschitzienne sur [a, b]. iii) Si a est intérieur à I, on a (∀x ∈ I) f(x) ≥ f(a) + (x−a).f'g(a) et f(x) ≥ f(a) + (x−a).f'd(a) , autrement dit le graphe de f se trouve au-dessus des tangentes à gauche et à droite de f en a. iv) Les fonctions f'g et f'd sont croissantes dans Int(I). L’ensemble des points où f n’est pas dérivable est au plus dénombrable.

    Preuve : i) Soit a un point intérieur à I. La fonction pa : x → axafxf

    −− )()(

    est croissante dans I − {a}.

    En vertu du théorème de la limite monotone, elle admet des limites à droite et à gauche en a, telles que pa(a − 0) ≤ pa(a + 0). Cela signifie que f est dérivable à droite et à gauche en a, et que :

    f'g(a) = supxa axafxf

    −− )()(

    = f'd(a) (*)

    La continuité de f en a découle de ses dérivabilités à droite et à gauche.

    ii) Si a < b, f'd(a) = infx>a axafxf

    −− )()(

    ≤ pa(b) = abafbf

    −− )()(

    = pb(a) ≤ supx

  • 15

    Théorème 3 : Soit f une fonction dérivable I → R. Les propriétés suivantes sont équivalentes : i) f est convexe (resp. strictement convexe) ; ii) f' est croissante (resp. strictement croissante) ; iii) ∀(a, x) ∈ I×I f(x) ≥ f(a) + (x − a).f'(a), autrement dit le graphe de f est au-dessus de ses tangentes (resp. ∀(a, x) ∈ I×I a ≠ x ⇒ f(x) > f(a) + (x − a).f'(a) ). Sous ces hypothèses, f' est continue dans I.

    Preuve : i) ⇒ ii) découle du théorème précédent. ii) ⇒ iii) g(x) = f(x) − f(a) − (x − a).f'(a) vérifie g'(x) = f'(x) − f'(a). L’étude des variations conclut. iii) ⇒ i) Si a < b < c, on a f(a) − f(b) ≥ (a − b).f'(b) et f(c) − f(b) ≥ (c − b).f'(b) ,

    d’où : ab

    afbf−− )()(

    ≤ f'(b) ≤ bc

    bfcf−− )()(

    , et on conclut via prop1 iv)

    Montrons que f’ est continue. Tout d’abord, f’ est croissante dans I, donc a une limite à droite et à

    gauche en tout x∈Int(I). Si limy→x−0 f’(y) = p et limy→x+0 f’(y) = q, le théorème de prolongement des fonctions dérivées montre que f’g(x) = p et f’d(x) = q. Comme f est dérivable en x, p = q, et f’ est continue en x. Le cas strict est laissé en exercice.

    Théorème 4 : Soit f une fonction deux fois dérivable I → R. i) f est convexe ssi (∀x ∈ I) f"(x) ≥ 0 ; ii) f est strictement convexe ssi (∀x ∈ I) f"(x) ≥ 0 et { x ∈ I ; f"(x) > 0 } est dense dans I.

    Preuve directe de i) : Il découle de Taylor-Young que f"(x) = limh→0 ²)()(2)2(

    hxfhxfhxf ++−+

    .

    On en déduit aussitôt que si f est convexe, f"(x) ≥ 0. Réciproquement, pour a < b < c, on a, par

    croissance de f' : ab

    afbf−− )()(

    = f'(α) ≤ f'(b) ≤ f'(β) = bc

    bfcf−− )()(

    ,

    où, par le TAF, a < α < b < β < c. Le ii) découle de i) et d’une remarque déjà faite. 2.2. Concavité, points d’inflexion : courbes y = f(x).

    Soit f une fonction réelle de variable réelle, deux fois dérivable ; on appelle point d’inflexion tout x tel que f"(x) = 0. Cette situation recouvre deux situations génériques :

    si f" s’annule en changeant de signe, il y a changement de concavité, la courbe traverse sa tangente en ce point ; on dit qu’il y a inflexion géométrique. Exemple : x3 en 0. si f" s’annule sans changer de signe, on dit qu’il y a point méplat. Exemple : x4 en 0. Ce sont là les situations génériques, c’est-à-dire généralement rencontrées ; il peut arriver aussi

    que f" n’ait pas de signe constant au V(x). Penser au cas où f"(x) = x.sinx1 , f"(0) = 0.

    2.3. Concavité, points d’inflexion : courbes paramétrées.

    Rapportons le plan affine à un repère direct (O,i , j ), et considérons la courbe C d’équations

    paramétriques x = x(t), y = y(t). Le point régulier M (c’est-à-dire tel que dt

    dM ≠ Ο) est dit non

    birégulier ou point d'inflexion si : det(dt

    dM ,²

    ²dtMd ) ≡ x'.y" − x".y' = 0.

    Notant p et q les entiers caractéristiques de C en M, on a p = 1, et : si q est impair, il y a position d'inflexion ; la courbe traverse localement sa tangente ; si q est pair, il y a point méplat ; la courbe reste localement du même côté de sa tangente.

  • 16

    2.4. Concavité, points d'inflexion : courbes en polaires.

    On rapporte le plan eucliden orienté à un repère orthonormé direct (O, i , j ), et l’on note (u (θ),v (θ

    )) le repère radial, et [x , y ] le produit mixte (i.e. le déterminant dans une base orthonormée directe).

    M(r(t), θ(t)) est point d’inflexion ssi E(t) ≡ [dt

    dM , ²

    ²dtMd ] = 0.

    Tous calculs faits dans le repère radial, cela équivaut à r2.θ'3 + r.r'.θ" − r.r".θ' + 2.r'2.θ' = 0.

    Dans le cas d’une courbe r = f(θ) l’on a θ = t et E(θ) = 3

    ''ϕ

    ϕϕ+ , où ϕ =

    r1 .

    On dit que la courbe polaire C tourne sa concavité vers le pôle au point M si, au voisinage de ce point, C est du même côté que O par rapport à sa tangente.

    Il faut pour cela écrire que [²

    ²dtMd ,

    dtdM ] et [ OM ,

    dtdM ] ont même signe.

    Dans le cas d’une courbe r = f(θ), cela conduit à la discussion :

    si E(θ) = 3

    ''ϕ

    ϕϕ+ > 0 , C tourne sa concavité vers O,

    si E(θ) = 3

    ''ϕ

    ϕϕ+ < 0 , C tourne sa concavité à l’opposé.

    Exercice : Montrer que les points d’inflexion de r = θθθ sin.cos.)cos(1

    ban ++ sont alignés.

    _________ Exercice 1 : Soit f : R → R une fonction convexe. Montrer que si f est majorée au V(+∞), f est décroissante ; si f est majorée au V(−∞), f est croissante. Que dire de f si elle est bornée sur R ?

    Exercice 2 : Soit I un intervalle de R*+ , f une fonction : I → R. Montrer que x → x.f(x) est convexe

    ssi x → f(x1 ) est convexe.

    Exercice 3 : Soient f : I → R une fonction convexe de classe C2, A et B deux points du graphe de f. Les tangentes en A et B se coupent en T. Montrer que AB ≤ AT + TB

    Exercice 4 : 1) Soit f une fonction convexe sur R. Pour tout h > 0, on pose gh(x) = ∫+hx

    xdttf

    h).(1 .

    Montrer que les gh sont convexes, de classe C1, et tendent simplement vers f quand h → 0+.

    Montrer que f est limite simple sur R d’une suite de fonctions convexes de classe C2, etc.

    2) Application : Soit f : R*+ → R+ convexe. Montrer que la fonction g(x) = ex/2

    .f(e−x

    ) est convexe sur R.

    Exercice 5 : lien entre une fonction convexe et la géométrie de son épigraphe.

    Soit I un intervalle ouvert, f une fonction convexe I → R. Alors l’ensemble F des fonctions affines g sur I minorant f est non vide, et f est l’enveloppe supérieure de cette famille f(x) = sup{ g(x) ; g∈F}. Ce résultat reste vrai lorsque I est fermé et f est convexe continue.

    Exercice 6 : intégration et convexité.

    1) Soit ϕ : I → R une fonction croissante. Montrer que, pour tout a∈I et tout réel c, la fonction :

    f(x) = c + ∫x

    adtt).(ϕ , est convexe dans I.

    2) Réciproquement, soit f : I → R une fonction convexe.

  • 17

    i) Montrer que : ∀(a, x) ∈ I2 ∫x

    ad dttf ).(' = ∫

    x

    ag dttf ).(' .

    [ Noter que f'd(x − ε) ≤ f'g(x) ≤ f'd(x + ε). ]

    ii) A l’aide de sommes de Riemann, montrer que f(x) − f(a) = ∫x

    ad dttf ).(' = ∫

    x

    ag dttf ).(' .

    iii) En déduire que, pour tout a ∈ I, il existe une constante c et une fonction croissante ϕ : I → R

    telles que, pour tout x intérieur à I, l’on ait : f(x) = c + ∫x

    adtt).(ϕ .

    Exercice 7 : Soit f continue I = [a, b] → R. Pour tout x ∈ R on pose ∆(x) = ∫ −b

    adtxtf ..)(

    1) Montrer que ∆ est continue et convexe. Quelles sont ses limites en ±∞ ? 2) Montrer que ∆ atteint sa borne inférieure V en un point de R. 3) Montrer que ce point est unique, et appartient à f(I). On le note m. 4) Exemples : étudier la fonction ∆ et déterminer m lorsque : a) f est un C

    1-difféomorphisme croissant sur [a, b] ; on notera g la bijection réciproque.

    b) f(x) = min(2x, 2(1 − x)) sur [0, 1] ; c) f(x) = sin x sur [0, π]. 5) Désormais, pour chaque fonction continue f, on note ∆f , Vf et mf les notions précédentes.

    a) Montrer que Vf ≤ ∫b

    adttf .)( et | mf | ≤ ab−

    2 ∫b

    adttf .)( .

    b) Soient f et g continues de I dans R. Montrer que (∀x) | ∆f(x) − ∆g(x) | ≤ || f − g ||1 .

    En déduire |Vf − Vg| ≤ || f − g ||1 . 6) Soit (fn) une suite de fonctions continues tendant en moyenne vers la fonction continue f.

    Montrer que la suite (mfn) admet des valeurs d’adhérence, puis qu’elle converge vers mf.

    Application : déterminer mf lorsque f est croissante sur I.

    Exercice 8 : Soit (fn) une suite de fonctions convexes sur un intervalle I de R, convergeant simplement vers une fonction f ; montrer que f est convexe, la convergence étant uniforme sur tout segment J ⊂ I.

    Exercice 9 : Montrer que la fonction ζ(x) = ∑∞

    =1

    1n

    xn est convexe sur son domaine réel.

    Exercice 10 : Montrer que la fonction Γ(x) = ∫+∞

    −0

    .te tx−1.dt est convexe sur son domaine réel.

    Exercice 11 : Montrer que la fonction F(x) = ∫∞+ −

    +0 .²1 dtte xt

    est convexe sur son domaine réel.

    Exercice 12 : Suites convexes.

    Une suite réelle (an) est dite convexe si (∀n ≥ 1) an+1−2an+an−1 ≥ 0 , concave si (−an) est convexe. 1) Donner une cns portant sur la suite bn = an+1 − an pour que (an) soit convexe. 2) Quelles sont les suites à la fois convexes et concaves ?

    3) Soit (an) une suite convexe. Montrer que 0 ≤ n ≤ p ≤ m ⇒ (m − n).ap ≤ (p − n).am + (m − p).an 4) Soit (an) une suite convexe. Montrer que la fonction f : R+ → R affine sur chaque segment [n, n+1], et telle que f(n) = an est convexe. 5) Montrer que si (an) est convexe bornée, (an) est décroissante minorée ; la réciproque est-elle vraie?

  • 18

    3. Fonctions convexes de plusieurs variables. Dans ce §, U désigne un ouvert convexe d’un R-evn de dim. finie.

    Proposition 1 : Soit f une fonction différentiable U → R. Pour que f soit convexe dans U, il faut et il suffit que : (∀a ∈ U) (∀h ∈ E) a + h ∈ U ⇒ f(a + h) ≥ f(a) + f'(a).h , autrement dit que le graphe de f soit au-dessus de chacune de ses variétés affines tangentes.

    Proposition 2 : Soit f une fonction de classe C2 : U → R.

    i) Pour que f soit convexe, il faut et il suffit que, pour tout a ∈ U, f"(a) soit une forme quadratique

    positive, i.e. : (∀h ∈ E) f"(a).(h, h) ≡ ∑≤≤ nji,1 ji xx

    f∂∂

    ∂²(a).hi.hj ≥ 0.

    ii) Pour que f soit strictement convexe, il suffit que, pour tout a ∈ U, f"(a) soit une forme quadratique définie positive.

    Proposition 3 : Soit f une fonction différentiable sur U. i) Si f est convexe, tout point critique est un minimum (global large) de f ; ii) Si f est strictement convexe, tout point critique de f est le minimum global strict. Exercice 1 : continuité des fonctions convexes.

    1) Soient U un ouvert convexe non vide d’un R-evn E, f une fonction convexe de U dans R. Pour que f soit continue dans U, il faut et il suffit qu’il existe une partie ouverte non vide V de U sur laquelle f soit majorée. 2) En déduire que si E est un R-evn de dim finie et U un convexe ouvert non vide de E, toute fonction f convexe de U dans R est continue. 3) Ces résultats s’étendent-ils au cas où U est convexe non ouvert ?

    Exercice 2 : Soient E un evn, U un ouvert convexe de E, f une fonction convexe U → R continue en un point x0. On se propose de montrer que f est localement lipschitzienne au V(x0), i.e. qu’il existe

    ρ > 0 et k > 0 tels que : ∀(x, y) ∈ B'(x0 , ρ)2 || f(x) − f(y) || ≤ k.|| x − y || (H. Halkin).

    1) Montrer qu’on peut se ramener à x0 = 0 et f(0) = 0 .

    2) Montrer (∃η > 0) (∀x ∈ E) ||x|| ≤ η ⇒ | f(x) | ≤ 1 .

    3) Soient ρ = 2η

    , k = η8 , λ = η

    2 ||x − y||. On suppose qu’existent x et y ∈ B'(x0 , ρ) tels que :

    || f(y) − f(x) || > k.|| x − y ||. Trouver une contradiction, en distinguant les cas λ ≥ 1 et λ < 1. Exercice 3 : Fonctions fortement convexes.

    Soit C un convexe d’un R-evn E. La fonction f : C → R est dite fortement convexe si :

    ∃a > 0 ∀t∈[0, 1] ∀(u, v)∈C2 f(t.u + (1 − t).v) ≤ t.f(u) + (1 − t).f(v) − 2a .t.(1 − t).||u − v||2

    1) Interpréter géométriquement cette propriété.

    2) Montrer que si C est un ouvert de E et si f est de classe C1, cette condition équivaut à l’une :

    i) ∀(u, v) ∈ C2 (∇f(u) − ∇f(v) | u − v) ≥ a.||u − v||2 ;

    ii) ∀(u, v) ∈ C2 f(v) ≥ f(u) + (∇f(u) | v − u) + 2a .||u − v||2 .

    Exercice 4 : programmation quadratique sans contrainte.

    Soit E un espace euclidien de dim n, A un endomorphisme symétrique de E, b un vecteur de E, c∈R.

  • 19

    1) Montrer que J(x) = 21 (Ax | x) − (b | x) + c est une fonction C∞. Déterminer son gradient ∇J(x)

    et sa hessienne ∇2J(x) = f"(x). 2) Montrer que J est convexe ssi A est positive, strictement convexe ssi A est définie positive. 3) On suppose désormais A définie positive. i) Montrer que J est coercive , i.e. lim||x||→+∞ J(x) = +∞ . ii) Montrer que J atteint son minimum en un point unique ξ de E, et que ξ = A−1.b. iii) Déterminer la nature des lignes de niveau de J.

    4) Algorithme de gradient à pas constant.

    On considère l’algorithme suivant, où ρ > 0 : x0 ∈ E , xk+1 = xk − ρ.∇J(xk). Montrer que pour 0 < ρ < ρ0, où ρ0 est une valeur seuil à déterminer, l’algorithme converge vers ξ. En déduire une méthode itérative de résolution de A.x = b.

    Exercice 5 : Soit Sn++(R) le cône convexe ouvert des matrices symétriques définies positives d’ordre n. On se propose de montrer que f : A → − ln(det A) est strictement concave sur Sn++(R). Pour cela on fixe A∈ Sn++(R), H ∈ Sn(R), et l’on considère la fonction de variable réelle : ϕ : t → − ln det(A + t.H) . 1) Vérifier que ϕ est définie sur un intervalle ouvert I contenant 0, et que :

    (∀t ∈ I) ϕ(t) − ϕ(0) = − ∑=

    +n

    iit

    1

    ).1ln( λ , où les λi sont les valeurs propres de A−1/2.H.A−1/2.

    2) En déduire que f est strictement concave.

    3) En déduire que si A et B sont symétriques définies positives distinctes, et si 0 < α < 1, det(α.A + (1 − α).B) > det(A)α. det(B)1−α. et que {M ∈ Sn++(R) ; det M ≥ 1} est un ensemble convexe.

    4. Convexité et calcul des variations. On rencontre des méthodes de convexité en calcul des variations, notamment dans le problème de la brachistochrone. En effet, lorsque la condition nécessaire d’Euler-Lagrange fournit une solution extrêmale, il reste à montrer la réciproque ; le cas le plus simple où l’on peut établir cette réciproque est celui où la fonctionnelle est strictement convexe, ce qui est souvent le cas. Sur ce sujet, voir le chapitre sur les fonctions de plusieurs variables, partie D.

    C. Inégalités de convexité. 1. Premiers exemples. (∀x ∈ R) exp x ≥ 1 + x ∀x∈]−1, +∞[ ln(1 + x) ≤ x

    ∀x ∈ [0, 2π ] π

    x2 ≤ sin x ≤ x 0 < x < y < π ⇒ x

    xsin > y

    ysin

    0 < x < y ⇒ x

    shx < y

    shy 0 < x et y ⇒

    xxsin <

    yshy

    ∀x ∈ [0, π] x.( 1 − πx ) ≤ sin x ≤ x

    ∀ x, y, a, b > 0 x.ln(ax ) + y.ln(

    by

    ) ≥ (x + y).ln(bayx

    ++

    ) , avec égalité ssi ax =

    by

    .

    Ces inégalités découlent de la convexité d’une certaine fonction, à trouver.

  • 20

    2. Moyennes.

    « Mec moche cherche femme superbe pour faire bonne moyenne. »

    Définitions : Si x1, ..., xn sont des réels > 0, on appelle moyennes arithmétique, géométrique, quadratique, harmonique des xi , les nombres An, Gn, Qn et Hn définis resp. par :

    An = nxx n++...1 Gn = n nxx ...1 Qn = n

    xx n²...²1 + et nH

    n = 1

    1x

    + ... + nx

    1 .

    On notera que An et Qn sont définis quels que soit le signe des xi .

    Proposition 6 : On a Hn ≤ Gn ≤ An ≤ Qn . Il y a une égalité ssi tous les xi sont égaux, et alors les 4 moyennes sont égales.

    Exercice 1 : Montrer l’inégalité Gn ≤ An par récurrence sur n.

    Exercice 2 : preuve de Cauchy de l’inégalité Gn ≤ An . 1) Montrer cette inégalité pour n = 2, n = 2

    m. Cas d’égalité ?

    2) On suppose 2m−1

    < n < 2m

    . Montrer l’inégalité en complétant le n-uplet (x1, ..., xn) en un 2m

    uplet en posant xk = An pour n < k ≤ 2m

    . Cas d’égalité.

    Exercice 3 : moyenne et médiane.

    Soient a1, ... , an n nombres réels. Pour tout x ∈ R, on pose f(x) = ∑=

    −n

    kkax

    1

    )²( et g(x) = ∑=

    −n

    kkax

    1

    .

    En quels points de R les fonctions f et g atteignent-elles leur minimum ?

    Exercice 4 : notion de f-moyenne.

    1) Soit f une fonction continue strictement monotone sur l’intervalle I, montrer que, quels que soient les points x1, ..., xn de I, il existe un unique réel m = mf(x1, ..., xn) tel que :

    f(m) = n1 .∑

    =

    n

    iixf

    1

    )( .

    On l’appelle f-moyenne de x1, ..., xn. Expliciter mf(x1, ..., xn) lorsque f(x) = x , lnx , x1 , x2.

    2) Si f et g sont continues et strictement monotones sur I, si g est croissante et gof−1 est convexe, montrer que : mf(x1, ..., xn) ≤ mg(x1, ..., xn) . Retrouver les inégalités de la prop. précédente.

    Proposition (inégalité de la moyenne géométrique). Si x1, ... , xn sont des réels > 0, et λ1,... , λn

    sont des réels > 0 de somme 1, on a : ∏=

    n

    ii

    ix1

    λ ≤ ∑=

    n

    iii x

    1

    .λ , avec égalité ssi tous les xi sont égaux.

    Cette inégalité généralise Gn ≤ An , et, comme elle, découle de la concavité du log.

    Application : inégalité isopérimétrique pour les triangles : Soit T un triangle ABC de côtés a =

    BC, b = CA, c = AB, de demi-périmètre p = 2

    cba ++ et d’aire S.

    Alors : S = ))()(( cpbpapp −−− ≤ 3.3²p

    , avec égalité ssi T est équilatéral.

    Exercice : Soit T un triangle ABC. Un point M intérieur au triangle se projette en P, Q, R resp. sur les côtés BC, CA, AB. On note S l’aire du triangle, a = BC, b = CA, c = AB. i) Montrer que 2S = a.MP + b.MQ + c.MR.

    6 La formule H2 ≤ G2 ≤ A2 était connue des pythagoriciens, comme le montrent certains extraits d’Archytas de Tarente. Mais il faut apparemment attendre 1729 pour trouver mentionnée explicitement par Maclaurin l’inégalité de la moyenne géométrique Gn ≤ An, et cela, bien que des problèmes d’extremum bien plus difficiles aient été abordés longtemps auparavant.

  • 21

    ii) En déduire un majorant de f(M) = MP.MQ.MR. iii) Montrer que f(M) est maximale ssi M est le centre de gravité du triangle

    3. Normes.

    Inégalité de Hölder : Soient p et q deux réels > 1 tels que p1 +

    q1 = 1, ak et bk (1 ≤ k ≤ n) des réels

    ou des complexes, alors : | ∑=

    n

    kkk ba

    1

    . | ≤ [∑=

    n

    k 1

    |ak|q ]1/q .[∑=

    n

    k 1

    |bk|p]1/p

    Inégalité de Minkowski : Soient p un réel ≥ 1, ak et bk ( 1≤ k ≤ n) des réels ou des complexes, on a

    [∑=

    n

    k 1

    |ak + bk|p]1/p ≤ [∑=

    n

    k 1

    |ak|p]1/p + [∑=

    n

    k 1

    |bk|p]1/p

    Ces inégalités, laissées en exercice, découlent notamment de la convexité des fonctions x→ xs pour s ≥ 1 et x ≥ 0, et x → ( 1 − x1/p )p sur x ∈ [0, 1] , pour tout réel p ≥ 1.

    Il en résulte que, pour p ≥ 1, ||x||p = [∑=

    n

    k 1

    |xk|p]1/p est une norme sur Rn ou Cn. Lorsque p = 1 ou 2,

    on retrouve les normes standard ; lorsque p → +∞ , il est facile d’établir que ||x||p → ||x||∞ . _________ Exercices Exercice : 1) Soient I un intervalle ouvert de R, f une fonction convexe dérivable dans I.

    Montrer que : (∀x ∈ I) f(x) = sup { f(y) + (x − y).f'(y) ; y ∈ I }. 2) Soient x1,..., xn, y1,... , yn 2n nombres réels tels que :

    x1 ≥ x2 ≥ ... ≥ xn , y1 ≥ y2 ≥ ... ≥ yn , x1 + x2 + ... + xn = y1 + y2 +...+ yn x1 ≥ y1 ; x1 + x2 ≥ x1 + x2 ; x1 + x2 + x3 ≥ y1 + y2 + y3 ;... ; x1 + x2 +...+ xn−1 ≥ y1 + y2 +...+ yn−1

    Montrer que pour toute fonction dérivable convexe f, on a : ∑=

    n

    iixf

    1

    )( ≥ ∑=

    n

    iiyf

    1

    )( .

    [ Indication : utiliser 1) pour se ramener à prouver que, si z1 ≥ z2 ≥ ... ≥ zn , on a :

    ∑=

    n

    iii zfx

    1

    )'(. ≥ ∑=

    n

    iii zfy

    1

    )'(. ; on utilisera la croissance de f'. ]

    Exercice : 1) Montrer que si les ai et bi sont > 0 : n ∏=

    +n

    iii ba

    1

    )( ≥ n ∏=

    n

    iia

    1

    + n ∏=

    n

    iib

    1.

    Cas d’égalité ? [ pls. méthodes possibles. ]

    2) Soient A et B deux matrices symétriques définies positives. Montrer que :

    n BA )det( + ≥ n A)det( + n B)det( .

    Exercice : inégalité de Jensen.

    1) Soit g continue R→ R ; g est convexe ssi pour toute f Riemann-intégrable [a, b] → R on a :

    g[ab−

    1 . ∫b

    adttf ).( ] ≤

    ab−1 . ∫

    b

    adttgof ).)(( ,

    i.e. l’image par g de la valeur moyenne de f est inférieure ou égale à la valeur moyenne de gof.

    2) Plus généralement, soit g convexe sur R. Montrer que, pour toute fonction f continue [a, b] →

    R et toute fonction h continue positive sur [a, b] telle que ∫b

    adtth ).( = 1,

  • 22

    g[ ∫b

    adtthtf ).().( ] ≤ ∫

    b

    adtthtgof ).().)(( .

    __________ Problème : transformation de Legendre

    Soit E l’ensemble des fonctions f : R → R∪{+∞} vérifiant les deux conditions suivantes : a) Il existe un moins un point en lequel f est finie ; b) Il y a au moins une fonction affine minorant f sur R. On appelle domaine de f l’ensemble dom f = { x ∈ R ; f(x) < +∞ } , et transformée de Legendre de f, la fonction : f*(p) = supx∈R p.x − f(x) .

    1) Exemples. Pour chacune des fonctions suivantes, déterminer f*, représenter graphiquement f et f*:

    a) f(x) = ax2 , a > 0 , puis f(x) = ax

    2 + bx + c , a > 0 .

    b) f(x) = 2²x + |x| c) f(x) = exp x , puis f(x) = ch x d) f(x) = Arctan x .

    2) Soit H = { f ∈ C2(R, R) ; (∀x) f"(x) > 0 et f'(R) = R }.

    a) Soit f ∈ H ; exprimer f*(p) à l’aide de f et de g = f'−1, bijection réciproque de f'. b) Montrer que f ∈ H ⇒ f* ∈ H et f** = f. En déduire que f → f* induit une involution de H.

    3) On revient au cas général f, g ∈ E. a) Montrer que : f ≤ g ⇒ g* ≤ f* .

    b) Montrer que : (∀λ > 0) (∀p) (λ.f)*(p) = λ.f*( λp

    ) .

    c) Montrer que : ∀(x, p)∈R2 x.p ≤ f(x) + f*(p) .

    d) En déduire que : f = f* ⇔ (∀x ∈ R ) f(x) = 2²x .

    d) Montrer que f* est convexe et appartient à E .

    e) Montrer que f** ≤ f et f* = f*** . f) Montrer que f est convexe ⇔ f = f** . g) Montrer que f** est la plus grande fonction convexe ≤ f . Remarque : La transformation de Legendre s’étend aux fonctions de plusieurs variables. Elle est utile en thermodynamique, etc.

    _____________

    Problème : Théorème du point selle de von Neumann Soient U et P deux ensembles, L : U×P → R une fonction numérique.

    1) Montrer l’inégalité : supp∈P infu∈U L(u, p) ≤ infu∈U supp∈P L(u, p) dans ΡΡΡΡ.

    La différence δ = infu∈U supp∈P L(u, p) − supp∈P infu∈U L(u, p) est appelée saut de L.

    Donner des exemples où δ = 0 et où δ > 0, en prenant U = P = {1, 2}, et U = P = R.

    2) On dit que (u*, p*) est un point selle de L si ∀(u, p) ∈ U×P L(u*, p) ≤ L(u*, p*) ≤ L(u, p*). a) Montrer que, si (u*, p*) est un point selle, alors :

    supp∈P infu∈U L(u, p) = L(u*, p*) = infu∈U supp∈P L(u, p) .

    b) Montrer que réciproquement δ = 0 n’implique pas toujours l’existence d’un point selle.

  • 23

    c) Etudier l’existence d’un point selle pour les fonctions suivantes :

    i) U = P = R, L(u, p) = u2 − p2

    ii) U = P = Rn = MR(n, 1), L(u, p) = 2

    1 . uAut .. − ubt . − 21 . vBvt .. + vat . ,

    où A et B sont symétriques définies positives d’ordre n, a et b sont deux vecteurs de Rn.

    d) Si U et P sont ouverts, et L est différentiable, montrer que tout point selle est un point critique.

    3) Application à un problème d’optimisation sous contraintes.

    Rn et R

    m sont munis de leurs structures euclidiennes naturelles et de leur ordre naturel.

    Soient U ⊂ Rn , J : U → R et θ : Rn → Rm des fonctions quelconques. On se propose de minimiser J(u) sous les contraintes u ∈ U, θ(u) ≤ 0.

    On définit le Lagrangien L(u, p) = J(u) + (p | θ(u)) sur U×R+m

    .

    Montrer que si (u*, p*) est un point selle de L, alors u* est solution du problème.

    [ Indication : Noter que ∀p ∈ R+m

    (p | θ(u*)) ≤ (p* | θ(u*)) ; en déduire (p* | θ(u*)) = 0, puis θ(u*) ≤ 0, et conclure.]

    4) Soient U et P deux espaces métriques compacts, L : U×P → R une fonction continue.

    a) Montrer que la fonction G(u) = supp∈P L(u, p) est continue sur U, et H(p) = infu∈U L(u, p) continue sur P.

    b) En déduire que L est de saut nul si et seulement si elle admet un point selle.

    Dans la suite de ce problème, E et F désignent deux R-espaces vectoriels normés, U et P des convexes compacts de E et F resp., L : U×P → R une fonction continue vérifiant : • Pour tout p ∈ P, L(., p) est convexe • Pour tout u ∈ U, L(u, .) est concave.

    On se propose de montrer que L admet un point selle (u*, p*) (théorème de von Neumann).

    5) Dans cette question, on suppose de plus, pour tout p ∈ P la fonction L(., p) strictement convexe. a) Montrer que, pour tout p ∈ P, il existe un unique υ(p) rendant minimum L(., p). b) Montrer que la fonction H(p) = L(υ(p), p) est concave. c) Montrer que H est majorée et atteint sa borne supérieure en un point p* ; soit u* = υ(p*). d) Vérifier que (∀u∈U) L(u*, p*) ≤ L(u, p*).

    e) Soit p ∈ P. Pour tout λ ∈ ]0, 1[ on pose pλ = (1 − λ).p* + λ.p et uλ = υ(pλ).

    Montrer que (∀p ∈ P) H(p*) ≥ L(uλ, p). En déduire (∀p ∈ P) H(p*) ≥ L(u*, p). Conclusion ?

    6) On revient au cas général : Pour tout p ∈ P, L(., p) est convexe.

    Pour tout ε > 0 , on pose Lε(u, p) = L(u, p) + ε.|| u ||2. Appliquer à Lε le résultat de 4), et conclure.

    ___________ Problème sur les matrices bistochastiques

    I. Permanent d’une matrice.

    Pour tout n ≥ 1, on note SSSSn le groupe symétrique de { 1, 2, ..., n }.

    Si A = (aij ) ∈ Mn(R), on appelle permanent de A : per A = ∑∈ nSσ

    aσ(1)1 ... aσ(n)n

    (Le permanent est donné par la même formule que le déterminant, mais sans les signatures ε(σ)).

  • 24

    Si x1, ..., xn sont n vecteurs de Rn, on appelle permanent de x1, ..., xn le permanent de la matrice dont les colonnes sont x1, ..., xn.

    1) Montrer que (x1, ..., xn) → per(x1, ..., xn) est une forme n-linéaire symétrique sur Rn.

    2) a) Montrer que per A = per tA . b) Enoncer et démontrer un théorème de développement du permanent selon la j-ème colonne, resp. la i-ème ligne d’une matrice. c) Enoncer et démontrer une propriété du permanent d’une matrice trigonale par blocs.

    3) Pour σ ∈ SSSSn, on note M(σ) = (δi,σ(j)) la matrice de la permutation associée à σ. Montrer que σ → M(σ) est un morphisme de groupes de SSSSn dans Gln(R) ; inverse de M(σ) ? Vérifier que A RRRR B ⇔ ∃(σ, τ) ∈ SSSSn

    2 B = M(σ).A.M(τ) est une relation d’équivalence dans Mn(R),

    et que l’on a : A RRRR B ⇒ per A = per B.

    4) Applications :

    a) Calculer le permanent de la matrice A = (i×j) d’ordre n. b) Soit An le nombre des permutations σ ∈ SSSSn telles que (∀i) | σ(i) − i | ≤ 1. Exprimer An sous forme d’un permanent ; en déduire une formule de récurrence, puis reconnaître An.

    II. Théorème de Frobenius-König, mariages et appariements.

    1) Soit A = (aij ) ∈ Mn(R) à coefficients ≥ 0. Montrer que, pour que per A = 0, il faut et il suffit qu’existe s ∈ [1, n] et une matrice nulle de format (s, n+1−s) extraite de A (th. de Frobénius-König)

    [ Indication : pour montrer la condition nécessaire, raisonner par récurrence sur n, et observer que si A = (aij ) ∈ Mn(R) est à coefficients ≥ 0 et ≠ 0, il existe (i, j) tels que aij > 0, le "permanent mineur" Aij étant alors nul. ]

    2) Soient E et F deux ensembles finis, x → A(x) une application E → PPPP(F). Pour qu’il existe une injection f : E → F vérifiant : (∀x ∈ E) f(x) ∈ A(x) , il faut et il suffit que :

    ∀H ∈ PPPP(E) card H ≤ card UHx

    xA∈

    )( ( lemme des mariages de Philip Hall, 1934 ).

    [ Indication : Si E ={ x1, ..., xm } et F = { y1, ..., yn }, considérer la matrice A = (aij ) où :

    aij = 0 si 1≤ i ≤ m et yj ∉ A(xi) et aij = 1 si 1≤ i ≤ m et yj ∈ A(xi) , ou i > m .]

    3) Considérons un groupe de n garçons et un groupe de n filles. Chaque garçon a été présenté à k filles, chaque fille à k garçons. Exprimer au moyen d’un permanent le nombre total de façons de former n couples de danse sans présentations nouvelles. Existe-t-il au moins une façon de procéder ?

    III. Matrices bistochastiques.

    Une matrice A = (aij ) ∈ Mn(R) est dite bistochastique si elle est à coefficients ≥ 0 et si :

    ∀i ∈ [1, n] ∑=

    n

    jija

    1

    = 1 et ∀j ∈ [1, n] ∑=

    n

    iija

    1

    = 1 .

    1) Montrer que l’ensemble Ωn des matrices bistochastiques est une partie convexe, compacte, stable pour la multiplication, de Mn(R). Montrer que Ωn a pour dimension affine (n − 1)

    2 .

    2) Soit W = (wij ) ∈ On(R) une matrice orthogonale ; montrer que A = (wij2) est bistochastique ;

    une telle matrice A est dite orthostochastique. Montrer à l’aide d’un exemple qu’on n’obtient pas ainsi toutes les matrices bistochastiques.

    3) Soit A ∈ Ωn, inversible, d’inverse bistochastique B. Montrer que A est une matrice de permutation. En déduire la forme générale des matrices bistochastiques et orthogonales.

  • 25

    IV. Théorème de Garret Birkhoff (1946).7

    1) Soit A ∈ Ωn. Montrer à l’aide de II.1) que per A > 0. En déduire que (∃σ ∈ Sn) (∀j) aσ(j)j > 0.

    2) Soit A ∈ Ωn , N(A) le nombre de termes nuls de A ; montrer que 0 ≤ N(A) ≤ n2 − n.

    3) On se propose d’établir que toute A ∈ Ωn est combinaison convexe de matrices de permutation. On procède par récurrence descendante sur N(A). Examiner le cas N(A) = n

    2 − n. Supposant le résultat vrai pour toute B ∈ Ωn telle que N(A) < N(B), considérer σ ∈ Sn telle que

    ∀j aσ(j),j > 0 , puis B = aMaA

    −−

    1)(. σ

    , où a = min aσ(j),j , et conclure.

    4) Montrer que les points extrémaux de Ωn sont les n! matrices de permutation M(σ).

    V. Propriétés spectrales des matrices bistochastiques.

    On appelle hausdorffien de la matrice A∈Mn(C) l’ensemble H(A) = { t X AX ; X∈Cn et t X X = 1}.

    1) Montrer que H (A) est une partie compacte et connexe par arcs de C, contenant le spectre de A.

    2) Montrer que si A est hermitienne, unitaire ou plus généralement normale, H (A) est l’enveloppe convexe du spectre de A (on rappelle qu’une matrice normale est une matrice qui commute avec son adjointe ; elle est alors diagonalisable dans une base orthonormée de Cn). En déduire que le hausdorffien d’une matrice de permutation M(σ) est inclus dans l’enveloppe convexe Cn du polygone U1 ∪ U2 ∪ ... ∪ Un , où Uk est l’ensemble des racines k-èmes de l’unité.

    3) Soit A ∪ Ωn. Montrer que 1 ∈ Sp A ⊂ { z ∪ C ; |z| ≤ 1 }, et que Sp A ⊂ Cn.

    NB : on peut montrer que H (A) est un ensemble convexe ; mais ce n’est pas facile.

    ____________ Parties convexes d’un espace métrique On se propose de généraliser la convexité, notion a priori affine, aux espaces métriques.

    Soit (E, d) un espace métrique. Appelons géodésique d’extrémités a et b dans E toute application γ ∈ [α, β] isométrique et telle que γ(α) = a, γ(β) = b. On a donc d(γ(s), γ(t)) = | s − t | pour tout (s, t) ∈ [α, β]2 .

    Une partie C de E sera dite convexe si, pour tout couple (x, y) ∈ C2, les géodésiques d’extrémités x et y sont incluses dans E. Remarque : Cette notion est utile dans l’étude des pavages convexes de l’espace hyperbolique.8 ____________ Bibliographie

    N. Bourbaki : F.V.R., Espaces vectoriels topologiques, Intégration (chap. 1) M. Berger : Géométrie, 3ème partie (Nathan) Corps convexes, La Recherche, septembre 1992 G. Hardy, E. Littlewood, G. Polya : Inequalities (Cambridge) L. Hörmander : Notions of convexity (Birkhauser) Marcus-Minc : A survey of matrix theory and matrix inequalities (Dover)

    7 Garret D. Birkhoff (1911-1996) est le fils du grand mathématicien américain George Birkhoff (1884-1944), qui prolongea les travaux de Poincaré sur les systèmes dynamiques. 8 Journées X-UPS, mai 2001.

  • 26

    J.-B. Hiriart-Urruty : Optimisation et analyse convexe (Puf) L. Chambadal, J.-L. Ovaert : Analyse t.2 (Gauthier-Villars) B. Gostiaux : Cours de maths spé t.4, chap. 3 (Puf) P. Doukhan, J.-C. Sifre : Cours d’agrégation d’analyse D. Monasse : Cours de taupe (Vuibert) A. Warusfel : Polygones convexes du plan euclidien orienté, RMS nov 1992 Encyclopedia Universalis : Convexité Aspects géométriques et combinatoires de la convexité, Journées X-UPS 1995 ENS Ulm-Cachan 2003 : Entropie mathématique X PC 2007 : Courbes convexes définies par une équation d’Euler.

    ____________

    Qu'est-ce qu'un polygone convexe ?

    Dans l’exercice de ses multiples fonctions d’examinateur (au baccalauréat, aux brevets de capacité, à Polytechnique...), Louis-Étienne Lefébure de Fourcy (1785-1869) se fit une réputation de croque-mitaine dont le souvenir survécut longtemps au Quartier latin. 9 Sa sévérité faisait le fond d’une foule d’anecdotes dont le nombre était sans cesse enrichi par l’imagination des potaches. En voici une, citée par le Larousse du XIXe. Un candidat-martyr, déjà interloqué par un grand nombre de questions auxquelles il avait fort mal répondu, s’entendit poser, pour finir, par le très redoutable professeur, la question suivante : « Qu’est-ce qu’un polygone convexe ? Monsieur, répondit bravement le candidat, je n’en sais rien... je sais seulement que c'est vous qui êtes vexant, et que c’est moi qu’on vexe! ».

    La concavité selon André Gide

    « Cet incident grave, c’est la lecture que Gide me fit le vendredi 12 [mai 1939] au matin, après avoir pris mille précautions pour me demander si j’étais particulièrement réceptive, particulièrement concave, comme il disait. Ce qu’il me lut, c’est ce qu’il a écrit durant son séjour à Louksor (…) », écrit la Petite Dame dans ses Cahiers.

    Un des pères de la convexité : Johann Ludwig Wilhelm Waldemar JENSEN

    Ce mathématicien danois autodidacte, né à Nakskov en 1859, mort à Copenhague en 1925, n’eut jamais de poste universitaire, et travailla longtemps comme expert dans une compagnie téléphonique. Il étudia les séries de Dirichlet d’une variable complexe (1884) et fit des travaux sur les fonctions holomorphes (formule de Jensen en calcul des résidus). Il contribua à l’hypothèse de Riemann, en démontrant un théorème qu’il envoya à Mittag-Leffler, qui le publia en 1899 : ce résultat important ne permit cependant pas à son auteur de résoudre cette conjecture. Jensen écrivit aussi des articles sur les inégalités de convexité (1888, 1906) (cf. Inequalities, de Hardy-Littlewood-Polya). En 1906, il introduisit la notion de fonction convexe sur un intervalle réel. En 1915, il montra qu’il existe une infinité de nombres premiers irréguliers (cf. Abrégé Hist Maths, t.1, p.200). Il étudia aussi les séries, la fonction eulérienne Γ, et des inégalités relatives aux fonctions complexes. En l’honneur des travaux de Jensen, les postes danoises ont édité une flamme philatélique comportant l’inégalité caractérisant les fonctions convexes.

    Concavité et géographie

    L’île de Groix, située au large de Lorient, contient la seule plage convexe d’Europe, la plage des Grands Sables. Cette plage, qui avance dans la mer, est également remarquable par sa géologie : au bord de l’eau, le sable a des reflets d’or ; plus haut, il est blanc avec des reflets rouges, dus à d’innombrables pépites de grenat.

    9 Lefébure de Fourcy eut notamment pour élève Victor Hugo au lycée Louis-le-Grand — un témoin raconta qu’il était «également émerveillé de son invention et de son ignorance» —. Il fut plus tard examinateur d’Évariste Galois au concours d’entrée à Polytechnique en 1829, mais la tradition veut que ce soit Charles Dinet qui ait recalé Galois.