Démonstration par récurrence transfinie

Bonjour. Je voudrais être sûr d'avoir bien compris ce théorème (dit de démonstration par récurrence transfinie) :
    Soit $P$ une propriété définie dans un ensemble $(E, \le)$ bien ordonné. Si : $\forall x \in E \ [\forall y < x , P(y)] \Rightarrow P(x)$ alors $P$ est vérifiée pour tout $x\in E$.

On compare souvent ce théorème au théorème de récurrence sur $\N$, pourtant il me semble qu'il y a une différence importante : dans ce dernier on demande que l'hypothèse de récurrence $P(n) \Rightarrow P(n+1)$ soit vérifiée, mais aussi que $P(0)$ soit vérifiée. Alors que dans celui de récurrence transfinie on demande juste que l'hypothèse de récurrence soit vérifiée.

C'est bien cela ?

Réponses

  • Bonjour Pierre.

    Je me place dans $\N$.
    Pour $x=0$, la proposition $ [\forall y < x , P(y)]$ prend la valeur Faux.
    Donc l'implication $\forall x \in E \ [\forall y < x , P(y)] \Rightarrow P(x)$ prend la valeur Vrai.

    De ce fait, présentée sous la forme de la récurrence transfinie, la récurrence sur \( \N \) ne nécessite pas d'initialisation.

    Suis- je clair ?

    e.v.
    Personne n'a raison contre un enfant qui pleure.


  • Bonjour ev. Oui c'est clair tu appliques la définition de l'implication. Et on peut réellement utiliser cette forme dans $\N$ ?

    Pourtant j'ai un livre d'algèbre (niveau licence) qui dit, à propos du théorème dans $\N$, qu'il est quelque fois nécessaire de regrouper dans l'hypothèse de récurrence tous les niveaux jusqu'à $n$. C'est l'hypothèse de récurrence forte. Mais il faut quand même montrer que $P(0)$ est vraie. Or le théorème par récurrence transfinie ressemble au théorème de récurrence forte dans $\N$. D'où mon trouble. Cela ne sert donc à rien dans ce cas de prouver $P(0)$ ?
  • Si on montre que pour tout $n$, sous hypothèse que $P(m)$ pour tout $m<n$, alors $P(n)$, alors on aura en particulier montré $P(0)$ (sous hypothèse vide). Parfois c'est plus naturel de faire comme ça, et parfois c'est plus naturel de faire par "récurrence faible".

    Si $R$ est une relation bien fondée sur $X$ et que $P$ est une propriété des éléments de $X$ telle que $P(x)$ dès que $P(y)$ pour tout $y \in X$ tel que $y R x$, alors $P(x)$ est toujours vérifiée. Quand $R$ est une relation d'ordre totale sur $X$, ça donne le principe énoncé dans le premier post.

    On peut prendre $R$ la relation sur $\N$ définie par $n R m \iff n+1=m$. Dans ce cas, il y a deux "types" d'entiers : d'un côté $0$ et de l'autre, ceux qui ont un prédécesseur. Il faut alors montrer deux choses : la propriété pour $0$ et la propriété pour $n+1$ en la supposant pour $n$.

    @ev La première proposition dont tu parles prend la valeur Vrai.
  • ev : Lorsque $x=0$, $\forall y < x, P(y)$ est vraie (bah oui : trouve moi un $y<0$ et je te montrerai que $P(y)$ :-D ) donc si tu sais prouver $(\forall y < 0, P(y))\implies P(0)$, tu sais prouver $P(0)$, donc au fond tu as bien besoin de l'initialisation, tu peux juste la déguiser de cette manière.
  • Merci pour vos rectifications.

    e.v.
    Personne n'a raison contre un enfant qui pleure.


  • Champ-Pot-Lion a écrit:
    Si on montre que pour tout $n$, sous hypothèse que $P(m)$ pour tout $m<n$, alors $P(n)$, alors on aura en particulier montré $P(0)$ (sous hypothèse vide). Parfois c'est plus naturel de faire comme ça, et parfois c'est plus naturel de faire par "récurrence faible".

    Bonjour CPL. Je comprends ce que tu dis. Et ev dit d'ailleurs la même chose (je crois que sa première proposition prend bien la valeur Faux). Ce qui m'étonne c'est que l'énoncé sur le théorème de récurrence forte dans mon livre d'algèbre pour la licence est donc incorrect. Voici le texte de mon livre, il apparaît comme commentaire après l'énoncé du théorème de récurrence faible :
      Lorsqu'il est nécessaire de regrouper dans l'hypothèse de récurrence tous les niveaux jusqu'à $n$, il faut alors démontrer que : 1) $P(0)$ est vraie 2) $\forall n \in \N \ [\forall p \le n \ \ P(p)] \Rightarrow P(n+1)$

    Il ne faut pas croire tout ce qui est écrit dans les livres :-)
    Je vous remercie pour vos réponses, toi et ev.
  • Pourquoi faux ?
  • pour Pierre, tu vas voir que c'est "la même chose" dite "langagièrement" différemment:

    $$ \exists n: [P(n) \ et\ (\forall p<n: nonP(p))]$$

    est la négation (logique classique) de :

    $$ \forall n: [(\forall p<n: nonP(p))\to (nonP(n))]$$

    et quand tu enlèves le "non" (P est quelconque), ça donne :

    $$ \forall n: [(\forall p<n: P(p))\to P(n)]$$
    Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
  • Non, l'énoncé de ton livre est correct. Tu remarques qu'il y a un $p\leq n$ au lieu de $p<n$, et cette distinction est ici importante parce que $0$ n'est le $n+1$ d'aucun $n\in \N$; et ev ne disait pas la même chose que CPL, puisque son message initial était incorrect.
  • Martimax a écrit:
    Lorsque $x=0$, $\forall y < x, P(y)$ est vraie

    Bonjour Martimax. Je crois que cette proposition est fausse, non vraie.
    C'est pourquoi l'implication $[\forall y < x , P(y)] \Rightarrow P(x)$ prend la valeur vraie pour $x=0$.
    Pour s'en convaincre, il suffit de poser $X = \{x \in E : y < x \text{ et } \lnot P(y) \}$
    Et alors le théorème s'écrit :
      Soit $P$ une propriété définie dans un ensemble $(E, \le)$ bien ordonné. Si : $\forall x \in E \ \ (X=\emptyset) \ \Rightarrow P(x)$ alors $P$ est vérifiée pour tout $x\in E$.

    Mais je ne comprends toujours pas pourquoi l'initialisation $P(0)$ = vraie est déguisée, pour moi c'est une conséquence des équations logiques mais je ne sens pas d'intuition derrière.
  • Oups. Je suis un peu noyé. Je vais essayer de digérer toutes vos réponses et reviendrai peut-être si je n'y arrive pas.

    Merci beaucoup.
    Pierre
  • @PC, je te traduis en français:

    mon premier énoncé centré dit que $P$ a un plus petit élément
    le deuxième qu'il n'en a pas
    le troisième que nonP n'a pas de plus petit élément.
    Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
  • Bah non Pierre, ça fait justement 3 fois que CPL et moi disons "cet énoncé est vrai" pour corriger ev.
    Si il n'y a aucun $y$ qui est $<x$, alors peu importe ce que tu me mets comme $P$, $\forall y< x, P(y)$ est vraie. Preuve : donne moi un $y<x$, je te montrerai que $P(y)$ (indication : tu ne peux pas m'en donner, donc je n'ai rien à faire :-D)
  • @Martimax. Tu as raison excuse-moi j'ai fini par comprendre mais ce n'est pas évident ! La proposition $(\forall x ... blabla)$ est vraie quel que soit le blabla si la variable $x$ n'existe pas. C'est ça ? Je m'en souviendrai. Donc il faut que $P(0)$ soit vraie dans le théorème, ça roule.
  • Bonjour Christophe.
    Tu as énoncé la contraposée du théorème je crois. C'est-à-dire si $P(n)$ n'est pas vérifiée pour tout $n \in \N$ alors il existe $n$ tel que $\lnot P(n) \text{ et } (\forall p<n:
    P(p))$. C'est ça ?
  • @PierreCap: On peut considérer en logique classique que $\forall x P(x)$ veut dire la même chose que $\neg (\exists x \neg P(x))$, que (si $E$ désigne un ensemble), $\forall x\in E, Q(x)$ abrège $\forall x \left(x \in E \Rightarrow Q(x)\right)$, et enfin que $A\Rightarrow B$ veut dire la même chose que $\neg (A \wedge \neg B )$.
    Dans ce cas si $V$ est un ensemble et $F$ une propriété quelconque, l'énoncé
    $$\left [\neg \exists y, y \in V \right ] \Rightarrow \left [ \forall x \in V, F(x)\right ]$$ devient une évidence grammaticale compte tenu de ce que (*) $\neg \neg C$ équivaut à $C$ pour tout énoncé $C$ puisque, une fois les abréviations dépliées et la règle (*) mise a contribution, on voit que cet énoncé dit la même chose que $$
    \neg \left [\left ( \neg \exists y \left [ y \in V \right ] \right )\wedge \exists x \left ( x \in V \wedge \neg F(x) \right )\right ]
    $$
    En effet s'il n'y a aucun élément dans $V$, comment pourrait-il y avoir un élément dans $V$ qui de surcroît ne satisfait pas $F$?
    Ensuite tu peux remplacer $V$ par $\emptyset$.
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • Bonjour Foys. Peux-tu me dire comment on interprète $\lnot \exists y$ ? J'ai décroché à partir de cette ligne.
  • Bonjour PierreCap; j'ai rajouté une paire de crochet en plus. $\neg \exists y H$ est juste $\neg (\exists y H)$.
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • Bonjour Foys. C'était à ligne du dessus mon problème :
    $$\left [\neg \exists y, y \in V \right ] \Rightarrow \left [ \forall x \in V, F(x)\right ]$$
    Mais j'ai compris en sortant le symbole $\lnot$ des crochets. Je te remercie.

    Ne peut-on pas dire aussi que $\forall x P(x)$ peut s'écrire $\forall x \in X$ en ayant préalablement posé $X=\{y \ | P(y)\}$ ?
    Si $P$ est impossible on voit ainsi que $X$ est vide et $\exists x \in X$ est faux donc $\forall x P(x)$ est vrai. Est-ce correct ?
  • D'une manière générale:

    1/ $[(\exists xR(x))\to P]$ veut dire la même chose que $[\forall x(R(x)\to P)]$ et ce dans TOUTES les logiques actuellement connues, y compris les plus faibles (bien plus faibles que l'intuitionniste). Tu peux même considérer que ce n'est pas une équivalence mais une égalité à ce point de rapprochement.

    2/ En particulier, avec $P:=faux$, on note généralement $\perp$ pour dire "faux", et on abrège $A\to \perp$ par $(non(A))$, ça te donne:

    $$[(\exists xR(x))\to \perp] \iff [\forall x(R(x)\to \perp)]$$

    c'est à dire

    $$[non(\exists x R(x))] \iff [\forall x(non(R(x)))]$$

    que l'on devrait probablement plutôt écrire raisonnablement:

    $$[non(\exists x R(x))] = [\forall x(non(R(x)))]$$

    A cause de la présence très en amont de cette équivalence.

    A mes précédents posts, je n'ai pas eu le temps d'écrire en entier l'axiome de récurrence qui t'intéressait, je me suis contenté d'insister (je varie en te le faisant avec le signe $\in$) sur le fait que pour tout $A$:

    c'est la même chose de dire : $non(\exists x:[x\in A\ et\ (\forall y<x: y\notin A)])$

    que de dire :$ [ \forall x:[ (\forall y<x: y\notin A) \to (x\notin A) ] $

    en notant $\to$ pour l'implication.

    Ceci afin de te signaler que c'est un grand mot que de dire que c'est un théorème que l'axiome de récurrence (ou la définition de bon ordre) entraine l'énoncé qui est à l'origine du présent fil. Certes, c'est bien un théorème, mais il est parfaitement évident, ce n'est qu'une réécriture de la définition quasiment telle quelle.

    Dire "toute partie non vide a un plus petit élément" c'est dire (et pas seulement "équivalent par théorème à dire"):

    $$ \forall A: [(\forall x:[ (\forall y<x: y\notin A) \to (x\notin A) ] )\to (A\ vide) ]$$

    edit, j'avais écrit $ \forall A: [(\forall x:[ (\forall y<x: y\notin A) \to (x\notin A) ] ) ]$ qui non seulement est faux, mais même plus, ne veut pas dire grand chose.
    Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
  • Bonjour Christophe. Je te remercie pour ces remarques très intéressantes et instructives. Je pense avoir compris le plus gros mais il y a deux ou trois points sur lesquels je bloque un peu.

    Sur le point (1) tu as écrit : $[(\exists xR(x))\to P]$ veut dire la même chose que $[\forall x(R(x)\to P)]$. Cela est vrai à condition que la variable $x$ ne figure pas dans l'énoncé de $P$ ? Ce qui est bien le cas dans l'exemple que tu prends ensuite.

    En dernière partie tu écris que la formule :
    $$ \forall A: (\forall x:[ (\forall y<x: y\notin A) \to (x\notin A) ] ) $$
    revient à dire que toute partie $A$ possède un plus petit élément. J'ai du mal à comprendre pourquoi, ce ne serait pas plutôt sa négation :
    $$\exists x:[x\in A\ et\ (\forall y<x: y\notin A)]$$
    qui veut dire cela (il existe $x\in A$ tel que tous ses minorants stricts n'appartiennent pas à $A$).
  • J'ai fait des fautes de frappe sous la barre horizontale j'écris l'hypothèse mais pas la conclusion je corrigerai oublie ce psg pour l'instant.
    Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
  • J'ai corrigé de mon téléphone sans du coup hélas laisser la trca de l'ancienne erreur je la signalerai d'un pc
    Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
  • Et oui x ne doit pas figurer pour ta Q1
    Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
  • [large]Juste une digression.[/large] Compte-tenu de ton passé annoncé, on t'a, foys et moi, directement informé dans le paradigme de la logique classique, mais sache que les mots logiques ont une définition profonde et authentique valable dans toutes les logiques connues, même très faibles. Je te les redonne:

    $(A\ et\ B):= (\forall X :[(A\to (B\to X))\to X])$

    $(A\ ou\ B):=(\forall X: [(A\to X)\to ((B\to X)\to X)])$

    $(\exists x: R(x)) := (\forall Z: [(\forall y:(R(y)\to Z))\to Z])$

    Tu as deux "et", je ne t'ai donné que le plus usité.

    C'est de là que résulte (entre autre) la "profonde quasi-égalité" entre $[(\exists xR(x))\to P]$ et $\forall x[R(x)\to P]$

    Je te rappelle aussi que "l'abréviation" $(non(A)):=(A\to Tout)$ peut en fait "se démontrer" quasiment dans les plus faibles logiques, donc ne peut pas être sujette à doutes importants (j'abrège $\perp :=Tout$).

    $$[non(A)] = [(non(\perp)) \to (non(A))] = [A\to \perp]$$

    Les logiques classiques et intuitionnistes (et autres logiques) sont définies comme suit:

    L'ensemble des phrases, noté $P$ est doté d'un ordre noté $\leq$, complet (tout ensemble a une borne inf) et d'un élément $1$ et vérifie, pour toutes phrases $A,B,C$:

    $(1\to A) = A$
    $A\leq B$ si et seulement si $1\leq (A\to B)$
    $[A\to (B\to C)]=[B\to (A\to C)]$
    $\to$ est croissant à droite et décroissante à gauche

    Les théorèmes sont les éléments $\geq 1$

    - Si tu ajoutes l'axiome : $\forall X: X\leq 1$, tu obtiens la logique dite AFFINE (ainsi en logique affine il n'y a qu'un théorème: $1$)

    - Si tu ajoutes à la logique affine l'axiome : $\forall X, Y: ( [X\to (X\to Y)]\leq [X\to Y])$, tu obtiens la logique dite INTUITIONNISTE

    - Si tu ajoutes à la logique intuitionniste l'axiome $\forall X,Y: [((X\to Y)\to Y) = ((Y\to X)\to X)]$, tu obtiens la logique dite CLASSIQUE.

    La science se fait en logique classique. Tes études se sont déroulées en logique classique par exemple.
    Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
  • Salut, j'ai lu la conversation en diagonale et comme je suis assez débutant et donc pas toujours à l'aise avec les "mélanges de grammaires" ou autre raccourcis, je tiens à apporter ces deux précisions à l'intention de PierreCap:

    - Posée comme elle est, ta question laisse penser que tu n'as pas cerné la différence fondamentale entre la récurrence "simple" et la récurrence forte. La première n'est valide que dans le cas où chaque élément (sauf 0) a un prédécesseur, donc dans le cas où ton ensemble bien ordonné est isomorphe à $(\mathbb{N}, \leq )$ ou un de ses segments initiaux (lui-même ou un ensemble fini), tandis que la récurrence forte est valide pour tout ensemble bien ordonné (si tu es au-delà de $\mathbb{N}$ il y aura au moins un élément sans prédécesseur, le premier d'entre eux est le plus petit élément plus grand que tout les entiers naturels, il existe car l'ensemble est bien ordonné).

    - Ici vous vous êtes surtout concentré sur le fait qu'en utilisant cette formule on peut se passer d'une formule d'initialisation, c'est exact, mais si on est pas habitué, il faut faire super attention à plusieurs raccourcis qui ont été utilisés ici, et dont les gens déjà très à l'aise avec la logique font abstraction (alors que ça peut méchamment bloquer les néophytes).

    Tu as écris à peu près cela:

    $\forall x\in E \left( \left[\forall y <x \rightarrow P(y) \right] \rightarrow P(x) \right) $

    On notera d'une part que quand on écrit $y<x$ c'est que y appartient à E (sinon la relation d'ordre n'a pas été définie) et les trucs du genre $\forall x \in E(F(x))$ (où F est une formule) sont en fait un raccourci pour dire $\forall x (x\in E \rightarrow F(x))$ (et pour la petite histoire, quand tu écris $\exists x\in E (F(x))$ ça signifie $\exists x (x\in E \wedge F(x) )$ ).
    Une formule "grammaticalement correcte" pour les règles de logique classique (dit aussi "calcul des séquents") ressemblerait plutôt à cela:

    $ \forall x \left( x\in E \rightarrow \left[ \left(\forall y \left[y \in E \rightarrow \left(y<x \rightarrow P(y)\right) \right] \right) \rightarrow P(x) \right] \right)$

    C'est à partir de cela que tu dois utiliser cette histoire d'hypothèse vide comme l'ont au début proposé ev et Champ-au-Lion, mais les premières fois, ce n'est pas évident et tu as donc tout intérêt à "transformer" cette formule de manière à avoir un machin qui te rendra plus évidente cette hypothèse vide, d'une part en mettant les implications sous formes disjonctives au niveau de $ y \in E \rightarrow \left(y<x \rightarrow P(y)\right) $ ( tu dois obtenir un truc dans ce goût-là: $\neg y\in E \lor \neg y<x \lor P(x) $, si je ne me trompe pas sur les conventions de priorités entre la négation et les opérateurs binaires ) et ensuite, comme ça a été proposé d'utiliser notamment ces histoires de négation et de quantificateur pour montrer que la formule est en fait équivalente à ce machin-là:

    $\forall x\left( x\in E\rightarrow \left[ \left( \neg\exists y[y\in E \wedge y<x\wedge \neg P(y)]\right) \rightarrow P(x)\right]\right)$

    Et là, ça pose moins de problème car la formule $\neg\exists y[y\in E \wedge y<x\wedge \neg P(y)]$ est évidemment vrai pour $x=0$.
  • Merci Christophe pour cette digression intéressante. J'ignorais qu'il y avait plusieurs logiques. C'est ma femme qui sera contente quand je lui apprendrai cela ;-) (elle me dit souvent qu'elle a sa propre logique, que je ne peux pas cpmprendre)
  • Merci Titi Le Curieux pour ces conseils très instructifs. J'ai en effet souvent des difficultés devant des expressions du genre $\forall y < x$. Et ça se complique davantage qd il y a le symbole $\lnot$ dans le coup. Je saurais comment les transformer pour qu'ils deviennent plus facilement compréhensibles. Je vais me faire un petit formulaire je crois. Je te remercie beaucoup.

    Pierre
  • $\forall x\in A: B$ est une abréviation de $\forall x: ([x\in A]\to B)$

    $\exists x\in A: B$ est une abréviation de $\exists x: ([x\in A]\ et\ B)$

    $\forall xRt: B$ est une abréviation (très abusive) de $\forall x: ([xRt]\to B)$

    $\exists xRt: B$ est une abréviation de $\exists x: ([xR t]\ et\ B)$

    C'est tout.

    D'autre part, comme le signale à juste titre TitiLC, on t'a écrit en espérant que tu saurais où se trouvent les tacites $\forall x\in A$, en écrivant $\forall x$ à la place, parce que c'est sacrément chronophages sinon. Mais n'hésite pas à demander si tu vois un $\forall x$ et que tu te demandes quel $<<\in A>>$ est sous-entendu.
    Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
  • D'accord merci Christophe. Je suis soulagé d'apprendre que derrière $\forall x$ et $\exists x$ il faut indiquer $x \in X$. Du moins lorsque le $X$ n'est pas évident.

    Tu utilises souvent le symbole " : " peux-tu me dire s'il a une signification particulière, ou si c'est juste un séparateur ? Car je l'ai aussi souvent vu dans les formules décrivant un ensemble comme $E=\{x\in X : P(x)\}$
  • Non, non, c'est juste pour séparer, car je ne trouve pas très aéré d'écrire $\forall xA$, donc j'écris $\forall x: A$
    Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
Connectez-vous ou Inscrivez-vous pour répondre.