Accessibilité et induction

$\newcommand{\pred}[1]{\text{préd} \left ( #1\right )}$
Le but de ce post est de présenter un prédicat ("Acc") qui est utilisé dans les prouveurs comme COQ afin de pratiquer des formes de récurrence un peu générales, mais qui se formalise bien en théorie des ensembles.

On se place dans ZF.
Dans toute la suite, $E$ est un ensemble et $r$ une relation binaire (quelconque!) sur $E$ (i.e. une partie de $E^2$).


I) Définitions de base.

Si $x\in E$, on notera $\pred x$ l'ensemble des prédécesseurs de $x$ c'est-à-dire l'ensemble des éléments $y$ de $E$ tels que $(x,y) \in r$.

Définition 1: On dit qu'une partie $D$ de $E$ est stable par succession si pour tout $x\in E$, si $\pred x \subseteq D$ alors $x \in D$.

Par exemple $E$ est lui-même stable par succession.

On a le premier résultat évident suivant:
1°) l'intersection de toute famille de parties de $E$ stables par succession est stable par succession.

Définition 2: l'intersection de l'ensemble des parties de $E$ stables par succession se note $Acc(E,r)$ dans la suite. Ses éléments s'appellent les éléments accessibles de $(E,r)$.

Remarque 1°: $Acc(E,r)$ est donc la plus petite partie de $E$ stable par succession d'après 1°).

On a un "principe de récurrence" qui n'est rien d'autre qu'un remaniement trivial de la définition:
2°)"Soit $P$ une propriété sur $E$ telle que pour tout $y\in E$, si pour tout $z\in E$ tel que $(y,z)\in r$, on a $P(z)$ alors on a $P(y)$.
Alors tout élément accessible de $E$ satisfait $P$"
. C'est simplement parce que $F:=\{x\in E \mid P(x)\}$ est stable par succession.

Définition 3: On dit qu'un élément de $E$ est initial (pour $r$) si l'ensemble de ses prédécesseurs est vide.
Si $y$ est un élément initial et si $F$ est une partie de $E$ stable par succession, alors $\emptyset = \pred y \subseteq F$ et donc $y\in F$. Ainsi $y$ appartient à toutes les parties de $E$ stables par succession et par suite:
3°) Tout élément initial de $E$ est accessible.
On verra plus loin que réciproquement, si $Acc(E,r) \neq \emptyset$ alors il existe des éléments initiaux pour $r$ dans $E$.
_______________________


II) Interprétation intuitive de la notion d'élément accessible.
Cette partie est indépendante des autres; aucun de ses résultats ne sera utilisé dans la suite notamment parce qu'on définira plus tard la notion de "fonction définie par récurrence" de façon générale. Le but est de permettre au lecteur de mettre une image mentale sur l'ensemble $Acc (E,r)$ . On suppose l'axiome du choix dépendant.

4°) Un élément $a$ de $E$ est accessible si et seulement si il n'existe aucune suite infinie $(a_n)_{n\in \N}$ telle que $a_0=a$ et $(a_{n+1},a_n) \in r$.
Ainsi, $a$ est accessible précisément quand toutes les suites qui partent de $a$ et remontent $r$ finissent par s'arrêter.

Preuve: Soit $B$ l'ensemble de tous les $x$ tels qu'il n'existe aucune suite partant de $x$ et satisfaisant la condition de l'énoncé. Alors $B$ est stable par succession (évident) et donc $Acc(E,r) \subseteq B$. Réciproquement, soit $y$ non accessible. Posons $y_0:=y$. Alors il existe au moins un $y_1 \in \pred {y_0}$ non accessible (sinon, $\pred {y_0} \subseteq Acc(E,r)$ et donc $y_0 \in Acc(E,r)$), de même il existe $y_2\in \pred {y_1}$ non accessible, $y_3\in \pred {y_2}$ non accessible ... Via l'axiome du choix dépendant, on construit donc une suite $n\mapsto y_n$ telle que $y_0=y$ et $y_{n+1} \in \pred {y_n}$ i.e. $(y_{n+1},y_n) \in r$ pour tout $n\in \N$. On a donc $y\notin B$, et le résultat suit.

Par exemple les éléments de $\N$ sont tous accessibles pour la relation $R(x,y) := y = x+1$ (on y reviendra).
___________________________


III) Relations bien fondées.

5°) Les énoncés suivants sont équivalents:
(i) tous les éléments de $E$ sont accessibles
(ii) pour toute partie non vide $G$ de $E$, il existe $y\in G$ tel que $\pred {y}$ est disjoint de $G$.


Définition 4: on dira que $r$ est bien fondée si elle satisfait une des conditions équivalentes du théorème 5°)

Preuve: si (i) est satisfait alors $E=Acc(E,r)$ est la plus petite partie stable par succession de $E$ et donc la seule. Si $G$ est une partie non vide de $E$ alors $E\backslash G$ est différent de $E$ et donc non stable par succession. Il existe donc $y$ dans $E$ tel que $\pred y \subseteq E \backslash G$ et tel que $y \notin E \backslash G$, autrement dit $y \in G$ ce qui entraîne (ii).
Réciproquement si (ii) est vrai, alors aucune partie de $E$ à part $E$ ne peut être stable par succession, en effet si $H$ est une partie de $E$ différente de $E$, $E \backslash H$ est non vide donc contient $z$ tel que $\pred z \cap (E \backslash H) = \emptyset$, autrement dit $\pred z \subseteq H$. Par suite $Acc(E,r)= \bigcap_{X \in \{E\}} X = E$ ce qui conclut la preuve.

Les relations bien fondées sont le cadre où on applique fréquemment les résultats de ce fil. $\N$ et la succession usuelle, les ensembles ordonnés, les fermés dans un espace muni d'une topologie noethérienne (Topologie de Zariski), l'appartenance sous l'axiome de fondation, les idéaux d'un anneau noethérien pour la relation d'ordre opposée de l'inclusion ...
__________________________


IV) Parties stables par prédecesseurs.
Définition 5: On dira qu'une partie $X$ de $E$ est stable par prédécesseurs si pour tout $t\in X$, $\pred t$ est contenu dans $X$.
$E$ est évidemment stable par prédécesseurs.

6°) Toute réunion et toute intersection d'un ensemble de parties de $E$ stables par prédécesseurs est encore stable par prédécesseur.
A nouveau cette propriété est triviale (application directe de la définition) comme le théorème 1°.

NB: on prendra grade au fait que "stable par prédécesseurs" n'est pas équivalent à "stable par succession" pour la relation opposée.

7°) $Acc(E,r)$ est stable par prédecesseurs.
Autrement dit, pour tout $x$, $x$ est accessible si et seulement si tous les prédécesseurs de $x$ sont accessibles.
Preuve de 7°): soit $F$ l'ensemble des $x$ de $E$ tels que $\pred x \subseteq Acc(E,r)$. Soit $y\in E$ tel que $\pred y \subseteq F$. Alors pour tout $z\in \pred y$, on a $\pred z \subseteq Acc(E,r)$ et donc $z\in Acc(E,r)$ par la remarque 1° de la partie I. Par suite, $\pred y\subseteq Acc(E,r)$ et donc $y\in F$. Donc $F$ est stable par succession. Donc $Acc(E,r) \subseteq F$ ce qui entraîne le résultat.

8°) Si $Acc(E,r)$ est non vide, il existe dans $E$ des éléments initiaux pour $r$.
Ce résultat est une sorte de réciproque à 3°.
Preuve: si $y\in E$, on définit $G(y)$ comme l'intersection des parties stables par prédécesseurs et contenant $y$.
Soit $U$ l'ensemble de tous les $t\in E$ tel que $G(t)$ contient au moins un élément initial. Alors $U$ est stable par succession, en effet soit $x\in E$ est tel que $\pred x \subseteq U$. Si $\pred x=\emptyset$, alors $x$ est un élément initial de $G(x)$. Sinon, soit $y\in \pred x$. Alors comme $y\in U$, il existe $i\in G(y)$ initial. Or $G(y) \subseteq G(x)$ (si $V$ est une partie de $E$ stable par prédécesseurs et si $x\in V$ alors $y \in V$ donc $G(y) \subseteq V$ donc en prenant l'intersection de tels $V$, $G(y) \subseteq G(x)$). Donc $i\in G(x)$.
Bref $U$ étant stable par succession, il contient $Acc(E,r)$ et comme ce dernier ensemble est par hypothèse non vide, on en déduit qu'il existe $p,q\in E$ tels que $p\in G(q)$ et $p$ initial,et en particulier l'existence d'un élément initial dans $E$.
De façon imagée, si on appelle "arbre généalogique" d'un élément $x\in E$ l'ensemble $G(x)$ défini dans cette preuve, on a montré plus généralement que tout élément accessible de $E$ possède au moins un élément initial dans son arbre généalogique.

Exemples: Si $(M,\top)$ est un ensemble muni d'une loi de composition interne et $e\in M$ un élément, notons $r_{\top,e}$ la relation $\{x,y \mid x \top e = y\}$.
Lorsque $M=\N$ muni de l'addition usuelle, $0$ est initial pour $r_{+,1}$.
Lorsque $M=\Z$ ou $\Z / n \Z$, aucun élément de $M$ n'est accessible pour $r_{ +,1}$ puisqu'il n'y a aucun élément initial dans $M$.

_________________________


Dans le message qui va suivre, on va montrer comment définir des fonctions par "induction" (ou récurrence) sur l'ensemble des éléments accessibles de $E$, ce qui était en fait le but principal de ce fil.
Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.

Réponses

  • $\newcommand{\pred}[1]{\text{préd}\left ( #1 \right )}$
    $\newcommand{\dom}[1]{\text{dom} \left ( #1 \right )}$
    Cette partie fait suite à http://www.les-mathematiques.net/phorum/read.php?16,1919294,1919294#msg-1919294 .

    V) Rappels (définitions) sur les fonctions et relations fonctionnelles.

    Définition 6: soit $\mathbf F$une formule logique à deux arguments. Si $A$ est un ensemble, la restriction de $\mathbf F$ à $A$ sera la formule $\mathbf F \big |_{A} (x,y):= \mathbf F(x,y) \text{ et } x \in A$.

    Définition 7: La phrase "$\mathbf F$ est une relation fonctionnelle" est l'abréviation de
    "Pour tous $a,b,c$, si $\mathbf F(a,b)$ et $\mathbf F(a,c)$ alors $b=c$".


    Si $\mathbf F (u,v)$, on dira parfois que "$v$ est l'image de $u$ par $ \mathbf F$"

    9°) Si $\mathbf F$ est fonctionnelle, sa restriction à n'importe quel ensemble l'est aussi.
    Preuve: évident.

    Définition 8: lorsque $f$ est un ensemble, $f$ est appelé une "fonction" si tous ses éléments sont des couples et si la formule (d'arguments $p,q$) "$(p,q) \in f$" est fonctionnelle au sens de 6°, autrement dit si pour tous $x,y,z$ tels que $(x,y)\in f$ et $(x,z)\in f$, on a $y=z$.
    On appelle domaine de $f$ et on note $\dom f$ l'ensemble des $t$ pour lesquels il existe un $u$ tel que $(t,u)\in f$.
    Pour toute fonction $f$ et tout $y\in \dom f$, $f(y)$ désigne l'unique objet tel que $\left(y,f(y) \right) \in f$.

    Ainsi, $f(y)$ n'est autre que l'image de $y$ par $f$.

    NB: soit $f$ une fonction. En assimilant $f$ à la relation fonctionnelle $(\text x, \text y) \in f$ (à arguments $\text x, \text y$), pour tout ensemble $B$, la restriction de $f$ à $B$ est l'ensemble des couples $(p,q)$ appartenant à $f$ et tels que $p\in B$ (le fait que ce soit un ensemble est garanti par les axiomes de ZF dont le schéma de remplacement). Cette restriction est notée à nouveau $f \big |_B$.

    10°) étant donné une relation fonctionnelle $\mathbf F$ et un ensemble $X$, il existe une unique fonction $m$ (i.e. un ensemble) tel que pour tous $a,b$ $\mathbf F\big |_X (a,b)$ si et seulement si $(a,b) \in m$.
    L'unicité est donnée par l'axiome d'extensionnalité.
    Pour l'existence, il existe un ensemble $Y$ dont les éléments sont exactement les $z$ tels qu'il existe $t\in X$tel que $\mathbf F (t,z)$ (schéma de remplacement) et on prend $m:=\{u \in X \times Y \mid \forall a,b, u = (a,b) \Rightarrow \mathbf F (a,b) \}$ via le schéma de compréhension.

    Pour faire simple et court: une relation fonctionnelle restreinte à un ensemble est la même chose qu'une fonction.


    Remarque 2° la définition de relation fonctionnelle s'étend bien sûr à des formules d'un nombre quelconque de variables. Par exemple une formule $\mathbf G(\text x, \text y,\text z)$ à 3 arguments $\text x,\text y,\text z$ est dite fonctionnelle si (on montre que) pour tous $u,v,w,x$, si $\mathbf G (u,v,w)$ et $\mathbf G (u,v,x)$ alors $w=x$.
    ________________________

    VI) Fonctions définies par induction.

    Dans le reste du présent message,on considère une formule à trois arguments $\mathbf H$ dont on suppose que c'est une relation fonctionnelle (voir Remarque 2°).

    Définition 9: une fonction $g$ est dite $\mathbf H$-inductive si:
    (i) $\dom g$ est une partie de $E$ stable par prédécesseurs
    (ii) pour tout $x \in \dom g$, $\mathbf H \left (x, g \big |_{\pred x}, g(x) \right )$


    Autrement dit $g(x)$ est l'image de $\left(x,g \big|_{\pred x} \right )$ par $\mathbf H$ pour tout $x$.

    11°) (unicité des fonctions $\bf H$ inductives sur $Acc(E,r)$): Soient $f,g$ deux fonctions $\mathbf H$-inductives. Alors les restrictions de $f$ et de $g$ à $Acc(E,r) \cap \dom f \cap \dom g$ sont égales.
    Soit $F$ l'ensemble de tous les $x$ de $E$ tels que si $x\in \dom f \cap \dom g$, alors $f(x) = g(x)$.
    Montrons que $F$ est stable par succession, ce qui entraîne bien sûr $Acc(E,r) \subseteq F$ et par suite, le résultat.

    Soit $u\in E$ tel que $\pred u$ est contenu dans $F$. supposons $u \in \dom f \cap \dom g$ et montrons $f(u)=g(u)$. Comme $\dom f$ et $\dom g$ sont stables par prédécesseurs par hypothèse, $\pred u \subseteq \dom f \cap \dom g$. Donc (définition de $F$ et $\pred u \subseteq F$) pour tout $v\in \pred u$, $f(v)=g(v)$. Donc $f \big|_{\pred u} = g \big|_{\pred u}$. Donc comme $\mathbf H \left (u,f \big|_{\pred u}, f(u) \right )$ et $\mathbf H \left (u,g \big|_{\pred u}, g(u) \right )$ et comme $\bf H$ est fonctionnelle, $f(u) = g(u)$ d'où le résultat.

    ******************
    Définition 10: on note $\mathbf{Rec(H)} (\text x, \text y)$ l'énoncé "il existe sur $E$ une fonction $\mathbf H$-inductive telle que $\text x \in \dom f$ et $(\text x, \text y) \in f$" (i.e. $f(\text x) = \text y$).

    Le théorème 11° dit exactement que la restriction de $\mathbf{Rec(\mathbf H)}$ à $Acc(E,r)$ est une relation fonctionnelle.

    Compte tenu du 10° de la partie V, on peut noter $Rec(\mathbf H)$ l'unique fonction correspondant à $\mathbf{Rec(\mathbf H)}\big |_{Acc(E,r)}$, i.e. telle que pour tous $p,q$, $(p,q)\in Rec(\mathbf H)$ si et seulement si $\mathbf{Rec(\mathbf H)} (p,q)$ et $p\in Acc(E,r)$.

    12°) $Rec(\mathbf H)$ est la plus grosse fonction $\mathbf H$-inductive dont le domaine est contenu dans $Acc(E,r)$, autrement dit:
    (i) pour toute fonction $\mathbf H$-inductive $g$ et tout $a \in Acc(E,r)$, $g(a) = Rec(\mathbf H) (a)$
    (ii) $Rec(H)$ est $\mathbf H$-inductive.

    (i) est conséquence immédiate des définitions de $\mathbf {Rec(H)}$ et $Rec(\mathbf H)$.
    (ii) $Acc(E,r)$ est stable par prédécesseurs -cf 7° du message précédent en lien- et par 6°dudit message, la réunion $Y$ des domaines de fonctions $\mathbf H$-inductives l'est aussi. Comme le domaine de $Rec(\mathbf H)$ est $Y \cap Acc(E,r)$, c'est une partie stable par prédécesseurs.
    Soit $x\in \dom {Rec(\mathbf H)}$. Soit $f$ $\mathbf H$-inductive telle que $x\in \dom f$. Alors $f(z)= Rec(\mathbf H)(z)$ pour tout $z\in \{x\} \cup \pred x$ par (i). Donc comme $\mathbf H \left (x, f \big |_{\pred x}, f(x)\right )$, on a aussi $\mathbf H \left ( Rec(\mathbf H)\big |_{\pred x}, Rec(\mathbf H) (x)\right )$ d'où le résultat.


    Définition 11: $Rec(\mathbf H)$ s'appelle la "fonction définie par récurrence (ou par induction) sur $Acc(E,r)$ à l'aide de $\mathbf H$".
    ______________________


    VII) Conditions suffisantes pour que $Rec(\mathbf H)$ soit définie sur tout $Acc(E,r)$.
    En gros, il suffit que $\dom {Rec(\mathbf H)}$ soit stable par succession (puisqu'il est déjà contenu dans $Acc(E,r)$).

    Par exemple: On fixe un ensemble $D$ dans ce qui suit.

    13°) Si pour tout $x\in E$ et $f\in D^{\pred x}$, il existe $y\in D$ tel que $\mathbf H (x, f, y)$, alors $\dom {Rec(\mathbf H)} = Acc(E,r)$.
    Soit $X$ l'ensemble des $x\in E$ tels que $\pred x \subseteq \dom {Rec(\mathbf H)}$. Alors comme $\dom {Rec(\mathbf H)}$ est stable par prédécesseurs, $\dom {Rec(\mathbf H)} \subseteq X$ et par suite, $X$ est également stable par prédécesseurs. Soit $f$ la fonction qui à $y\in X$ fait correspondre l'unique $z$ tel que $\mathbf H \left (y, Rec(\mathbf H) \big |_{\pred y},z\right )$(*). Alors $f\big| _{\dom {Rec(\mathbf H)}}$ coïncide avec $Rec(\mathbf H)$ (car $Rec(\mathbf H)$ est $H$-inductive). Montrons que $f$ est $\mathbf H$ -inductive. Soit $t\in \dom f = X$. Alors $\pred t \subseteq \dom {Rec(\mathbf H)}$ et donc $f\big |_{\pred t} = Rec(\mathbf H) \big |_{\pred t}$. Compte tenu de ça et de (*), on a $\mathbf H \left (t, f\big |_{\pred t},f(t) \right )$ ce qui prouve que $f$ est $\mathbf H$-inductive.
    Ces considérations montrent que $\dom {Rec(\mathbf H)}$ est stable par succession (les éléments $x$ tels que $\pred x \subseteq \dom {Rec(\mathbf H)}$ sont dans le domaine d'une fonction inductive et dans $Acc(E,r)$).
    Par suite $Acc(E,r) \subseteq \dom {Rec(\mathbf H)}$ et le résultat suit.

    On donne une forme plus habituelle de ce résultat:

    14°) . Soit $I$ l'ensemble des éléments initiaux de $(E,r)$. Soit $u: I \to D$ une fonction. Pour tout $x\in E$ non initial, soit $\Phi_x$ une fonction de $D^{\pred x}$ dans $D$. Alors il existe une unique fonction $f:Acc(E,r) \to D$ telle que $f(i)=u(i)$ pour tout $i\in I$ et $f(x)=\Phi_x \left ( f \big |_{\pred x} \right)$ pour tout $x \in Acc(E,r) \backslash I$.
    Si $\pred x$ est vide, posons $\Phi_x (\emptyset) := u(x)$. Rappelons que l'on a $D^{\emptyset}=\{\emptyset\}$ et donc que $f$ n'est autre que $Rec(\mathbf K)$ avec $\mathbf K (\text x,\text p, \text y):=\Phi_{\text x} \left (\text p\big |_ {\pred {\text x}} \right) = \text y $. On applique 13°).
    ___________________________

    Tous ces résultats s'énoncent plus simplement dans le cadre de relations bien fondées (on a simplement $Acc(E,r) = E$).
    Les constructions de fonctions par récurrence (sur $\N$ ou ensembles bien ordonnés) que le lecteur connaît déjà sont des cas particuliers des théorèmes 12° à 14° ci-dessus.
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • La page web de COQ consacrée à Acc et aux relations bien fondées est intéressante à lire: https://coq.inria.fr/library/Coq.Init.Wf.html

    On va présenter en illustration un exemple parfois cité par christophe c mais jamais démontré B-) (le handwaving ne compte pas) sur le site.
    Soient $\Omega$ un ensemble, $(F_n)_{n \in \N}$ une famille dénombrable de parties de $\Omega$ et $\mathcal B$ la plus petite tribu de $\Omega$ contenant $X_k$ pour tout $k\in \N$.

    Le résultat:
    Si on suppose l'axiome du choix dépendant, il existe une partie $A$ de $\N ^{\N}$ et une fonction $\varphi:A\to \mathcal B$ surjective.

    $p,q \mapsto 2^p(2q+1)$ est une bijection notoire de $\N^2$ sur $\N^*$

    Soit $R$ l'ensemble des couples $(f,g)\in \N^{\N}$ tels que
    -ou bien $g(0)=0$ et pour tout $n\in \N$, $g(n+1)= f(n)$
    -ou bien $g(0)=1$ et il existe $p\in \N$ tel que pour tout $q\in \N$, $g(2^p(2q+1)) = f(q)$.

    $\newcommand{\pred}[1]{\text{préd}\left ( #1 \right )}$
    On voit alors que pour cette relation les éléments initiaux de $\N^{\N}$ pour $R$ sont les $h\in \N^{\N}$ tels que $h(0)\geq 2$.
    De plus si $g\in \N^{\N}$:
    Si $g(0)=0$, $\pred g = \{n \mapsto g(n+1) \}$
    Si $g(0)=1$, $\pred g = \{q \mapsto g(2^p(2q+1)) \mid p \in \N\}$.

    Si $f\in \N^{\N}$ est initial, on pose $u(f):= F_{f(0)-2}$.
    Si $f(0)=0$, $\pred f$ est un singleton $\{e\}$ et on pose pour tout $Y\in \mathcal P(\Omega)^{\{e\}}$ ,$\Phi_f (Y) := \Omega \backslash Y(e)$.
    Si $f(0)=1$, $\pred f=\{h_n\mid n \in \N\}$ est dénombrable et pour tout $Z \in, \mathcal P(\Omega)^{\pred f}$, on pose $\Phi_f (Z) = \bigcup_{n \in \N} Z(g_n)$.

    On est alors dans les conditions du théorème 14 du message précédent et il existe donc une fonction inductive maximale $\varphi$ définie sur tout $Acc \left (\N^{\N},R \right)$, telle que pour tout $f$ accessible, $\varphi(f)=F_{f(0)-2}$ si $f(0)\geq 2$, $\varphi(f)$ est le complémentaire de $\varphi(n\mapsto f(n+1))$ si $f(0)=0$
    et enfin $\varphi(f) = \bigcup_{p \in \N} \varphi (q \mapsto f(2^p (2q+1)))$ si $f(0)=1$.

    On voit tout de suite sous l'axiome du choix dépendant , que l'image de $Acc \left (\N^{\N},R \right)$ par $\varphi$ est une tribu. Le reste est routinier.
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
Connectez-vous ou Inscrivez-vous pour répondre.