Les concepts de base des formes modulaires
dans Arithmétique
Bonjour, j'ai du mal à comprendre les concepts derrière les modular forms.
- Quelqu'un pourrait m'expliquer intuitivement en quelque mots le lien entre une modular form et une courbe elliptique ? (j'ai déjà essayé de lire Fred Diamond, 1st course in modular forms et Apostol modular functions, j'avance très lentement, mais donc pas besoin de rentrer dans les détails, juste d'indiquer des pistes)
- Pareil pour ce qu'est une "cusp" ? (et pourquoi c'est important ?)
Merci beaucoup
- Quelqu'un pourrait m'expliquer intuitivement en quelque mots le lien entre une modular form et une courbe elliptique ? (j'ai déjà essayé de lire Fred Diamond, 1st course in modular forms et Apostol modular functions, j'avance très lentement, mais donc pas besoin de rentrer dans les détails, juste d'indiquer des pistes)
- Pareil pour ce qu'est une "cusp" ? (et pourquoi c'est important ?)
Merci beaucoup
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
L'intérêt de cet objet est qu'on peut lui associer une fonction $L$ qui possède des propriétés analogues à celles de la fonction $\zeta$ de Riemann ou aux fonctions $L$ de Dirichlet.
Un exemple (parmi d'autres) d'utilisation : si $K$ est un corps de nombres cubique de discriminant $<0$, la fonction $\zeta_K$ de Dedekind associée à $K$ se factorise très simplement sous la forme
$$\zeta_K (s) = \zeta(s) L(s,f)$$
où $f$ est une certaine forme automorphe parabolique. Ceci résulte du fait que, dans cette situation particulière, la conjecture forte d'Artin est vraie, ce qui permet de réinterpréter la factorisation sous cette forme (voir à ce sujet l'article de Deligne et Serre, Formes modulaires de poids $1$, 1974). On peut alors effectuer les calculs sur $\zeta_K$ peu ou prou de la même manière qu'avec $\zeta$.
D'où l'importance de ces objets.
$$y^2+x^3+ax+b=0$$
les fonctions $a,b$ sont des formes modulaires dans la variable $\omega$ et engendrent l'espace des formes modulaires (tu le trouves expliqué dans l'arithmétique de Serre).
Les fonctions modulaires apparaissent naturellement dans les problèmes classiques d'arithmétique (partitions, décomposition en sommes de carrés), mais ça Serre ne l'explique nulle part dans son livre d'arithmétique, il préfère le garder pour lui;-)
M
sur ce qu'a dit Mauricio :
- pour une certaine lattice $\Lambda$, on regarde la fonction elliptique de Weirstrass $\wp(z) = \frac{1}{z^2} +\sum_{a \in \Lambda^*} \frac{1}{(z-a)^2}-\frac{1}{a^2}$. Cette fonction est $\Lambda$ invariante, son domaine fondamental c'est $\mathbb{C} / \Lambda$ (un parallélogramme du plan complexe avec une topologie qui en fait un tore). On trouve que $(\wp(z)')^2 = 4 (\wp(z))^3 - g_2 \wp(z) - g_3$ donc que $(\wp(z)',\wp(z))$ trace une "elliptic curve over the complex numbers" quand on fait varier $z$. Finalement on voit que $g_2,g_3$ peuvent prendre toutes les valeurs quand on change de lattice, donc qu'il y a une bijection entre les elliptic curves et les lattices (et leur fonction de Weirstrass). $g_2,g_3$ sont des modular form en tant que fonctions de la lattice :
- pour une modular form, on regarde $\mathbb{C} / \Gamma$ (le groupe modulaire $\Gamma \simeq SL_2(\mathbb{Z})$). Ce genre de fonction a une invariance par action de $\Gamma$ quand une fonction elliptique est doublement périodique (donc invariante par action du groupe de translation d'une lattice), mais donc ça reste le même genre d'objet. Le domaine fondamental $\mathbb{C} / \Gamma$ est plus compliqué et a une forme d'arche.
La série d'Eiseinstein $G_{2k}$, c'est en gros (la dérivée $2k-2$ème de) la fonction de Weirstrass vue comme fonction de la lattice $\Lambda = \mathbb{Z} + \tau \mathbb{Z}$, et donc à chaque $\tau$ on peut associer une elliptic curve.
sur ce qu'a dit Noix de totos :
- on prend les coefficients $a_n$ de Fourier d'une modular form, et on regarde la L-fonction $F(s) =\sum_{n=1}^\infty a_n n^{-s}$. C'est là que le Hecke operator (un opérateur linéaire des modular form de poids $k$ dans elles-mêmes) est important, puisqu'il permet de construire toutes les modular form à coefficients multiplicatifs (et donc celles pour lesquelles $F(s)$ a un Euler product) :
La modular form est une "simultaneous eigenforms" si et seulement si ses coefficients sont multiplicatifs (le Hecke operator est construit d'une manière que $\implies$ est évident, l'autre direction un peu moins).
Une telle "simultaneous eigenform" est soit une série d'Eiseinstein ($a_n = \sigma_k(n)$, donc $F(s) = \zeta(s)\zeta(s-k)$) soit une cusp form (par exemple $\Delta = \eta^{24}$ qui donne $a_n = \tau(n)$ la fonction de Ramanujan, dont il est presque impossible de prouver qu'elle est multiplicative sans le Hecke operator).
On a aussi que $F(s)\Gamma(s)$ (là c'est la fonction gamma) est la transformée de Mellin de la modular form :
$$f(\tau) = \sum_{n=1}^\infty a_n e^{2 i \pi n \tau} \implies \int_0^\infty f(- \frac{x}{2 i \pi} ) x^{s-1} dx = \Gamma(s) F(s)$$
(je me rends compte qu'en écrivant $\sum_{n=1}^\infty$ je suppose que $f$ est une cusp form)
Dès qu'on a une "simultaneous eigenform" (une modular form à coefficients multiplicatifs) on sait prouver que les $a_n$ sont $\mathcal{O}(n^{2k})$, et vu que l'invariance de $f$ pour le groupe modulaire donne une équation fonctionnelle pour $F(s)$ (type celle qu'on a pour $\zeta(s)$), avec le Euler product on a donc une hypothèse de Riemann (c'est le propos de la Selberg class d'inclure les L-fonctions de ces modular form).
Qu'est-ce qu'il y a d'important ensuite à comprendre ? La fonction $\zeta_{E(Q)}(s)$ d'une elliptic curve ? Les sous-groupes de $SL_2(\mathbb{Z})$ et autres newforms ?
J'ai vu que les fonctions theta étaient aussi très liées aux modular form, mais sans vraiment être capable de les placer dans tout ça ? (à part que $\zeta_K(s) \Gamma(s)$ est la transformée de Mellin d'une fonction thêta, et il y a la theta representation qui montre que la fonction theta de Jacobi est invariante par le groupe d'Heisenberg agissant sur le (demi) plan complexe, donc encore le même genre d'objet)
Donc il explique que si on prend la fonction de Weirstrass pour une lattice $\Lambda$, avec $P(z) = (\wp'(z+z),\wp(z))$ on a $P$ qui est un isomorphisme de groupe entre $(\mathbb{C}/\Lambda,+)$ l'addition complexe modulo $\Lambda$ et $E(\mathbb{C}),\cdot$ l'opération de groupe habituelle sur la courbe elliptique (complexe, $y,x$ l'étant) $y^2 = 4x^3 - g_2 x - g_3$.
Donc, si on connait la loi de groupe d'une courbe elliptique, on peut calculer $\wp(z_1+z_2)$ et $\wp'(z_1+z_2)$ en fonction (rationnelle) de $\wp(z_1),\wp(z_2),\wp'(z_1),\wp'(z_2)$. D'où le lien fort entre fonction elliptique et courbe elliptique.
Il explique aussi que l'isomorphisme réciproque de $P$ c'est l'intégrale elliptique (...)
et que toutes les fonctions elliptiques sont des fonctions rationnelles en $\wp(z), \wp'(z)$ (pour un certain $\Lambda$), la preuve étant simplement qu'une fonction elliptique holomorphe est constante.
Cette équation fonctionnelle n'est pas seulement utilisée pour les (éventuels) zéros dits non-triviaux de la fonction $L$. Elle sert également à obtenir, via le théorème de Phragmen-Lindelöf, une borne de convexité dans la bande critique, i.e. une majoration de la forme $L(\sigma + it) \ll |t|^{\theta_f(\sigma) + \varepsilon}$ pour $\sigma$ dans la bande critique et $|t| \geqslant 3$, et où $\theta_f(\sigma) >0$ est un exposant lié à la nature de la fonction $L(s,f)$.
Par exemple pour $f = \mathbf{1}$ et pour $\sigma = \frac{1}{2}$ (qui est la valeur de $\sigma$ la plus emblématique, évidemment), l'équation fonctionnelle de $\zeta$ permet d'obtenir $\theta_{\mathbf{1}} \left ( \frac{1}{2} \right)= \frac{1}{4}$. L'amélioration de cet exposant est l'un des principaux problèmes actuels de théorie analytique des nombres, et fait l'objet de recherches actives et très poussées, car on pense que l'on peut prendre $\theta_{\mathbf{1}} = 0$ (hypothèse de Lindelöf). Le record actuel, très récent, est dû à Bourgain (2015) qui a obtenu $\theta_{\mathbf{1}} \left ( \frac{1}{2} \right) = \frac{53}{342} \approx 0,15447 \dotsc$, améliorant le précédent record de 2005 dû à Huxley ($\frac{32}{205} \approx 0,15609\dotsc$).
M.
Sinon en écrivant ce que j'ai écrit plus haut j'ai eu l'impression de comprendre des choses, est-ce que vous voulez bien le relire et me dire quel concepts important il faut que je regarde ensuite ? (notamment les sous-groupes $G$ de $SL_2(\mathbb{Z})$ et les "cusp" de la compactification de $G/\mathbb{C}_{Im(\tau) > 0}$ blablabla)
(je vais aussi essayer de regarder en détail les démonstrations et les calculs qui sont impliqués dans ces livres sur les formes modulaires, mais comme je disais pour le moment mon problème est que je me perds un peu dans les concepts - que j'ai un peu du mal à voir où on veut en venir)
Par exemple j'ai regardé pas mal les caractères de Dirichlet et les corps de nombres et les fonctions zeta de Dedekind, qui sont la transformée de Mellin également d'une fonction thêta. Comment est-ce que vous feriez pour lier ça aux formes modulaires ?
Une de mes portes d'entrée dans la citadelle s'est faite (c'est banal) par l'étude arithmétique des séries d'Eisenstein des réseaux de $\mathbb C$.En fait, il y a un seul réseau ``générique'' de $\mathbb C$, à savoir le réseau $2i\pi (\mathbb Z + \mathbb Z\tau)$ où $q = e^{2i\pi\tau}$ est vu ``comme une variable''.
Comme j'étais (et je le suis encore) un amateur, je me suis procuré je ne sais combien d'ouvrages sur le sujet. Tous apportent quelque chose. J'ai bien apprécié, pour l'enfant que je suis (cela le rassure), les quelques lignes de la page 9 de W. Stein (Modular Forms, a Computational Approach).
The above definitions note de CQ : cusps et formes modulaires of modular forms might leave the impression that modular forms occupy an obscure corner of complexe analysis. This is not the case! Modular forms are highly geometric, arithmetic, and topological objects that are of extreme interest all over mathematics:
Et dans les 2 pages suivantes, il fournit 10 thèmes liés aux formes modulaires.
J'attache 4 pages (brouillon) sur ma vision naïve (et partielle) du monde modulaire. J'ai d'autres pages de ce type. Evidemment rien à voir, avec les ouvrages dont je parle ci-dessus, qui sont écrits par des spécialistes. Si cela te dit, je peux t'en fournir la liste (de ces ouvrages).
Après la série d’Eisenstein $G_{2k}(\tau)$ pour moi c'est l'objet le plus simple, vu qu'il est facile de la définir et de montrer son invariance par le groupe modulaire et que ses coefficients de Fourier sont $\sigma_k(n) = \sum_{d | n} d^k$, i.e. c'est le prototype d'une forme modulaire liée à $\zeta(s)$.
Après on a aussi que $\zeta(s)\Gamma(s/2)$ c'est la transformée de Mellin de $\theta(-t^2/(i \pi))$ où $\theta(\tau) = \sum_{n = -\infty}^\infty e^{i \pi n^2 \tau }$ est la fonction thêta la plus simple.
Sachant que $\Gamma(s) \zeta(s) \zeta(s-k)$ c'est la transformée de Mellin de $G_{2k}(-\tau/(2 i \pi))$, est-ce que ça me permet d'établir un lien entre $\theta(\tau)$ et $G_{2k}(\tau)$ ?
Enfin tu évoques certains des sous-groupes de $SL_2(\mathbb{Z})$, est-ce que tu as une explication intuitive de pourquoi ils sont importants (et comment ils sont liés à $\zeta(s)$ ?)
Connais tu la fonction $j : \mathbb H \to \mathbb C$ qui est $\Gamma(1)$-invariante ? Et qui se prolonge en $\overline {\mathbb H} \to \mathbb P^1(\mathbb C)$. Note $\Gamma(1) = \mathrm {SL_2}(\mathbb Z)$.Et la fonction elliptique $\lambda$ qui est $\Gamma(2)$-invariante ?
C'est une bonne chose d'avoir un peu de métier sur les fonctions elliptiques complexes. Et de savoir où taper en ce qui concerne la $\mathbb Q$-rationnalité en $q = e^{2i\pi\tau}$. Et de voir $q$ comme une variable. Comprends tu ce que je veux dire ? As tu remarqué les bienfaits du réseau $2i\pi(\mathbb Z + \mathbb Z\tau)$ par rapport au réseau $\mathbb Z + \mathbb Z\tau$ ? Ils sont semblables donc ``pareils'' mais le premier ``épure'' le facteur $2i\pi$ qui apparaît ``partout''.
Es tu un ami intime de la série de Weierstrass $\wp_L$ d'un réseau $L$ ?
Sais tu réduire une courbe elliptique définie sur $\mathbb Z$ modulo $p$ ? Le résultat n'est pas toujours une courbe elliptique (iI faut savoir en tenir compte). Je stoppe là, j'ai peur de me faire jeter.
Sais tu ce qu'est le conducteur d'une courbe elliptique rationnelle ? As tu sous le coude quelques courbes elliptiques que tu aimes bien ? Quel est ton domaine ? Dans la citadelle constituée du monde modulaire, il doit y avoir un certain nombre de petites portes cachées pour que les enfants puissent entrer (les spécialistes entrent par la grande porte).
As tu une idée des petites portes par lesquelles toi tu pourrais entrer ? Ce qui convient à l'un ne convient pas nécessairement à l'autre.
A suivre.
De ce fait, $G$ est d'indice fini dans $\Gamma$ et en particulier, il y a une puissance de $T = \pmatrix {1 & 1\cr 0 &1\cr}$ qui est dans $G$ disons $T^h \in G$. Le fait que $f : \mathbb H \to \mathbb C$ soit faiblement modulaire de poids $k$ pour $G$ signifie que $f$ est invariante par $G$ au sens du poids $k$ i.e.
$$
f^{[\gamma]_k} = f \qquad \hbox {pour tout $\gamma \in G$}
$$
et que $f$ est méromorphe sur $\mathbb H$. On peut appliquer cela à $\gamma = T^h$ qui est dans $G$. Par définition (vu la forme de $T^h$):
$$
f^{[T^h]_k}(z) = f(T^h . z) = f(z + h)
$$
Il faut d'abord s'occuper du $G$-cusp le plus simple $\infty = {1 \over 0} = \pmatrix {1\cr 0\cr}$. Puisque $f(\tau+h) = f(\tau)$ et que $f$ est méromorphe sur $\mathbb H$, on peut
développer $f$ en puissances de $q_h := q^{1/h}$ où $q = e^{2i\pi\tau}$:
$$
f(\tau) = \sum_{n \in \mathbb Z} a_n q_h^n
$$
On dit alors que $f$ est méromorphe au cusp $\infty$ si $a_n = 0$ pour $n \ll 0$, holomorphe en ce cusp si $a_n = 0$ pour $n \lt 0$.
Une autre manière analogue de raconter cela est de considérer la projection $\pi_h : \mathbb H \to \mathbb D \setminus \{0\}$ où $\mathbb D$ est le disque unité et $\pi_h : \tau \mapsto e^{2i\pi\tau/h}$. Puisque $f(\tau + h) = f(\tau)$, $f$ se factorise à travers $\pi_h$ : $f = F \circ \pi_h$ où $F : \mathbb D \setminus \{0\} \to \mathbb C$. Et je job est d'étudier $F$ en l'origine i.e. en ``$q_h = 0 \Leftrightarrow \tau = i\infty$''.
Et en un autre cusp ${a \over c} = \pmatrix {a\cr c\cr}$ ? Il y a $\gamma = \pmatrix {a & b\cr c &d\cr} \in \Gamma$ tel que $\gamma(\infty) = {a \over c}$. Attention : $\gamma$ est dans $\Gamma$ et pas dans $G$. On dit alors que $f$ est holomorphe en ce cusp si $f^{[\gamma]_k}$, qui est une forme faiblement modulaire de poids $k$ pour le groupe $G' := \gamma G\gamma^{-1}$, est holomorphe en $\infty$. C'est facile de voir que $G'$ est aussi de congruence (en fait, ici on a essentiellement utilisé d'indice fini dans $\Gamma$, et $G'$ l'est si et seulement $G$ l'est). Et ensuite, il y a un certain nombre de vérifications à faire : pourquoi cela ne dépend pas de $\gamma$ (il y plein de $\gamma \in \Gamma$ qui vérifient $\gamma(\infty) = {a \over c}$) ; on peut avoir des représentations différentes des cusps : ${a\over c} =_G {a' \over c'}$ ...etc...
Correction : $G'$ c'est $\gamma^{-1} G\gamma$ et pas $\gamma G\gamma^{-1}$.
Je ne sais pas si cela va t'aider.
Par ailleurs, je peux te ``dire des choses'' sur $Y_0(N) = \mathbb H/\Gamma_0(N)$, qui est un ouvert de la courbe modulaire $X_0(N)$, i.e. ce que cet espace classifie, du moins ce que j'ai compris. Il faut bien sûr commencer avec $\mathbb H/\Gamma$, qui est un exemplaire de $\mathbb C$, via la fonction $j$.
Même si c'est écrit partout dans les bouquins sur les formes modulaires, je n'avais pas réalisé que le point à l'infini est envoyé en $a/c, gcd(a,c) = 1$ par $\gamma \in \Gamma$, i.e. en tous les points rationnels de $Im(z) = 0$, points où les translatées $\gamma. \Omega_0$ du domaine fondamental $\Omega_0 = \{|Im(z)| < 1/2, |z| > 1\}$ s'accumulent :
être holomorphe ou méromorphe ou ni l'un ni l'autre à $\infty$ ça définit donc le type de la barrière naturelle $Im(z) = 0$ (c'est de toute façon une barrière naturelle puisque si $f$ est continue sur $Im(z) = 0$ alors vu qu'elle est constante sur les rationnels on a que $f(z)$ est constante sur $Im(z) = 0$ et donc par prolongement analytique $f(z) = cste$ sur tout $\mathbb{H}$).
Mais donc une cusp c'est bien une orbite (une classe d'équivalence par $G$) de points où les $\gamma. \Omega_0$ s'accumulent, c'est d'ailleurs pour ça que c'est un point manquant dans $\mathbb{H} \setminus G$ pour qu'il soit compact (vu que c'est un point qui est à la frontière d'une infinité de $\gamma. \Omega_0$)
(note : en représentant $\mathbb{H}$ sur la demi-sphère de Riemann, le point $\infty$ est aussi un point où les $\gamma. \Omega_0$ s'accumulent).
Maintenant j'ai un petit problème conceptuel sur comment interpréter la différence entre "être invariant par $G$" et "provenir d'une forme différentielle invariante par $G$" (la différence c'est le terme $(cz+d)^k$) et sur l'effet que l'un ou l'autre a.
(PS : si tu veux ouvrir une discussion sur un truc que tu ne comprends pas sur $\zeta(s)$, je pourrai essayer de t'aider)
$$
f^{[\gamma]_k} \hbox { (noté parfois $f \mid_k \gamma$)} = \tau \mapsto \det(\gamma)^{k-1} (c\tau + d)^{-k} f(\gamma . \tau), \qquad
\gamma = \pmatrix {a & b\cr c & d\cr} \in \mathrm {GL}_2(\mathbb Q)
$$
Et j'ai apporté une correction bien visible en rouge dans mon dernier post. Il est important de noter que :
$$
f \mid_k(\gamma\gamma') = (f \mid_k \gamma) \mid_k \gamma' ,\qquad \gamma, \gamma' \in \mathrm{GL}_2(\mathbb Z)
$$
Tu noteras, dans le document de Winckler (La paramétrisation modulaire des courbes elliptiques) que sa définition de forme modulaire de poids 2 (en bas de la page 4) holomorphe est erronée: la composition (l'action) doit avoir lieu au sens des formes différentielles (poids 2) et pas au sens de la composition ordinaire (= fonctions, poids 0).
Est ce que cela va dans le sens de ton interrogation ?
J'attache encore 2 pages de brouillon. Pour éviter de croire que je veux fourguer sur le forum mes brouillons, je te ferais une liste des ouvrages que je possède sur le sujet (j'ai envie de dire une douzaine et même un peu plus).
Par ailleurs, quand on débute, on peut commencer par le poids $0$ i.e. les fonctions et le groupe $\Gamma_0(N)$. Pour un certain nombre de petites valeurs de $N$, le genre de la courbe $X_0(N)$ est $0$, ce qui veut dire ici $X_0(N) \simeq \mathbb P^1(\mathbb C)$. Montrer une telle isomorphie consiste à expliciter une forme modulaire $f : \mathbb H \to \mathbb C$ de poids $0$ pour $\Gamma_0(N)$ telle que toute autre forme modulaire de poids $0$ pour $\Gamma_0(N)$ soit une fraction rationnelle de $f$. Par exemple, pour $N=1$, il s'agit de la fonction $j$. Ici, la méromorphie aux cusps de $\Gamma_0(N)$, c'est plus simple because le poids $0$ : il s'agit de fonctions au sens ordinaire.
Par ailleurs, pour tout $N$, on a la main sur les cusps de $\Gamma_0(N)$. Par exemple, leur nombre est :
$$
\sum_{d\mid n} \varphi(\mathrm{pgcd}(d,N/d))
$$
C'est le cardinal du quotient de $\mathbb P'_1(\mathbb Z/N\mathbb Z)$ par l'action à gauche de $T = \pmatrix {1 & 1\cr 0 & 1\cr}$. Tu peux commencer par $N=1$ et $N=2$ !
Ajout C'est un excellent exercice de montrer, si $f$ est une forme modulaire de poids $k$ pour $\Gamma = \mathrm{SL}_2(\mathbb Z)$, que $g$, définie par $g(\tau) = f(N\tau)$ est une forme modulaire de poids $k$ pour le groupe $\Gamma_0(N)$. En essayant d'en faire le plus possible (valeurs aux $\Gamma_0(N)$-cusps de $g$ selon la valeur de $f$ au $\Gamma$-cusp $i\infty$ de $f$).
Petit exemple : soit $\Delta$ le discriminant modulaire; c'est une forme modulaire de poids $12$ pour $\Gamma$. En prenant le réseau $2i\pi(\mathbb Z + \mathbb Z\tau)$, on a:
$$
\Delta = \Delta(q) = q \prod_{n=1}^\infty (1-q^n)^{24} = q \left(\sum_{n=0}^\infty (-1)^n \times (2n+1) \times q^{n(n+1) \over 2}\right)^8, \qquad q = e^{i\pi\tau}
$$
Alors la fonction
$$
f_2 = {\Delta(q) \over \Delta(q^2)}
$$
est une forme modulaire de poids $0$ (une brave fonction) pour le groupe $\Gamma_0(2)$ avec la propriété:
$$
X_0(2) \ \buildrel {f_2} \over \simeq \ \mathbb P^1(\mathbb C) \qquad \hbox {ou encore} \qquad
\mathbb C(X_0(2)) = \mathbb C(f_2)
$$
Et le revêtement $X_0(2) \to X_0(1) \ \buildrel j \over \simeq \ \mathbb P^1(\mathbb C)$ est explicite :
$$
j = {(f_2 + 256)^3 \over f_2^2}
$$
Quant à ouvrir une discussion sur $\zeta$, Mellin, le monde analytique, .etc..: ce monde m'a toujours fait peur et je me sens trop vieux pour ... La seule façon serait que l'on considère que je suis un enfant dans ce domaine (mais en général, cela n'intéresse pas les spécialistes de parler aux enfants).
En attendant (ce n'est pas lié à ce qui précède), si tu t'ennuies (sic), tu peux regarder le papier de Barry Mazur, Number Theory as Gadfly, in http://math.stanford.edu/~lekheng/flt/mazur1.pdf. Si tu es géomètre, tu apprécieras, je pense, les jolis dessins de revêtements (ramifiés ou pas).
$$
1 - t_p T + pT^2 = (1 - \alpha_pT) (1 - \beta_pT), \qquad \qquad |\alpha_p| = |\beta_p| = p^{1/2}
$$
Certes c'est équivalent mais ci-dessus c'est bien mieux. Et le coup du $t_{p^k} = t_p t_{p^{k-1}} - pt_{p^{k-2}}$, c'est bien joli pour la programmation mais pas toujours efficace dans les preuves.
Cela m'a boosté car je me suis mis à déterminer (en lisant Ireland-Rosen et Koblitz) les fonctions $L$ des courbes elliptiques $y^2 = x^3 - Dx$.
Et j'ai lu partiellement un joli papier de Tibouchi ``Les conjectures de Weil''. Avec des noms que je fais débarquer peut-être dans le désordre : Gauss, Hass, Weil, Dwork, Stepanov/Bombieri, Deligne ...
Voilà, voilà. Je vais probablement effacé toutes mes contributions dans le fil de la rubrique Stham, ce dont tout le monde se fiche bien d'ailleurs. Mais j'ai ma petite fierté et j'ai pas envie de me retrouver à côté de certains.
\log \sum_{n \ge 1} t_n n^{-s} &= \log \prod_p (1-t_p p^{-s} + p^{1-2s})^{-1} = \log \prod_p (1-\alpha_p p^{-s})^{-1}(1-\beta_p p^{-s})^{-1}\\
& = -\sum_p \big(\log (1-\alpha_p p^{-s})+\log (1-\beta_p p^{-s})\big)= \sum_p \sum_{k \ge 1} \frac{\alpha_p^k + \beta_p^k}{k}p^{-sk}
\end{align*} qui converge absolument pour $Re(s) > 3/2$
on montre que pour tout $\gamma,\gamma' \in GL_2(\mathbb{Q})^+$ : $$f[\gamma \gamma']_k = f[\gamma] [ \gamma']_k$$
i.e. la composition d'opérateur $[\gamma]_k$ est compatible avec la multiplication de matrices.
ensuite on prend une certaine forme modulaire pour $SL_2(\mathbb{Z})$ : $$\forall \gamma \in SL_2(\mathbb{Z}), \qquad f[\gamma]_k = f$$
et pour un certain $a \in GL_2(\mathbb{Q})^+$ on considère $$g = f[\alpha]_k$$
on trouve alors que pour toute matrice $\gamma \in SL_2(\mathbb{Z})$, si $\alpha \gamma \alpha^{-1} \in SL_2(\mathbb{Z})$ alors
$$g[\gamma]_k = f[\alpha]_k[\gamma]_k = f[\alpha \gamma]_k =\underbrace{ f[\alpha \gamma \alpha^{-1}]_k}_{= \ f} [\alpha]_k =f [\alpha]_k = g$$
i.e. $g(\tau)$ est modulaire pour $\Gamma = \{ \gamma \in SL_2(\mathbb{Z}) \ \mid \ \alpha \gamma \alpha^{-1} \in SL_2(\mathbb{Z}) \} $.
Un rapide calcul montre alors qu'avec $\alpha = \begin{pmatrix}N & 0 \\ 0 & 1\end{pmatrix}$ et $\gamma= \begin{pmatrix}a & b \\ c & d\end{pmatrix}$ on a que $\alpha \gamma \alpha^{-1} = \begin{pmatrix}a & N b \\ c/N & d\end{pmatrix}$ qui est dans $SL_2(\mathbb{Z}$ ssi $c \equiv 0 \bmod N$. Ainsi, $\Gamma = \Gamma_0(N) = \{ \gamma \in SL_2(\mathbb{Z}) \ \mid \ \gamma \equiv \begin{pmatrix}\ast & \ast \\ 0 & \ast\end{pmatrix} \bmod N \}$.
Avec un peu de travail supplémentaire ou trouve qu'en choisissant $f$ modulaire seulement pour un certain sous-groupe de $SL_2(\mathbb{Z})$, on a $\Gamma = \Gamma_0(dN)$ ou $\Gamma_1(dN)$ ou $\Gamma(dN)$.
A partir de ça, il faudrait aussi que je regarde les parties génératrices de $\Gamma_0(N)$,$\Gamma_1(N)$,$\Gamma(N)$, je pourrai vérifier si une fonction est une forme modulaire ou une cusp form (holomorphe et s'annule aux cusps) et a priori c'est bon j'aurai les outils pour faire les démonstrations sur les opérateurs de Hecke (i.e. faire le lien entre les formes modulaires et la classe de Selberg et l'hypothèse de Riemann)
$$
g(a/c) \quad \hbox {en fonction de}\quad f(i\infty)\ ?
$$
Une coquille dans Diamond et Shurman sur le weight $k$ operator. Je note ici $f \mid_k \beta$ pour pas me fatiguer. Au début, chez eux, $\det(\beta) = 1$. Et tout d'un coup, en haut de la page 165, ils rappellent la définition mais il y a le glissement $\beta \in \mathrm {GL}^+(\mathbb Q)$. Et la formule donnée est fausse. Chez un certain nombre d'auteurs, c'est pareil (j'ai tout vu). Certes, c'est pas grave, cela se corrige tout seul sauf que quand tu débutes, tu as besoin d'être pris en main. Je sais pas si chez eux, il y a eu un glissement avant cette page 165 (glissement : du $\det = 1$ à $\det > 0$).
Classe de Selberg et tout le truc : je pourrai pas te suivre. Le seul endroit où je peux opérer un petit quelque chose est de nature arithmétique (et encore)
donc quand tu dis $g(a/c)$ tu veux dire $g |_k \gamma(i\infty)$ où $\gamma = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in SL_2(Z)$ tel que $\gamma \cdot i\infty = a/c$ ?
et alors avec $g(\tau) = f(N\tau)$ j'ai
$$\lim_{\tau \to i\infty} g |_k \gamma(\tau) =\lim_{\tau \to i\infty} (c \tau+d)^{-k} g(\frac{a \tau+b}{c \tau+d}) = \lim_{\tau \to i\infty} (c \tau+d)^{-k} f(N\frac{a \tau+b}{c \tau+d}) $$ $$ = \lim_{\tau \to i\infty} m^{-k} (\frac{c}{m} \tau+D)^{-k} f(\frac{a\frac{N}{m} \tau+B}{\frac{c}{m} \tau+D}) =m^{-k} \lim_{\tau \to i\infty} f|_k \beta (\tau) = m^{-k} \lim_{\tau \to i\infty} f (\tau) = m^{-k} f(i\infty)$$
où $\beta = \begin{pmatrix} aN/m & B \\ c/m & D \end{pmatrix} \in SL_2(Z)$ et $m = gcd(c,N)$ tel que $ \beta \cdot i \infty = \frac{aN/m}{c/m} = N\frac{a}{c} $
et en utilisant que $\lim_{\tau \to i\infty} \frac{(c \tau+d)^{-k} }{m^{-k} (\frac{c}{m} \tau+D)^{-k} } = 1$ et que $f|_k \beta(\tau) $ est continue en l'infini
$$
\lim_{\tau \mapsto i\infty} (c\tau + d)^{-k} g\left( {a\tau + b\over c\tau+d}\right) \quad \hbox {existe}
$$
Et la valeur est cette limite. Je ne trouve pas comme toi. Et à une époque donnée, comme j'étais pas sûr, j'ai fait des vérifications avec magma, ce qui m'a conforté dans ce que j'avais trouvé. Of course, il me fallait un stock de formes modulaires (je crois qu'il s'agissait d'une série d'Eisenstein).
$$
g(a/c) = m^{-k} f(i\infty) \qquad \hbox {avec} \quad m = \gcd(c,N)
$$
mais tu as perdu ``un $N$ quelque part'' (j'arrive pas à voir où pour l'instant). Afin que tu sois convaincu que quelque chose cloche, je prends tout simplement $a/c = i\infty$ i.e. $c = 0$ si bien que ton $m$ vaut $N$. Mais quel est le D.L. de $g$ en $q = 0$ en fonction de celui de $f$ ? Of course $q = e^{2i\pi\tau}$.
Ajout Je crois que je vois un défaut dans ton post. On a l'impression que tu as écrit :
$$
f\left( N{a\tau +b \over c\tau +d}\right) = f(\beta \cdot \tau)
$$
Peux tu confirmer que tu crois que c'est vrai ? Si oui (que tu y crois), pourquoi c'est vrai ?
Question : est ce que les auteurs Diamond & Shurman disent que ces deux conducteurs (analytique, algébrique) sont égaux ? Que penser de la pédagogie de la chose ?
Par ailleurs, parler de $X_0(N)_{\rm alg} $ signifie que l'on sait que $X_0(N)_{\mathbb C}$ est une courbe (algébrique) définie sur $\mathbb Q$. Et pas seulement, une surface de Riemann.
Et tout cela n'est pas du pinaillage : le conducteur intervient de manière cruciale dans le lien entre courbes elliptiques rationnelles (de conducteur $N$) et formes modulaires de poids $2$ (pour $\Gamma_0(N)$). Je m'en suis sorti comment dans mes expérimentations il y a une dizaine d'années ? Et bien, j'ai bénéficié du fait que c'était implémenté dans mon système de Calcul Formel chéri.
$$\gamma = \begin{pmatrix}a& b \\ c & dN \end{pmatrix} \in SL_2(\mathbb{Z}), \qquad \gamma' = \begin{pmatrix}aN& b \\ c & d \end{pmatrix} \in SL_2(\mathbb{Z})$$
et là miracle, avec $\alpha = \begin{pmatrix}N& 0 \\ 0 & 1 \end{pmatrix}$ et $ \alpha' = \begin{pmatrix}1& 0 \\ 0 & N \end{pmatrix}$ on a
$$ \alpha \gamma = \begin{pmatrix}aN& bN \\ c & dN \end{pmatrix} = \gamma' \alpha'$$
et donc avec $g(\tau) = N^{k-1} f(N\tau) = f |_k \alpha(\tau)$ on a
$$g |_k \gamma (i\infty) = f |_k \alpha \gamma (i\infty) =f |_k \gamma' \alpha'(i\infty) = f |_k \alpha'(i\infty) = N^{-1} f (i\infty)$$
Ensuite en toute généralité, si $g = f|_k \alpha$ pour une matrice $\alpha \in GL_2(\mathbb{Q}^+)$, alors pour calculer $g |_k \gamma(i \infty), \gamma \in SL_2(\mathbb{Z})$ on a besoin de $\gamma'\in SL_2(\mathbb{Z}), \alpha' = \begin{pmatrix}A& B \\ 0 & D \end{pmatrix} \in GL_2(\mathbb{Q}^+)$ tel que $$\alpha \gamma = \gamma' \alpha'$$
et alors on trouve
$$g |_k \gamma (i\infty) = f |_k \alpha \gamma (i\infty) =f |_k \gamma' \alpha'(i\infty) = f |_k \alpha'(i\infty) = |A|^{k-1} |D|^{-1} f (i\infty)$$
et miracle, l'exercice 1.2.11 propose exactement de démontrer qu'il existe toujours $\gamma',\alpha'$ tel que ça marche.
$$
f \mid_k A = {\det(A)^{k/2} \over (c\tau + d)^k}\ f(A\cdot \tau), \qquad
A = \pmatrix {a & b\cr c & d\cr} \in \mathrm {GL}^+_2(\mathbb Q)
$$
Regarde l'exposant de $\det(A)$ : ce n'est pas $k-1$ comme tu as écrit. J'ai bien essayé de t'expliquer qu'il ne faut pas toujours faire confiance à certains auteurs. Il faut les recouper (en recouper beaucoup). J'espère que cela te rappelle quelque chose cette histoire d'exposant.
Play again. Peut-être qu'il y a un moyen d'assurer la cohérence du résultat ?
Sinon, il y a la possibilité (que je te signalais implicitement dans la discussion sur schtam) d'oublier $GL_2(\mathbb{Q})^+$ et de considérer à la place $SL_2(\mathbb{Q})$ pour lequel $|_k \gamma$ se prolonge naturellement.
Dans mon cas ça signifie prendre $\alpha = \begin{pmatrix}N^{1/2}& 0 \\ 0 & N^{-1/2} \end{pmatrix}$ et $ \alpha' = \begin{pmatrix}N^{-1/2}& 0 \\ 0 & N^{1/2} \end{pmatrix}$ donc on a toujours $\alpha \gamma = \gamma' \alpha'$ et avec $ g(\tau) = N^{k/2} f(N \tau) = f |_k \alpha(\tau)$ j'obtiens
$$g |_k \gamma (i\infty) = f |_k \alpha \gamma (i\infty) =f |_k \gamma' \alpha'(i\infty) = f |_k \alpha'(i\infty) = N^{-k/2} f (i\infty)$$
(donc le même résultat, mais avec plus de panache)
et donc la question c'est juste comment tu définis $f|_k {\scriptstyle \begin{pmatrix}A & 0 \\ 0 & A \end{pmatrix}} (\tau) = A^{e_k -k} f(\tau)$.
Tu vois alors que quelque soit l'exposant on a bien $f|_k{\scriptstyle \begin{pmatrix}A & 0 \\ 0 & A \end{pmatrix}} |_k {\scriptstyle \begin{pmatrix}A' & 0 \\ 0 & A' \end{pmatrix}} = f|_k {\scriptstyle \begin{pmatrix}AA' & 0 \\ 0 & AA' \end{pmatrix}} $ et donc ça reste compatible avec la multiplication de matrices.
Au final, on voit aussi que le plus logique c'est soit d'oublier $GL_2^+(\mathbb{Q})$ et de ne considérer que $SL_2(\mathbb{Q})$, soit de manière équivalente de choisir $e_k = k$.
Après peut-être que tu as un argument qui me fera changer d'avis ? [small](genre choisir $e_k$ pour que la limite de $f|_k{\scriptstyle \begin{pmatrix}A & 0 \\ 0 & A \end{pmatrix}}$ quand $A \to 0$ soit compatible avec autre chose ?)[/small]
- enfin pour la valeur au cusp qui dépend de $a/c$, j'ai supposé $gcd(aN,c) = 1$, donc je suppose que les différentes cusps correspondent aux différentes valeurs de $gcd(aN,c)$
Soit $f$ une forme modulaire de poids $k$ pour $\mathrm {SL}_2(\mathbb Z)$ et $g$ définie par $g(\tau) = f(N\tau)$. Alors $g$ est une forme modulaire de poids $k$ pour $\Gamma_0(N)$ et (avec des notations peut-être discutables) :
$$
g(p) = \left( {\ell \over N}\right)^k\, f(i\infty), \qquad \qquad
\hbox {où $\ell$ est le niveau de $p$}
$$
et donc si $gcd(a,c) = 1, gcd(aN,c) = gcd(c,N) = l$ alors je trouve qu'il existe $b,d$ tel que $a\frac{N}{l}d - b\frac{c}{l} = 1$ et $B,D$ tel que $aD-cB = 1$
$\gamma = {\scriptstyle\begin{pmatrix}a& B \\ c & D \end{pmatrix}} \in SL_2(\mathbb{Z}), \qquad \gamma' = {\scriptstyle\begin{pmatrix}aN/l& b \\ c/l & d \end{pmatrix}} \in SL_2(\mathbb{Z})$
alors avec $\alpha = N^{-1/2}{\scriptstyle\begin{pmatrix}N& 0 \\ 0 & 1 \end{pmatrix}} \in SL_2(\mathbb{Q})$ et $ \alpha' = N^{-1/2}{\scriptstyle \begin{pmatrix}u& v \\ 0 & w \end{pmatrix}}\in SL_2(\mathbb{Q})$ et $g(\tau) = f(N\tau) = N^{k/2}f |_k \alpha (\tau)$ j'ai $\alpha \gamma =N^{-1/2}{\scriptstyle\begin{pmatrix}a N & BN\\ c& D \end{pmatrix}} = \gamma' \alpha' = N^{-1/2}{\scriptstyle\begin{pmatrix}aN u/l & aN v/l + bw \\ c u/l & cv/l+wd \end{pmatrix}}$
où $aNv/l+bw = BN$ et $cv/l+wd = D$ donc $a(cv/l+wd)- c(aNv/l+bw)/N = 1 = awd-bcw/N = w l / N $ i.e. $w = N / l$
et
$$g |_k \gamma (i\infty) = N^{k/2}f |_k \alpha \gamma (i\infty) =N^{k/2} f |_k \gamma' \alpha'(i\infty) =N^{k/2} f |_k \alpha'(i\infty) =w^{k} f (i\infty) = N^{k}l^{-k} f (i\infty)$$
i.e. le même résultat que toi (ouf !)
Tu n'as pas traité le cas d'un cusp quelconque, et de mon côté, je n'ai fourni aucune preuve par post (et je n'en fournirai pas par ce moyen). Mais on peut s'en tenir là, si tu veux.
En passant faire gaffe à ce qui est écrit dans la littérature concernant les cusps de $X_0(N)$. Je cite Reyssat p. 120 dans From Number Theory To Physics (je crois) :
Une erreur s'est glissée à plusieurs reprises dans la littérature sur la représentation des cusps de $\Gamma_0(N)$; on peut prendre comme système de représentants les nombres $b/d$ où $d \mid N$ ($d > 0$) et $b$ parcourt un système de représentants premiers à $d$ des $\varphi(e)$ classes de $U(\mathbb Z/e\mathbb Z)$ avec $e = \gcd(d,N/d)$ mais on n'a pas le droit de réduire $b$ modulo $e$.
Quand on implémente, c'est mortel.
Tiens le mot du jour de W. Stein concernant l'aspect ``computational'' des formes modulaires, page 10 : ``Wiles did not need a computer, because the relevant spaces of modular forms that arise in his proof have dimension 0''. Qu'est ce qu'il est malicieux, ce William Stein.
(en notant $\gamma_d$ l'entrée en bas à droite de $\gamma$)
si $f \in M_k(\Gamma_1(N))$ alors
$$\langle d \rangle f = f|_k \gamma\qquad \gamma \in \Gamma_0(N), \gamma_d = d$$
on a que c'est un opérateur linéaire $M_k(\Gamma_1(N)) \to M_k(\Gamma_1(N)) $
car avec $g =\langle d \rangle f = f |_k \gamma, \gamma \in \Gamma_0(N),\gamma_d = d$,
on a que pour tout $\alpha \in \Gamma_1(N)$ il existe $\alpha' \in \Gamma_1(N)$ et $\gamma' \in \Gamma_0(N), \gamma'_d = d$ tel que $$\gamma \alpha = \alpha' \gamma'$$ et donc $\langle d \rangle f$ ne dépend pas de $\gamma$ mais seulement de $\gamma_d$, et
$$g |_k \alpha = f |_k \gamma \alpha =f |_k\alpha' \gamma' = f |_k \gamma' = \langle d \rangle f = g$$
ensuite avec $$\pi_\chi = \frac1{\varphi(N)} \sum_{d=1}^N \overline{\chi(d)} \langle d \rangle$$ pour un certain caractère de Dirichlet modulo $N$, vu que
$\sum_{\chi \bmod N} \chi(d) = \varphi(N) 1_{d \equiv 1 \bmod N}$ et $\langle d \rangle \langle d' \rangle = \langle d d'\rangle$ on a $\pi_\chi^2 = \pi_\chi$ et $\quad \sum_{\chi \bmod N} \pi_\chi = I$.
et donc qu'avec $M_k(N,\chi) = \{f \in M_k(\Gamma_1(N)), \ \langle d \rangle f = \chi(d) f \}$ on a que $\pi_\chi$ est une projection orthogonale $ M_k(\Gamma_1(N)) \to M_k(N,\chi) $ et que
$$M_k(\Gamma_1(N)) = \bigoplus_\chi M_k(N,\chi)$$
je trouve ça assez fou, j'ai l'impression que ça implique des tas de choses, mais je ne sais pas encore quoi. Je vais continuer ma lecture et mes investigations.
Mais ça serait plus intéressant que tu dises de ton côté (sans rentrer dans le détail, juste les mots-clefs ^^) quelles sont/étaient tes principales motivations pour étudier les formes modulaires (hormis le côté algébrique "joli").
Donc je suppose que tu vas dire que ça permet de résoudre certains problèmes d'arithmétiques, et que ça permet de démontrer la modularité des courbes elliptiques ? Et à part ça ?
On a beaucoup retenu l'impact sur le grand théorème de Fermat. Et du coup, de ce côté, il n'y a rien à voir puisqu'il n'existe pas de solution à l'équation diophantienne que tu sais ... Alors que des courbes elliptiques rationnelles, il y en a autant qu'on veut...
Et j'étais loin de penser qu'il y avait un aspect vraiment effectif dans l'affaire. Mais j'ai fini par comprendre, avant que l'ex conjecture de Shimura-Taniyama-Weil ne soit résolue, que des milliers de courbes elliptiques avaient été testées (pour modularité). Quand tu vois certains exposés là-dessus, tu es très étonné : ah bon, c'est concret, ce binz ?
Une différence notable entre nos points de vue : tu te places probablement d'un point de vue ``chercheur'' tandis que je me place d'un point de vue ``amateur''. Est ce que parler aux enfants de tout cela est possible ? J'ai bien vu un certain effort chez toi pour parler du monde analytique (fonction $\zeta$ de Riemann ...etc..).
Je pense que de gros efforts pédagogiques devraient être réalisés pour essayer d'expliquer la signification de grands résultats mathématiques à des non spécialistes. Tu vas penser que je rêve et que probablement que de tels exposés existent (c'est un peu vrai).
Je crois comprendre que tu as pu entrer dans la citadelle modulaire ?
il y a pleins d'applications des formes formodulaires.
Tu es du métier ?
Enfin, j'attache 4 pages d'un brouillon personnel dans lequel je raconte mon déclic. Je crois pouvoir dire que c'est en 2000, en rencontrant Henri Cohen. Pour pari, il avait déjà réalisé un sacré boulot effectif (il suffit de voir le travail à faire pour déterminer le conducteur d'une courbe elliptique rationnelle et même un modèle de Néron). Son (premier) livre date de 1993, je crois. Et je pense que ``les choses'' étaient en place sous pari dans les années 1995 (et même avant) ?
En magma, cela viendra plus tard, bien plus tard. Avec en particulier William Stein. Je me souviens, avant que ce dernier n'entre en scène, avoir dû contredire un des implémenteurs qui se trompait dans le calcul des $t_p$ (trace du Frobenius au dessus de $\mathbb F_p$) lorsque $p$ est de mauvaise réduction (j'ai cru que j'allais perdre pied).
mais j'ai dit une grosse c*****, que $\Gamma_0(N)$ est généré par seulement deux matrices, ce qui est faux, ça l'est aussi pour $\Gamma_1(N)$ d'ailleurs.
Voici la réponse que j'avais posté :
mais elle reste intéressante parce qu'elle est très simple, et qu'on voit bien ce qui est nécessaire pour que $C(\gamma)$ soit un morphisme $\Gamma_0(N) \to \mathbb{Z}^2$ (et pas $\mathbb{Z}^g$ où $g$ est le nombre de générateurs de $\Gamma_0(N) $).
Il faut montrer qu'il existe des générateurs $\alpha_k$ tels que $C(\alpha_k) \in C(\alpha_1) \mathbb{Z}+C(\alpha_2)\mathbb{Z}$ pour tous les $k$.
Question : il y a-t-il un truc évident pour voir que si $f$ une cusp newform, alors $C(\gamma)$ est bien un morphisme $\Gamma_0(N) \to \mathbb{Z}^2$, ou bien faut-il forcément passer à la géométrie algébrique, les groupes d'homologie, les variétés Jacobiennes, etc. ?