À propos de Syracuse

1356725

Réponses

  • rebonjour

    S = {3,7,9,11,15,19,27,31,41,47,55,63,71,73,83,91,95,97,109 }


    S est bien avec ses 19 éléments sans le 5


    BERKOUK
  • merci @berkouk
    ma machine tourne en ce moment pour calculer les descendances du 5 suite aux remarques de @lourran
    on va tenter d'atteindre la 20ème génération et j'attends donc un peu pour entrer tes formules

    comme on a deux approches en ce moment , algébrique avec toi et collag3n et plus structurelle avec lourran, j'en profite pour glisser un mot.
    Quand j'ai constitué ma base de données, j'ai d'abord beaucoup fait d'analyse de la structure. Les chaines de i' me semblaient importantes et j'ai donc trouvé cette histoire de 911 en étape 12, la prépondérance du 5 pour le i, etc. des listes de couples qui sont liés aux montées et descentes priopres aux suites, des listes de chainages plus longues, le tout sans grand ''éclairage''. ça va bcp mieux depuis que les x, n, tdv et autres variables sont entrés en jeu et qu'on a ces formules. Le problème est que rien ne les lie de manière évidente à ce qu'on observe dans la structure, rien n'explique les 40% du 911 parmi les autres i' de l'étape 12. Bizarre...

    La découverte qui me semble la meilleure est cette histoire de longitude et de latitude. Je suis en confiance avec ma méthode et mes outils parce ces deux objets ont été mis en évidence uniquement par l'analyse des données. Après je trouve que c'est finalement plus dur à expliquer que de faire le travail d'analyse. Les graphiques devraient aider à cette compréhension comme la mise à disposition des tableurs, mais ça prend du temps. J'attends vraiment un retour sur une fonction qui viendrait matcher les données de ces courbes. Sur Mathlab, on peut vour que ce sont des splines, mais c'est un peu maigre. Donc j'espère que cette aventure exploratoire va continuer et nous amener des réponses.
  • Passer 40% du temps par 911, ou 95% par 5 , n'est dû qu'au fait que tu observes des nombres très petits, et que ce n'est pas distribué linéairement. C'est comme pour les gaps de nombres premiers ou on voit majoritairement un Gap de 6 jusqu'à $10^{35}$, remplacé par un Gap de 30, ...
  • Je n'ai rien suivi aux histoires de latitude / longitude.

    Mais à partir du moment où ton travail se base sur :
    - temps de vol
    - nombres d'étapes impaires
    - dernier nombre impair rencontré.
    et rien de plus,

    forcément, les courbes que tu vas obtenir devraient être à base de logarithmes (ou d'exponentielles si tu fais je ne sais quelles manipulations).
    En mettant une echelle logarithmique sur l'un des 2 axes (l'axe des i') , les courbes devraient donc devenir quasiment des droites.

    Tout ça vu de très loin, je ne suis même pas sûr qu'on soit sur la même planète.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • @lourran
    quel septicisme !
    certes les courbes sont des droites en mettant l'axe en echelle log. j'avais vu ça tout seul merci bcp
    mais droite ou courbe les alignements sont là et bien là
    et ces alignements correspondent bien à une logique entre les variables que nous utilisons
    donc please lis mes derniers posts, regarde les données dans Excel et je t'assure qu'on habite sur la même planète
  • @collag3n
    oui surement !
    il faudrait que je fasse des coups de sonde dans des tranches plus grandes de i'
    c'est prévu mais le temps de calcul me manque. plus on va vers des grands nombres, plus les échantillons sont petits : 100.000 i' si on commence à 10^15 c'est une goutte d'eau
    c'est vraiment dommage qu'il y ait pas des données publiques avec les variables que nous utilsons
  • Si tu as des droites, tu as facilement l'équation de ces droites ; trouver l'équation d'une droite, partant de 2 points très éloignes de cette droite, ça se fait facilement. Ton problème de spline est résolu.

    Je ne vois pas quel est ton problème avec ces équations de droites.
    Ou alors, quand tu as les équations de droite sur cette échelle logarithmique, tu n'arrives pas à reformuler cela avec une échelle normale ?

    Sur la question '5 est très majoritaire parce qu'on traite des petits nombres', je ne suis pas d'accord avec Collag3n.
    Certes, si on prend un intervalle beaucoup plus grand, les proportions vont évoluer, Mais de façon très marginale.
    Je suis convaincu que si on regarde tous les entiers inférieurs à $10^100$, 5 reste très majoritaire, au delà de 90%. Je pense même qu'on reste au delà de 94% ... mais soyons prudent.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • Attention, je n'ai pas dit que 5 ne concentrait pas beaucoup de chemins (il me semble que la "tête de banche" concentre une densité asymptotique de 75%, et 5 est particulier parce que c'est la tête de la première "branche"), mais mon point est que l'observation d'une tranche même grande n'est pas un bon indicateurs, surtout que pour des grands nombres, les successions ont tendance à suivre des séquences presqu'identiques voir ma remarque ici
    (Note: même pour 5 on a des creux de ci de là. Ex: seul 10% des nombres entre 10^52 et 10^52+10^4 passent par 5)
  • 10^52 à 10^52+10^4, c'est un intervalle très petit. Et on a des phénomènes de grappe. Sur un intervalle aussi petit, on peut certainement avoir 5000 nombres ou même plus qui ont des chemins différents au début, mais qui se rejoignent à mi-chemin, et qui finissent le parcours de Syracuse tous sur la même ligne. Et cette ligne n'est pas obligée de passer par le nombre 5.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • Exactement. Et oui, c'est un intervalle minuscule, mais dans l'absolu, même 10^100000000000 ca reste minuscule. C'est bien la plus grosse limitation des vérifications par ordinateur.
  • Toute suite de Syracuse a la structure d’un arbre généalogique réduit à sa branche paternelle : Jean Untel, fils de Bernard Untel, petit-fils de Valentin Untel….

    La succession des impairs de i’ à i est une suite de i’parent_i’enfant dont la relation est : (i’enfant*3+1)/2^m=i’parent. Par exemple on a 433parent_577enfant puisque (577*3+1)/2^2 = 433

    L’ancêtre final de i’ est i, i étant un impair tel que 3*i+1 =2^m. Et seuls les ancêtres mènant à 1, i est la génération 1 : en généalogie ce serait l’ensemble des ‘’souches’’ d'un arbre. On peut donc substituer le terme ‘’étape’’ par génération.

    De ce fait les valeurs de i sont les noms de famille de l’arbre. Même si en théorie il y a une infinité de i possibles, la quantité de i est minuscule par rapport aux i' : la proportion de i dans N vaut m/2^m (1000/2^1000 = 9.332636e-299… c’est-à-dire quasi rien).

    On peut classer tous les i’parent_i’enfant en deux catégories selon m. Si m>1 : i’parent<i’enfant, et si m=1 : i’parent>i’enfant. Par exemple 35_23 pour m=1 ou 577_3077 pour m =4.

    Un enfant a toujours un parent. Un parent peut avoir un ou plusieurs enfants. Un enfant a plusieurs adelphes (nom générique pour désigner à la fois un frère et une sœur et éviter donc tout machisme dans notre énoncé).

    On peut comparer dans une génération le nombre de descendances d’un i’ par rapport à l’ensemble des adelphes de cette génération : 911 à 40% de toute la descendance des adelphes de la génération 12.

    CONJECTURE DE SYRACUSE REVISITEE (et à affiner largement)
    1) Sauf à démontrer qu’il existerait un i’ sans parent – ce qui est impossible – tout i’ a un parent et remonte en x génération par la branche qui lui est propre à son ancêtre i tel que 3i+1=2^m
    2) Si pour l’ensemble des i possibles, il était possible de générer tous les i’ sur toutes les générations, l’ensemble i’ + l’ensemble i est l’ensemble des entiers impairs.
    3) Une chaine générationnelle de i' à i est un ensemble de chainons parent-enfant qui ne peut faire que remonter du dernier descendant à sa souche (ou ancêtre) i.
    4) La question cruciale étant du pourquoi une chaine générationnelle est composée de tels i’, et de telles valeurs de tdv, x et n, ce graphique montre que les alignements [i’,tdv] pour les générations 2 à 12 en ayant sélectionné pour i’ tous les adelphes de chaque génération. Et que retrouve-t-on : 11 latitudes.

    Dans la journée je mets dans le google-drive le tableau excel relatif à ces données.101886
  • Je pense que tu cherches quelque chose. Mais je ne sais pas quoi.

    Le paquet qui est en gros entre 40000 et 45000 , sur la courbe tdv-gen-11, c'est un paquet de nombres. Comme on se limites aux nombres impairs et aux enfants impairs, les enfants de ces nombres sont entre $40000*2^m /3$ et $45000*2^m/3$, donc pour m=1, un premier groupes d'enfants entre 26000 et 30000, pour m=2 un autre groupe d'enfants entre 52000 et 60000, etc etc.
    On voit bien ces groupes d'enfants sur la courbe tdv-gen-12.

    Le paquet qui est sur la courbe tdv-gen-11 entre 80000 et 90000 a lui aussi des enfants. Et comme 80000,90000, c'est exactement le double de 40000,45000 ... on retombe en fait pour la génération 12 sur les mêmes groupements/clusters d'individus.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • le tableur (xls) des générations de la souche i =5 et des adelphes par génération est ici :
    https://drive.google.com/drive/folders/10vxJmkmaDzZ2lN2VtWPENrLLP3KVko8V
    nom du fichier : Syracuse_generation5_v2

    Mode d'emploi
    SYRACUSE : décompose la suite en fonction du i' entré E3. La liste des Parent.i'_Enfant.i' est dispo à droite
    DATA : la base de données pour les i' de 3 à 120.001 pour tout i
    DATA : la base de données pour les i' de 3 à 120.001 pour i = 5
    ADELPHES_LIST : tableau par génération des adelphes trouvés (= valeurs uniques de i' dans une colonne d'étape de DATA5)
    ADELPHES_DATA & ADEPHES_GRAPH : c'est là que ça se passe.

    Jeter d'abord un oeil sur le graph puis revener à ADELPHES_DATA et sélectionner une génération de Gen (colonne A).
    Revenez au graph et regarder la sélection.
    Regardez les ''paquets" de nombre dont parle @lourran. Ce sont des groupes de i' ayant le même tdv. Typique de Syracuse ces paquets !

    Selectionner un x_n_i ayant bcp d'occurence : par exemple avec x_n_i = 12_32_5, on voit sur le graph un paquet très serré entre i' = 104.213 et 119.297 pour un seul tdv de 48. x_n_i = 12_32_5 étant equivalent à x_n_tdv = 12_32_48 vous pouvez choisir l'un des deux pour vos sélections.

    Plus marrant : choisissez un seul tdv en colonne F. vous allez voir les i' communs à ce tdv sur plusiuers générations (les courbes de tendance partent en vrac dans cet affichage)

    Faites des sélections aussi avec n. S'il y a pas mal d'occurences comme pour n = 27, la courbe sur le graph semble être une longitude pour les points [i',tdv] en début de paquets.
  • Bonjour à tous

    En fournissant aux membres du forum les données de mon data mining sur les suites de Syracuse, je veux faire progresser grâce à leurs retours l’analyse de ces données, et aussi de pouvoir valider quelques formules et hypothèses.

    Ce qui a été plutôt efficace depuis le début de ce post, la fabrication des données s’améliorant aussi d’ailleurs dans la continuité des échanges.

    Principe : 1) on ne part pas sur un post du genre ‘’je m’attaque à la démonstration de la conjecture de truc-bidule’’. C’est un travail collaboratif basé sur des données expérimentales, vérifiables par chacun. Je parle plutôt de ‘’monstration’’ que de démonstration. 2) Comme ce post est long, des points de synthèse comme celui-ci sont faits régulièrement, ce qui permet à un nouvel arrivant de prendre le train en marche.

    Utilité ? Cette initiative devrait servir à quelque chose sauf si quelqu’un m’explique qu’il existe déjà : a) une liste exhaustive pour un très grand nombre de suites avec des très grands nombres contenant les variables i’, i, x, n, tdv. b) une étude sur l’évolution de la popularité du i=5 en génération 1 ou de i’ =911 en génération 12. c) une formule calculant un tdv avec comme variable uniquement i’, ou comment expliquer les alignements de points dans [i’,tdv]…

    Pause humour : sur la planète Shadok, la conjecture 1+1=2 n’ayant toujours pas été démontrée, le professeur Shadoko fait des traits en faisant défiler ses sujets devant lui. A ce jour, le professeur a dépassé 10^100 traits, il se doute bien qu’il y aurait un truc à creuser, mais ça ne vient pas. Cette petite parenthèse peut éventuellement être mise en relation avec le paragraphe précédent.

    Rappelle sur la notation et les formules
    i’ : l’impair de départ
    x : le nombre d'étapes impaires
    n : le nombre d'étapes paires (ou combien de fois on divise par 2 jusqu’à i)
    i : la dernière étape impaire avant 1
    tdv : le temps de vol
    x_n_i ou x_n_tdv : regroupement de variables utiles lors des tris
    Et les formules validées par les données :
    x = log(2^tdv/i';6) @Collag3n
    n =tdv-(LOG(3i+1;2)+x) @Collag3n
    y = ((i*(3*i+2)-5)/16)*2^n-i'*3^(x-1) @Collag3n
    z = x/(tdv-(log(3i+1);2)+x) sachant que z < log2/log3 @BERKOUK2
    3i+1=2^m
    Il en y beaucoup d’autres en cours si vous suivez ce fil de discussion.
    L’accès aux données est ici : https://drive.google.com/drive/folders/10vxJmkmaDzZ2lN2VtWPENrLLP3KVko8V

    Concepts :
    Une suite de Syracuse est structurée en liens de parenté (cf discussions avec @lourran) donc comme un arbre généalogique : pour chaque impair de départ i’, on remonte les générations vers la souche i tel que 3i+1=2^m. i est le parent le plus ancien (ou ancêtre) de tous les i’
    i est la génération 1 puisqu’il faut passer par 3i+1= 2^m pour revenir à 1. La définition d’une suite de Syracuse serait d’ailleurs plus précise ainsi :
    Tout impair i’ au départ d’une suite se lie à un impair parent et une chaine de parenté de longueur finie se forme car il y a toujours un énième parent i tel que 3i+1=2^m

    En partant de l’impair de départ i’, on atteint en premier son parent immédiat. Tout au long d’une branche, on a une succession de 3*i’_enfant + 1 /2^m = i’_parent

    Un enfant a un parent. Un parent peut avoir un, plusieurs ou pas d’enfants. Dans cette logique généalogique, on nomme adelphes (pour éviter de dire frères et rester dans le neutre comme parent et enfant) toutes les valeurs uniques d’une génération g qui ont le même parent dans la génération g-1. La génération 2 est entièrement composée d’adelphes. La génération 3 compte 20 adelphes sur 21, la génération 4 : 44/48, (voir les données)

    Les entiers impairs i’ sont donc répartis dans les sous-ensembles générationnels g>=2, les entiers i dans g=1 et enfin 1 comme souche universelle dans une g0.

    Objets :
    Il y a deux objets que le travail sur les données essaie de cerner : les coordonnées des points en relation avec les alignements perceptibles ‘’à l’œil nu’’ dans un nuage de points [i’, tdv], et les tirets ou paquets de points que l’on voit aussi nettement.

    J’ai nommé latitude et longitude deux courbes (ou deux droites si l’échelle verticale est logarithmique) qui passent par un point dans [i’, tdv]. Je pense que le mieux est de le constater par vous-même, et le dernier document mis en ligne est justement fait pour ça : Syracuse_new_v39_graph_v4.xls + mode-emploi_syracuse_new_v39_graph_v4.pdf

    Pour les tirets ou paquets, ce même document Excel est aussi là pour visualiser les données en ce sens. Si j’imagine que vous avez maintenant le graphique devant les yeux, voici les observations que j’en tire.

    J’ai entré 666 comme référence (c’est juste un numéro dans une liste de i’) et le tableur actualise le graphique avec les deux courbes latitude/longtitude et retourne qu’il y a 59 i' de même x_n_i entre 33621 & 38347 avec CROISEMENT [i',tdv] = [33621,36]. Je vois que le graphique ne bouge pas quand le i’ choisi aléatoirement dans cette plage change (touche f9) : tous ces i’ ont le même tdv (et sont de même génération). Si je zoome sur le paquet situé au point de croisement, je vois distinctement les 59 i’ sur la ligne de tdv 36, et tout à gauche de cette ligne, le point bleu appartenant à la longitude.

    Une latitude est composée de points ou de paquets de points ayant la même latitude. La longitude (qui n’aligne que des points uniques) passe par le premier point du paquet (ici 33621). Si vous n’avez pas encore chargé le xls, regardez les deux schémas joints, c’est très clair.

    Ma demande la plus urgente concerne les fonctions qui sont derrière ces courbes. Il est difficile de dire que ces objets n’existe pas si des données les montrent. Ce qu’il y a dans Excel n’invente rien, ce ne sont que des outils de tri et d'analyse.

    Il y a encore beaucoup à dire mais ce texte est déjà bien long.

    Je remercie par avance tous ceux qui s’investiront dans cette démarche.101986
    101988
  • @lourran
    est-ce que tu peux charger Syracuse_new_v39_graph_v4.xls + mode-emploi_syracuse_new_v39_graph_v4.pdf
    https://drive.google.com/drive/folders/10vxJmkmaDzZ2lN2VtWPENrLLP3KVko8V
    et essayer de rependre ce que tu essaies de m'expliquer dans ton dernier post en me donnant les ref que tu auras utilsées avec ce tableur
    Je pense que tu as vu quelque chose, mais il faudrait que j'ai dans excel les mêmes exemples que toi pour comprendre.
    Mon post de cet apm fait une synthèse qui peux t'interesser : je parle bcp des parentés
  • désolé j'ai passé les dernières journées à mettre au point une bonne version de l'affichage des latitudes et longitudes et aussi du système de parenté. Je reviens rapidement vers toi à propos de tes dernières formules
    peux-tu jeter un coup d'oeil sur le drive sur ces fichiers
    new_v39_graph_v4.xls + mode-emploi_syracuse_new_v39_graph_v4.pdf
    https://drive.google.com/drive/folders/10vxJmkmaDzZ2lN2VtWPENrLLP3KVko8V
  • @lourran : si on regarde les paquets de points sur une même latitude, ils sont de plus en plus longs quand i' grandit. ça a l'air quasi proportionnel. je vais essayer de trouver l'équivalence i' / longueur des paquets, c'est pas très compliqué à mettre en place
  • Je t'invite à faire un truc.
    Tu es à l'aise avec Excel, tu vas pouvoir t'amuser.

    Dans un fichier Excel,
    Cellule A2, tu mets le nombre 16384 ( c'est $2^{14}$)
    Cellule B2, tu mets la lettre k ; ça ne sert pas à grand chose, c'est juste pour l'esthétique, mais on va y revenir.
    Cellule C2, tu mets le nombre 1.
    Et tu copies ça sur environ 500 lignes, en incrémentant la colonne C (16384k+1, puis16384k+2 puis 16384k+3 etc )


    En colonne D, tu ne mets rien, pour que ce soit lisible.
    En colonne E, F et G tu mets les formules :
    E2 : =IF(MOD(C2;2)=0;A2/2;3*A2)
    F2 : =B2
    G2 : =IF(MOD(C2;2)=0;C2/2;3*C2+1)
    Puis tu copies ça sur tes 500 lignes.

    Et tu copies ça sur plusieurs colonnes. A chaque fois une colonne vide, puis 3 colonnes avec les formules ci-dessus.
    Je l'ai fait jusqu'aux colonnes BI,BJ,BK.
    Si tu fais tout comme il faut, tu verras les valeurs (3888,k,1) dans les cellules (BI2, BJ2, BK2)
    Tu verras aussi (108,k,1) pour les lignes 85,86, 97 ... plusieurs lignes avec des valeurs différentes en colonne C, mais le même résultat en colonnes (BI,BJ,BK)

    Ca veut dire quoi, tout ça. J'essaie de mettre un tout petit peu de formalisme dans les traitements.
    Le nombre k, ça peut être n'importe quel entier. Par exemple k=100, ou k=1000.
    Si on part de i' = 16384*k+1, et qu'on fait 15 étapes, on va arriver au nombre 3888*k+1
    J'imagine que tu as reconnu les formules. On fait y=i'/2 si i' est pair, et y=(3i'+1)/2 si i' est impair.
    Mais, pour que les formules soient 'génériques', je décompose i' en 2 parties :
    Colonne C= le reste de la division de i' par 16384.
    Colonne B= un nombre k, qui symbolise le quotient de i' par 16384
    Peu importe si k = 1000 ou k=100000000, on connaît déjà le comportement des 15 premières étapes de la suite pour tous les nombres de la forme $16384k+1$, grâce à ce calcul.

    Et je m'intéresse à toutes les étapes de la suite de Syracuse, y compris les étapes paires.
    Quand tu masques les étapes paires, tu ne vois plus rien.

    En colonne BI, on constate que les valeurs qu'on rencontre sont toujours les mêmes : 108 ou 648 ou 3888 ou 23328 ou 139968 ...
    Et on constate aussi que 648, c'est 108*6 ; 3888, c'est 648*6 etc etc, un facteur multiplicatif de 6 à chaque étage.

    En fait, ceux qui ont eu 2 montées et 13 descentes se retrouvent avec $16384*3^2/2^{13}=108$ dans cette colonne (peu importe si les montées ont eu lieu au début du trajet, ou au milieu, ou à la fin...)
    etc, 3 montées et 12 descentes, ça nous emmène à 648 etc etc.
    Le facteur 6 vient de là, on remplace une division par 2 par une multiplication par 3, ça revient à multiplier par 6.

    On constate aussi que les nombres $16384k+a$, avec $a\in{{84,85,96,104,106,113,136,138,140,141,150,151}}$ se retrouvent tous à $108k+1$ après 15 étapes.
    Tous ces nombres là ont eu 2 montées et 13 descentes, et sur la suite du parcours, ils sont solidaires, ils sont dans le même wagon, et ils suivront le même chemin partant de 108k+1 jusqu'à 1. Ils apparaîtront donc dans le même groupe dans tes graphiques.
    Plutot que de wagon, je devrais parler de covoiturage. Certains se sont groupés dans la voiture n°108k+1, d'autres se sont groupés dans la voiture n°108k+2 ; au sein de chaque voiture, ils vont rester solidaires jusqu'à l'arrivée. Mais la trajectoire de la voiture 108k+1 et la trajectoire de la voiture 108k+2 peuvent être très différentes.

    Et comme on a mis un peu de formalisme, on a mis un facteur k qui traine au milieu de tout ça, on constate donc que ces formules sont valables aussi bien pour les nombres 16384*1000 et suivants, que pour les nombres 16384*1500 et suivants ou 16384*123456789 et suivants. ...

    Je pense que sur cette base, tu vas pouvoir continuer à jouer avec cette conjecture de Syracuse.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • @lourran
    merci bcp pour cette contribution.
    par contre j'ai un petit souci pour refaire ton modèle
    aucun souci a priori jusqu'à la 1ère copie sur 500 lignes
    mais quand je recopie tes colonnes, je pense qu'il y a une instruction qui manque : tui dois forcément incrémenter quelque chose sinon les copies restent identiques, ce qui ne sert à rien
    tu peux regarder, je voudrais vraiment avoir strictement le même modèle que toi

    marrant aussi les formules en anglais ;)
  • En colonne E,F,G, les formules lisent le contenu des colonnes A,B,C.
    Puis en colonnes I,J,K, les formules lisent le contenu de E,F,G etc etc

    Quand tu tapes les formules données en E2,F2 et G2, puis que tu copies/colles sur les colonnes suivantes, rien à changer, Excel va transformer la formule, tu auras directement :
    En case I2 : =IF(MOD(G2;2)=0;E2/2;3*E2)
    etc etc
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • sinon est-ce que tu peux me valider ce modèle :
    cellule A1 = start k
    cellule B2 = 2^14
    en ligne 2 titres des col A à D : i' Syracuse kème Résultat
    puis en ligne 3 :
    A3 : =$B$1+CELLULE("ligne";A3)-3 (attention il faut bien taper signedollar_B_signedollar_1 : SHTAM vire les $)
    B3 : =SI(MOD(A3;2)=0;"y=i'/2";"y=(3i'+1)/2")
    C3 : ="k+"&CELLULE("ligne";A3)-3
    D3: =SI(MOD(A3;2)=0;A3/2;3*A3+1)

    On copie vers le bas cette ligne autant qu'on veut
    est-ce que cela reproduit correctement ton modèle initial ?
    cf image :102046
  • ok je teste
    regarde le ''modelèe bis"
  • L'intérêt de laisser la colonne i' sous la forme 16384k+1 (donc 3 colonnes , une pour 16384, une pour k et une pour +1), c'est que ça montre clairement que le résultat sera valable pour toute valeur de k.

    Et donc, quand on répète la manipulation de Syracuse 15 fois : Si tous les 16384k+a conduisent à 108k+1 quand a vaut une des valeurs 84,85, 96,104 ..on sait que c'est valable pour toute valeur de k. Et donc on acquiert la certitude que ce phénomène qui se produit pour k=1 va se reproduire pour toute valeur de k.

    Si on remplace k par une valeur précise, on ne sait plus si le résultat obtenu est une coïncidence ou pas.

    L'intérêt est très limité.
    Mais la mise en oeuvre est facile, et je pense que ça va te permettre de comprendre certains phénomènes qui te semblent 'magiques' pour l'instant.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • c'est ok
    j'ai bien BI2 =3888
    BJ2 : K
    BK3 : 1
  • la magie précède la science
    je regarde tout ça en détail
  • @lourran
    je mets sur le drive un excel qui reproduit ton modèle
    https://drive.google.com/drive/folders/10vxJmkmaDzZ2lN2VtWPENrLLP3KVko8V
    SYRACUSE_MODEL_LOURRAN-v2
    en onglet : MODEL_0 ton modèle initial
    en onglet : MODEL_1 une version un peu améliorée pour réduire le nombre de colonnes : du coup j'ai 22 générations... on pourra pousser avec une ruse ou deux en génération n (avce des macros)

    Dans MODEL_1 tu retrouves en colonne AS et AT la 15ème génération
    en filtrant AT avec ''108'' on trouve les k suivants (en numéro de lignes k+1 = num ligne) : j'en ai donc un peu plus que toi (le premier en 64)
    64
    80
    84
    85
    96
    104
    106
    113
    128
    136
    138
    140
    141
    150
    151
    160
    168
    170
    192
    208
    212
    213
    226
    227
    256
    272
    276
    277
    280
    282
    300
    301
    302
    320
    336
    340
    341
    384
    416
    424
    426
    452
    453
    454
  • Attention,
    En colonne BN, quand tu affiches 30, la vraie valeur est 30.375.
    Tu as des nombres à virgule, ce qui n'est pas cohérent avec la mécanique de Syracuse.
    Si tu veux beaucoup de colonnes, il faut que tu remplaces le $2^14$ de la colonne A par un $2^23$ par exemple.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • ok compris
    si le "seed" est 2^14, il faut rester à gen<=15
    c'est bien ça ?
  • Pour finir le vendredi en beauté, une (peut-être) grosse bétise, mais bon j'en appelle à votre sagacité bien connue :

    1) S'il y a un algorithme de Syracuse qui fait revenir tout entier i' à un i = 2^m, il y a un algorithme inverse qui part de tous les 2^m possibles et rejoint tout N privé de 1,2,4,8
    2) le Père Noël nous offre un ordi quantique magique , c'est le moment de tester un petit script
    3) le script grosso modo: premier seed 2^4 = 16 on fait (16-1)/3 = 5 c'est un impair qu'on multiplie par 2 donc 2*5=10
    On vérifie si (10-1)/3 =3 c'est un entier donc on stocke.
    Pour 5*4 = 20 que dalle
    Pour 5*8 = 40, (40-1)/3 = 13
    On continue jusqu'à l'infini...
    4) Le calcul est fini (c'est magique n'est-ce pas) et on a plein de i et i' : 5, 13, 53...dans la mémoire quantique
    5) On recommence le même process pour chacune de ces valeurs jusqu'à l'infini (ça commence à chauffer un peu quand même)
    6) Tant qu'on y est, on réitère les instructions 3) à 5) pour toutes les autres puissances de 2 (on peut en sauter une sur deux)
    7) l'ordi a quasi fondu et on a consommé toute l'énergie de l'univers. Mais dans un dernier spasme l'ordi affiche :
    Résultat : N privé de 1,2,4,8
    Il 'est gourré l'ordi magique ?????
  • Oui. Voire gen<=14 si on prenait en compte la valeur 0 en colonne C. Mais le cas 0 en colonne C n'a pas beaucoup d'intérêt, le chemin est direct de 2^14 jusqu'à 1...
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • Et le résultat est , dans cet ordre :
    16, 5,32, 10,64, 3,20,21,128, 6,40,42,256, 12,13,80,84,85,512, 24,26,160,168,170,1024, 48,52,53,320,336,340,341,2048 etc etc

    Et on retrouve 52 juste avant 53, 340 juste avant 341 ... alors que 340 et 341 n'ont aucun lien de parenté, pas le même père, pas le même grand père ... Et on aura plein de séquences comme ça dans notre chaine ; d'ailleurs, le triplet 80,84,85 qu'on voit ici, on l'avait vu dans nos messages précédents, c'est bien le même, ce n'est pas une coïncidence.

    On constate aussi que dans cette séquence 48,52,53,320,336,340,341,2048, on a quelques nombres qui valent environ 52, puis quelques nombres qui valent environ 335 ( environ 6,2 fois plus que 52), puis un nombre qui vaut 2048 (environ 6 fois plus que 335). Et ce ratio un peu plus grand que 6, on va le retrouver systématiquement dans la suite de cette chaine.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • @lourran
    et hello à @everybody : j'espère qu'on a perdu personne ;)

    en bref @lourran a proposé un modèle qui a été bien documenté dans les posts précédents
    c'est un modèle qui grosso modo comprend les pairs

    de manière générique le type de modèle que nous suivons depuis le debut de ce post exclut les pairs (hormis n leur nombre)
    il est évident qu'il faut trouver le lien entre les deux

    on sait que dans un couple impair i'parent_i'enfant il y a m pairs qui font le lien (au moins un)

    on sait aussi que si on part d'une puissance de 2 comme 16 il est facile de trouver un algorithme inverse de celui de Syracuse qui va donner une suite telle que 16, 5, 10, 3, 20, xxx, 40, 13, 80, xxx,160, 53, 320, xxx, 640, 213, 1280, xxx : xxx sont des pairs dont il n'est pas possible d'extraire un impair entier tel que pair-1/3 = i'

    si on fait de même en partant de 64, 256, 1024... on va vite trouver plein de i' correspondant aux valeurs paires qui les ont "engendrés".

    donc pour faire court : une ''suite impaire'' de Syracuse de i' à i a son équivalent ''suite paire'' de p' à p sachant que i'*3+1=p' et que p=2^m

    ça a le mérite d'être simple. mais c'est l'enfer dans le ''language machine'' des entiers, où se cache le fameux ''comment" s'y prennent les entiers pour toujours revenir à 2^m si on est en suite paire ou 2^m-1/3 si on est en suite impaire.

    ça vaut donc le coup de creuser le modèle de lourran et voici donc une première approche avec le tableur SYRACUSE_MODEL_LOURRAN-v3 qui est sur le drive.
    https://drive.google.com/drive/folders/10vxJmkmaDzZ2lN2VtWPENrLLP3KVko8V

    Si vous l'ouvrez vous trouvez dans MODEL_1 l'application des formules de @lourran sur 500 lignes et 15 générations à partir du seed 2^14

    En onglets MODEL1_GEN et MODEL1_S on isole les valeurs des colonnes "gen" et "syracuse'' (je fais court)

    Dans l'onglet SELECT : on peut choisir en B1 une valeur de ligne et l'affichage montre pour les 15 générations :
    MODEL1_GEN : les valeurs des colonnes gen
    MODEL1_S : les valeurs des colonnes syracuse
    GEN/2^14 : les valeurs des colonnes gen divisé par 2^14
    GEN/S : les valeurs des colonnes gen divisé par les valeurs des colonnes syracuse

    et là regardez bien un drôle de truc (la pépite du jour si on veut)
    Si vous traquez les valeurs 108 dans la gen 15 pour MODEL1_GEN (j'ai mis de B12 à B55 toutes les lignes où on trouve 108)
    vous allez voir que la ligne GEN/S se compose de valeurs décimales et de valeurs entieres

    par exemple pour ligne 300 que j'ai mis en illustration, on voit bien que c'est décimal de gen1 à gen7 puis entier de 8 à 15 où se trouve 108

    et là bingo : de J6 à Q6 correspondantes aux valeurs de la ligne GEN/S = 54
    on voit que ces valeurs sont très bien alignées sur GEN/2^14 = 0,001x4 - 0,0232x3 + 0,2136x2 - 0,909x + 1,56 pour x de 1 à 8

    amusez vous à le faire sur les autres lignes proposées, ça marche toujours.
    manip :
    je tape 212 en B1 (85 en 21ème position de la liste des 108)
    je vois que les cellules K6 à O6 sont égales à 72 et je les sélectionne
    je fais insertion\nuage de points
    je demande une courbde de tendance sur ces points et je choisis polynomiale que j'ajuste en degré 4
    ce qui donne : 0,0002x4 - 0,0033x3 + 0,024x2 - 0,0868x + 0,1362 avec un r^2 de 1

    nb: on peut trouver pour les col gen-1 à gen-15 que des entiers en GEN/S comme par exemple pour 64. Je n'ai à priori pas trouvé de lignes n'ayant pas d'entier mais je n'ai pas fouillé outre mesure.

    Mes questions:
    Quel formalisme peut-on tirer de ces observations?
    Qu'est-ce qui fait qu'un groupe de GEN/2^14 s'alignent sur une courbe polynomiale s'ils on la même valeur entière GEN/S

    Bon we. Je fais un petit break mais je lirais vos réponses avec plaisir102184
  • Bof, pas passionné du tout par cette histoire de nombres entiers /nombres décimaux. Quand S vaut 1,2 ou 4, Gen/S donne généralement un nombre entier , oui, so what ?

    L'idée de faire une division euclidienne par $2^{14}$, c'est quoi ? On a un nombre entier $z$ ; on fait la division euclidienne par $2^{14}$, et on trouve un quotient $q$ et un reste $r$ : $z = 2^{14} * q + r $
    Ce tableau nous dit quoi ? Il nous dit que tout le début du chemin de Syracuse suivi par $z$ dépend essentiellement de $r$, et $q$ n'intervient quasiment pas. Je devrais dit qu'il illustre cette propriété, ou qu'il nous la rappelle.

    On sait par exemple que le nombre $27$ a un rôle un peu particulier. Le chemin partant de $27$ est 'anormalement' long. On voit ici que ce sera la même chose pour $16384+27$ ou $16384*2+27$ ou pour tout nombre $16384*q+27$.
    Si on part de $16384k+27$, on passe à l'étape $14$ par $279936k+484$ ... soit un nombre environ $17$ fois plus grand que le nombre de départ.

    En d'autres mots, si au lieu d'écrire les nombres en base 10, on les écrit en base 16, on conclue que les nombres du type ????001B vont avoir un trajet 'anormalement' long.

    Si on constate des phénomènes répétitifs dans les courbes, l'explication est là. Ce qui se passe entre $q*2^{14}+1$ et $(q+1)*2^{14}$ se répète quasiment à l'identique entre $(q+1)*2^{14}+1$ et $(q+2)*2^{14}$. Tout le problème est dans le quasiment.
    J'ai pris $2^{14}$, mais $2^{15}$ ou $2^{16}$ auraient bien entendu donné la même chose, ils auraient même permis de regarder un peu plus d'étapes.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • @lourran et@everybody

    J'ai commencé à faire la jonction entre les 2 modèles
    pour rappel :
    1) le modèle ''impair'' est basé sur l'analyse de données de suites i' à i (donc que des impairs) mais tenant compte des pairs au travers de la variable n qui est le nombre de division par 2 d'une suite de i' à i. De nombreuses formules définissent les rapports x, n, i, et tdv et l'analyse de données de ce modèle est toujours en cours.
    2) le modèle ''pair'' de @lourran qui suit ce post depuis le début. @lourran l'explique mieux que moi mais disons que si on prend une puissance de 2 comme 2^14, un jeu de formules va donner pour chaque génération (étapes) des valeurs spécifiques : Pour le citer : ''On constate que les nombres 16384k+a, avec a =84,85,96,104,106,113,136,138,140,141,150,151 se retrouvent tous à 108k+1 après 15 étapes.''

    il y a sur le drive
    https://drive.google.com/drive/folders/10vxJmkmaDzZ2lN2VtWPENrLLP3KVko8V
    un nouveau doc excel : SYRACUSE_MODEL_LOURRAN-v4

    Par rapport à l'onglet ''SELECT'' où les choses se passent, les 3 onglets de gauche sont dédiés au modèle ''pair'' et les 2 de droite sont un condensé du modèle ''impair''. SELECT fait donc la jonction.

    Pour que ça marche j'ai entré dans les cellules B12 à B21 les valeurs de a qui ne produisent des ''108'' en gen15 tout en produisant des i' impairs : a=85, 113, 141, 151, 213, 227, 277, 301, 341, 453 (list_a)

    Vous pouvez donc entrer en D1 une valeur de ligne correspondant à ces valeurs de a et une valeur de k entre 1 et 7 (limite de la base de calcul).

    Qu'est-ce qu'on voit ?
    1) que ça produit plein de 911 en gen 12 (le 911 est un running gag entre @lourran et moi)

    2) que tous les i = 5

    3) que ça produit des suites plus ou moins longues : pour k de 1 à 7 et a=list_a, il n'y a que 14 valeurs uniques de tdv :
    32, 35, 39, 40, 41, 42, 58, 74, 123, 127, 128, 129, 130, 159

    4) et de même 14 couples tdv_x (x est le nombre de div impaires de i' à i) :
    128_44, 35_8, 41_10, 129_44, 39_9, 127_43, 42_10 ,130_44, 58_16, 32_6, 159_55, 40_9, 123_41, 74_22

    5) en appliquant :
    x = log(2^tdv/i';6) @Collag3n
    n =tdv-(LOG(3i+1;2)+x) @Collag3n
    on a donc une suite de 14 x_n_i :
    6_22_5, 8_23_5, 9_26_5, 9_27_5, 10_27_5, 10_28_5,16_38_5, 22_48_5, 41_78_5, 43_80_5, 44_80_5, 44_81_5, 44_82_5, 55_100_5

    6) on utilise ces 14 x_n_i dans l'onglet DATA5 comme filtre de la colonne x_n_i (c'est déjà fait dans le classeur)
    ou en reprenant le Syracuse_generation5_v2 dans l'onglet ADELPHES_DATA comme filtre de la colonne x_n_i :
    revoici les ''paquets'' : ces groupes de i' dans une fourchette de valeurs assez serrée et qui ont le même tdv
    nb :si vous le faites vous-même avec Syracuse_generation5_v2 tous les 14 x_n_i ne sont pas là à cause de la taille limitée de la base

    7) en sélectionnant tous ces x_n_i on obtient le graph [i',tdv] qui montre tous les paquets de points liés au "108" du modèle pair (illustration jointe)

    CONCLUSION:
    les modèles pair et impair se croisent : leur lien se fait sur les paquets de points et leurs x_n_i . Donc on ne fait pas tout à fait n'importe quoi si deux méthodes convergent sur des objets identiques.
    Je rappelle au passage qu'une longitude passe par le premier [i',tdv] d'un paquet défini par un x_n_i spécifique, le dit paquet étant lui-même sur une latitude alignant plusieurs points ou paquets de points

    Action a venir
    PMF intégre dans DATA du modèle impair les variables GEN_15 (je suis preneur pour une plus belle notation) du modèle pair
    @lourran continue (je l'espère) sa généralisation commencée dans son précédent post sur la base de ces nouvelles infos
    @kingofmathlab nous donne les fonctions latitude et longitude102296
  • J'ai parcouru un post ancien de Pablo_de_retour sur la suite de syracuse

    Solutions possibles
    Pablo_de_retour est un mathématicien humoriste
    Pablo_de_retour est un fou de maths
    Pablo_de_retour est un mathématicien fou
    Pablo_de_retour est un troll
    Pablo_de_retour est un mathématicien qui veut prouver que les maths sont fausses parce qu'il existe des démonstrations sans sens
    Pablo_de_retour est un passionné de LaTex, seul le formalisme l'intéresse, plus il y en a, meilleur c'est

    Conclusion
    Chaque démonstrateur devrait ouvrir un classeur Excel 5 minutes avant de publier une démonstration pour vérifier que rien de marche dans la dite démonstration. Dans n'importe quel langage, on peut écrire des tas de phrases savantes qui ne veulent strictement rien dire : Lacan y arrivait très bien avec la langue française (Lacan a d'ailleurs utilisé pour ces théories psychanalytiques un formalisme mathématique strictement privé de sens). Le type qui écrit les discours de Macron présente également d'excellentes aptitudes dans ce domaine.

    L'observation et l'analyse des données, avec des méthodes reproductibles, vérifiables et cohérentes (il suffit de publier ces classeurs excel) me suffit largement. Ces analyses sont parfaitement explicables en langue française, avec un formalisme minimal. Quand quelqu'un arrive à formaliser ces données, on a le formalisme et la vérification expérimentale en même temps. Merci à @collag3n, @berkouk2 et@lourran pour leurs contributions.

    PETIETE ANNONCE : cherche bon connaisseur de mathlab ou r pour analyser les données dites "latitude" et "longitude" dont j'ai beaucoup parlé dans mes posts. On trouve ces données dans la plupart des classeurs Excel mis sur le drive mais je peux aussi faire des csv ultra-simples pour une importation sans effort. Je m'y mets d'ailleurs dès aujourd'hui.
    https://drive.google.com/drive/folders/10vxJmkmaDzZ2lN2VtWPENrLLP3KVko8V
  • Ah oui, j'adore Lacan. Voici une de ses citations :

    «... on peut montrer qu'une coupure sur un tore correspond au sujet névrotique».

    Lorsqu'on I'interroge pour savoir si I'utilisation de cette topologie est au mieux une analogie pour expliquer la vie de l'esprit, Lacan répond :

    "ce n'est pas une analogie... Ce tore existe vraiment et il est exactement la structure du névrosé. Ce n'est pas une analogie; ce n'est pas même une abstraction, car une abstraction est une sorte de diminution de la réalité, et je pense que c'est la réalité."

    :)o
  • exactement ! Notre ami Lacan était un peu Tore-du

    Je l'ai étudié à la fac le Lacan : Le plus étonnant est que ces émules arrivaient à sortir quelque chose d'intelligible de la théorie lacanienne.
  • oui, ce sont des Pablo beaucoup plus sophistiqués...
  • PETITE ANNONCE : cherche bon connaisseur de mathlab ou r pour analyser les données dites "latitude" et "longitude"
    on cherche une fonction pour chacune autre que tdv = a*ln(i')+b ou alors une formule pour a et b ;)

    vous trouvez dans le drive
    https://drive.google.com/drive/folders/10vxJmkmaDzZ2lN2VtWPENrLLP3KVko8V
    un xls nommé :
    SYRACUSE_data_lat_long.xls
    qui contient les données latitude longitude pour 10 i' seed (donc 10 groupes de données)

    Je me suis mega appliqué pour la présentation, j'espère que vous apprécierez. c'est conçu pour être facile à importer

    si vous débarquez dans ce post :
    dans [i', tdv] i' étant un entier impair qui démarre une suite et tdv son temps de vol
    on peut faire passer par un point (s'il y a un paquet horizontal de points c'est le premier point du paquet )
    une latitude : courbe montante de la forme tdv = a*ln(i') +b avec a positif & b négatif
    une longitude : courbe descendante de la forme tdv = a*ln(x) + b avec a négatif & b positif

    nb : par rapport à l'illustration, les données Latitude vont jusqu'à 4272102312
  • le plus long paquet de points pour i'<=200.001 comprend 1.028 points
    il est situé de i '161.221 à 188.935
    le tdv est de 90 et i = 5
  • En exclusivité mondiale pour Shtam !

    Je le dis, je le clame, que dis-je je le claironne : dans le nuage de points [i', tdv], il n'y a que des "paquets" même si certains n'ont qu'un point !

    Je rappelle qu'un paquet est un cluster de i' ayant le même tdv, ces i' étant dans une fourchette de valeurs assez proches, d'où l'aspect en paquets ou tirets.

    J'ai pu organiser 93,6% de la base de données (pour i'<=200.001) selon cette nouvelle règle (sont actuellement exclus les i <>5)

    Il suffit de sélectionner une valeur x_n_i pour identifier un paquet. Il y a dans la base pour i =5, exactement 955 x_n_i possibles. Le nuage de points [i', tdv] réduit à i=5 comprend 93.680 points que l'on peut donc regrouper en 955 paquets.

    Mais il y a encore mieux, j'ai aussi toutes les longitudes pour i = 5. Je rappelle qu'une longitude est un alignement de points dans [i',tdv] suivant une courbe descendante de type a*ln(i')+b = tdv avec a négatif & b positif. Mais je peux préciser aujourd'hui :

    UNE LONGITUDE EST UN ALIGNEMENT DE PAQUETS SUR UNE COURBE DE TYPE a*ln(i')+b = tdv, L'ALIGNEMENT SE FAISANT SUR LE PREMIER POINT A L'EXTREME GAUCHE DU PAQUET.

    Dans la base pour i'<200.001, pour i = 5, il y a exactement 54 longitudes que j'ai identifiées par un classificateur "x_n_i ref" allant de 1 à 54.

    Le classeur Syracuse_new_v40 va vous permettre d'en juger par vous-mêmes :
    https://drive.google.com/file/d/1ZkXj_Qk6OyLJtDf8aSBLmI1UE0ItEQDQ/view?usp=sharing

    1) Aller sur l'onglet DATA
    dans la colonne "x_n_i ref" déselectionner ''tbc'' en bas de la liste du filtre (il va virer les i<>5)
    choisisser dans la colonne "x_n_i" une valeur au hasard
    selectionner les valeurs affichées dans les colonnes i' et TDV et faites un nuage de points : vous visualisez un paquet.
    La colonne "elt paquet" vous donne son nombre de points.

    2) Aller sur l'onglet DATA
    Vérifier que les filtres n'ont plus de selection active
    Selectionner n'importe quelle valeur de 1 à 54 dans le filtre de la colonne "x_n_i ref"
    selectionner les valeurs affichées dans les colonnes i' et TDV et faites un nuage de points : vous avez une longitude. Ceux sont les groupes de paquets alignés via leur point à l'extrème gauche de chaque paquet sur une même courbe.
    nb : les longitudes à partir de 9 sont plus "spectaculaires" que celles de 1 à 8 mais sont toutes sont légitimes.

    Et voilou ! Le nuage de points [i', tdv] est donc entièrement classifié si on ajoute les latitudes donc un nouveau classificateur ne saurait tarder. Vu la méthode que j'utilise, le nuage de points peut être étendu comme on veut à n'importe quelle taille (et si bien sûr le forum se cotise pour m'offrir une render farm)

    Resterait à formaliser tout ça : mais ça c'est votre boulot !
  • Bonjour,
    PMF a écrit:
    Resterait à formaliser tout ça : mais ça c'est votre boulot !

    Tu rigoles !! T'observer shtammer me suffit largement !!!

    Cordialement,

    Rescassol
  • PMF a écrit:
    il n'y a que des "paquets" même si certains n'ont qu'un point !

    Dans tout ensemble de points "il n'y a que des "paquets" même si certains n'ont qu'un point ". Tu viens de réinventer l'eau chaude.

    Cordialement.
  • @rescassol
    @gerard0
    140 messages et environ 3000 vues et voilà les bonnes vannes qui arrivent!
    Ok :)
    donc merci pour votre contribution essentielle !
    visiblement si on vous explique le fil à couper le beurre, vous allez avoir du mal à comprendre... (ça c'est pour l'eau chaude)
    donc je re-explique lentement :
    1) s'il y a bien quelque chose qui caractérise une suite de Syracuse c'est bien les 4 variables i, i', x, n, tdv et la démonstration minimale serait de dire que s'il y a moyen de démontrer que tout i' s'associe à un tdv , on a faire le tour de la question. b. a.-ba non ?
    2) je m'occupe que de traiter les données : quand j'avance des choses, je peux montrer que ça existe et qu'on peut s'en servir
    3) donc je reprends ce que vous auriez compris en ouvrant le classeur de mon post précédent :
    il y a tout simplement pour i = 5 deux "seed" x_n_i (de seed la graine, j'explique à fond hein?) c'est 2_1_5 et 1_1_5 (on peut les répérer facilement dans l'onglet XNI_GEN. Il suffit d'incrémenter x de 2 et n de 3 -tant qu'on veut mais je m'arrete à x = 141 puisque c'est la valeur minimale de ma base i'<200.001.
    4) ces x_n_i interceptent tous les [i',tdv] pour i=5 soit 93600 éléments environ. cela permet de défiinr les paquets de points et d'expliquer au moints les aligements de type longitude.
    5) donc please ouvrer ce classeur !
  • PMF, soyons sérieux.
    Contrairement à certains, tu n'es pas arrivé en disant : 'J'ai une preuve de ... ' mais en disant 'Je m'amuse avec la suite de Syracuse'.
    Et pour cette raison, j'ai participé activement.

    Mais même moi, je n'ai toujours rien compris à tous tes fichiers Excel ; je ne vois pas du tout l'intérêt de ces tableaux qui n'en finissent pas. Et je n'ai toujours rien compris à ces histoires de latitudes et longitudes. Et soyons clair, si je n'ai rien compris, c'est qu'il n'y avait rien à y comprendre.

    Tu voulais trouver une logique, tu semblais considérer ces coïncidences comme surprenantes, et j'ai essayé de t'apporter d'autres éléments pour expliquer ces coïncidences, qui n'ont rien de magique. Pour t'aider.

    Mais à titre personnel, je n'ai rien vu de nouveau ou d'intéressant dans tous ces fichiers.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • tu as totalement raison @lourran et je te remercie de ton apport

    Voilà donc les résultats tangibles avec les notations que nous connaissons :
    Base de donnée étudiée pour i' de 3 à 200.0001
    100.000 éléments donc 93.680 avec i = 5
    Deux x_n_i ''seed'' qui permettent de générer tous les autres : 2_1_5 et 1_1_5 (en incrémentant x de 2 et n de 3)
    Nombre de i' dont le x_n_i part du seed 2_1_5 : 46.365
    Nombre de i' dont le x_n_i part du seed 1_1_5 : 47.313
    Total 93.678
    La base pour i = 5 est entièrement couverte à l'exception de i' = 5 et i' = 156.159 parce il faudrait partir de n =0 pour 5 et aller jusqu'à x =141 pour 156.159 (très facile à corriger)
    Latitudes identifiées : 136 (pour i = 5)
    Longitudes identifiées : 54 (pour i = 5)
    Clusters identifiés : 955 (pour i = 5)
    Tous les points visibles dans [i',tdv] pour i=5 sont donc classifiables selon leur longitude, latitude et cluster.

    Sachant que :

    Un cluster de points [i'_tdv] c'est un ''paquet'' de i' ayant le même tdv et le même x_n_i.

    Par analogie à un point terrestre où se croise une latitude et une longitude, on peut faire de même dans l'espace bidimensionnel de [i',tdv]
    avec une courbe descendante dite de longitude qui est de type a*ln(i')+b = tdv avec a négatif & b positif. La longitude passe toujours par le premier point à l'extrème gauche d'un cluster. Isoler une longitude revient à choisir un seul x_n_i dans la base (onglet DATA, colonne x_n_i ref)

    Pour la latitude, c'est une courbe montante de la forme tdv = a*ln(i') +b avec a positif & b négatif. Isoler une latitude revient à choisir un seul x (et i = 5) dans la base (onglet DATA, colonne x_n_i ref).

    Voilà , c'est tout.

    C'est dommage que l'on arrive à un point que je trouve pas trop cool dans cette discussion. C'est peut-être la face noire du SHTAM. Vraiment dommage parce que les vraies subtilités commencent maintenant selon moi. Moi je suis quasi au bout de ce que je voulais faire : bien décrire une base de données des suites de Syracuse avec une technique que je maitrise bien. Creuser la mine et l'étayer proprement. Remonter du minerai.

    Mais les ricanements et les ''je ne comprends pas de quoi tu parles" semblent prendre le dessus...

    Le classeur Syracuse_new_v40 a été mis à jour sur le drive avec quelques détails qui en améliorent la compréhension, surtout le graphique.
    https://drive.google.com/file/d/1ZkXj_Qk6OyLJtDf8aSBLmI1UE0ItEQDQ/view?usp=sharing
    J'ai ajouté la colonne x_n_i seed dans DATA et un onglet DATA_GRAPH. Jouer avec les filtres dans DATA et regarder sur DATA_GRAPH se former les latitudes et longitudes ou les clusters de points est un régal (enfin pour moi).
  • PMF,

    sauf à avoir un égo surdimensionné, on ne peut pas à la fois ne pas faire des maths élaborées sur un forum de maths et dire que ce qu'on fait est important.
    " Moi je suis quasi au bout de ce que je voulais faire : bien décrire une base de données des suites de Syracuse avec une technique que je maitrise bien."
    C'est bien, on te l'a dit. Mais personne n'a trouvé utile ce "travail" qui t'a intéressé.
    La suite est assez bizarre :
    "Creuser la mine et l'étayer proprement. Remonter du minerai. " ?? Tu es chercheur d'or ? Si oui, quelle pépité as-tu trouvée ? Personne n'a rien vu.

    Plus grave :
    "Resterait à formaliser tout ça : mais ça c'est votre boulot ! "
    Tu nous donne des ordres ?? tu t'es amusé avec un tableur et tu demandes aux autres d'en faire quelque chose ? Non, ce n'est pas sérieux. Il a déjà fallu l'aide des autres pour que tu avances dans ton jeu avec les données sur des tout petits nombres, et tu crois qu'ils vont te prendre au sérieux ?

    Et tu ne comprends même pas le ridicule de ta phrase : "il n'y a que des "paquets" même si certains n'ont qu'un point ! " Au point de répondre en reprenant "le fil à couper le beurre".

    Finalement, contrairement à ce que j'ai cru, tu as bien un égo surdimensionné (ou tu es complétement à la masse sur ce que sont les maths et le reste). Comme 99% des "inventeurs" ce shtam, tu t'illusionnes ...

    Tant pis pour toi !
  • @gerard

    on va passer des plombes sur une seule phrase que tu t'ingénies à travestir. Un cluster peut ne contenir qu'un point, c'est tout. c'est jsute une boite.

    Ego surdimensionné bof, bof... Mais oui je suis assez triste que cette approche pratique n'intéresse pas "votre" communauté.

    Pour le reste, tu cherches maladroitement la polémique, je laisse tomber. Tu es passé à côté d'un certain humour que j'avais évidemment mis dans mes messages. Je suis ravi de l'aide de @Collag3n, @Berkouk, @lourran que je n'ai pas cessé de remercier.

    Sans racune. Bye
  • Vous trouverez ici le fichier Syracuse_tdv_solver_v2.xlsm
    https://drive.google.com/file/d/14yhSyqdOcCTuK91Kyx7qk3-9UqIn4WJY/view?usp=sharing
    C'est la (dé)monstration qu’il est possible d’associer un i’ à un tdv sans effectuer directement la suite de Syracuse de ce i’.

    Il suffit d’entrer une valeur x_n_i en cellule D6 de l’onglet TDV_SOLVER et de lancer la macro 1 qui va s’arrêter sur un couple [i’,tdv] affiché en cellule H6 et H7 (partie bleue). Je conseille de chercher des valeurs x_n_i dans les 1000 première lignes de DATA colonne F sinon le calcul sera long, voire très, très long.

    Exemple : je rentre en cellule D6 de l’onglet TDV_SOLVER le x_n_i de la ligne 17 de DATA col F : 41_66_5. Je lance la macro et elle s’arrête sur i’ =27 tdv = 11. Ce que la partie jaune me confirme. Je peux aussi avoir la curiosité de chercher une valeur de i’ dans DATA col A et d’entrer son x_n_i correspondant. J’entre donc 12_25_5 qui correspond à 911 (le célèbre 911 de l’étape 12). J’exécute la macro et elle s’arrête sur …. 813. Mais c’est normal. En effet les x_n_i liés à 12_25_5 sont dans le cluster [813, 817, 819, 827, 837, 841, 843, 845, 863, 911]. Pour rappel les clusters sont des paquets ou tirets de points bien visibles dans un nuage de points [i’,tdv].

    On pourrait d’ailleurs faire une variante qui afficherait tous les i’ du cluster du x_n_i cherché.
    Tous les x_n_i existants dans DATA pour les 100.000 i’<=200.001 fonctionneront mais attention encore une fois à la durée des calculs.
    Il n’y a évidemment aucun calcul de l’algorithme de Syracuse pendant la macro. La partie jaune qui effectue cet algorithme n’est activée qu’à la fin de l’opération pour vérifier par soi-même que les deux résultats sont identiques.

    Comment ça marche : la clé de l’opération est le rapport entre i’ et y tel que
    i' = -(y-((i*(3*i+2)-5)/16)*2^n)/3^(x-1)
    qui est déduit de y = ((i*(3*i+2)-5)/16)*2^n-i'*3^(x-1) @Collag3n
    Les valeurs de y pour tous les x_n_i de DATA sont stockées dans l’onglet XNI_Y. Pour chaque i’ testé on calcule ‘’i’ trouvé’’ (cellule H7] d’après la valeur y associée au x_n_i (cellule H8). Le test est OK quand H7 = H5.

    J’attire l’attention sur le fait est que la matrice [xni,y] de 2*1649 cellules est très nettement inférieure (1.65%) à la matrice [i’,tdv] de 2*100.000 cellules tout en donnant strictement la même réponse à la question : quel est le tdv de ce i’ ?

    Il est certainement possible de faire des variantes de ce solver en prenant par exemple
    z = x/(tdv-(log(3i+1);2)+x) sachant que z < log2/log3 @BERKOUK2.
    On pourrait aussi imaginer un solver qui tire au hasard des x_n_i et donne des [i’, tdv]
    On peut aussi imaginer trouver une relation générale entre x_n_i et y (ce qui éviterait de stocker y)

    Je rapproche ici ce solver (et ses futurs cousins) de l’automate de Collatz de @wilfrid car pour moi il existe des procédés algorithmiques qui peuvent simuler des suites de Collatz. Avec l’automate et ce solver, ça en fait déjà 2.

    Encore un grand merci à @Collag3n et Berkouk que je vois moins sur ce post mais dont j’aimerais évidemment l’avis sur ce solver.102638
  • Bonjour,
    PMF a écrit:
    Je rapproche ici ce solver (et ses futurs cousins) de l’automate de Collatz de @wilfrid car pour moi il existe des procédés algorithmiques qui peuvent simuler des suites de Collatz. Avec l’automate et ce solver, ça en fait déjà 2.

    Ce n'est pas tout à fait exact : l'automate ne se livre à AUCUN calcul, chose que je t'ai amplement expliquée dans le sujet dédié, et du coup il n'a pas besoin d'une base de données.

    Tu devrais utiliser LaTeX pour tes formules, ce qui augmenterait leur lisibilité et éviterait ainsi qu'on les zappe.
Cette discussion a été fermée.