Un modèle pour Syracuse

18911131426

Réponses

  • Dans le cluster 12_25_5_41, il y a 10 chemins de longueur identiques qui mènent tous à 101000 (40) à l'étape 9

    En partant donc de l'étape 42, les chemins vont progressivement prendre un trajet commun (pdf joint). Si on convertit en binaire les étapes paires et impaires de 813 qui est le minorant du cluster et que l'on compare les éléments identiques des autres chemins, on obtient :

    étape : 9 : 10 itérations_______000101000
    étape : 16 : 9 itérations_______000010110
    étape : 24 : 4 itérations_______010010100
    étape : 29 : 3 itérations_______010000010
    étape : 42 : 1 itérations_______100101101

    Les jonctions se font toujours sur les étapes paires (dernier terme binaire= 0)

    Donc sous un aspect combinatoire, un cluster par le regroupement d'entiers ayant le même $i(n), p(n), D(n)$ et se structurant par des chemins partagés. De sorte que le cluster 12_25_5_41 est identifiable à une liste de "jonctions" dont le premier terme indique que tous les membres du cluster ont cette même jonction :

    (40) 000101000 tous identiques à 40
    (22) 000010110 9 chemins communs sur 10
    (148) 010010100 4 chemins communs sur 10
    (130) 010000010 3 chemins communs sur 10
    (813) 100101101 tous différents de 813 au départ

    Il y a gros à parier que chaque cluster possède une liste unique de ce type. Le dernier terme de la liste indique que le minorant a lui seul cette valeur, tandis que le premier terme indique que tous les membres du cluster partage ce terme.

    Médaille Fields en chocolat à celui ou celle qui voit une relation dans ces 5 valeurs binaires
  • Les jonctions se font toujours sur les étapes paires :
    Oui, un nombre impair i ne peut avoir qu'un fils 2*i, alors qu'un nombre pair peut, dans certains cas, avoir 2 fils 2*i et (i-1)/3.

    Donc, soyons plus précis : les jonctions se font toujours sur des nombres égaux à 4 modulo 6 (modulo, congruence ... je ne sais pas si tu connais cette notion)
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • @lourran
    Le modulo n'explique pas la conjecture mais on peut imaginer qu'il y a peut-être une autre forme modulaire qui serait à l'œuvre.
    Il n'y a pas une infinité de cas particuliers dans cette conjecture : les chemins pour revenir à 1 ont bcp de points communs et assez peu de clusters rassemblent tous les entiers...
    Quand on dit revenir à 1, je ne pense pas qu'on utilise la bonne image pour décrire ce qu'il se passe. D'abord parce les entiers reviennent plutôt sur des $D(n)$. Et si on regarde de manière plus générale les entiers arrivent toujours à une jonction quelconque. Dès que cette connexion est faite, c'est l'autoroute vers 1.
    Le système des entiers est donc blindé de jonctions comme on dirait à Marseille. Je me dis que les jonctions à l'intérieur d'un cluster sont sûrement les plus intéressantes à étudier. Parce que les entiers se groupent en clusters et que les retours à 1 reposent uniquement sur les jonctions.
    Un cluster serait donc un hub de jonctions.
  • Tu dis ça pour te convaincre toi-même que les clusters sont utiles. Et encore plus quand tu mets en avant les $D(n)$ D'n) est une étape comme une autre.
    Quand tu disais que 911 était un nombre très particulier parce qu'il captait 42% des entiers si je me souviens bien, tu défendais une thèse très différente. Et j'imagine que tu as dû défendre encore d'autres théories.
    On a un arbre. Chaque nombre de la forme 6k+4 est une jonction,où 2 sous-arbre se rejoignent.

    Parmi ces nombres de la forme 6k+4, on peut faire 3 groupes, ceux qui sont de la forme 18k+4, 18k+10 ou 18k+16 ... Ces 3 groupes de nombres ont des propriétés communes, les arbres partant des nombres 18k+4 ont pas mal de points communs, idem pour les arbres partant des nombres 18k+10, et idem pour les arbres partant des nombres 18k+16.

    Est-ce que tu te souviens de ce message de Nodgim, où il parlait des nombres de la forme 54+7 si je me souviens bien (54, c'est sûr, c'est le reste +7 dont je ne suis pas sûr) ?
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • Je dis toujours que 93% des suites passent par 5 en étape 1 et environ 40% par 911 en étape 12.
    Ce n'est pas une théorie : c'est une observation statistique.
    Des jonctions sont clairement plus populaires que d'autres. Mon modeste travail consiste à simplement le montrer.
    S'il y a des différences entre des chemins très rares et des chemins ultra empruntés on a le droit de le dire. Le défaut des arbres est de ne pas indiquer le taux de frequentation : cela donne l'impression que c'est très uniforme. Et c'est faux. Sur une carte on voit des centaines de routes mais deux ou trois vont concentrer tout le trafic.
    Si on suppose qu'il y a une cause à un effet, certains chemins sont plus empruntés parce que clairement leur probabilité est plus forte que celle des autres chemins.
    Alors pourquoi le 5, pourquoi le 911 ? La vérité est que les maths n'en savent rien. Il y a un mécanisme combinatoire chez les entiers qui génère des chemins bien particuliers que l'algorithme trouve. C'est une sorte de coup de pot d'avoir cet algorithme parce qu'on aurait jamais vu cette structure sans lui. Une structure qui se moque ouvertement de la totalité des connaissances arithmétiques... c'est ça qui fait le sel de cette conjecture pour les amateurs.
    Et ce qui justifie l'observation du comportement des suites. Je ne suis pas ébloui par le travail qui a été fait sur le plan observationnel à ce jour. Calculer comme des bourrins jusqu'à des valeurs pas possibles est débile. Personne n'a fait un travail statistique un peu sérieux parce que tout le monde veut trouver une solution mathématique. Sauf que les entiers savent faire des choses que les maths ignorent ! Donc les observer faire est important.
    Des réseaux d'ordinateurs pourraient faire de la big data sur ces suites et des IA pourraient analyser les structures de ces données. Rien ne dit que la résolution de cette conjecture sera le fait d'un mathématicien.
  • @PMF j'ai l'impression que ta définition de "résolution de cette conjecture" n'est pas la même que celle des mathématiciens...
  • Pourquoi 911 capte plus d'entiers que les autres impairs de 12è génération, ça s'explique assez bien. Relis les messages où on en parlait. Idem pour le 5.

    Tu peux critiquer le travail des mathématiciens, la parole est libre. Mais soyons réaliste. On doit en être à 1000 messages à peu près, et si on compare l'ensemble des acquis au bout des ces 1000 messages, et ce qui est sur le site de Eric Rosendaal dont on a déjà parlé, on a pour l'instant moins de résultat dans toute cette discussion de 1000 messages que dans son site. Lequel site n'est pourtant qu'un site de vulgarisation, et qui existe depuis une dizaine d'années. A l'inverse, il y a des notions qui sont dans son site, et qui ne figurent pas ici.

    Tu as inventé des noms, tu as défini des tas de mots (latitude, longitude, jonction, analyse généalogique versus générationnelle ... et j'en oublie), mais les concepts qui sont derrière sont à peu près vides. Un lycéen de très bon niveau va trouver tout ça en 1 ou 2 semaine. Il va peut-être choisir un vocabulaire différent, mais il n'y a rien dans nos 1000 messages qui n'aurait pas déjà été griffonné par un lycéen dans la marge d'un cahier.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • Allez, je rajoute une couche.
    PMF a écrit:
    certains chemins sont plus empruntés parce que clairement leur probabilité est plus forte que celle des autres chemins.

    C'est le truc le plus absurde qui ait jamais été proféré à propos des suites de Collatz. L'algorithme de Collatz est déterministe, ce qui veut dire qu'à chaque étape il y a un nombre en entrée et un seul et unique nombre en sortie, auquel n'est attachée aucune probabilité de sortir sinon 1. On parlerait de probabilités si à partir du premier terme d'une suite existait plusieurs chemins pouvant chacun aboutir à une valeur terminale différente, certains ayant une plus forte probabilité que d'autres d'être empruntés pour x ou y raison. Or, une suite de Collatz est un chemin unique.
    Le défaut des arbres est de ne pas indiquer le taux de fréquentation

    Le concept de taux de fréquentation est lié à une vision particulière des suites (probablement issue de la fréquentation trop assidue d'une base de données). Tu peux décider que 13, 40, 20, 10, 5 est un chemin fréquenté parce que 17 l'emprunte, et encore plus fréquenté parce que 45 et 181 l'empruntent également, sans parler de 4056356181, 16225424725 et 64901698901, qui boostent sa fréquentation. Comment associes-tu le nombre de termes qui empruntent un chemin donné au taux de fréquentation de celui-ci, sachant qu'ils sont une infinité à l'emprunter ?

    Ta base de données te procure des suites de Collatz la même vision que celle que tu aurais du monde si tu l'observais à travers le trou d'une serrure. Tu n'as aucune idée de l'incroyable complexité de l'arbre des suites, ce qui t'amène à le considérer comme une misérable petite chose en comparaison de ta base de données, seule à même de révéler la glorieuse structure des suites.

    Il est temps que tu te réveilles.
  • Mouaaaahhh
    On appuie sur le bouton rouge et tout le monde est sur le pont.

    Ce fil repose pourtant sur une idée simple. En faisant une petite base de données on est sûr d'avoir déjà toutes les jonctions pour une infinité d'entiers. En faisant une petite base de données et avec un peu d'imagination et de sens de l'observation toute la structure se dessine et on voit des tas de choses.

    Le point important c'est le rapport entre ce que l'on voit (la structure est visible) et ce que les maths racontent. A ce petit jeu les maths ont perdu. Les entiers sont plus malins que les maths.

    Quelques faits:
    Tous les $D(n)$ possibles sont connus par la fonction $\frac{2^{m}-1}{3}$
    Ça c'est le premier cercle. Il n'existe pas un entier qui arrivera à 1 sans entrer par un point de ce cercle. Plus ce $D(n)$ est petit plus il est passant ou emprunté. Sauf ceux qui sont stériles parce que multiples de 3 of course.

    Dès qu'il y a un $D(n)$ il y a une famille de clusters qui lui est liée. Elle commence par la plus petite paire $i(n),p(n)$ et elle va continuer à grandir. On peut prédire au moins un membre d'un cluster depuis le cluster souche jusqu'à la saint glinglin. Tous les entiers possibles appartiennent à un cluster donné. Et tous les clusters dépendent d'un cluster souche.

    Les clusters contiennent toutes les jonctions possibles. Les clusters sont donc eux-mêmes des boîtes de jonctions (hub). Le monde des entiers contient une carte des jonctions que l'on peut appeler un arbre si on veut. Mais une carte c'est plus parlant parce que ça renvoie à des routes et les routes renvoient à une circulation.

    Alors oui le système est dynamique parce que le trafic est tout sauf uniforme : si on faisait de la Big Data avec ces données on pourrait voir que les disparités de circulation sont énormes. Et quelle que soit la taille des données observées. Elles sont où les maths qui parlent de cette circulation et de sa disparité ????

    Très étrange dans un monde où le Big Data est omniprésent que personne ne passe les données de cette conjecture par ces moyens d'analyse. Il y a personne dans une fac ou un centre de recherche qui a eu cette idée ?109820
  • wilfrid a écrit:
    une suite de Collatz est un chemin unique.

    sauf que la dite suite est composé de tronçons communs à plein d'autres : 1000 banlieusards partent d'une rue différente mais se retrouvent tous quelques minutes plus tard dans le même embouteillage.
    Donc je te renvoie à la relecture des 1000 messages de ce fil.
  • Dire qu'une suite de Collatz est un chemin unique dans l'arbre signifie qu'il n'existe aucun chemin identique. Prenons la suite de 23 :

    23, 70, 35, 106, 53, 160, 80, 40, 20, 10, 5, 16, 8, 4, 2, 1

    puis celle de 70 :

    70, 35, 106, 53, 160, 80, 40, 20, 10, 5, 16, 8, 4, 2, 1

    Ces deux chemins sont-ils identiques ? Non, parce que 23 n'appartient pas au chemin de 70. Par contre, le chemin de 70 appartient à celui de 23, mais le simple fait de le dire indique qu'on parle de deux suites différentes, celle de 23 et celle de 70. Même si on avait du temps à perdre et qu'on disait que la suite de 35 appartient à celle de 23, que celle de 53 appartient à celle de 35, etc., on parlerait toujours de suites qui diffèrent entre elles d'un ou plusieurs termes, et qui donc ne sont pas identiques. Dans ce sens, chaque suite est le "tronçon commun" à une infinité d'autres suites, parce que tu pourrais prendre le prédécesseur de 23 pour créer une autre suite, puis le prédécesseur de celui-ci, et continuer comme ça jusqu'à l'infini en créant à chaque fois un tronçon commun à toutes les suites que tu construiras ensuite.

    La notion de tronçon commun serait acceptable s'il en existait ne serait-ce qu'un qui soit identifiable en tant que tel. Or, comme je viens de le dire, chaque suite pouvant être qualifiée de tronçon commun il n'en existe aucun. Ce n'est qu'une vue de l'esprit.

    Pour en revenir au graphe sur fond noir que tu as posté, celui qui ressemble à un balai à franges avachi sur le sol, tu as omis (volontairement ou non, je ne sais pas) de citer ce qu'écrit son auteur dans le paragraphe "A word on technology" : "Pour être franc, je ne suis pas tout à fait sûr du fonctionnement des graphes que j'ai produits. Pour obtenir cet effet de torsion j'ai dû modifier certaines valeurs de mon fichier d3.v3.js.". Tout le monde le sait depuis plusieurs années : on peut faire dire ce qu'on veut aux images, surtout celles qu'on a soi-même fabriquées. Comme le disait Winston Churchill, "les seuls sondages en lesquels je crois sont ceux que j'ai manipulés moi-même".
  • Voici une façon d'utiliser les clusters comme "hub" de jonctions

    Très simplement, je remplace l'entier trouvé en étape impaire 12 par le cluster auquel il appartient :
    si par exemple c'est 911 on met à la place 12_25_5_41
    pour 6731585, on met 12_38_5_54
    Evidemment tous les clusters commencent par 12 qui est le $i(n)$ commun. Ce qui change est leur $D(n)$ et $p(n)$

    Pour une bdd de 3 à 120.001, on trouve 56857 chemins passant par l'étape impaire 12. Les autres chemins (3143) ont moins de 12 étapes.
    On a donc presque toute la bdd qui passe par cette étape (95%)

    Il n'y a que 38 clusters uniques :
    Cluster12_________count
    12_25_5_41_______25376
    12_24_5_40_______7347
    12_23_5_39_______4789
    12_29_5_45_______3439
    12_27_5_43_______3335
    12_28_5_44_______2599
    12_30_5_46_______2283
    12_26_5_42_______1829
    12_31_5_47_______1517
    12_32_5_48_______915
    12_20_341_42_____378
    12_33_5_49_______313
    12_19_341_41_____306
    12_23_85_43______281
    12_21_341_43_____277
    12_24_341_46_____252
    12_24_85_44______250
    12_22_341_44_____239
    12_27_85_47______141
    12_23_341_45_____122
    12_25_341_47_____117
    12_26_341_48_____116
    12_28_85_48______112
    12_26_85_46______110
    12_25_85_45______96
    12_35_5_51_______89
    12_34_5_50_______73
    12_29_85_49______58
    12_28_341_50_____39
    12_27_341_49_____35
    12_36_5_52_______12
    12_29_341_51_____3
    12_30_85_50______3
    12_38_5_54_______2
    12_19_21845_47___1
    12_20_21845_48___1
    12_22_5_38_______1
    12_37_5_53_______1

    Les clusters ayant $D(n)=5$ représente 95% des cas.

    Imaginons que nous sommes les douaniers au poste frontière "12" et que nous contrôlons les clusters des entiers qui "passent".
    Un entier sur 2 entre dans le hub 12_25_5_41 qui contient 813, 817, 819, 827, 837, 841, 843, 845, 863, 911 : pas de souci pour savoir où il arrivera 12 étapes plus loin ; la seule nuance est qu'il y aura 10 chemins possibles pour arriver à 5 avec une grosse préférence (92%) pour
    5, 53, 35, 23, 61, 325, 433, 577, 3077, 2051, 1367, 911

    Si on faisait cette opération pour toutes les valeurs de toutes les étapes impaires, on simplifierait bcp la représentation de l'arbre (ou carte). Ces hubs fonctionnent exactement comme les aéroports hubs : on y arrive de plein de destinations et on en part vers plein d'autres. Sauf que pour les clusters "hub" on repart toujours vers 1.

    Donc la navigation sur la planète Syracuse est d'aller d'un hub à l'autre. Chaque hub garantit qu'il y a à la prochaine étape un autre hub qui rapproche de 1. Voici le trajet "hub to hub" le plus populaire de Syracuse :
    1_0_5_5<<<<<<2_5_5_11<<<<<<3_6_5_13<<<<<<4_7_5_15<<<<<<5_10_5_19<<<<<<6_14_5_24<<<<<<7_16_5_27<<<<<<
    <<<<<<8_18_5_30<<<<<<9_22_5_35<<<<<<10_23_5_37<<<<<<11_24_5_39<<<<<<12_25_5_41
  • @wilfrid

    juste pour mon information : connais-tu le sens du mot "argutie" ?
  • Pour avancer un peu avec les clusters "hub" j'ai cette fois fait la jonction entre l'étape 11 et l'étape 12.

    Donc simplement toutes les valeurs trouvées dans les étapes 11 et 12 sont remplacées par leurs clusters respectifs.

    On trouve 38 clusters que ce soit pour l'étape 11 ou la 12. Le plus important est évidemment leur liaison et combien on en trouve
    La réponse est 160 pour assurer 56857 jonctions. C'est bien plus petit que 38*38 associations théoriquement envisageables.

    Si on prend les jonctions à partir de 12_25_5_41 :

    11_21_5_36<<<<<<<<12_25_5_41 : 1 jonction
    11_22_5_37<<<<<<<<12_25_5_41 : 300 jonctions
    11_23_5_38<<<<<<<<12_25_5_41 : 615 jonctions
    11_24_5_39<<<<<<<<12_25_5_41 : 24460 jonctions

    Donc comme toujours il y a un tronçon qui concentre l'essentiel de la "circulation"
    Pour info le fameux 27 passe par 11_24_5_39<<<<<<<<12_25_5_41
  • Définition d'un cluster comme "hub" de jonctions"

    Définir un cluster comme un "hub" de jonctions c'est simplement grouper tous les membres d'un même cluster en une seule jonction.

    Les chemins de Syracuse passent par les étapes impaires que l'on numérote à partir du $D(n)$ considéré comme étape 1.

    Dans l'étape 12 par exemple, on trouve tous les entiers ayant un $i(n)=12$ quelque soit leur $p(n)$ ou $D(n)$. Le propre d'un cluster étant de grouper les entiers s'ils ont les mêmes $(i(n),p(n),D(n)$ l'ensemble des entiers de l'étape 12 est donc aussi l'ensemble des clusters commençant par 12 (ou ayant un $i(n)=12$). Pour 56857 passages par l'étape 12 (bdd <=120.001) il n'y a que 38 clusters pour grouper les 1128 valeurs uniques trouvées en étape 12.

    Le transport aérien utilise les hubs pour optimiser le nombre de vols nécessaires pour assurer le maximum de liaisons. Le vol direct Paris Los Angeles sera bien plus cher que le vol Paris-Chicago-Los Angeles tout simplement parce que la deuxième solution est bien plus rentable pour les compagnies aériennes.

    Rasoir d'Occam ou chemin le plus court (ou le plus simple), on peut imaginer que l'organisation des chemins vers 1 tende vers un modèle optimisé plutôt qu'un fatras de solutions individuelles. La compagnie aérienne syracusienne garantit en quelque sorte que chaque entier aille vers 1 parce que le réseau de connections (hubs) est parfaitement organisé, et donc qu'il n'est pas trop compliqué.

    On va donc vers 1 en allant de cluster-hub en cluster-hub, c'est-à-dire en passant d'un cluster $i(n)$ au suivant $i(n-1)$. Dans ma bdd par exemple le passage des étapes 13 à 11 le plus populaire est : 11_24_5_39_______12_25_5_41______13_28_5_45 (21764 passages).
    Mais on peut trouver un passage vers 11_24_5_39 qui aura pris qu'un seul "passager" : 11_24_5_39______12_25_5_41_______13_34_5_51

    Dans le pdf joint, il y a la liste des jonctions pour les étapes 13 à 11. Les exemples cités ci-dessus sont en page 3.

    Si je pouvais utiliser un logiciel comme PLOTLY (typique du Big Data) il serait surement possible de faire une représentation telle que celle-ci
    https://dash-gallery.plotly.host/dash-cytoscape-lda/
    On verrait toutes les connections hub à hub et les plus fréquentées seraient visuellement les plus grosses. Les couleurs seraient utilisées pour les familles de $D(n)$.
    Reste qu'il faut "un certain temps" pour apprivoiser cet outil...
  • Bonjour,

    > Définition d'un cluster comme "hub" de jonctions"

    Ce forum est francophone.

    Cordialement,

    Rescassol
  • PMF a écrit:
    La compagnie aérienne syracusienne garantit en quelque sorte que chaque entier aille vers 1 parce que le réseau de connections (hubs) est parfaitement organisé

    Eh ben voilà, tu as démontré la conjecture ! Félicitations !

    Il y a quand même un léger problème : imaginons qu'il n'existe qu'une seule suite, comment est-il possible qu'elle aille vers 1 sans l'assistance du réseau de la compagnie syracusienne ?
  • PMF,
    Ton dernier PDF, peux-tu le refaire :
    Version 1 : en affichant uniquement les colonnes cluster11 / cluster12 et comptage associé. (donc les colonnes 1, 2 et 4 de ton PDF actuel)
    Version 2 : en affichant uniquement les colonnes cluster 12 / Cluster13 et comptage associé (donc les colonnes 2,3 et 4 de ton PDF actuel.

    Si je ne m'abuse, la version 1 aura très peu de lignes, et la version 2 aura autant de lignes que ton PDF actuel.
    Et ça, ça m'interpelle.
    Attention, ne sur-interprétons pas cette question. La question sous-jacente est juste une question de combinatoire, et pas un début de recherche sur la conjecture de Syracuse.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • @lourran
    voici les versions des jonctions des clusters 11_12 et 12_13

    pour faciliter la lecture les deux fichiers ont été classés selon l'ordre du cluster 12

    Le nombre de jonctions est quasi identique : 160 vs 161 pour respectivement 56857 et 55924 passages par ces jonctions
  • Cher Rescassol

    HUB est tout de même un peu plus parlant que "plate-forme de correspondance aéroportuaire".
    Le terme est accepté par le Larousse : https://www.larousse.fr/dictionnaires/francais/hub/10909970
  • Cher Wilfrid

    Selon le principe des chemins vers 1 passant d'un cluster-hub à un autre, n'importe quelle suite va d'un hub à l'autre : c'est une simple permutation de l'ensemble des entiers impairs à l'ensemble des clusters. Tout impair appartenant à un cluster, ça marche tout le temps.

    Normalement on trouve des clusters de plus en plus grands ou fur et à mesure que $i(n)$ grandit. Mais il existe aussi des clusters avec un seul entier. Le but du jeu est que tout de même l'ensemble des clusters est bien plus petit que l'ensemble des impairs.
  • Bon, j'avais mal vu.
    Il y a quand même un truc que j'avais déjà soupçonné il y a un certain temps, et qu'on retrouve ici. On le voyait en fait dans le fichier initial, ça ne se voit plus dans les 2 fichiers que je t'ai demandés.

    Si on prend le cluster 12_25_5_41 :
    Au niveau 11, il va vers 11_22_5_37, 11_23_5_38 ou 11_24_5_39.
    Et au niveau 13, les éléments viennent de 13_26_5_43 ou ... ou ... 13_34_5_51
    Donc TDV = 37 38 ou 39 au niveau 11,
    Et TDV entre 43 et 51 au niveau 13.
    Ok, jusque là, rien d'extraordinaire.
    Le truc qui me surprend, c'est que si TDV = 37 ou 39 au niveau 11, alors TDV est impair au niveau 13. Et si TDV= 38 au niveau 11, alors TDV est pair au niveau 11.

    Aucune exception, merveilleux. Mais regardons un autre cluster pour voir ... et patatras.

    On va voir plus loin , le cluster 12_27_5_43 par exemple, alors c'est presque l'inverse.
    Dans ce cluster 12_27_5_43, pour beaucoup de lignes, quand TDV est impair au niveau 11, il est pair au niveau 13, et quand TDV est pair au niveau 11, il est impair au niveau 13.
    Dans le cluster 12_25_5_41, la coïncidence était parfaite, aucune exception.
    Dans le cluster 12_27_5_43, la règle est plutôt inversée, mais on a quelques exceptions.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • PMF a écrit:
    Selon le principe des chemins vers 1 passant d'un cluster-hub à un autre, n'importe quelle suite va d'un hub à l'autre

    Tu ne réponds pas à mon interrogation. Laisse tomber les hubs un instant et poses-toi la question de savoir pourquoi une suite quelconque, isolée de tout autre contexte, aboutit à 1.

    Je comprendrai que tu ne puisses fournir aucune réponse.
  • @lourran
    tant qu'à faire on peut aussi caractériser les 3 tdv des clusters 11, 12, 13

    ça donne ça :
    TDV____________PAR TYPE________PAR ELTS
    IIP______________56______________3197
    PPI_____________45______________3257
    III______________75______________27960
    PPP____________63______________8771
    PIP_____________36______________3213
    PII______________51______________5522
    IPI______________37______________2000
    IPP_____________51______________2004

    Le triple tdv impair III est le plus important par type et par élément (ou nombre de passage par cette jonction)

    mais c'est bcp dû au passage par 12_25_5_41 en étape 12
    11_22_5_37______________12_25_5_41______________13_26_5_43______________216_____________III
    11_22_5_37______________12_25_5_41______________13_28_5_45______________1_______________III
    11_22_5_37______________12_25_5_41______________13_30_5_47______________69______________III
    11_22_5_37______________12_25_5_41______________13_32_5_49______________12______________III
    11_23_5_38______________12_25_5_41______________13_27_5_44______________63______________PIP
    11_23_5_38______________12_25_5_41______________13_29_5_46______________216_____________PIP
    11_23_5_38______________12_25_5_41______________13_31_5_48______________318_____________PIP
    11_23_5_38______________12_25_5_41______________13_33_5_50______________16______________PIP
    11_24_5_39______________12_25_5_41______________13_28_5_45______________21764___________III
    11_24_5_39______________12_25_5_41______________13_26_5_43______________2629____________III
    11_24_5_39______________12_25_5_41______________13_30_5_47______________18______________III
    11_24_5_39______________12_25_5_41______________13_32_5_49______________43______________III
    11_24_5_39______________12_25_5_41______________13_34_5_51______________1_______________III

    le détail dans le pdf
  • @wilfrid
    le but de ce fil est une observation du comportement des suites de Collatz sous l'angle des clusters
    rien n'interdit de le faire...
  • Bonjour,

    > HUB est tout de même un peu plus parlant que "plate-forme de correspondance aéroportuaire".

    Il existe "moyeu'.
    D'autre part, "cluster" n'est pas plus français, il y a "foyer".

    Cordialement,

    Rescassol
  • @PMF,

    Explique-moi quelle différence il y a entre dire : "tout nombre auquel on applique l'algorithme de Collatz aboutit à 1", et dire : "tout nombre figurant dans la base des données issues de l'algorithme de Collatz est guidé vers 1 par les hubs".

    C'est comme si quelqu'un disait que lorsque la moitié droite de la Lune est éclairée, c'est le premier quartier, et qu'un petit génie débarquait en expliquant qu'en réalité c'est lorsque la moitié gauche est dans l'ombre.
  • @wilfrid
    ton histoire de lune n'est pas super éclairante... ça tombe pourtant sous le sens que grouper les jonctions par cluster-hub donne une structure (ou un réseau) plus simple à observer

    Cela s'argumente ainsi :
    1) les entiers qui sont dans un même cluster ne le sont pas par hasard. Ils partagent des propriétés communes $i(n),p(n),D(n)$ et sont proches en valeur.
    2) De ce fait aller d'un hub à un autre c'est aller d'un groupe de propriétés communes à un autre. Pas forcément par hasard non plus.

    Souci : pas d'outil pour visualiser ça pour le moment. Tu pourrais aider avec Mathématica ?
  • PMF a écrit:
    Tu pourrais aider avec Mathematica ?

    J'avais cru comprendre que tu te l'étais procuré, mais je dois confondre avec quelqu'un d'autre.

    Quelles données Mathematica serait-il censé afficher ? Dans quel Pdf se trouvent-elles ?
  • @wilfrid

    dans le pdf joint, j'aimerais voir le réseau des p(n) des 4 dernières colonnes (exemple façon "igraph" joint)

    possible ?109918
  • Tu ne peux pas afficher des données qui ne sont pas liées d'une manière ou d'une autre ! Quel rapport y a-t-il entre elles ?
  • @ wilfrid

    p(n)11___________p(n)12___________p(n)13__________p(n)14
    20______________24______________28______________30
    20______________24______________28______________32
    20______________24______________28______________34
    20______________24______________28______________36
    20______________24______________30______________31
    20______________24______________30______________33
    20______________24______________30______________35
    20______________26______________27______________29
    20______________26______________27______________31
    20______________26______________27______________33
    20______________26______________27______________35
    20______________26______________29______________30
    20______________26______________29______________32
    20______________26______________29______________34
    20______________26______________33______________35
    20______________30______________32______________34
    20______________30______________34______________35

    Le but du graph en réseau serait de montrer les liaisons ligne par ligne.
    1ère ligne 30 va à 28 puis 24 puis 20
    2ème ligne 32 va à 28 puis 24 puis 20
    ect...

    le pdf joint est plus simple et réduit au D(n) = 5
  • [suite]

    Ce que je vois est qu'on retrouve les mêmes clusters disséminés un peu partout, comme par exemple 13_29_5_46. J'en déduis qu'il s'agit d'une arborescence (un arbre sous forme de tableau il n'y a rien de plus obscur). Ce qu'il manque dans ton Pdf c'est la colonne des nœuds, ou termes impairs, ils permettraient au moins d'y comprendre quelque chose.
  • Nos posts se sont télescopés.

    J'espère que tu as des économies, parce que vu le boulot ma facture va être salée !
  • normalement cela se fait avec R igraph ce genre de graphique
    mais je n'ai pas fait de R depuis 10 ans
  • Le Pdf fait 13 pages. Après avoir saisi les données des deux premières pages je me suis dit que j'allais voir ce que ça donnait avant de continuer. J'ai bien fait parce que c'est déjà le foutoir total. Je pense qu'ajouter ne serait-ce qu'une page supplémentaire n'apporterait rien.

    EDIT : nouveau graphe après suppression des données en double. Il est beaucoup plus lisible, mais c'est toujours le foutoir.109948
  • Je joins également les données pour le cas où tu voudrais vérifier.

    EDIT : nouvelle liste après suppression des doublons.109944
  • Merci Wilfrid
    Je vois que tu as fais des "edges" pour chaque jonction. C'est effectivement ce que fait aussi igraph avec R mais je n'ai pas réussi à sortir un graph de réseau non plus. En tout cas merci de tes efforts.

    En toute théorie le réseau devrait être plus lisible. Il devrait être concentrique à mon avis avec un cercle par étape impaire où toutes les valeurs de p(n) prendraient place. Je vais tenter de faire un schéma à la mano.
  • Bonjour,

    "edges" ?

    Cordialement,

    Rescassol
  • Je crois que tu refuses de voir la réalité, qui est qu'aucune structure ne se dégage de ces données. Et d'ailleurs ça ne m'étonne pas.

    Mathematica est suffisamment "intelligent" pour sélectionner lui-même le modèle de graphe à appliquer après analyse des données. Si celles-ci constituent une arborescence, c'est ce qu'il va tracer. Mais si elles sont incohérentes il va les afficher dans leur état brut, comme ci-dessus. Tu n'en tireras rien de plus parce qu'il n'y a rien à en tirer.
  • Ce que dis PMF, c'est que tu as supprimé une des informations.
    On ne devrait pas visualiser des nombres , mais des couples. La première flêche ne va pas de 20 vers 24, mais de (20,11) vers (24,12)

    Toute flêche va donc d'un élément (a,b) vers un élément (a', b+1) , avec a'>a.

    Et c'est pour cette raison qu'il parle de cercles concentriques.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • J'ai suivi les indications de PMF dans ce message : http://www.les-mathematiques.net/phorum/read.php?43,2058452,2099006#msg-2099006

    Je ne savais pas qu'elles avaient un sens caché, et je ne vois pas dans le dernier Pdf qu'il a posté où sont les couples tels que "(20,11) vers (24,12)".
  • Le groupement des entiers en clusters est le plus naturel à concevoir parce qu'ils partagent des propriétés communes $i(n),p(n),D(n)$ et sont proches en valeur.

    Il y a aussi évidence à mettre en valeur les étapes impaires. La raison en est simple : les clusters sont construits en fonction du $D(n)$ ce qui revient à dire que l'on considère la dernière étape impaire avant 1 comme destination finale (évidemment dès qu'un $D(n)$ est atteint, cela équivaut à arriver à 1). A partir de là, chaque étape impaire est une extension par filiation de l'étape 1 qui est celle des $D(n)$. Donc dans cette logique, la structure des suites via les clusters repose sur les impairs.

    Les pairs ne sont pas oubliés pour autant : ils sont représentés par le $p(n)$ et nous allons voir plus loin que cette valeur à une grande importance.

    Que ces clusters soient vus comme des hubs de jonction tombe moins sous le sens que le groupement des entiers en clusters, mais c'est aussi assez naturel. Si on substitue dans chaque étape impaire chaque valeur impaire par son cluster, on va avoir un nouvel arbre plus simple qui aura tendance à grouper les chemins. Et cet arbre peut être plus parlant pour la compréhension de l'organisation des chemins.

    Un cluster va donc être à la fois un groupe d'entiers de mêmes propriétés mais aussi une boite de jonction ou un hub. On y rentre avec certaines propriétés et on en sort avec d'autres. Et là, il va y avoir une homogénéisation des chemins remarquable. Regardons par exemple le chemin du 27 : il monte et il descend en permanence, passant dans les étapes 14 à 11 par 1619, 2429, 911, et 1367. Mais si on regarde les clusters respectifs de ces entiers, l'ordre est retrouvé : 11_24_5_39<<_____<<12_25_5_41<<_____<<13_28_5_45<<_____<<14_29_5_47
    car si on regarde les $p(n)$ de chaque cluster on a en allant vers 1 : 29>>>28>>>25>>>24.

    On a donc une nouvelle propriété : un chemin via les clusters-hubs est toujours un chemin de $p(n)$ décroissant. Il peut être décroissant de 1 ou plus mais il n'est jamais ni égal ni supérieur. Pour une décroissance de 1 pour chaque $i(n)$, donc à chaque passage d'une étape impaire à l'autre en allant vers le $D(n)$, on décroit aussi le $p(n)$ d'au moins 1. (voir note de fin)

    Donc les chemins sont des solutions pour toujours descendre la somme $i(n)+p(n)$ à chaque étape impaire et les tdv diminueront donc d'au moins 2 d'une étape à l'autre. Ce qu'il faut déduire de cela, c'est que les clusters font le job. L'ensemble des entiers impairs d'une étape impaire donnée n'est pas cohérent en tant que tel, mais les clusters que l'on peut attribuer à cette étape le sont ! Ils sont pour tous les clusters de l'étape précédente, la solution pour avoir un $p(n)$ plus petit avec le bon $D(n)$.

    On arrive donc à une nouvelle définition d'un chemin dans les suites de Syracuse. Quelque soit la valeur de $n$ à une étape impaire donnée, quelle soit plus grande ou plus petite que la valeur impaire de l'étape précédente, le cluster correspondant à cette valeur a pour propriété d'avoir un $p(n)$ plus petit d'au moins 1 que le précédent. Et donc évidemment à la fin du processus, on arrive à un $i(n)=1$ et un $p(n)=0$ ce qui est la marque d'un $D(n)$ :
    n__________t(n)_________i(n)________p(n)
    5__________5__________1__________0
    21_________7__________1__________0
    85_________9__________1__________0
    341________11_________1__________0
    1365_______13_________1__________0
    5461_______15_________1__________0
    21845______17_________1__________0
    87381______19_________1__________0

    Note : la vérification intégrale de la bdd pour montrer la décroissance systématique des $p(n)$ est en cours mais les coups de sonde aléatoires le montrent déjà clairement. Image jointe pour le 27.109950
  • @rescassol
    désolé mais "edge" est le terme employé par Rstudio.
  • @wilfrid
    Implicitement chaque ligne du pdf fourni est un ensemble de liaisons par paire qui se lit de droite à gauche :
    D(n)________p(n)11_______p(n)12______p(n)13_______p(n)14
    5__________20__________24__________28__________30
    se lit ainsi :
    Pour une ligne de D(n) = 5,
    en partant du p(n)14 je relie :
    30>28
    puis 28>24
    puis 24>20
    et je dessine cette arborescence.
  • merci lourran !

    j'ai essayé de pousser le raisonnement ici : http://www.les-mathematiques.net/phorum/read.php?43,2058452,2099232#msg-2099232
  • Donc si je comprends bien, faire comme mon fichier de données posté ci-dessus le montre : 30 > 28, 28 > 24 puis 24 > 20, est entièrement différent de, je cite :

    en partant du p(n)14 je relie :
    30>28
    puis 28>24
    puis 24>20

    J'avoue avoir beaucoup de mal à comprendre la subtilité.
  • Voici la vérification de la décroissance des $p(n)$ pour les étapes 14 à 11
    Cela correspond au passage de 55047 entiers sur 60000 dans cette bdd, cad tous les entiers ayant au moins 14 étapes impaires.
  • non tu as bien fait les liaisons mais on pourrait avoir un arbre plutôt comme celui qui est joint
    à la "mano" je n'ai fait que les liaisons vers 20 en étape 11109956
Connectez-vous ou Inscrivez-vous pour répondre.