Évolution de 2 variables en fonction du temps

Bonjour à tous
Actuellement en stage je cherche à savoir s'il y a une relation entre le cumul de pluviométrie mensuel et le nombre de jours de pluie dans le mois en fonction du temps.

Grâce au logiciel R j'ai pu faire des graphique (ggplot) me permettant de placer les années (points sur le graph) selon le cumul de pluie (ordonnée) et le nombre de jours de pluie (abscisse). Ainsi toutes les années sont placées. J'aimerais testé cette relation : est-ce qu'au fil du temps il pleut plus et pendant plus de jour ? Ou moins mais plus de jours ? Ou plus mais moins de jours ? etc. En bref, le temps a-t-il un effet sur ces 2 variables.

Toutefois je ne sais pas vraiment comment faire, quel test utilisé. J'ai pensé faire une régression linéaire multiple mais ayant 2 variables dépendantes et 1 indépendante (si je ne me trompe pas) je ne sais pas comment m'y prendre.

Quelqu'un aurait-il des pistes pour m'aider ? N'hésitez pas à me questionner si vous avez besoin de plus d'information.
Merci pour votre attention, à bientôt !

Réponses

  • Bonjour.

    Dans un premier temps, a variable année n'est pas très pertinente, c'est plutôt un individu, pour ce que tu veux faire. Donc tu devrais avoir une série doubles nombre de jours/cumul de pluie, qui t'a permis de faire un nuage de points. Ce nuage, avec une régression linéaire, te permet de savoir si tes deux variables sont liées.
    Si elles ne sont pas vraiment liées (nuage en patate), tu pourras regarder, avec un deuxième nuage de points (année/nb de jours) si le nombre de jour de pluie a une tendance (augmentation globale; ou diminution globale); et avec un troisième (année/cumul) si le cumul de pluie a une tendance (augmentation globale; ou diminution globale). Mais tes questions (est-ce qu'au fil du temps il pleut plus et pendant plus de jour ? Ou moins mais plus de jours ? Ou plus mais moins de jours ? ) n'auront plus vraiment de sens.
    Par contre, si les deux variables sont liées (nuage allongé en biais, coefficient de corrélation élevé), tes questions prennent un sens, et il suffit de regarder un seul des deux autres nuages (année/nb de jours par exemple) pour avoir des réponses; que tu peux compléter avec l'autre nuage.

    Il existe aussi des modèles globaux, mais plus difficiles à traiter et surtout à interpréter.

    Cordialement.

    PS : Représenter les nuages permet de savoir quel modèle de régression utiliser. La régression linéaire n'est pas toujours la meilleure idée.
  • Bonjour gerard0,

    Merci pour ta réponse rapide et efficace !

    Dans l'attente de trouver une solution, j'ai déjà étudié la variation de chaque variable en fonction de l'année avec une régression linéaire. J'observe des évolutions significatives : certes peu car le modèle n'est pas le plus adapté mais il est imposé par la méthode. Mais cela permet de répondre à d'autres questions (augmentation ou diminution au cours du temps).

    Donc si j'ai bien compris : la variable année est assimilée a un individus et : la formule ci-dessous me suffirait pour savoir si elles sont liées.
    lm(CumulPluie~NombreJourPluie)

    J'étais trop orienté avec l'année en tant que variable mais en effet la considérer comme étant un individu est beaucoup plus logique et m'aide à éclaircir ma réflexion !

    En ce qui concerne les autres modèles de régression je ne les maîtrise pas du tout, pour ne pas dire que je ne les connais.

    Merci beaucoup, bonne journée
  • Bonjour,

    Je reviens vous car depuis hier j'ai quasiment fini mes tests statistiques.

    Je fais donc le modèle suivant : lm(cumul_pluie~NombreJoursPluie) et tous les tests ressortent très hautement significatif avec des p-value E-16 et un R² élevé >0,50 (souvent aux alentours de 0,70). En soit ça peut sembler logique : plus il pleut, plus il y a de jours dans le mois où il pleut.

    Mais lorsque je regarde mes nuages de points Cumul~Année et Nombre de jours~Année, comme me l'a conseillé gerard0, l'interprétation devient plus compliquée surtout quand les 2 variables sont stables dans le temps.

    Est-ce que cela vient du fait, comme le disait gerard0, que la régression linéaire n'est pas le modèle le plus adapté ?
    Si je reviens à ce qu'il disait : devrais-je seulement me contenter de regarder les graphiques pour interpréter cela ?

    Bonne journée
  • Si sur ton nuage tu ne vois pas d'évolution temporelle ("surtout quand les 2 variables sont stables dans le temps"), il n'y a aucune raison de vouloir faire des analyses qui ne diront rien !
    Ce n'est même pas une question de modèle de régression.

    Cordialement.
  • Merci pour ce recadrement.
    Les résultats ne sont pas évidents à interpréter du fait de la grande variabilité des résultats au fil du temps.
    Il faut que j'intègre cette notion de variabilité dans mon analyse.

    Merci encore pour ton aide précieuse !
Connectez-vous ou Inscrivez-vous pour répondre.