Statistique mémoire de fin d'étude

Salut à tous
Je suis en master 2 et je suis en train de faire mon mémoire de fin d'étude dont le sujet est le suivant :
Comment les États s'adaptent-ils à l'émergence des cryptomonnaies ?

Ma deuxième partie est une partie dans laquelle je fais des statistiques pour essayer de comprendre pourquoi un pays serait à même de rendre une cryptomonnaie illégale par exemple.

J'ai donc un fichier excel qui liste tout les pays du monde avec leurs caractéristiques (Taux de natalité, Salaire, Industrie, Population...) dans un premier onglet. Dans un deuxième onglet, j'ai une liste avec les pays dans une colonne et dans une deuxième colonne chaque pays est associé a un 0 si le bitcoin est légal et un 1 si le bitcoin est illégal.

L'idée serait de trouver des critères ayant une corrélation, par exemple que ce sont les pays ayant les salaires les plus faibles qui sont les plus à même d'interdire les cryptomonnaies.

Le problème est que j'ai fait la fonction =COEFFICIENT.CORRELATION mais je ne trouve que des coeff entre -0.2 et 0.2 donc non significatifs. J'ai également installé XLstats mais je ne trouve rien de pertinent.
Savez-vous où j'ai pu faire des erreurs ou si cela est normal ?
Merci énormément d'avance pour votre aide !

Réponses

  • Bonjour.

    Le calcul d'un coefficient de corrélation quand une variable n'a que deux valeurs est une mauvaise idée, encore plus quand cette variable n'est même pas une variable numérique (ici, 0 et 1 sont des codages).
    Tu peux examiner déjà tes données en les représentant. Et s'il te semble qu'il y a des liens statistiques, essayer de les justifier avec un modèle adapté (corrélation logistique, par exemple)

    Cordialement.
  • Il y a des pays où le bitcoin est illégal ?
    Gérard a tout dit, comment espérer une corrélation entre ces données ?
    A la rigueur entre données quantitatives, par exemple PIB et volumes d'échanges sur le bitcoin.
  • Merci beaucoup à tous les deux pour cette explication.

    Gerard, quand tu me dis de représenter mes données, qu'entends-tu par là ?
    Sais-tu comment je peux réaliser un test de corrélation logistique (avec excel ou autre) ?

    Dsl Désolé de vous déranger mais je n'ai pas fait beaucoup de stats durant mes études donc c'est un peu flou pour moi.
    Merci d'avance.
  • Et oui le bitcoin est interdit dans 5 pays: Bangladesh, Bolivie, Equateur, Kyrgyzstan et Nepal.
  • Tu peux faire des représentations de tes différentes variables pays par pays, en mettant ensemble les pays qui interdisent le bitcoin, pour voir si apparaissent des différences nettes.
    Pour la régression logistique, on laisse généralement travailler un logiciel de stast (je en sais pas si Xlstats sait faire), mais la difficulté est l'interprétation. Qui nécessite une vraie formation.

    Cordialement.
  • Salut remnic,
    laisse moi d'abord te faire un remarque, le fait de trouver un coefficient de corrélation qui est égal à +ou - 0,2, ne veut pas dire qu'il est non significatif. il faut faire un test (exemple celle de Pearson, Spearman, ...) avant de conclure.

    Je te propose 4 issues possibles, mais comme gerard a dit, tu auras besoin d'une assistance d'une personne qui a suivi qlqs quelques cours avancés de statistiques.

    1. La plus facile mais pas objective est de passer par les graphes, sous le langage R tu peux utiliser "ggplot2", en jouant avec les variables, ça te donnera une idée réelle mais pas conclusive (tu auras besoin des tutos sur youtube).

    2. Faire une classification, tu peux passer par les arbres de décision, cela te permettra de répondre à ta question.

    3. La 2ème solution que je te propose, celle la demande beaucoup de travail. Puisque la variable [que] tu cherches à expliquer est "la légalisation du bitcoin" qui est une variable catégorielle, je te propose donc de faire un classement pour chaque variable dépendante qui sont quantitatives (les informations que tu possèdes) pour les rendre qualitatives, Exemple la variable PIB per capita, tu formes 3 classes en prenant les seuils fixés par la banque mondiale par exemple. Une fois fait cela tu peux faire ressortir la matrice de corrélation.
    Sans oublier de faire les tests de significativité. Sous R tu peux utiliser la fonction "rcorr" du package "Hmisc" pour identifier la significativité.

    4. La méthode que Gerald vient de te proposer est de faire la régression logistique, ce qui te donnera la probabilité qu'un pays ne légalise pas le bitcoin sous la condition des informations disponibles que tu vas utiliser.

    PS. Cherche un statisticien dans ton coin pour t'aider avec ça, toi seul tu ne peux pas y arriver, car tu auras besoin de quelqu'un qui a mtrisé la théorie, ce qui n'est pas le cas pour toi.
Connectez-vous ou Inscrivez-vous pour répondre.