Statistique pour les nuls — Les-mathematiques.net The most powerful custom community solution in the world

Statistique pour les nuls

Bonjour à tous,
Je suis un jeune ingénieur, travaillant dans la recherche et le développement de culture bactériennes. Je cherche à améliorer mes compétences en statistiques en échangeant avec vous si vous le voulez bien :-)

Je me suis inscrit à ce forum car je suis actuellement confronté à un problème :
Une partie de mon travail consiste notamment en la détermination de nouveaux composés dans des milieux de culture (criblage de composé). Pour déterminer l'impact de ces composés testé, je mesure une réponse qui est (en gros) le nombre de bactéries en fin de culture.
Le problème est qu'en biologie, la variabilité biologique est très grande, de plus la précision ma mesure est peu précise.
Il est donc difficile pour moi de dire si telle ou telle différence est significative ou non.
J'ai la possibilité de réaliser des répliquas biologiques et techniques mais je ne suis pas sûr de savoir les analyser et encore moins les comparer.

Je voulais savoir, quelle démarche je pourrais mettre en œuvre pour comparer deux expériences ?
Si par exemple je veux comparer deux milieux de culture.
Combien de répliquas biologiques dois-je réaliser ? Combien de répliquas techniques pour chaque répliqua biologique ?
Comment faire pour dire que ma différence éventuelle est significative ? Quelle diagramme je dois tracer ou test effectuer ? Comment déterminer le % de chance que je me trompe en disant que cette différence est significative ?
J'ai essayé de me documenter mais je me perds à chaque fois car je pense que je n'ai pas la base nécessaire. Je suis en revanche très motivé pour essayer de comprendre et d'acquérir ces bases !

Je suis preneur si vous avez des livres ou des site à me conseiller ! Ou bien si vous voulez directement échanger avec moi !

Je suis désolé pour ce long message, je ne savais pas trop ou le poster !
En vous souhaitant à tous et à toutes une bonne journée !

Réponses

  • Bonjour.

    L'idéal serait que tu aies le temps d'étudier un bouquin général de statistiques, par exemple le Saporta, pour avoir un panorama sérieux des outils utilisés : analyse descriptive à une ou plusieurs variables, tests, analyse discriminante, ...

    Déjà, il y a certaines questions auxquelles on ne peut pas répondre :
    "Combien de répliquas biologiques dois-je réaliser ?" "Combien de répliquas techniques pour chaque répliqua biologique ? " (cette fois, je ne comprends même pas la question) "Quelle diagramme je dois tracer ou test effectuer ?"
    et deux questions plus simples :
    "Comment faire pour dire que ma différence éventuelle est significative " : On dit que la différence est significative lorsqu'un test de cette différence échoue (la valeur test est dans la zone de rejet - la p-value est plus faible que le risque choisi). Attention, il ne s'agit pas de comparaison d'expériences, mais de comparaison de valeurs ou modalités issues de ces deux expériences. Sur les mêmes expériences, il peut y avoir des variables statistiques significativement différentes et d'autres non. Ce qu'on en déduit n'est pas l'affaire du statisticien.
    "Comment déterminer le % de chance que je me trompe en disant que cette différence est significative ? " Là encore, une étude sérieuse de la théorie des tests d'hypothèse te permettra d'éviter ce genre de question floue, car si le test de différence dit que la différence est significative, il n'y a rien d'aléatoire (*). Par contre, le test est construit sur la probabilité à priori (appelée "risque") que le test échoue alors même que l'hypothèse de base (dans ton cas "pas de différence") est vraie.

    Donc le mieux est que tu fasse le travail d'apprentissage (**) dans un ou plusieurs bouquins, et te fasse aider sur un site spécialisé en statistiques, comme par exemple Forumpro, et en même temps, que tu dégages clairement quelles sont les variables statistiques que tu veux étudier (leur type, la façon de les mesurer, ...) et les questions très précises que tu vas vouloir traiter. Cette deuxième partie du travail demande peu de connaissances (cours de stats de collège-lycée sur les stats descriptives, ou premières pages du premier chapitre de statistiques du Saporta (il y a au départ 4 chapitres de probas, outils de base des statistiques).

    Cordialement.

    (*) si je lance un dé et que j'obtiens 3, il n'y a plus d'aléatoire. J'ai obtenu 3, de façon certaine.
    (**) c'est possible, pour ma part je n'ai jamais suivi de cours de statistiques ni de probas, et j'ai dû les enseigner !!
  • Bonjour Gérard,

    Tout d'abord merci pour votre réponse, et pour le temps que vous m'accordez !

    L'idéal serait que tu aies le temps d'étudier un bouquin général de statistiques, par exemple le Saporta, pour avoir un panorama sérieux des outils utilisés : analyse descriptive à une ou plusieurs variables, tests, analyse discriminante, ...

    Je suis d'accord avec vous ! Je compte bien prendre le temps qu'il faudra car je pense que l’outil qu'est la statistique me servira dans beaucoup de domaines (et pas seulement dans ma vie professionnelle). J'ai d’ailleurs commencé de lire "https://docplayer.fr/2510408-Principes-et-methodes-statistiques.html". Merci pour votre conseil je vais voir si je peux acheter "Saporta".

    "Comment faire pour dire que ma différence éventuelle est significative " : On dit que la différence est significative lorsqu'un test de cette différence échoue (la valeur test est dans la zone de rejet - la p-value est plus faible que le risque choisi).

    D'accord !

    Attention, il ne s'agit pas de comparaison d'expériences, mais de comparaison de valeurs ou modalités issues de ces deux expériences. Sur les mêmes expériences, il peut y avoir des variables statistiques significativement différentes et d'autres non. Ce qu'on en déduit n'est pas l'affaire du statisticien.

    Je crois (mais ne suis pas sûr) avoir compris votre message. Je reformule et vous me dites si j'ai bien compris : Il faut que je choisisse en amont de mon expérience des variables statistiques qui me semblent être les plus adaptées à ma problématique. Et je dois ensuite travailler avec ces variables. Sachant que la conclusion des tests sera conditionnée par mon choix.
    Essayons de prendre un exemple : je souhaite comparer deux populations bactériennes obtenues avec deux milieux de culture. Quels sont mes choix de variables statistiques ? Je peux choisir la moyenne (si je veux augmenter ma quantité), je peux choisir l’écart-type (si je veux augmenter la "reproductibilité" de mes expériences. Ai-je bien compris ?

    "Comment déterminer le % de chance que je me trompe en disant que cette différence est significative ? " Là encore, une étude sérieuse de la théorie des tests d'hypothèse te permettra d'éviter ce genre de question floue, car si le test de différence dit que la différence est significative, il n'y a rien d'aléatoire (*). Par contre, le test est construit sur la probabilité à priori (appelée "risque") que le test échoue alors même que l'hypothèse de base (dans ton cas "pas de différence") est vraie.

    Super ! C'est exactement ce genre de réponse que je cherche ! J'avoue que j'ai parcouru quelques sites/cours, mais je me mélange énormément entre les statistique descriptives, les probabilités et les statistiques permettant d'obtenir des "modèles" statistiques. L'ensemble des notions se mélange dans ma tête, et ça se voit car j’emploie mal les notions. Je vais finir de lire le cours que j'ai trouvé et voir si c'est plus clair pour moi.
    Je dis peut-être une grosse bêtise. Cela vient du fait que la notion de variable statistique est un peu floue pour moi.

    Donc le mieux est que tu fasse le travail d'apprentissage (**) dans un ou plusieurs bouquins, et te fasse aider sur un site spécialisé en statistiques, comme par exemple Forumpro,

    D'accord, c'est vrai que je me rends compte que ma venu sur ce forum est un peu prématurée. Je vais essayer de reprendre mon travail d'apprentissage.

    et en même temps, que tu dégages clairement quelles sont les variables statistiques que tu veux étudier (leur type, la façon de les mesurer, ...) et les questions très précises que tu vas vouloir traiter.

    D'accord, j'espère que je comprendrai un peu mieux le travail en amont pour dégager le variables statistiques.

    Cette deuxième partie du travail demande peu de connaissances (cours de stats de collège-lycée sur les stats descriptives, ou premières pages du premier chapitre de statistiques du Saporta (il y a au départ 4 chapitres de probas, outils de base des statistiques).

    D'accord, je pense que je vais me procurer ce livre, j'ai vraiment besoin de "repartir de zéro".
    Merci encore pour vos réponses !
    Cordialement.
  • " Ai-je bien compris ? " pas vraiment, moyenne et écart type ne sont pas des variables statistiques, mais des caractéristiques de ces variables (moyenne de quoi ?)
    Un exemple de variable : nombre de bactéries au mm3. Un autre exemple : présence de telle souche, ou pas.

    Et effectivement, c'est bien actuellement cette notion qui te plante.

    Cordialement.
  • @Gérard0
    Ah oui effectivement, je me rends compte de l'énormité que je viens de dire.
    Ok c'est plus clair. Effectivement la variable qui m'intéresse dans un premier temps est le nombre de bactéries par mL.
    Cordialement.

    [Inutile de reproduire le message précédent. AD]
Connectez-vous ou Inscrivez-vous pour répondre.
Success message!