Aide statistique - tests et interprétation

Bonjour à tous,
Je vous écris car j’ai besoin de progresser en statistique mais je n’arrive pas à connecter toutes les notions dans ma tête.
J’aimerais si possible vous présenter un exemple pour qu’on discute de la démarche à suivre pour la construction de mes expériences, pour que je puisse derrière analyser correctement mes résultats. et surtout que j’arrête de dire des bêtises.

Exemple :
Je dispose de 500g de produit humide, je cherche à réaliser une expérience de séchage sur ce produit.
1 - Il me faut déterminer son humidité relative avant séchage : concrètement je prélève 4 échantillons (5 x 5g de produit). Je les pèse avec une balance prise à 1mg. Je sèche ces échantillons avec une méthode de référence (T>100°C), je repèse et détermine mon humidité relative.

J’obtiens par exemple :
A -> 71,47% ± 0,01% ; B -> 71,28% ± 0,01% ; C -> 70,84% ± 0,01% ; D -> 71,03% ± 0,01%, E -> 70,49% (Ici le ± 0,1% représente l’impact de la précision de ma mesure (qui prend en compte précision de balance, erreur de lecture etc…) sur le calcul de mon humidité relative).

La question que je me pose est la suivante. Que puis-je dire sur mon produit humide initial ?
Maintenant je bloque un peu (oui je suis TRÈS mauvais). Voilà ce que je me demande.
D’où provienne les différences entre mes mesures ? Premièrement la précision de ma mesure (d’où le ± 0,01%). Mais cela ne me permet pas d’expliquer la différence entre A et B par exemple (vu que je suis précis à 0,01%). Il y a donc une autre source de variabilité : je suppose que c’est dû au fait que la répartition de l’humidité relative de mon produit n’est pas parfaitement homogène (dois-je supposer/vérifier que cette hétérogénéité suis une loi normale ?).
Ok ce n’est pas parfaitement homogène, mais quand je regarde les valeurs que j’obtiens je me dis que mon humidité relative ne vaut pas 5%, j’ai même envie de dire pour résumer que mon humidité relative vaut 71% (sa moyenne).
Seulement voilà, si je dis que mon HR moyenne vaut 71% (sans intervalle) ce n’est pas très scientifique, ça voudrait dire que je connais la valeur exacte, ce qui n’est pas vrai. Je peux calculer l’écart-type de mes valeurs (ici 0,38%).
C’est ici que je bloque, toutes mes connaissances me disent de dire que ça vaut 71% ± écart-type. Je veux bien les croire mais quand je cherche % de chance que j’aie que ma vraie valeur soit dans cet intervalle je ne trouve rien, on parle d’intervalle de confiance et non pas de l’écart-type. N'ai-je rien compris ?
Ou dois-je me fixer un % de risque et calculer un intervalle de confiance ? Cet intervalle, que représente-t-il pour ma vraie valeur de moyenne d’humidité relative ?

2 – Je reçois un deuxième produit (d’un autre fournisseur) dont je mesure de la même façon l’HR. J’obtiens en mesurant les échantillons :
A -> 68,43% ± 0,01% , B-> 68,92% ± 0,01% ; C ->70,37% ± 0,01% ; D ->68.49% ± 0,01% et E -> 69,61% ± 0,01%.
La différence n’est pas flagrante du tout … mais j’ai quand même envie de dire que l'HR du deuxième chargement est plus petite que le premier. Comment puis-je procéder ? J'aimerais me fixer un risque de me tromper de 1%. comment procéder ? Je suppose qu’ils ont même moyenne et je fais un test de Student avec 1% ?

3 – Je sèche les 2 produits en utilisant le même protocole, je définis comme étant le produit le plus intéressant : celui qui va perdre le moins rapidement en humidité relative. Pour ce faire je trace une cinétique des moyennes de mes mesures à différents temps.
Imaginons que j’obtienne 2 droites : une de coeff -2,44%/h et l’autre de coeff -1,97%/h. Alors là c’est le désert total, existe-t-il un test à faire pour dire qu’une vitesse est significativement plus grande que l’autre ?

Si quelqu'un a eu la patience de lire jusqu'au bout je l'en remercie,
Si vous avez une ou plusieurs réponses à mes questions je suis preneur !
Merci d'avance !

Réponses

  • Bonjour.

    Je ne traite que du 1), il y a déjà suffisamment à dire.
    * Ton 0,01% n'est pas une précision de mesure (qui dépend de l'appareil et de la valeur de la mesure), mais une précision de lecture de l'appareil de mesure; à priori, c'est plutôt 0,005% si tes graduations on affichages sont de 0,01 en 0,01%.
    * Avec 5 mesures dans l'échantillon et en supposant qu'il est homogène, les différences que tu trouves viennent de l'erreur de mesure. Si l'appareil est bien calibré, ces erreurs sont en moyenne nulles, ce qui fait qu'un échantillon donnera une estimation non biaisée de la vraie valeur (mais à priori pas la vraie valeur).
    * Évidemment, il est possible que ton produit ne soit pas homogène, ce qui va compliquer la situation. Dans ce cas, ton échantillon a de fortes chances d'être trop petit pour donner un résultat utile. Supposons dans la suite que le produit est homogène.
    * Une bonne estimation de l'humidité relative de ton produit est la moyenne des 5 valeurs.
    * Bien évidemment, on préfère avoir une précision sur l'estimation, on aimerait quelque chose du genre 71.02 à 0,1 près, c'est à dire être sûr que le résultat est entre 70,92 et 71,12. Ce n'est pas possible, on n'a que 25 g sur 500. On peut cependant, si les circonstances s'y prêtent, avoir une idée sur un intervalle probable, l'intervalle de confiance.

    Pour bien comprendre ce que tu fais, tu as besoin de te former (t'autoformer, c'est possible, je l'ai fait) aux statistiques et aux techniques de mesure. Pour les stats, n'importe quel bouquin de statistiques inférentielles (estimation, tests, ..) convient. Pour les mesures, il y a un bouquin que je connais : "Modélisation et estimation des erreurs de mesure", de Michelle Neuilly au Cetama.

    Cordialement.
  • Bonjour gerard0,
    Tout d'abord merci pour votre réponse ! C'est très instructif !

    Je ne traite que du 1), il y a déjà suffisamment à dire.
    * Ton 0,01% n'est pas une précision de mesure (qui dépend de l'appareil et de la valeur de la mesure), mais une précision de lecture de l'appareil de mesure; à priori, c'est plutôt 0,005% si tes graduations on affichages sont de 0,01 en 0,01%.


    Mon appareil de mesure est une balance de précision (lecture digitale) je n'ai pas trouvé l'erreur de lecture associé. Je sais uniquement que j'ai préalablement vérifier (et non calibré) ma balance à l'aide d'un "poids étalon" et que cette mesure était à +/- 1ppm de la valeur de "l'étalon".


    * Avec 5 mesures dans l'échantillon et en supposant qu'il est homogène, les différences que tu trouves viennent de l'erreur de mesure. Si l'appareil est bien calibré, ces erreurs sont en moyenne nulles, ce qui fait qu'un échantillon donnera une estimation non biaisée de la vraie valeur (mais à priori pas la vraie valeur).

    J'avoue que je n'arrive pas à comprendre pourquoi, mon instruments de mesure donne une mesure précise au ppm (en tout cas avec la masse étalon, sachant que mes échantillons sont du même ordre de gradeur). Comment une mesure précise au ppm peut-elle menée à une imprécision après calcul de l'ordre de 1% ?
    Peut être du à d'autre facteur que je ne prend pas en compte ?
    J'entends que en faisant des répliqua je mesure une incertitude de type A. Du coup pour écrire le résultat de ma mesure il faut que j'écrive :

    HR = moyenne des échantillons +/- X.(incertitude de type A)
    Sachant que je me fixe un risque de me trompé et via les table j'en déduis la valeur de X ?



    * Évidemment, il est possible que ton produit ne soit pas homogène, ce qui va compliquer la situation. Dans ce cas, ton échantillon a de fortes chances d'être trop petit pour donner un résultat utile. Supposons dans la suite que le produit est homogène.
    * Une bonne estimation de l'humidité relative de ton produit est la moyenne des 5 valeurs.

    Ok :)

    * Bien évidemment, on préfère avoir une précision sur l'estimation, on aimerait quelque chose du genre 71.02 à 0,1 près, c'est à dire être sûr que le résultat est entre 70,92 et 71,12. Ce n'est pas possible, on n'a que 25 g sur 500. On peut cependant, si les circonstances s'y prêtent, avoir une idée sur un intervalle probable, l'intervalle de confiance.

    Oui je suis carrément d'accord avec vous, cependant si je fais une mesure sur la totalité de mon échantillon il ne m'en reste plus pour faire l'expérience ^^
    D'ailleurs une question me vient : Dans mon exemple si je détermine un intervalle de confiance j'e fais intervenir mon écartype qui fait intervenir le nombre de répliqua que je fais ce qui me dérange un peu (je m'explique).

    Imaginons qu'au lieu de de faire 5x5g pour mes mesure je fasse 10x2,5g. Je teste la même quantité de matière mais j'aurai une population de mon échantillon bien plus grande et donc un écartype probablement plus petit alors que j'ai tester la même proportion de matière. A quel moment le poucentage de matière initial testé entre il en compte ? Est ce que je vais obtenir des résultat plus dispersés et comme j'ai plus d'échantillon je retrouve le même écartype ?
    En gros ma question c'est : pourquoi je calcule une dispersion avec un nombre d'échantillon et non pas pondérer par le % de ma matière à tester (qui je trouve est plus représentative que mon nombre d'échantillon).


    Pour bien comprendre ce que tu fais, tu as besoin de te former (t'autoformer, c'est possible, je l'ai fait) aux statistiques et aux techniques de mesure. Pour les stats, n'importe quel bouquin de statistiques inférentielles (estimation, tests, ..) convient. Pour les mesures, il y a un bouquin que je connais : "Modélisation et estimation des erreurs de mesure", de Michelle Neuilly au Cetama.

    Oui, c'est ce que j'essaie de faire en se moment en lisant des cours de (Bio)statistique. Mais j'ai un problème : je dois absolument appliquer ce que je lis sinon je ne l'intègre pas. Or, au moment de l'appliquer dans un cas réel (ce que je fais là) je bloque et personne pour répondre à mes questions (à part vous ^^).


    Cordialement.
    Merci encore pour votre précédente réponse !
    Passez une bonne journée !
  • Re-bonjour
    Quand je lis un cours de statistique je bloque très rapidement car j'ai pleins de questions et d’incompréhension.
    Je comprends que dans son calcul l'écart-type caractérise une distribution. Mais je trouve que moi ce qui me parle le plus ça serait plus :

    distribution = 1/n . somme(ValeurAbs(xi - xmoyenne))

    Pourquoi remplace-t-on la valeur absolue par un carré ? Pour s'approcher d'une norme ?
    Merci d'avance !
  • Re-re bonjour :)
    Une autre question ...
    Je ne comprends pas vraiment l'intervalle de confiance ... pourtant j'essaie vraiment de lire !!!

    De ce que je comprends de l'intervalle de confiance :
    avec un risque de 5%, il se calcule comme : moyenne +/- 1,96.ecart-type

    S'interprète-t-il comme : si je fais 100 fois une mesure, j'en aurais 95 qui seront dans cet intervalle et 5 qui seront en dehors de cet intervalle ?
    Si oui, cet intervalle ne m'intéresse pas a priori, moi ce que j'aimerais c'est un intervalle qui me donne une information du type : ma "vrai" moyenne d'humidité relative est dans tel intervalle et j'ai x% de chance de me tromper.
    Il y a peut-être un lien hyper-logique entre les deux mais il m'échappe pour l'instant ...

    Edit : Je crois que j'ai compris: Ma "vrai" valeur fait partie de mes tirages possibles initialement, elle a donc 95% de chance de se trouver dans l'intervalle de confiance que j'ai déterminé. Mais cette probabilité c'était avant que je réalise l'expérience, c'est pour ça qu'on dit confiance et pas probabilité ?

    Merci d'avance !
  • Bonjour.

    Je ne sais pas trop comment tu passes de la pesée au taux d'humidité, mais je ne suis pas surpris qu'avec une balance ultra-précise tu aies des résultats assez peu précis : il y a de nombreuses causes d'erreur (perte de matière, séchages inhomogènes, ... je ne connais pas ton procédé, mais il est complexe) qu'il est difficile de quantifier.

    Je reviens sur tes questions statistiques, qui sont traitée dans tous les bons bouquins de stats :
    * Pourquoi l'écart type ? En fait, ce n'est pas lui qui est utile, mais son carré, la variance. Car elle possède des qualités calculatoires très utiles, et aussi parce qu'avec la moyenne, elle caractérise de nombreuses lois probabilistes qui servent de modèle en stats, à commencer par la moi Normale. L'écart absolu moyen que tu proposes ne permet pas grand chose, ce qui fait qu'il est utilisé, mais très peu.
    * "l'intervalle de confiance" ?? Il y a autant d'intervalles de confiances que de modèles. Celui dont tu parles est l'intervalle de confiance sur une variable gaussienne (Normale). Ton paragraphe en gras est tout à fait correct, tu as compris.

    Cordialement.
  • Bonjour gerard0,
    Merci d'avoir pris le temps de lire et pour ta nouvelle réponse !

    Je ne sais pas trop comment tu passes de la pesée au taux d'humidité, mais je ne suis pas surpris qu'avec une balance ultra-précise tu aies des résultats assez peu précis : il y a de nombreuses causes d'erreur (perte de matière, séchages inhomogènes, ... je ne connais pas ton procédé, mais il est complexe) qu'il est difficile de quantifier.

    En effet je ne peux pas estimer les pertes de matière due au déplacement de mon échantillon.


    Je reviens sur tes questions statistiques, qui sont traitée dans tous les bons bouquins de stats :

    J'imagine que oui, j'essaie vraiment de lire ces bouquins, mais ils manquent de cas pratiques ce qui fait que je n'arrive pas à fixer ce que je lis.

    * Pourquoi l'écart type ? En fait, ce n'est pas lui qui est utile, mais son carré, la variance. Car elle possède des qualités calculatoires très utiles, et aussi parce qu'avec la moyenne, elle caractérise de nombreuses lois probabilistes qui servent de modèle en stats, à commencer par la moi Normale. L'écart absolu moyen que tu proposes ne permet pas grand chose, ce qui fait qu'il est utilisé, mais très peu.

    Ok

    * "l'intervalle de confiance" ?? Il y a autant d'intervalles de confiances que de modèles. Celui dont tu parles est l'intervalle de confiance sur une variable gaussienne (Normale). Ton paragraphe en gras est tout à fait correct, tu as compris.

    Ah je pensais que c'était général.

    Merci pour tes réponses, je vais retourner bosser tous ça ...

    Bonne journée !
Connectez-vous ou Inscrivez-vous pour répondre.