Loi normale et intervalle de tolérance
dans Statistiques
Bonjour à tous,
Je travaille dans l'industrie pharmaceutique et dans le but de valider un procédé de production je dois calculer des capabilités.
J'ai quelques notions de statistiques mais pas énormément poussées non plus. Me voilà donc bloqué sur une problématique, d'où ma venue vers vous.
Pour résumé, nous avons, dans une étape de fabrication d'un médicament, une machine permettant de mettre sous blisters des comprimés.
Un des différents paramètres à étudier va être la température de formage du PVC afin qu'il puisse y accueillir les comprimés.
Problème n°1: Distribution normale
Pour se faire, nous avons relevé la valeur de cette température toutes les 30mn et nous avons donc pu récolter 500 valeurs (500 échantillons).Afin de calculer la capabilité il faut tout d'abord démontrer que la distribution est normale, or après passage au test de normalité (sur minitab), j’obtiens des valeurs de p bien inférieure à 0,05.
Serait-il donc possible de dire que la distribution est normale en sachant que la taille des échantillons est suffisamment grande (n >30) ? On pourrait ignorer le test de normalité sans problème majeur. Le théorème central limite nous dit que, la distribution de l’échantillonnage tend à suivre la loi normale lorsque la taille est grande (n > 30).
Ceci concernait un paramètre que nous avons pu relever 500 fois, cependant j'en ai d'autres où seulement 80 échantillons ont pu être relevés. Mon hypothèse est-elle toujours bonne ?
Problème n°2: Intervalle de tolérance
J'ai aussi besoin de déterminer une plage de tolérance pour un autre paramètre critique lié notre procédé de production.
Nous avons pu relever ce paramètre 300 fois, faut-il ici aussi démontrer la normalité et si concluante se baser sur la formule:
Limite inf et supp= µ ± 3 ? (afin de pouvoir contenir 99.865% de la distribution), ou y-a-t-il une autre façon de procéder ?
Si par malheur la distribution ne serait pas normale et qu'il est trop facile de dire que pour les grands échantillons elle est normale, comment devrais-je opérer ?
Je vous remercie énormément par avance,
En espérant que vous arriverez à m'aiguiller.
Cordialement,
Kouakakou
Je travaille dans l'industrie pharmaceutique et dans le but de valider un procédé de production je dois calculer des capabilités.
J'ai quelques notions de statistiques mais pas énormément poussées non plus. Me voilà donc bloqué sur une problématique, d'où ma venue vers vous.
Pour résumé, nous avons, dans une étape de fabrication d'un médicament, une machine permettant de mettre sous blisters des comprimés.
Un des différents paramètres à étudier va être la température de formage du PVC afin qu'il puisse y accueillir les comprimés.
Problème n°1: Distribution normale
Pour se faire, nous avons relevé la valeur de cette température toutes les 30mn et nous avons donc pu récolter 500 valeurs (500 échantillons).Afin de calculer la capabilité il faut tout d'abord démontrer que la distribution est normale, or après passage au test de normalité (sur minitab), j’obtiens des valeurs de p bien inférieure à 0,05.
Serait-il donc possible de dire que la distribution est normale en sachant que la taille des échantillons est suffisamment grande (n >30) ? On pourrait ignorer le test de normalité sans problème majeur. Le théorème central limite nous dit que, la distribution de l’échantillonnage tend à suivre la loi normale lorsque la taille est grande (n > 30).
Ceci concernait un paramètre que nous avons pu relever 500 fois, cependant j'en ai d'autres où seulement 80 échantillons ont pu être relevés. Mon hypothèse est-elle toujours bonne ?
Problème n°2: Intervalle de tolérance
J'ai aussi besoin de déterminer une plage de tolérance pour un autre paramètre critique lié notre procédé de production.
Nous avons pu relever ce paramètre 300 fois, faut-il ici aussi démontrer la normalité et si concluante se baser sur la formule:
Limite inf et supp= µ ± 3 ? (afin de pouvoir contenir 99.865% de la distribution), ou y-a-t-il une autre façon de procéder ?
Si par malheur la distribution ne serait pas normale et qu'il est trop facile de dire que pour les grands échantillons elle est normale, comment devrais-je opérer ?
Je vous remercie énormément par avance,
En espérant que vous arriverez à m'aiguiller.
Cordialement,
Kouakakou
Réponses
-
Petite relance si vous voulez bien m'aider dans mon brouillard :-)
-
Koukakou a écrit:Je travaille dans l'industrie pharmaceutique et dans le but de valider un procédé de production je dois calculer des capabilités.Koukakou a écrit:Le théorème central limite nous dit que, la distribution de l’échantillonnage tend à suivre la loi normale lorsque la taille est grande (n > 30).Koukakou a écrit:On pourrait ignorer le test de normalité sans problème majeur.Karakou a écrit:Ceci concernait un paramètre que nous avons pu relever 500 fois, cependant j'en ai d'autres où seulement 80 échantillons ont pu être relevés. Mon hypothèse est-elle toujours bonne ?Karakou a écrit:J'ai aussi besoin de déterminer une plage de tolérance pour un autre paramètre critique lié notre procédé de production.
Nous avons pu relever ce paramètre 300 fois, faut-il ici aussi démontrer la normalité et si concluante se baser sur la formule:
Limite inf et supp= µ ± 3 ? (afin de pouvoir contenir 99.865% de la distribution), ou y-a-t-il une autre façon de procéder ?
Un autre exemple pour mieux comprendre ce que je dis. Quand on a 500 échantillons, il n'est honnêtement nul besoin en pratique de tests d'hypothèses pour voir si la distribution est normale ou pas. On affiche des histogrammes avec différentes échelles et on voit tout de suite si c'est raisonnable ou pas. Les tests d'hypothèse sont là pour quantifier les choses, mais la visualisation des données c'est important aussi.
Désolé de ne pas t'aider plus. Mais les maths c'est puissant quand on comprend ce qu'il y a derrière, qu'on sait quoi en attendre, et que le problème est clair. Les maths n'offrent pas de réponse quand il n'y a pas de question claire. -
Bonjour Skyffer3.
Tu redis et complètes ce qu'il a eu comme réponses sur le forum des statistiques. Mais manifestement, la réponse ne lui convenant pas, il a essayé d'avoir une réponse différente ici.
En plus, ce qu'il ne dit pas ici, c'est que ses valeurs sont le rassemblement de plusieurs échantillons, d'où une cause supplémentaire de non Normalité et un risque de ne pas pouvoir traiter ces données.
Cordialement. -
AH ça je savais d'avance qu'une telle réponse ne lui conviendrait pas :-D De toute façon faut pas rêver, si on veut un travail statistiques de qualité il faut embaucher un statisticien. Ça fait un peu élitiste mais les maths c'est pas une matière simple, et on peut pas "tricher", et même pour des pros il faut du temps pour prendre du recul sur les outils et comprendre en profondeur afin de les utiliser à bon escient.
-
Entièrement d'accord.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 163.1K Toutes les catégories
- 7 Collège/Lycée
- 21.9K Algèbre
- 37.1K Analyse
- 6.2K Arithmétique
- 53 Catégories et structures
- 1K Combinatoire et Graphes
- 11 Sciences des données
- 5K Concours et Examens
- 11 CultureMath
- 47 Enseignement à distance
- 2.9K Fondements et Logique
- 10.3K Géométrie
- 62 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 68 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 312 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10K Probabilités, théorie de la mesure
- 772 Shtam
- 4.2K Statistiques
- 3.7K Topologie
- 1.4K Vie du Forum et de ses membres