Taux d’erreur sur une population globale

Bonjour aux mathématiciennes et aux mathématiciens,

Mon problème :
Je dois vérifier la qualité de l'instruction de dossiers. J'ai décidé de vérifier un échantillon au hasard de N dossiers (j'utilise la formule ALEA d'Excel pour les choisir) et d'estimer ensuite le taux d'erreurs sur l'ensemble des dossiers.
Si ce taux d'erreur et l'intervalle de confiance sont "satisfaisants", par exemple si ce taux d'erreur est de moins de 1% sur la population globale, je ne change pas la méthode d'instruction. Sinon, je dois creuser un peu plus (contrôles exhaustifs ?) et m'interroger sur ces méthodes d'instruction et les revoir.

Avec un intervalle de confiance de 95%, j'ai trouvé le tableau ci-dessous mais je ne sais pas comment le généraliser à un taux quelconque ; à 100, 200 opérations vérifiées ou le modifier en tenant compte d'un intervalle de confiance de 99%
Taux d'erreur pour la population globale  < ou = au pourcentage de : 1  2  3  4  5 10 			
Nbre max d'erreurs pour un échantillon de 10 opérations contrôlées   0  1  1  1  1  2     			
Nbre max d'erreurs pour un échantillon de 20 opérations contrôlées   1  1  2  2  2  4    			
Nbre max d'erreurs pour un échantillon de 30 opérations contrôlées   1  2  2  3  3  6   		
Nbre max d'erreurs pour un échantillon de 40 opérations contrôlées   1  2  3  4  4  7
Je recherche la méthode/formule pour calculer le nombre maximum d'erreurs à constater sur un échantillon pour que le taux d'erreur sur la population globale soit < ou = à un taux donné et pouvoir vérifier et compléter ce tableau.

Autre question : Quelle est la formule pour estimer la taille d'un échantillon à choisir en fonction de la taille de la population avec un intervalle de confiance donné.
Merci pour votre aide.
Bonne journée.
Eric

Réponses

  • Bonjour.

    Ces tableaux ont été construits à partir d'hypothèses sur les erreurs de dossier qu'on ne connaît pas, mais qu'on peut imaginer assez facilement :
    * Il y a peu de dossiers erronés (d'où le test de "moins de 1% d'erreurs)
    * les erreurs sont indépendantes (il n'y a pas par exemple un employé qui fait très souvent n'importe quoi)

    Dans ce cas, un modèle classique est que le nombre de dossiers incorrects sur N dossiers examinés suit une loi de Poisson de moyenne Np où p est la probabilité qu'un dossier pris au hasard sera incorrect. On fera le test de "p<= 1%" en prenant le cas le plus mauvais (p=1%) et déterminant un intervalle de confiance à 95% (ou 99%) sur le nombre de dossiers incorrects trouvés parmi les N examinés. Par exemple, pour N=100, on a une loi P(1) (Poisson de moyenne 1), dont les probabilités de trouver 0, 1, 2, 3, ... dossiers incorrects sont 0,368, 0,368, 0,184, 0,061, 0,015, 0,003, etc.
    Pour un intervalle à 99%, on trouve qu'il y a une probabilité supérieure à 0,99 que le nombre de dossiers incorrects soit inférieur ou égal à 4 (0,996 - à 3, on n'atteint pas encore 0,99), donc on prendra 4 comme nombre maximum de dossiers incorrects, et si on en a 5 ou plus, on fera un contrôle supplémentaire.

    Donc pas de formule, mais une méthode à utiliser.

    Pour ta deuxième question, il n'y a pas de réponse statistique, mais des points de vue assez raisonnables. S'il y a moins de 1% de défauts, avec 100 examens, on trouvera en moyenne un défaut, donc on en trouvera rarement. Après, ce sont les conditions de ces examens (temps, coût, ...) qui feront choisir un nombre, sachant que plus l'échantillon est grand, plus le test est efficace (puissant).

    Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.