interpréter l'écart-type ?

emiemar · February 2006

Bonjour,

Si l'écart-type est faible, cela signifie que les valeurs sont peu dispersées autour de la moyenne (série homogène) et inversement (série hétérogène).

Mais comment juger qu'un écart-type est grand ou petit ?

Que puis-je conclure si j'ai une moyenne de 94 et un écart-type de 13,14 ou bien une moyenne de 812 et un écart-type de 15,36 ?

Est ce que l'interprétation se fait en rapprochant l'écart-type de la moyenne ?

Merci par avance pour votre aide.

Emilie

GERARD5 · February 2006

Il n'y a pas de "bonne règle" d'interprétation de l'écart-type. On l'a choisi pour ses propriétés mathématiques (plus exactement celles de la variance) et non pas pour sa signification.
Par contre :
* Pour des séries de même moyenne, la comparaison des écarts types a un sens.
* Pour des réalisations d'une loi Normale, l'interprétation est possible (l'écart type est une distance normalisant les fréquences de réalisation).

Cordialement

Christian Vassard · February 2006

On a des résultats généraux, qui sont simplement liés à la définition de l'écart-type, que l'on peut affiner dans le cas où la série suit une loi normale: quelle que soit la série statistique, 3/4 de valeurs sont dans l'intervalle ]m-2*sigma, m+2*sigma[, et 8/9 dans l'intervalle ]m-3*sigma, m+3*sigma[.
Cordialement,
Christian V

emiemar · February 2006

* Pour des séries de même moyenne, la comparaison des écarts types a un sens.

C'est-à-dire ?

Merci.

koniev2 · February 2006

Bonjour
Cela peut peut-être t'intéresser : K. Pearson dans ses tables pour Statisticiens donne la relation entre l'étendue : maxi - mini des valeurs et l'écart-typed'une loi normale.
Echantillon de 100 sujets l'écart entre la plus petite et la plus grande valeur est 10 on peut estimer l'écart-type à 10 * 0.199 = 1.99. Le nb 0.199 est lu dans la table en face de 100.
Pour n = 2 ce coeff vaut 0.886 et
pour n = 1000 il vaut 0.154.
Cordialement
Koniev

GERARD5 · February 2006

"* Pour des séries de même moyenne, la comparaison des écarts types a un sens.

C'est-à-dire ? "

Le sens de la comparaison : si l'écart - type est plus faible, la dispersion est moindre.
De même, pour des séries positives, on utilise le coefficient de variation qui est le quotient de l'écart type par la moyenne pour comparer des dispersions relatives.

Quant à la règle de Christian Vassard, elle se généralise (Formule de Bienaymé-Tchebicheff) : Entre $m-t \sigma et m+t \sigma$ il y a une proportion des valeurs qui est supérieure à 1 - 1/t².
Pour t grand, la formule est pratiquement sans utilité.

Cordialement

muaddob · February 2006

bonjour,
 une autre façon moins matématique d'interpréter consiste à regarde si tu as des contraintes sur ta séries. Par exemple s'il s'agit de M< borne, alors
 
 un bon sigma est tel que <IMG WIDTH="131" HEIGHT="30" ALIGN="MIDDLE" BORDER="0" SRC="http://www.les-mathematiques.net/phorum/2006/02/14/79685/cv/img1.png" ALT="$ M+6 \sigma_M<borne$"> autrement dit :
 <IMG WIDTH="107" HEIGHT="36" ALIGN="MIDDLE" BORDER="0" SRC="http://www.les-mathematiques.net/phorum/2006/02/14/79685/cv/img2.png" ALT="$ \sigma_M<\frac{borne-M}{6}$">
 
 cette méthodologie industrielle s'appelle le six sigma, et tu peux trouver des infos sur le web.
 
 une société commercialise un produit qui aide à faire ça, je peux te donner le nom si ça t'intéresse !
 
 Cordialement

GERARD5 · February 2006

Attention Muaddob : Le $6\sigma$ correspond d'une part à une série supposée approximativement Normale et d'autre part à un intervalle autour de la moyenne. On l'utilise :
* Pour mettre sous contrôle une production (valeurs de cotes comparées à l'intervalle de tolérance surtout).
* Comme intervalle de contrôle en SPC (statistical process control = contrôle statistique des procédés).

Il est utilisé avec d'autres outils : Cp, Cpu, Cpm , etc.

Cordialement

emiemar · February 2006

Merci à tous pour vos réponses.

J'ai une question subsidiaire :

Qu'est-ce qui différencie la variance de l'écart-type ?
Est-il intéressant de les comparer ?

Je pensais faire à partir de mes données deux courbes. Une qui représente les moyennes, une autre qui représent les variances. Et ceci afin de voir si l'écart par rapport à la moyenne est important. Qu'en pensez-vous ?

Merci.

GERARD5 · February 2006

Ce qui différencie la variance de l'écart type, tu le sais, c'est que l'une est le carré de l'autre.
De plus, la variance est difficile à utiliser avec la moyenne, elle n'a pas la même unité (si les données sont en m, la moyenne est une longueur, la variance une surface; C'est pour ça qu'on prend sa racine carrée).

Par contre, je ne saisis pas la fin de ton message : Tu as une série de séries de données, avec pour chaque série de données une moyenne et une variance ?

Cordialement

emiemar · February 2006

"Tu as une série de séries de données, avec pour chaque série de données une moyenne et une variance ?"

Oui.

Voici un exemple :

Pour un level = 0.1, j'ai les résultats suivants :

nbMess moyenne écart-type variance

10 9 1,78 3,16
6
12
9
9
8
7
11
9
11

Pour un level = 0.2, j'ai les résultats suivants :

nbMess moyenne écart-type variance

22 21 3,56 12,64
15
15
26
22
20
20
24
18
24

... et ainsi de suite pour level = 0.3, level = 0.4, jusqu'à level = 1

GERARD5 · February 2006

Et que veux-tu en faire, que veux-tu découvrir ?

el tyrano0 · February 2006

Merci Muaddob, c'est juste l'info qu'il me fallait! (cf. Post fermé)

Kuja · February 2006

La méthode du six sigma, je trouve ça quand même à la limite de l'escroquerie ...

muaddob · February 2006

Pourquoi ?
Gerard : je vois pas pourquoi 6 sigma serait restreints aux variables gaussienne (sigma existe dans tous les cas).

Kuja, je ne comprends pas ta remarque ?

On cache discrètement sous le facteur 6 ce qu'en d'autres temps on appelait coefficient de sécurité, mais on peut arriver à formuler des problèmes en termes de 6sigma, qu'on a du mal à faire en terme de coeff de sécurité.

Enfin, je connais surtout DFSS (design for six sigma) et en particulier dedans la partie robust design, et je trouve pas ça absurde du tout.

Cordialement

emiemar · February 2006

Ce qui m'intéresse, c'est de voir si l'écart par rapport à la moyenne est important. Autrement dit, j'aimerai voir sur un seul graphique les moyennes et les écarts. Pour info, j'utilise Excel.

Vous avez des suggestions pour tirer au mieux profit de mes données, en termes d'analyse ?

Kuja · February 2006

Evidemment le sigma existe toujours.
Mais comme l'a fait remarquer Gérard, toute borne ou coefficient de sûreté ou que sais-je basé sur un résultat faisant intervenir un intervalle centré sur la moyenne et de largeur six sigma suppose que la loi est approximativement normale.
Je n'ai pas fait le test, mais je suppose que les résultats obtenus en utilisant le "six sigma" sur des données issues d'une loi lognormale par exemple doivent être catastrophiques.

GERARD5 · February 2006

Salut emiemar.

Une idée graphique, facile à réaliser sous excel est de représenter "à la physicien" la courbe des moyennes, encadrée par les deux courbes moyenne + écart-type et moyenne - écart-type. Ce que les physiciens font aussi en représentant une série de mesures sur un phénomène par un intervalle (une barre verticale) basé sur moyenne + écart-type et moyenne - écart-type. Excel fait peut-être cela aussi.

Cordialement

GERARD5 · February 2006

Kuja : j'ai fait un test rapide avec Excel : on est effectivement très loin des 99,74% de la loi normale dans un intervalle de 6 sigma autour de la moyenne d'une loi lognormale. En contrôle de processus, la première étape est normalement de s'assurer que les valeurs contrôlées sont à peu près gaussiennes.
Il y a une mode du 6 sigma qui étend ceci sans précaution. Mais j'ai vu pire : des logiciels de SPC qui ne permettent pas de s'assurer que la production est sous contrôle, c'est à dire que la répétabilité des mesure est satisfaisante. Dit encore autrement, on ne connaît pas la moyenne qu'on veut contrôler !

Cordialement

Kuja · February 2006

Bonjour Gérard,

Merci d'avoir fait le test, mais ça ne m'étonne pas. Toute loi de densité non symétrique mettra en échec la méthode de la même manière, et même si elle est symétrique, on peut encore avoir des surprises (je pense notamment à une loi bêta).

Sinon, je suis consterné par les remarques que tu donnes. As-tu une explication pour le développement de telles démarches "à l'aveuglette" ?

Amicalement,

GERARD5 · February 2006

Je n'ai qu'une explication : les effets de mode dans l'industrie et le commerce. J'ai connu (1960) le "tout automatique", le "tout robot" (1970), l'ordinateur qui règle tout (1980), la qualité totale (1990), j'en passe et des meilleurs.
Par contre, les patrons et ingénieurs raisonnables ont développé des démarches raisonnables et sont toujours efficaces.

Cordialement

muaddob · February 2006

j'en vois une autre:
quand le sage montre la lune avec le doigt, l'imbécile regarde le doigt.

les masse sont imbéciles ... et 6 sigma est le doigt de la méthode sur l'idée d'adopter une approche statistiques aux process, et faire remonter à l'ensemble de la chaine de l'entreprise (jusqu'au marketing).

Gerard avec tout le piquant qu'on lui connait, à dessiner un tableau de doigts, plutôt qu'un tableau de lunes...

"6 sigma" est un slogan avant tout !

Cordialement

PS: il y aura toujours des imbéciles qui suivent les doigts: moralité pointer alternativement la lune et le sol, et vous aurez une foule d'acquiescements

jctout · February 2006

Tiens, une question: pour les concours, y a-t-il une fourchette d ecart-type à ne pas franchir ?
Et quand on est prof en lycée, quelle fourchette d' écart-type doit-on avoir ? Ou du moins à partir de quand doit-on s'inquiéter (par ex, un ecart-type de 4 peut être le signe d un Ds trop dur par exemple).

Richard André-Jeannin2 · February 2006

Si le DS est vraiment très dur, tout le monde a 0 et l'écart-type est nul.

Le Furet · February 2006

J'ai régulièrement des écarts-type supérieurs à 5 en 2nde. Ce n'est pas vraiment à ça que je vois qu'un devoir est trop dur.

GERARD5 · February 2006

Pour jctout : J'ai fait passer des concours, et les consignes de notes étaient au contraire faites pour augmenter l'écart-type. En effet, il est nécessaire d'étaler les résultats pour éviter d'avoir des notes finales identiques à la fin de la liste des admis. Si 10 candidats ont la même note et que 2 doivent être admis et 8 recalés, comment les choisir, alors qu'ils n'ont pas été jugés à l'oral par le même jury ?
Donc on avait des consignes qui reviennent à mettre de très bonnes nots (17 ou plus) aux très bons candidats, et des très mauvaise (2 ou 3) aux plus mauvais candidats.

L'écart-type n'a par contre rien à voir avec la difficulté d'un problème. Il peut éventuellement donner une idée de la progressivité des difficultés.

Cordialement

nz · October 2010

Bonsoir à tous,
j'ai trouvé cette règle sur l'écart-type fort et faible et je voudrais savoir si elle est correcte ou dans quel cas elle est valable?
Un écart-type fort> moyenne/2
un écart-type faible<moyenne/2
exp: ecart-type= 0,20< m=70/2
Merci

gerard0 · October 2010

Bonjour.

Dans quel contexte ?

Car si la moyenne est nulle, il n'y a pas d'écart type faible. Or pour toute série statistique ou variable aléatoire, on peut facilement passer à une moyenne nulle (soustraire la moyenne). Et on le fait souvent.

dans un cadre général, c'est une règle idiote. Pour certaines situations, ça a peut-être un sens.

Cordialement.

christophe c · October 2010

Tiens (je rep à quelques posts plus hauts) j'aurais vu un écart type élevé sur un DS un signe qu'il est bien fichu moi, c'est marrant.

gerard0 · October 2010

Tu sais, Christophe,

mes plus heureuses années étaient lorsque j'avais un écart type petit parce que la moyenne était forte (moyenne de classe de première F1 à 13, avec peu de moyennes inférieures à 10 - comme quoi la constante macabre d'Antibi n'est pas une obligation).

J'ai peur que cette idée d'écart type fort ou féaible ne soit qu'une rationalisation sans fondement.

Cordialement.

nberezina · October 2010

Pour en revenir à la première question: effectivement, l'écart-type tel quel ne veut rien dire si on ne le met pas en rapport avec la moyenne. C'est pourquoi lorsqu'on a besoin de la significaiton physique des résultats, en général on parle du pourcentage d'erreur = (écart-type / moyenne) x 100, ce qui permet de mieux comparer la dispersité des résultats obtenus, par exemple, avec dux méthodes d'analyses différentes ou sur des séries différentes etc.

Pour la représentation graphique, il n'y a pas de prblèmes non plus, on peut afficher les barres d'erreurs sur les valeurs du graphe en moyenne, la fonction existe dans Exel (cliquer sur la courbe et ouvrir l'onglet barre d'erreurs).

Pour les DS, encore une fois tout dépend de la moyenne, si elle de 5 avec un écart-type de 5, c'est qu'il a été trop dur, si elle est de 10 avec le même écart-type c'est qu'il a été bien et si elle est de 15 c'est qu'il a été trop facile, ou alors le profésseur et les élèves ont été excellents

gerard0 · October 2010

Bonjour Nberezina.

Le point de vue que tu développes est celui du praticien qui ne travaille qu'avec des nombres positifs. Mais même dans ce cas, l'interprétation d'un coefficient de variation est délicate, sauf contexte précis.
D'ailleurs tu trahis le contexte qui t'est habituel puisque tu parles de "pourcentage d'erreur", ce qui veut dire que tu ne pratiques ce genre de calculs que dans le domaine de la mesure.

Pour les notes, inutile de fabriquer des règles abstraites face à des situations aussi dissemblables (même dans des classes de même niveau du même établissement pour la même matière).

Cordialement.

nberezina · October 2010

Bonjour Gérard,

tout a fait d'accord pour le côté praticien

Par contre je n'ai pas compris pourquoi cette approche est uniquement valable pour les nombres positifs?

Sinon pour le terme "pourcentage d'erreur" on peut le remplacer aussi par le "pourcentage d'incertitude", globalement il s'agira de toute manière de baser la fiabilité du résultat sur sa réproductibilité (qu'il s'agisse de l'appareil de mesure ou de l'expérience dans son ensemble).

Cordialement,

PS: les notes ce n'est effectivement pas mon domaine

gerard0 · October 2010

pourquoi cette approche est uniquement valable pour les nombres positifs?

Parce que cette notion n'existe pas si la moyenne est nulle (j'en avais parlé !). Ou même quasi nulle (prends la série -10, -9, -1, 9, 10).

Sinon pour le terme "pourcentage d'erreur" on peut le remplacer aussi par le "pourcentage d'incertitude"

Mais ça ne change rien à ma remarque : Un économiste qui traite les statistiques de l'INSEE ou un financier qui veut modéliser les cours de la bourse n'ont pas à priori d'erreur ou d'incertitude. La variabilité n'est pas nécessairement une imprécision. Elle est même souvent une base de la statistique (cycles saisonniers du chômage). C'est pour ça que je disais que tu trahissais ta propre pratique étroite (ce n'est pas une critique, seulement une constatation). Et la suite me le confirme. Or je crains que nz (si ce n'est pas toi) ne fasse pas des statistiques dans le même domaine : La règle de comparaison à 0,5 me semble tellement malsaine en calcul d'erreur ...

Cordialement.

nberezina · October 2010

Re-bonjour,

j'étais partie sur l'idée que si ce n'étais pas positif cela pouvait être négatif et là je ne voyais pas de différence, je n'avais pas compris que vous parliez d'une moyenne nulle, désolée...

pour les termes, c'est vrai que j'ai sans doutes l'habitude d'une approche plus expérimentale, et même pour les variations saisonnières du chômage je le ressens plutôt comme une incertitude, 3 millions à plus ou moins 20000 près pour moi sonne de la même façon que le taux de l'arsenic à 400 ppm à plus ou moins 5 près

mais c'est sans doutes une déformation proféssionnelle.

par contre dans ma pratique des statistiques j'ai besoin d'additionner des valeurs expérimentales et là j'ai un problème sur les écart-types, si je fais C = A + B à quoi est égal l'écart type de C en fonction de celui de A et B?
j'ai posé cette question il y a quelque temps sur ce forum mais personne m'a répondu, c'est bête? trivial? il y a quelque chose d'évident que je ne vois pas?

Merci,

Cordialement

gerard0 · October 2010

Tu as effectivement une vue déformée. les variations saisonnières sont régulières, pas les erreurs expérimentales.

par contre dans ma pratique des statistiques j'ai besoin d'additionner des valeurs expérimentales et là j'ai un problème sur les écart-types, si je fais C = A + B à quoi est égal l'écart type de C en fonction de celui de A et B?

Bizarre que personne ne t'ai répondu, car c'est classique : L'écart type sur C dépend des écarts types sur A et B et de la liaison (corrélation) entre A et B. La formule est classique :
Var(A+B)= Var(A)+Var(B)+2 cov(A,B)
De plus elle s'obtient facilement à partir de la linéarité de la moyenne (ou de l'espérance s'il s'agit de variables aléatoires).
Pour des variables indépendantes, cov(A,B)=0.

Cordialement.

nberezina · October 2010

Merci beaucoup!

j'ai essayé de passer par l'écart type, alors que c'est tellement plus simple de faire les équations avec la variance et d'extraire la racine par la suite! manque de pratique se fait sentir

tout parait très simple une fois qu'on vous l'a expliqué...

encore merci,

cordialement

gerard0 · October 2010

En fait, le bon outil est la variance. L'écart type n'a d'intérêt que dans sa comparaison avec la moyenne (ou d'autres caractéristiques) car il a la même unité qu'elle.

Cordialement.

Kevin42 · February 2011

Bonjour
J'ai un écart type de 0.22 et une moyenne de 1.92, j'ai établi un modèle gaussien sur excel qui me permet de voir les variation de l'un par rapport à l'autre. Je dois proposer à mon responsable une solution moins couteuse pour la maitrise notre processus.

Est-il couteux de baisser ma moyenne ou mon écart type ? En sachant que mon but est d'élever ma fréquence de 10%.
Merci

gerard0 · February 2011

Bonjour.

Est-il couteux de baisser ma moyenne ou mon écart type ?

Comment veux-tu qu'on sache ?
A ton avis, un morglub est il plus coûteux qu'un stromblich ?

En sachant que mon but est d'élever ma fréquence de 10%.

Ta fréquence cardiaque ?

Bon, arrête de rêver : Ce n'est pas en calculant que tu changeras la réalité. Donc explique vraiment ton problème (réalité, lien avec le modèle, lien avec le coût et la fréquence -de quoi au fait ?-, etc.) et on pourra peut-être t'aider.

Cordialement

carpediem · May 2011

Bonjour,
svp de m'indiquer comment interpreter la faiblesse ou la force d'un écart-type. y a t-il des echelles ou en utilisant le pourcentage d'erreur. si tel est le cas, me dire si il y existe une echelle normative qui puisse etre utilisé pour interpreter l'ecart type utilsé. Ma moyenne est de 310 et l'ecart-type est de 12,38. est il elevé ou faible ? mais ce que je savoir c'est comment porter ce genre de jugement.

Merci de me répondre.

gerard0nl · May 2011

Bonjour.

La première chose à faire quand on pose la question qui est le titre d'un fil de discussion est de lire le fil depuis le début. On ne va pas te récrire ce qui y est déjà.
Donc quand tu l'aura lu, et s'il te reste une vraie question, reviens la poser.

Cependant ta question "12,38. est il elevé ou faible ?" n'a pas de réponse. Si quelqu'un t'avait demandé si 12,38 est grand ou petit, qu'aurais-tu répondu ? C'est exactement ta question !

Cordialement.

jamesly · May 2011

Salut
Si on a le revenus moyen et l'écart type d'un pays A et le revenu moyen et l'écart type d'un pays B et on demande dans quel pays les revenus sont plus homogènes ?
Est-ce qu'on doit déterminer le coefficient de variation ? Si oui comment saura-t-on que tels revenus est plus homogènes par rapport aux autres ?
Merci

gerard0 · May 2011

Bonsoir Jamesly.

Aucun moyen de répondre à la question "dans quel pays les revenus sont plus homogènes ? " sans avoir de définition de "homogène". L'une des définitions classiques est le rapport entre le premier et le dernier décile. Plus ce rapport est faible, plus on considère que les revenus sont homogènes. Mais alors rien à voir avec l'écart type. Une autre est l'analyse de la concentration (indice de Gini, etc.). Encore une fois, rien à voir avec l'écart type. le coefficient de variation serait une idée, mais assez peu satisfaisante. je te laisse imaginer comment on pourrait l'exploiter (c'est du sens commun). Rappel : l'écart type est une mesure de la dispersion des valeurs.

Cordialement.

Hugot · May 2012

Bonjour dans la cadre d'une analyse de données de 3919 clients j'ai calculé sur la variable étudiés la moyenne 1.87 et l'écart type qui est de 0.79 calculé via la formule écart type d'excel. Peut ton dire que les observations sont dispersés ou au contraire qu'elle sont proche de la moyenne?

gerard0 · May 2012

Bonjour.

Si à 10 de plus ou dix de moins, on est proche, tes données sont très proches de la moyenne. Si à 0,2 de plus ou de moins, on est loin, tes données sont très dispersées, souvent loin de la moyenne.

Dans l'absolu, "proche" ne veut rien dire. Vu d'Europe, les chutes du Niagara sont proches de Detroit ou Ottawa. Une fois sur place, tu trouveras que c'est loin !!

Donc ce type de qualificatif ne peut être donné que par rapport à un autre cas identique, ou une habitude.

Cordialement.

youplala · May 2012

Moi aussi j'ai une question ^^

Je voudrais savoir s'il y a un intérêt de calculer l'écart-type et la moyenne de ses gains par partie de poker ? Pour la moyenne, je pense que oui afin d'estimer notre espérance de gain mais pour l'écart-type je ne vois pas du tout à quoi cela peut servir puisque je ne compare pas cet écart-type à une autre série (résultat d'un autre joueur).

gerard0 · May 2012

Bonjour.

C'est une façon de faire des statistiques. Es-ce utile ? Pour certains joueurs, oui, ça les rassure.
Par contre, je ne connais pas de théorie qui puisse permettre d'en déduire ce qui se passera demain.

Cordialement.

ev · May 2012

Gérard a écrit:

Par contre, je ne connais pas de théorie qui puisse permettre d'en déduire ce qui se passera demain.

C'est pourtant simple !

amicalement,

e.v.

gerard0 · May 2012

(tu)

youplala · May 2012

pour le poker y'a ca:
http://www.evplusplus.com/poker_tools/variance_simulator/

J'avoue ne pas comprendre l'utilité de ce truc. J'y mets mon "winrate" (donc incluant la variance dut aux multiples variable qui font le jeu du poker) et je rajoute en plus la SD (standard deviation) de ce même winrate.

Cela a-t-il en sens de faire ce genre de simulation ? J'avoue ne pas comprendre.

Edit: je n'arrive pas non plus à comprendre l'utilisation de ces types de graph pour représenter les résultats. De plus, aucune indication n'est donné sur la probabilité d'avoir ces résultats simulés. C'est moi qui ne comprends rien ou y'a un loup dans leur simulation ?

interpréter l'écart-type ?

Réponses

Lettre d'information