ebook img

13 erreurs, moyennes et ajustements PDF

14 Pages·2006·0.73 MB·French
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview 13 erreurs, moyennes et ajustements

13 ERREURS, MOYENNES ET AJUSTEMENTS Dans ce chapitre on propose un ensemble d’informations essentielles sur la manière d’analyser les erreurs de mesures, et de traiter un grand nombre de données. On présente tout d’abord une discussion sur les « erreurs » et ensuite la manière d’estimer la probabilité que le résultat final est juste. 13.1 ERREURS Dans les dictionnaires, le mot erreur est défini comme la différence entre une valeur approximative – résultat d’une observation ou d’une mesure, ou d’un calcul – et la valeur réelle. Le problème est qu’en général nous ne connaissons pas la “vrai valeur”, dans la mesure où il s’agit généralement du résultat d’une mesure ou d’un calcul. C’est pourquoi, il faut trouver une manière d’estimer la « fiabilité » de notre résultat. Le terme “erreurs” n’est pas très précis en tant que tel. Nous devons donc être plus explicite sur sa définition. Les erreurs peuvent être classés de la manière suivante: 1) Les bévues ou fautes de mesure ou de calcul sont généralement évidentes car elles produisent des résultats éloignés de ce qui est attendu. Elles doivent être corrigées en repentant la mesure ou le calcul. 2) Les erreurs systématiques sont plus difficiles à détecter. Ce sont des différences reproductibles, souvent le résultat d’un mauvais fonctionnement du matériel ou d’une insuffisance mathématique conséquente. Elles doivent être détectées (et corrigées en conséquence) en répétant la mesure avec un matériel différent ou en refaisant le calcul (avec l’aide d’un collègue ou avec une méthode différente). 3) Les erreurs aléatoires sont les plus fréquentes. Elles sont le résultat de la qualité inévitablement limitée de nos instruments. Elles peuvent être seulement partiellement corrigées en perfectionnant le matériel ou la méthode analytique, et en répétant les mesures (comme la lecture de la température ou du pH) ou en augmentant la durée de l’observation (par exemple, de la radioactivité). 13.2 PRECISION ET EXACTITUDE 13.2.1 DEFINITIONS Il est important de distinguer précision et exactitude. 243 Chapitre 13 1) La précision d’un résultat est la mesure de la reproductibilité d’une observation, dans quelle mesure un résultat peut être déterminé correctement, indépendamment d’une référence à la vraie valeur. L’ ”erreur” associée correspond mieux à l’incertitude d’un résultat. 2) L’exactitude est l’estimation de la justesse d’une observation, dans quelle mesure le résultat est proche de la “vraie” valeur. Les deux définitions que nous avons données sont liées. • La précision est une estimation de l’importance des erreurs aléatoires. Si on est capable de réduire les erreurs aléatoires, par exemple, avec un meilleur matériel ou une meilleure procédure, la précision de la mesure sera meilleure, le résultat sera plus précis, et l’analyse sera davantage reproductible. Augmenter la précision en réduisant les erreurs aléatoires est l’objectif de tous les laboratoires. • D’autre part, une erreur systématique a un effet direct sur l’exactitude de la mesure; éviter ou éliminer les erreurs systématiques permet d’obtenir des résultats plus précis et dignes de confiance. Augmenter l’exactitude des résultats est souvent l’objectif des inter comparaisons internationales entre plusieurs laboratoires qui analysent le même jeu d’échantillons, et en utilisant régulièrement des standards. Pour étudier et éventuellement réduire les erreurs systématiques il est important de disposer de données avec des erreurs aléatoires faibles, avec une précision relativement forte. D’autre part, il est inutile de faire beaucoup d’efforts pour augmenter la précision, si l’erreur systématique est forte. La Fig.13.1 illustre la différence entre précision et exactitude. 13.2.2 NOMBRES ET CHIFFRES SIGNIFICATIFS Quand on présente des valeurs numériques on a l’habitude d’indiquer l’incertitude sous forme de nombres et de chiffres. Si on indique une distance de 5000 km, il est habituel de ne considérer que les chiffres les plus à gauche. Cependant, si on est sur du chiffre suivant (le O le plus à gauche), il vaut mieux écrire 5.0×103 km. En général, il est préférable d’écrire les nombres en notation scientifique, i.e. une présentation en notation décimale avec plusieurs chiffres, multipliés par une puissance de 10. Le chiffre le plus à droite renferme l’incertitude. En règle générale la précision de l’incertitude (i.e. le degré de certitude de l’incertitude ne dépasse pas 10% de l’incertitude. Par exemple, si la radioactivité d’un échantillon est mesurée à 13.56 Bq, on peut avoir une incertitude de 13.56±0.12 ou 13.56±0.08, mais indiquer un chiffre supplémentaire comme 13.56±0.081 exagérerait la « certitude de l’incertitude ». L’incertitude détermine aussi le nombre de chiffres indiqués. Par exemple, il est correct de noter 13.56±0.12 Bq, mais ça n’a pas de sens d’écrire 13.564±0.12 Bq. Lors des calculs avec l’ordinateur tous les chiffres doivent être conservés; on arrondit seulement le résultat final. Néanmoins, les résultats obtenus au cours d’un calcul 244 Erreurs, Moyennes et Ajustements intermédiaire doivent être écrits avec un nombre de chiffres qui se justifie. Le calcul complet doit, cependant, être effectué sans arrondis intermédiaires. Fig.13.1 Exemple pour illustrer la précision et l’exactitude, montrant deus séries de résultats à partir de 19 mesures de la même radioactivité. A. Les données sont imprécises mais exactes, donnant la valeur moyenne correcte de 13.56 Bq. La zone grisée correspond à 1σ de niveau de confiance; i.e. 68% odes données devraient se trouver dans cet intervalle (exemple dans la Part.13.5.2). B. Les données sont précises, mais inexactes probablement du fait d’une erreur systématique, la valeur moyenne étant maintenant 13.50 Bq, au lieu de la « vrai » valeur de 13.56 Bq. 13.2.3 INCERTITUDES Il y a deux catégories différentes d’incertitudes. 1) Les incertitude instrumentales, dues à la fluctuation du résultat de toute observation instrumentale, que ce soit la mesure de la température extérieure, la mesure du poids d’une lettre sur une balance, ou l’utilisation d’un équipement spécial pour mesurer le temps le temps en laboratoire. Une estimation de l’importance de l’incertitude peut être obtenue à partir d’une « supposition éclairée », ou en renouvelant la mesure et en observant la distribution des résultats. 245 Chapitre 13 2) Les incertitudes statistiques, dues au fait que certains processus, même théoriquement montrent des fluctuations. La décroissance radioactive est un exemple caractéristique. Même un équipement idéal (qui n’existe pas) observerait des fluctuations dans la mesure de l’activité, ou une dispersion « statistique des résultats ». Dans de tels cas, des procédures existent pour déterminer l’incertitude au-delà du doute. 13.3 INCERTITUDES INSTRUMENTALES 13.3.1 VALEURS MOYENNES La valeur moyenne résultant d’un grand nombre de mesures est définie comme la somme des résultats divisé par le nombre de mesures: 1 N x ≡ ∑xi ≡ (x1 +x2 +x3 +L+xN)/N (13.1) N i=1 N est le nombre de mesures, i représente le nombre de séries d’une mesure quelconque et x le paramètre mesuré. On ignore souvent N et i = 1, pour écrire simplement Σx. i Le nombre de mesures est toujours limité. Cependant, si on peut augmenter ce nombre à l’infini, on obtiendra une meilleure valeur de la moyenne, définie alors ainsi 1 µ ≡ lim ( ∑x ) (13.2) i N→∞ N La médiane est maintenant définie comme la valeur d’un jeu de données en dessous de laquelle se situent la moitié des mesures, l’autre moitié étant plus élevée que la médiane. Dans le cas d’une distribution symétrique la moyenne et la médiane sont équivalentes. Nous utiliserons un peu plus loin la déviation (écart) d’un résultat par rapport à la moyenne (ou la médiane), ⎯x − x; par définition l’écart moyen des résultats par rapport à la valeur moyenne i est égal à zéro : ______ 1 N 1 1 xi−x = N ∑(xi −x) = N∑xi − NNx = x−x =0 (13.3) i=1 13.3.2 DISTRIBUTION DES DONNÉES Les résultats d’un grand nombre de mesures peuvent être présentés sous forme d’un histogramme, graphe indiquant le nombre de fois (axe des y) que les résultats indiqués sur l’axe des x ont été obtenus (Fig.13.2). 246 Erreurs, Moyennes et Ajustements Fig.13.2 Histogramme (en forme de bloc), indiquant la distribution irrégulière des résultats de mesures dans x i.e. entre x et x + ∆x autour d’une valeur moyenne; on donne les i(∆x) i i écarts autour de la valeur moyenne (⎯x ) plutôt que la valeur réelle en fonction du nombre d’observations (axe des y) pour des valeurs comprises dans un certain intervalle. La courbe régulière représente la distribution gaussienne, qui est le résultat supposé d’un nombre infini de mesures. Elle représente aussi la distribution de probabilité (P) des données autour de la valeur moyenne. Les écarts à la moyenne sont donnés en terme de déviation standard (σ). En haut du graphe on a indiqué l’intégrale ou la somme des probabilités: la probabilité d’observer des valeurs entre ⎯x + σ et ⎯x − σ est de 68 %, entre ⎯x + 2σ et ⎯x − 2σ de 95 % et enfin entre x + 3σ et x − 3σ de 99.7 %. Il est évident que la probabilité d’obtenir, par la suite, des résultats éloignés du résultat le plus fréquent est de moins en moins forte. L’histogramme (ou bloc diagramme) constitué de colonnes représentant le nombre de fois (N) que les résultats x dans un certain intervalle i i(∆x) x et x + ∆x a été observé, correspond à la distribution des échantillons. La valeur moyenne i i est: 1 x = ∑N x i i(∆x) N i et (13.4) N = ΣN i 247 Chapitre 13 Si lorsqu’on construit l’histogramme, on donne à ∆x ou la largeur de la classe une taille trop forte, Presque toutes les données peuvent se trouver sur une seule colonne, suggérant une bonne certitude statistique, mais une mauvaise résolution; si ∆x est choisi trop petit on augmentera la résolution, mais peu de données tomberont dans la même colonne et la fiabilité sera faible (histogramme dispersé). Plus on aura de mesures, meilleure sera l’impression de distribution des données autour d’une certaine valeur moyenne. Pour un nombre infini de résultats avec des erreurs aléatoires la distribution des échantillons est représentée par une distribution en forme de cloche normale ou Gaussienne, sur laquelle la probabilité d’observer une valeur de y = y à x = x est: i i ⎧ 2⎫ 1 ⎪ 1⎛y −f(x )⎞ ⎪ Pi = exp⎨− ⎜⎜ i i ⎟⎟ ⎬ (13.5) σi 2π ⎪⎩ 2⎝ σi ⎠ ⎪⎭ y est la valeur mesurée de la variable dépendante y, f(x) est la valeur de y calculée pour la i i valeur de la variable dépendante x, σ est la déviation standard de y, que l’on définira plus i i i loin. La valeur la plus probable que l’on observera, le mode, correspond au pic de distribution, i.e. le haut de la courbe lissée. Pour les données avec des erreurs aléatoires la distribution est symétrique autour du sommet. La Fig.13.2 montre la courbe de Gauss avec l’histogramme issu d’un nombre limité de mesures. 13.3.3 DÉVIATION STANDARD 13.3.3.1 PRÉCISION DES DONNÉES Il est évident que si les erreurs aléatoires sont faibles, les valeurs de la déviation (x −⎯x) sont i petites et la distribution des résultats autour de la moyenne sera plus resserrée. La déviation moyenne est une mesure de l’étendue des données autour de la moyenne, ce que l’on appelle la dispersion du jeu de données. L’ Eq.13.3 a montré que l’on ne peut pas utiliser la simple moyenne de toutes les déviations, une conséquence de la définition de la moyenne. La moyenne des valeurs absolues des déviations, i.e. indépendamment de leur signe, caractérise mieux la dispersion : ____ 1 d ≡ ∑ x −x (13.6) i N Pour des raisons mathématiques cependant, utiliser les valeurs absolues n’est pas approprié. C’est pourquoi, on prend les carrés des déviations pour caractériser la distribution. La valeur ainsi obtenue est appelée la variance: ⎡1 ⎤ ⎛ 1 ⎞ σ2 ≡ lim ∑(x −µ) = lim ⎜ ∑x2⎟−µ2 (13.7) N→∞⎢⎣N i ⎥⎦ N→∞⎝N i ⎠ 248 Erreurs, Moyennes et Ajustements La variance est ainsi la moyenne des carrés moins la carré des moyennes. La mesure quantitative des erreurs aléatoires, i.e. de la dispersion statistique des données autour de la moyenne, ou en d’autres termes de la précision est alors donnée par la déviation standard σ, qui est la racine carré de la variance. Plus la déviation standard est petite, meilleure est la précision, et plus la courbe de Gauss est resserrée. Si nous considérons maintenant le jeu réel des mesures, la déviation standard de ce jeu est: 1 σ ≡ ∑(x −x)2 (13.8) i N−1 Le fait que l’on mette N−1 au lieu N en dénominateur est discuté dans les textes classiques sur l’analyse statistique. Cette nécessité peut être évaluée en considérant le cas extrême d’une seule mesure. Une seule mesure ne peut pas donner une idée de la précision de la mesure. C’est pourquoi, la fraction ne peut pas être un nombre réel. Les calculateurs de poche récents peuvent calculer⎯x σ. Des niveaux de confiance variés sont indiqués sur la Fig.13.2. La probabilité qu’un résultat aléatoire d’une mesure se situe entre⎯x + σ⎯x − σ est calculée à 68%. Ceci revient à dire qu’une nouvelle mesure fournira un résultat compris entre ±σ de la moyenne : la déviation standard est le niveau de confiance 68%, 2σ est le niveau de confiance 95%, et 99.7% correspond au niveau de confiance 3σ. 13.3.3.2 PRÉCISION SUR LA MOYENNE La discussion précédente a porté sur la précision des données, caractérisée par la déviation standard. Il est également important de reporter l’incertitude dans le résultat final d’un grand nombre de mesures. C’est pourquoi, on doit calculer la précision de la valeur moyenne ou, plus spécifiquement, la déviation standard de la moyenne. Ci-dessous nous allons discuter brièvement de la propagation des erreurs; i.e. l’incertitude globale obtenue à partir de nombreux résultats, chacun ayant sa propre incertitude. La conclusion est que la variance de la moyenne est la variance du jeu de données divisée par le nombre de mesures : σ 2 1 σ 2 = xi = ∑(x −x)2 (13.9) x N N(N−1) i La déviation standard de la moyenne est alors: σ 1 σ = xi = ∑(x −x)2 (13.10) x N N(N−1) i 249 Chapitre 13 A titre d’exemple nous calculerons la moyenne et les déviations standards pour les données indiquées sur la Fig.13.1A et le Tableau 13.1. On suppose que toutes les données ont la même incertitude/précision. Tableau 13.1Jeu de données correspondant à la Fig.13.1A. Nr. x x −⎯x Nr. x x −⎯x Nr. x x −⎯x i i i i i i 1 13.55 −0.01 8 13.40 −0.16 15 13.45 −0.11 2 13.45 −0.11 9 13.56 +0.00 16 13.62 +0.06 3 13.57 +0.01 10 13.52 −0.04 17 13.74 +0.18 4 13.68 +0.12 11 13.51 −0.05 18 13.65 +0.09 5 13.63 +0.07 12 13.63 +0.07 19 13.45 −0.11 6 13.47 −0.09 13 13.52 −0.04 7 13.69 +0.13 14 13.55 −0.01 Moyenne ⎯x = 13.56 Déviation standard σ = √{Σ(x − 13.56)2}/18 = ±0.095 x i σ de la moyenne = σ /√19 = ±0.022 x 13.4 INCERTITUDES STATISTIQUES Les incertitudes statistiques, définies dans la Part.13.2.3, proviennent des fluctuations aléatoires du nombre d’événements, par exemple le nombre de désintégrations radioactives par unités de temps, plutôt que d’une précision limitée des instruments de mesure. Pour ces fluctuations statistiques la théorie des statistique fournit une technique mathématique pour décrire la distribution des données et la déviation standard. Le résultat est que la déviation standard de plusieurs comptages M détectés durant un intervalle de temps t est simplement : σ = √M (13.11) Pour un taux de comptage R, i.e. le nombre de coups par seconde, la déviation standard est alors: 1 1 R σ = M = Rt = (13.12) R t t t L’incertitude relative du taux de comptage est donnée par: 250 Erreurs, Moyennes et Ajustements σ 1 R = (13.13) R Rt Il est évident que la précision relative est meilleure si le taux de comptage est plus élevé et le temps de mesure plus long. Le cas des niveaux de confiance lorsqu’on observe les données avec les incertitudes statistiques est similaire à celui des incertitudes instrumentales comme nous en avons discuté dans la partie précédente. La probabilité pour qu’une valeur “réelle” observée sur une période de temps infinie se situe entre x + σ et x − σ de la valeur mesurée i i est de 68%: la déviation standard est le niveau de confiance 68%, 2σ est le niveau de confiance 95%, et 99.7% correspond au niveau de confiance 3σ. 13.5 PROPAGATION DE L’ERREUR 13.5.1 DÉVIATION STANDARD On veut souvent déterminer une quantité A qui est une fonction d’une ou plusieurs variables, chacune avec sa propre incertitude. L’incertitude de chacune de ces variables contribue à l’incertitude totale. Nous nous limiterons à donner les expressions mathématiques pour σ2 dans différents cas. Les équations repose sur la relation générale de la fonction : A = f (x, y, z) Dans le cas des incertitudes statistiques la déviation standard de A dépend des variables indépendantes x, y et z de la manière suivante: 2 2 2 ⎛∂A⎞ ⎛∂A⎞ ⎛∂A⎞ σ 2 =σ 2⎜ ⎟ + σ 2⎜ ⎟ + σ 2⎜ ⎟ (13.14) A x y ⎜ ⎟ z ⎝ ∂x ⎠ ⎝ ∂y ⎠ ⎝ ∂z ⎠ Si les incertitudes sont considérées comme instrumentales, des équations similaires doivent être utilisées pour calculer l’incertitude du résultat final. Pour la relation générale: A = f(x, y, z) avec les incertitudes instrumentales ∆x, ∆y et ∆z, l’incertitude en A est : 2 2 2 ⎛∂A⎞ ⎛∂A⎞ ⎛∂A⎞ ∆A2 = ∆x2⎜ ⎟ + ∆y2⎜ ⎟ + ∆z2⎜ ⎟ (13.15) ⎜ ⎟ ⎝ ∂x ⎠ ⎝ ∂y ⎠ ⎝ ∂z ⎠ débouchant sur les équations équivalentes pour ∆A et σ (Eqs.13.16-13.19). Dans ces A exemples a et b sont des coefficients, x et y sont des variables indépendantes, A la variable dépendante. 251 Chapitre 13 1) A = ax + by et A = ax − by avec les incertitudes σ et σ ; dans les deux cas: x y σ 2 = a2σ 2 + b2σ 2 (13.16) A x y 2) A = ± a xy et A = ± a x/y σ 2 σ 2 σ 2 A = x + y (13.17) A2 x2 y2 3) A = a e± bx σ /A = ± bσ (13.18) A x 4) A = a ln(± bx) σ = a σ /x (13.19) A x 13.5.2 MOYENNE PONDÉRÉE Jusqu’à présent lorsqu’on a calculé les valeurs moyennes, nous avons considéré que tous les nombres avaient la même précision et ainsi qu’ils avaient le même poids. Si on affecte à chaque à chaque nombre sa propre déviation standard, la moyenne doit alors être calculée de la façon suivante: x ∑ i σ 2 x = i (13.20) 1 ∑ σ 2 i tandis que la déviation standard de la moyenne est obtenue à partir de : 1 ⎛ 1 ⎞ = ∑⎜ ⎟ σ 2 ⎜σ 2 ⎟ ⎝ ⎠ x i ce qui donne: 1 σ = (13.21) x ∑(1/σ )2 i Le poids de chaque résultat est inversement proportionnel au carré de la déviation standard; 1/σ2 est appelé le facteur de pondération. Si les déviations standard σ sont égales, l’expression pour σ de la moyenne se réduit à i l’Eq.13.10: 252

Description:
d'abord une discussion sur les « erreurs » et ensuite la manière d'estimer la probabilité que le résultat final est juste. 13.1. ERREURS. Dans les
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.