1 Estimation des variations de production
1.1 Introduction
Un procédé de fabrication même lorsqu’il est sous contrôle connait des variations aléatoires (peu importantes).
Ces variations sont assignables aux 5M (voir figure ). La dispersion globale du procédé de fabrication notée \(D_G\) rend compte de ces fluctuations.
Lien vers le cours de Patrice Hardouin
- Les variations qui sont imputables aux machines sont particulièrement étudiées. On note \(D_M\) la dispersion due aux machines, on parle aussi de dispersion instantanée.
Il est clair que \(D_G \geq D_M.\)
1.2 Estimation de la dispersion globale
On suppose que les observations suivent une loi normale de moyenne \(\mu\) et d’écart type \(\sigma_G\). Cela permet de dire que la proportion théorique de données dans
\([\mu-\sigma_G,\mu+\sigma_G]\) est de 68.3 %,
\([\mu-2\sigma_G,\mu+2\sigma_G]\) est de 95.4 %,
\([\mu-3\sigma_G,\mu+3\sigma_G]\) est de 99.7 %.
Ainsi pour la dispersion globale on choisit \[D_g=6\sigma_G.\]
Pour l’estimation de \(D_M\) on prélève un échantillon à un instant donné (ainsi les variations sont uniquement dues à la machine) et on suppose là-encore que les valeurs sont distribuées selon une loi normale de moyenne \(\mu\) et d’écart type \(\sigma_M.\) Naturellement, la dispersion instantanée sera définie par \(D_M=6\sigma_M.\)
Les deux écarts types \(\sigma_M,\sigma_G\) sont inconnus, en pratique, ils vont être estimés de la façon suivante :
On note \(y_{ij}\) la valeur \(i=1,...,n\) de l’échantillon \(j=1,...,k.\)
Exemple : on prélève 25 échantillons de 5 unités de production. Les observations fluctuent autour de \(y=1\). Ces fluctuations sont aléatoires et peu importantes (\(\pm\) 5%).
Les données sont disponibles ici
Une estimation de \(\mu\) est \[\hat \mu=\overline{\overline{y}}=\frac 1{k} \displaystyle\sum_{j=1}^k \bar y_{j},\] et une estimation de \(\sigma_G\) est \[\hat \sigma_G= \sqrt{\frac{\displaystyle\sum_{j=1}^k\sum_{i=1}^n(y_{ij}-\hat \mu)^2}{n\times k-1}}.\] Dans l’exemple on a \(\hat \sigma_G=\) 0.02206.
1.3 Estimation de la dispersion instantanée :
Il existe plusieurs estimations possibles de \(\sigma_M\) :
la première est basée sur le calcul des écarts types des \(k\) échantillons prélevés.
la deuxième est basée sur le calcul des étendues des \(k\) échantillons prélevés.
Pour ces calculs on appliquera des coefficients de correction qui sont donnés en fonction de \(n\) dans le tableau suivant. Le coefficient \(d_2(n)\) correspond à l’espérance de l’étendue d’une loi normale centrée réduite et \(c_4(n)\) à l’espérance de l’écart type d’une loi normale centrée réduite. Ces valeurs peuvent très facilement être obtenues par simulation par exemple pour \(n=5\) :
<-5
n<-10^6
B<-rep(NA,B)
s<-rep(NA,B)
Rfor(b in 1:B){
<-rnorm(n)
X<-sd(X)
s[b]<-max(X)-min(X)
R[b]
}<-mean(s)
c4<-mean(R)
d2<-sd(R) d3
n | c4 | d2 | d3 |
---|---|---|---|
2 | 0.7971 | 1.1273 | 0.8513 |
3 | 0.8862 | 1.6924 | 0.8897 |
4 | 0.9214 | 2.0591 | 0.8791 |
5 | 0.9400 | 2.3262 | 0.8645 |
6 | 0.9514 | 2.5344 | 0.8486 |
7 | 0.9593 | 2.7046 | 0.8340 |
8 | 0.9643 | 2.8455 | 0.8195 |
9 | 0.9695 | 2.9704 | 0.8076 |
10 | 0.9730 | 3.0786 | 0.7969 |
1.3.0.1 Calcul basé sur les écarts types \(s_j\)
On sait pour chaque échantillon \(j\) de \(n\) valeurs calculer une estimation de l’écart type \(\sigma_j\) en calculant \[s_j= \sqrt{\frac{\displaystyle\sum_{i=1}^n(y_{ij}-\bar y_j)^2}{n-1}},\] où \(\bar y_j\) est la moyenne de l’échantillon \(j.\)
Dans l’exemple les premiers écarts types valent
sample | s_j |
---|---|
1 | 0.01560 |
2 | 0.01229 |
3 | 0.02588 |
4 | 0.01433 |
5 | 0.02207 |
6 | 0.02400 |
On pose \(\bar S =\frac{\sum_{j=1}^k s_j}{k}\) et alors une estimation de l’écart type instantané \(\sigma_M\) est donné par
\[ \hat \sigma_M=\dfrac{\bar S}{c_4} \] où \(c_4\) est donné dans la table 1.
On obtient \(\hat \sigma_M=\) 0.0228258
1.3.0.2 Calcul basé sur les étendues \(R_j\)
Pour chaque échantillon \(j\) on calcule l’étendue
\[ R_j=\max(y_{ij})-\min(y_{ij}) \]
On pose \(\bar R =\frac{\sum_{j=1}^k R_j}{k}\) et alors une estimation de l’écart type instantané \(\sigma_M\) est donné par
\[ \hat \sigma_M=\dfrac{\bar R}{d_2} \]
où \(d_2\) est donné dans la table 1.
Retour à l’exemple
sample | R_j |
---|---|
1 | 0.04128 |
2 | 0.02866 |
3 | 0.07048 |
4 | 0.03681 |
5 | 0.05540 |
6 | 0.06414 |
On obtient \(\hat \sigma_M=\) r
On constate que les estimations obtenues à partir de \(\bar R\) ou de \(\bar S\) sont proches.