Les plans d'expériences

Le comportement des produits industriels est généralement fonction de nombreux phénomènes, souvent dépendants les uns des autres. Pour prévoir ce comportement, le produit et les phénomènes sont modélisés, et des simulations sont effectuées ; la pertinence des résultats des simulations dépend de la qualité des modèles.

En particulier, dans le cadre de la conception ou reconception d'un produit, les modèles font généralement intervenir un certain nombre de grandeurs physiques que l'on s'autorise à modifier, appelées paramètres. Le problème du concepteur est alors de trouver les "bonnes" valeurs de ces paramètres, c'est-à-dire celles qui feront que le produit aura le comportement attendu ; cela nécessite d'identifier l'influence des paramètres sur la réponse du produit. Cela passe généralement par des études expérimentales, consistant à imposer différentes valeurs de ces paramètres et à mesurer les réponses obtenues.

Or, ces essais sont coûteux, et ce d'autant plus que le nombre de paramètres à faire varier est important. En effet, la modification d'un paramètre peut par exemple exiger un démontage et un remontage du produit, ou bien la fabrication de plusieurs prototypes différents (cas d'une pièce produite en série), ou encore l'interruption de la production pour changer d'outil (cas d'un process de fabrication)... Le coût d'une étude expérimentale dépend donc du nombre et de l'ordre des essais effectués.

Les plans d'expériences consistent à sélectionner et ordonner les essais afin d'identifier, à moindres coûts, les effets des paramètres sur la réponse du produit. Il s'agit de méthodes statistiques faisant appel à des notions mathématiques simples. La mise en oeuvre de ces méthodes comporte trois étapes :

  1. Postuler un modèle de comportement du système (avec des coefficients pouvant être inconnus) ;

  2. Définir un plan d'expériences, c'est-à-dire une série d'essais permettant d'identifier les coefficients du modèle ;

  3. Faire les essais, identifier les coefficients et conclure.

Exemple : afin d'illustrer les principaux concepts de la méthode, nous prenons l'exemple de la catapulte Statpult, commercialisée par NCMR Company (lien ici). Cette catapulte est représentée sur la Figure 1 ; elle permet de projeter des balles en plastique à l'aide d'un bras muni d'un bol. Son fonctionnement est le suivant :

  • on place une balle dans le bol ;

  • on accroche un élastique entre le mât, fixe, et le bras, pivotant ;

  • on tend l'élastique en reculant le bras jusqu'à un certain angle, appelé angle d'armement ;

  • on lâche le bras ;

  • l'élastique se détend, le bras est propulsé jusqu'à une butée, où sa course est stoppée ; la bille est alors éjectée du bol.

Figure 1 : La catapulte et ses différents réglages.

1. Modélisation

1.1. Facteurs et niveaux

La première étape consiste à recenser les paramètres du système. Ces paramètres correspondent à des grandeurs physiques du produit industriel, que l'on peut régler directement ou que l'on s'autorise à modifier lors d'une reconception (par exemple en fabriquant de nouveaux prototypes).

La seconde étape est de préciser les valeurs que l'on souhaite leur donner. Sur le produit réel, les paramètres peuvent varier de façon continue (avec une infinité de valeurs possibles) ou discrète (avec un nombre fini de valeurs possibles) ; dans le cadre du modèle, nous ne considérons que des paramètres discrets, et nous nous limitons à un petit nombre de valeurs possibles.

Définitions : les paramètres que l'on fait varier au cours des essais sont appelés facteurs, et les valeurs possibles que l'on attribue à un facteur sont appelées niveaux.

Exemple : sur la catapulte, nous retenons 5 facteurs que nous faisons varier sur 3 niveaux.

  • Bandage de l'élastique sur le mât : 4 positions possibles, 3 utilisées.

  • Accrochage de l'élastique sur le bras : 5 positions possibles, 3 utilisées.

  • Position du bol sur le bras : 5 positions possibles, 3 utilisées.

  • Angle de butée du bras : goupille dans l'une des 6 positions prévues, 3 utilisées.

  • Angle d'armement du bras : variation continue, 3 positions utilisées.

Nous modélisons ces facteurs par des variables réelles ou entières sans dimension, qui correspondent aux grandeurs physiques du produit via une échelle ou une normalisation. Dans le cas (fréquent) où il n'y a que deux niveaux, les niveaux "bas" et "haut" sont respectivement notés -1 et +1 (ou, parfois, 1 et 2). Lorsqu'il y a trois niveaux ou plus, on utilise généralement les valeurs 1, 2, 3...

1.2. Réponse

Définition : la réponse est la grandeur mesurée lors de l'essai.

Exemple : pour la catapulte, un essai consiste à lancer la balle, et la réponse est la distance à laquelle la balle touche le sol (mesurée longitudinalement à partir de l'avant du bâti, la catapulte étant posée par terre).

1.3. Modèle de comportement

Définition : le modèle de comportement du système est la relation mathématique donnant la réponse en fonction, entre autres, des facteurs.

Le but des essais est d'identifier ce modèle de comportement. Dans cette ressource, nous supposerons que la réponse s'exprime à l'aide d'une fonction des facteurs, et uniquement des facteurs :

où y est la réponse et x1, ..., xn sont les facteurs. Ce modèle est déterministe (la réponse dépend uniquement des facteurs sans aucune incertitude possible, ce qui revient à ignorer les bruits tels que les erreurs de mesure) et invariant (le comportement n'évolue pas au cours du temps). Il s'agit d'une simplification par rapport aux hypothèses habituelles de la méthode ; ainsi, la plupart des plans d'expériences prennent en compte les incertitudes et sont conçus pour être robustes, c'est-à-dire les moins sensibles possibles à l'effet de ces incertitudes sur les résultats.

L'écriture du modèle consiste simplement à postuler une forme pour f, faisant intervenir des coefficients qui seront identifiés au cours des essais. Nous présentons ici quelques exemples courants.

Modèle affine sans interactions

Un choix extrêmement simple est le suivant :

Il s'agit d'un modèle affine par rapport à chacun des facteurs (en fixant tous les facteurs autres que xi, on a une relation du type f(xi) = Axi + B). Notons que l'influence de chacun des facteurs sur la réponse "va toujours dans le même sens" : si ai est positif, la réponse sera toujours croissante en fonction de xi.

Modèle affine avec interactions doubles

En réalité, la forme ci-dessus est souvent insuffisante, car les facteurs agissent rarement de manière indépendante les uns des autres ; l'influence d'un facteur sur la réponse peut dépendre du niveau des autres facteurs. Supposons par exemple que, sur une sélection de deux facteurs ayant chacun deux niveaux, on ait testé les 4 combinaisons possibles et obtenu les résultats suivants :

Bandage Angle armement Distance en mm
Essai P1 P2 Réponse
1 -1 -1 10
2 +1 -1 20
3 -1 +1 200
4 +1 +1 140

Dans le tableau ci-dessus, chaque ligne correspond à un essai ; la première colonne en donne le numéro, les suivantes (jusqu'à l'avant-dernière) donnent les niveaux pris par les différents facteurs (+1 désigne le niveau "haut" et -1 le niveau "bas"), et la dernière colonne sert à inscrire le résultat de l'essai. En comparant les essais deux à deux, on constate que :

  • (essais 1 et 2) lorsque x2 est au niveau bas, x1 a un "effet positif" sur la réponse : celle-ci est plus élevée lorsque x1 est au niveau haut.

  • (essais 3 et 4) lorsque x2 est au niveau haut, x1 a un "effet négatif" sur la réponse.

L'influence de x1 sur la réponse dépend donc du niveau de x2. Or, ce type de comportement ne peut être représenté correctement par la forme précédente : l'influence de x1 y est uniquement déterminée par la valeur du coefficient a1. Pour introduire cette dépendance, on peut ajouter des termes "croisés" au modèle précédent ; on obtient alors la forme suivante :

Ce modèle est lui aussi affine par rapport à chacun des facteurs ; les produits permettent de prendre en compte les interactions doubles ou interactions d'ordre 2 entre les facteurs, puisque l'influence d'un facteur xi peut maintenant dépendre du niveau de ses voisins xj.

Naturellement, il peut arriver que certains couples de facteurs interagissent fortement entre eux, et d'autres faiblement voire pas du tout ; si le concepteur a connaissance de cette situation avant de réaliser les essais, il a tout intérêt à adapter le modèle en conséquence, en excluant les interactions pouvant raisonnablement être négligées. En effet, il est clair que plus un modèle possède de coefficients, plus il faut réaliser d'essais pour les identifier, et plus cette identification s'avère coûteuse !

Modèle affine avec interactions d'ordre supérieur

La notion d'interaction peut se généraliser à plus de deux variables. Par exemple, un modèle avec interactions d'ordre 3, ou interactions triples, s'écrira sous la forme suivante :

Les produits triples permettent de modéliser des phénomènes se produisant lorsque trois facteurs sont à un niveau donné. On définit de même des interactions d'ordre 4, 5... Dans un modèle à n facteurs, il existe ainsi des interactions jusqu'à l'ordre n.

Cependant, en pratique, les interactions d'ordre élevé ont souvent une influence très faible sur la réponse. Il est donc possible de ne pas les inclure dans le modèle, ce qui conduit à faire moins d'essais ; ce principe est utilisé dans la construction de nombreux plans d'expériences, comme nous le verrons dans la partie suivante. Dans de nombreuses applications, on obtient des résultats tout à fait satisfaisants en se limitant aux interactions doubles.

Autres modèles

Enfin, il est tout à fait possible d'utiliser des fonctions non affines par rapport à un ou plusieurs des facteurs : des fonctions quadratiques (ou d'ordre plus élevé), ou des fonctions particulières si la connaissance que l'on a du problème le justifie. Dans ce cas, il faut naturellement veiller à attribuer suffisamment de niveaux aux facteurs concernés pour que l'identification soit possible ; par exemple, si l'on souhaite introduire une dépendance quadratique par rapport à un facteur, il faut faire varier ce dernier sur au moins trois niveaux, car il faut m points pour identifier un polynôme de degré m-1 de manière unique.

2. Plans d'expériences

Une fois le modèle choisi, l'étape suivante est de définir l'ensemble d'essais qui permettra d'en identifier les coefficients. Dans le cadre de la conception ou de la validation d'un produit industriel, il est rarement judicieux d'utiliser une approche "naïve" (du type "faire varier un facteur à la fois"). En effet, les études expérimentales sont généralement coûteuses ; les concepteurs souhaitent donc les réaliser de manière :

  • efficace, c'est-à-dire en effectuant le moins d'essais possible pour aboutir au résultat,

  • robuste, c'est-à-dire en minimisant l'impact des erreurs de mesure et de modélisation sur les résultats.

Or, l'efficacité et la robustesse dépendent d'une part du choix des combinaisons testées (c'est-à-dire des niveaux affectés aux différents facteurs), et d'autre part de l'ordre dans lequel ces tests sont effectués. C'est précisément l'objet des plans d'expériences ; un plan d'expériences n'est rien d'autre qu'une liste ordonnée d'essais à effectuer, permettant d'identifier les coefficients d'un modèle donné de manière efficace et robuste. Ces plans reposent sur des théories statistiques ; on peut les classer en deux catégories.

2.1. Plans complets

Une première catégorie de plans d'expériences est destinée à fournir une information la plus complète possible sur des systèmes présentant relativement peu de facteurs. Ces plans consistent à tester toutes les combinaisons possibles, en faisant varier tous les facteurs à tous leurs niveaux de manière exhaustive, d'où leur nom de plans factoriels complets ou plus simplement plans complets.

Pour ce faire, Yates et Hunter ont proposé une technique simple pour le cas où chaque facteur n'a que deux niveaux. Elle consiste à numéroter les facteurs et à faire varier successivement leurs niveaux de la façon suivante :

  • Au premier essai, tous les facteurs sont au niveau bas.

  • On change le niveau du premier facteur à chaque essai...

  • ... celui du deuxième facteur tous les 2 essais...

  • ... et, plus généralement, celui du k-ième facteur tous les 2k-1 essais.

La méthode peut s'adapter au cas où les facteurs ont plus de deux niveaux.

Exemple : sur la catapulte, limitons-nous pour simplifier aux trois facteurs suivants, classés dans l'ordre qui suit, chacun étant supposé n'avoir que deux niveaux.

  • x1 : angle d'armement (niveau haut : 180°, niveau bas : 150°)

  • x2 : accrochage (niveau haut : position 3, niveau bas : position 1)

  • x3 : bandage (niveau haut : position 4, niveau bas : position 2)

La liste des essais à effectuer est alors la suivante :

Essai x1 x2 x3
1 -1 -1 -1
2 +1 -1 -1
3 -1 +1 -1
4 +1 +1 -1
5 -1 -1 +1
6 +1 -1 +1
7 -1 +1 +1
8 +1 +1 +1

Dans le cadre d'un modèle affine, ce plan permet d'identifier l'influence de tous les facteurs et de toutes les interactions, jusqu'à l'ordre maximal. En effet, on a 23 = 8 essais, et 8 coefficients à identifier puisque le modèle complet s'écrit :

Il reste alors à choisir l'ordre dans lequel ces essais sont effectués. Pour cela, la plupart des approches tiennent compte du fait que les phénomènes réels sont rarement invariants, et que l'influence des facteurs et de leurs interactions est susceptible d'évoluer au cours du temps. Des considérations statistiques permettent alors de choisir cet ordre de sorte que les résultats soient le moins biaisés possible.

2.2. Plans réduits

En pratique, les plans complets ne sont utilisables que sur des systèmes avec très peu de facteurs, ou lorsque chaque essai prend très peu de temps ; par exemple, dans le cas de la catapulte avec ses 5 facteurs à 3 niveaux, un plan complet demanderait d'effectuer 35 = 243 essais... Des plans réduits, consistant à sélectionner certaines combinaisons, ont donc été proposés. Ils permettent naturellement de réduire les coûts mais diminuent également l'information disponible sur le comportement du système ; il faut donc s'assurer de la pertinence de la sélection par rapport au modèle à identifier.

Pour cela, on part du constat qu'un plan factoriel complet permet d'identifier les coefficients de toutes les interactions, jusqu'à l'ordre le plus élevé. Or, comme nous l'avons vu, on prend rarement en compte toutes les interactions possibles dans le modèle (les interactions d'ordre élevé, en particulier, sont souvent négligées). L'idée est donc d'éliminer des essais de sorte à ne "faire travailler" que les interactions retenues ; les plans obtenus étant des sous-ensembles du plan factoriel complet, on les appelle plans factoriels fractionnaires.

Concrètement, l'usage de ces plans demande tout d'abord d'écrire le modèle (c'est-à-dire de lister les facteurs et les interactions à prendre en compte) et de choisir le nombre de niveaux des facteurs. Différentes techniques sont alors utilisables ; nous en présentons deux.

Méthode de Box et Hunter

La méthode de Box et Hunter permet de construire soi-même des plans réduits à partir de plans complets. Elle s'adresse exclusivement aux modèles à deux niveaux par facteur et se base sur la définition suivante.

Définition : soient xi et xj deux facteurs admettant chacun deux niveaux, notés +1 et -1. On appelle niveau de l'interaction entre xi et xj, et on note Iij, le produit de leurs niveaux respectifs.

Ainsi, si xi et xj sont tous deux au niveau haut (+1) ou au niveau bas (-1), leur interaction est au niveau haut (+1) ; dans le cas contraire, elle est au niveau bas. Le niveau de l'interaction de deux facteurs exprime donc formellement si, lors d'un essai donné, les deux facteurs agissent "dans le même sens" ou non ; cette définition correspond tout à fait aux termes d'interaction "croisés" tels qu'ils ont été définis au paragraphe précédent. Elle se généralise à plus de deux facteurs : ainsi, étant donnés trois facteurs xi, xj et xk admettant chacun deux niveaux, on note Iijk le produit de leurs trois niveaux respectifs, et ainsi de suite. On peut ainsi monter jusqu'à un ordre égal au nombre de facteurs.

La méthode de Box et Hunter consiste à négliger l'interaction d'ordre le plus élevé, et à ne conserver que les essais donnant un même signe (par exemple +1) à cette interaction. En reprenant l'exemple de la catapulte avec trois facteurs à deux niveaux, les niveaux des interactions sont donnés ci-dessous :

Essai x1 x2 x3 I12 I13 I23 I123
1 -1 -1 -1 +1 +1 +1 -1
2 +1 -1 -1 -1 -1 +1 +1
3 -1 +1 -1 -1 +1 -1 +1
4 +1 +1 -1 +1 -1 -1 -1
5 -1 -1 +1 +1 -1 -1 +1
6 +1 -1 +1 -1 +1 -1 -1
7 -1 +1 +1 -1 -1 +1 -1
8 +1 +1 +1 +1 +1 +1 +1

La démarche conduit donc à ne sélectionner que les essais 2, 3, 5 et 8, ce qui permet de diviser le nombre d'essais par deux par rapport à un plan complet. Il y a cependant un problème : même si l'interaction triple est réellement nulle, il peut rester jusqu'à 7 autres coefficients dans le modèle, alors que l'on ne dispose que de 4 résultats d'essais pour les identifier. Autrement dit, à moins que l'on sache a priori qu'au moins 3 de ces coefficients sont nuls, on n'obtiendra au mieux que des relations entre les coefficients et l'identification rigoureuse sera impossible. Ce phénomène, présent dans de nombreux plans réduits, est appelé alias ou confusion des actions ; nous verrons dans la partie suivante qu'il peut introduire des erreurs significatives dans les coefficients identifiés. Il s'agit d'une limitation naturelle, non spécifique à cette méthode ; il n'est pas possible de réduire indéfiniment le coût d'une étude expérimentale sans en dégrader la robustesse.

Tables de Taguchi

La construction d'un plan fractionnaire adapté à un modèle donné est souvent délicate pour un non-spécialiste. Pour cette raison, on trouve dans le commerce des recueils de plans réduits "prêts à l'emploi", chacun adapté à un ou plusieurs modèles donnés ; un des exemples les plus connus est celui des tables de Taguchi, conçues par le statisticien Génichi Taguchi dans le but de minimiser l'effet des alias et des erreurs de mesure.

Concrètement, une table de Taguchi se présente sous forme d'un tableau associé à un ou plusieurs graphes linéaires, comme sur la Figure 2. Ces derniers précisent les modèles avec lesquels la table peut être utilisée. Les sommets représentent les facteurs ; les symboles donnent une indication sur la fréquence de modification de leurs niveaux. Plus le cercle est rempli, plus cette fréquence est élevée, et plus on a donc intérêt à associer un facteur facilement modifiable à ce sommet. Les arcs, quant à eux, représentent les interactions entre deux facteurs ; les interactions d'ordre supérieur à 2 ne sont pas prises en compte.

En pratique, on ne trouve pas toujours un graphe correspondant exactement au modèle considéré ; il faut alors choisir un graphe incluant les interactions voulues, et nécessitant le moins d'essais possibles. Une fois le graphe choisi, le tableau donne directement la liste des essais à effectuer ; les numéros se trouvant près des sommets ou arcs correspondent aux numéros des colonnes dans le tableau.

Exemple : reprenons l'exemple de la catapulte, cette fois en version complète (5 facteurs à 3 niveaux). Afin de simplifier l'étude, nous ne considérons que 3 interactions possibles :

  • entre le bandage de l'élastique (x1) et l'accrochage (x2) de l'élastique

  • entre le bandage de l'élastique (x1) et l'angle d'armement (x5)

  • entre l'accrochage de l'élastique (x2) et l'angle d'armement (x5)

Il faut alors trouver une table de Taguchi dont le graphe possède au moins ces 5 sommets et ces 3 arcs, et comportant 3 niveaux par facteur. Aucune table standard ne possède cette configuration exacte ; parmi les tables incluant cette configuration, la table dite L27(313) est celle qui possède le moins de lignes. Cette table, et les graphes associés, sont représentés sur la Figure 2.

Figure 2 : table de Taguchi L27 (313).

Compte tenu de la nature "triangulaire" des interactions du modèle, nous considérerons naturellement le premier des trois graphes. Il faut alors affecter chaque sommet à un facteur en tenant compte des difficultés de modification. Pour cela, nous supposons que l'angle d'armement est facile à modifier (car il ne nécessite de déplacer aucune pièce sur la catapulte) et que les autres facteurs sont difficiles à modifier ; une affectation possible des colonnes de la table, correspondant à cette hypothèse, est proposée ci-dessous :

1 2 3 4 5 6 7 8 9 10 11 12 13
facteur bandage angle arm. 1x2 1x2 accrochage 1x5 1x5 2x5 bol angle proj. 2x5

Le tableau associé aux graphes donne alors directement la liste des 27 essais à réaliser pour identifier les 8 paramètres du modèle. Ce nombre est nettement inférieur aux 35 = 243 essais requis par un plan complet ; en outre, il est nettement supérieur au nombre de paramètres et les résultats fourniront donc a priori une quantité raisonnable d'informations, susceptible de limiter les erreurs d'alias. La méthode de Taguchi mène donc, en pratique, à des compromis réalistes entre efficacité et robustesse.

3. Identification des coefficients

Le plan d'expériences donne directement la séquence d'essais à réaliser. Une fois ceux-ci effectués, il ne reste plus qu'à en exploiter les résultats afin d'identifier les coefficients du modèle. Pour cela, on utilise des techniques statistiques, fondées sur une propriété importante des plans d'expériences utilisés : l'orthogonalité.

Définition : on dit qu'un plan d'expériences ou qu'un ensemble d'essais est orthogonal lorsque pour tout couple de facteurs (xi, xj), chaque niveau de l'un est associé à chaque niveau de l'autre un même nombre de fois, indépendant du couple choisi.

On vérifie facilement que tous les plans d'expériences présentés dans cette ressource sont orthogonaux : chaque couple de niveaux est présent deux fois dans le plan complet du paragraphe 2.1, une fois dans le plan de Box et Hunter du paragraphe 2.2, et trois fois dans le plan de Taguchi de la Figure 2. Intuitivement, cette définition correspond à un ensemble d'essais "équilibré" dans un certain sens : nous allons voir qu'elle simplifie grandement l'identification des coefficients.

3.1. Effet d'un facteur ou d'une interaction

Pour identifier les coefficients du modèle, une approche "naïve" serait de comparer directement les essais deux à deux, et d'en déduire à chaque fois une relation entre les coefficients. Le problème est que ce mode opératoire est peu robuste ; en effet, lorsque l'on fait varier un facteur xi entre deux mesures, la différence des réponses provient non seulement de l'influence de ce facteur et de ses interactions, mais également de tout ce qui a été négligé dans le modèle : interactions d'ordre élevé, bruits et erreurs de mesure. Ainsi, ce que l'on croit identifier comme étant l'influence d'un facteur est en réalité "parasité" par de nombreux phénomènes incontrôlés. Pour peu que ces phénomènes ne soient pas complètement négligeables ou s'additionnent entre eux, on peut obtenir une erreur significative dans les coefficients.

Afin de limiter cette erreur, l'idée est d'utiliser des calculs de moyennes sur des ensembles de résultats "équilibrés", c'est-à-dire orthogonaux : c'est la notion d'effet. On définit ainsi l'effet (total) d'un facteur xi à un niveau Ai par :

  • la moyenne de tous les résultats pour lesquels xi = Ai

  • MOINS la moyenne générale.

Il résulte immédiatement de cette définition que pour tout facteur xi, la somme de ses effets à ses différents niveaux est nulle. En particulier, pour un facteur à deux niveaux, l'effet de son niveau "bas" est l'opposé de l'effet de son niveau "haut" ; on se contente donc généralement de calculer l'effet du niveau "haut", que l'on note Ci.

De la même manière, on définit l'effet de l'interaction entre xi au niveau Ai et xj au niveau Aj par :

  • la moyenne de tous les résultats pour lesquels xi = Ai et xj = Aj

  • MOINS l'effet de xi au niveau Ai

  • MOINS l'effet de xj au niveau Aj

  • MOINS la moyenne générale.

Il en résulte de même que pour tous facteurs xi et xj, la somme des effets de leur interaction aux différents niveaux de l'un ou l'autre des deux facteurs est nulle. En particulier, pour deux facteurs à deux niveaux, on peut se contenter de calculer une seule valeur : on prend généralement celle obtenue lorsque les deux facteurs sont au niveau "haut" et on la note Cij. L'effet des interactions d'ordre supérieur à 2 est défini selon le même principe.

Pour que ces outils statistiques aient du sens, il est essentiel que le plan d'expériences utilisé soit orthogonal. En effet, lorsque l'on calcule l'effet d'un facteur xi, il faut que tous les autres facteurs apparaissent autant de fois au niveau "haut" qu'au niveau "bas", sinon leur effet biaiserait celui de xi ! Ceci éclaire le choix du terme "orthogonal" pour cette propriété : elle permet d'étudier l'effet d'un facteur indépendamment des autres facteurs à partir des résultats des essais.

Le principal avantage de cette méthodologie est sa robustesse, c'est-à-dire la faible influence des bruits et autres interactions négligées. En effet, calculer un effet sur un plan orthogonal revient à comparer deux ensembles de résultats dans lesquels tous les autres facteurs prennent tous leurs niveaux. Ainsi, sous réserve que le plan utilisé comporte suffisamment d'expériences, les influences des interactions négligées et des bruits vont se compenser lorsque l'on calculera les deux moyennes pour prendre leur différence ; l'erreur introduite sera donc plus faible. Inversement, lorsque l'on utilise une approche "naïve" consistant à comparer des résultats d'essais deux à deux, les interactions négligées ne sont pas compensées, et peuvent tout à fait se cumuler ; l'erreur introduite est donc plus importante. Attention, cette "compensation" ne constitue naturellement pas une garantie contre les phénomènes d'alias (ou confusion des actions) se produisant lorsque l'on utilise un plan réduit avec trop peu de mesures, puisque dans ce cas on ne sait pas ce qu'on identifie !

Exemple 1 : reprenons la catapulte "simplifiée" (3 facteurs à 2 niveaux), étudiée par le plan complet du paragraphe 2.1. Les résultats des mesures, et les effets associés, sont donnés dans le tableau ci-dessous :

Bandage Angle armement Accrochage Distance en mm
Essai x1 x2 x3 Réponse I12 I13 I23 I123
1 -1 -1 -1 10 +1 +1 +1 -1
2 +1 -1 -1 20 -1 -1 +1 +1
3 -1 +1 -1 200 -1 +1 -1 +1
4 +1 +1 -1 140 +1 -1 -1 -1
5 -1 -1 +1 60 +1 -1 -1 +1
6 +1 -1 +1 100 -1 +1 -1 -1
7 -1 +1 +1 205 -1 -1 +1 -1
8 +1 +1 +1 172 +1 +1 +1 +1
C1=-5,3 C2=65,9 C3=20,8 m=113,3 C12=-17,8 C13=7,1 C23=-11,7 C123=-0,375

L'effet C1 du facteur x1, par exemple, est obtenu par :

où yk désigne le résultat du k-ième essai et m la moyenne générale des 8 essais. L'effet C12 est quant à lui obtenu par :

Les effets des autres facteurs et interactions sont obtenus de façon identique.

Exemple 2 : considérons le même problème, étudié cette fois-ci par un plan réduit (4 essais) de type Box et Hunter, présenté au paragraphe 2.2 ; l'emploi de ce type de plan peut sembler justifié vu que l'effet de l'interaction triple est quasiment nul. Les résultats des mesures, et les effets associés, sont donnés dans le tableau ci-dessous.

Bandage Angle armement Accrochage Distance en mm
Essai x1 x2 x3 Réponse I12 I13 I23 I123
1 -1 -1 +1 60 +1 -1 -1 +1
2 +1 -1 -1 20 -1 -1 +1 +1
3 -1 +1 -1 200 -1 +1 -1 +1
4 +1 +1 +1 172 +1 +1 +1 +1
C1=-17 C2=73 C3=3 m=113 C12=3 C13=73 C23=-17 C123=-59

Il s'agit des mêmes réponses que pour l'exemple précédent, mais on a sélectionné moins d'essais. Examinons les conséquences de cette sélection : en comparant la dernière ligne des deux tableaux, on constate que :

  • la moyenne est très bien évaluée,

  • l'effet du facteur le plus influent (C2) est relativement bien évalué,

  • les effets des autres facteurs et des interactions sont très mal évalués.

Ceci illustre le phénomène d'alias, ou confusion des actions, évoqué précédemment : l'information disponible n'est plus suffisante pour identifier correctement tous les effets, et ceci bien que l'interaction triple ait effectivement un effet négligeable (ce qui ne se retrouve d'ailleurs pas dans les résultats du plan réduit !).

Exemple 3 : prenons cette fois la catapulte "complète" (5 facteurs à 3 niveaux) étudiée par le plan réduit de Taguchi de la Figure 2.

Afin de présenter les résultats de manière commode, on utilise la représentation graphique de la Figure 3. L'idée est de tracer, pour chaque facteur ou interaction, l'effet (additionné de la moyenne générale) en fonction du niveau ; pour des facteurs à deux niveaux, on obtient des droites dont les pentes sont les Ci ou Cij. L'avantage de cette représentation est d'offrir une visualisation immédiate des différents effets.

Figure 3 : résultats du plan de Taguchi sur la catapulte

Ici, on voit par exemple que le facteur le plus influent semble être l'angle d'armement, et que l'effet global de chacun des facteurs semble être à peu près linéaire, sauf celui de l'angle de projection. Les effets des interactions semblent quant à eux être non-linéaires et relativement faibles.

3.2. Expression du modèle

Dans le cas d'un modèle affine à deux niveaux par facteur, les coefficients sont directement donnés par les effets. En adoptant la valeur +1 pour le niveau "haut" et -1 pour le niveau "bas", on montre en effet que le modèle s'exprime de la façon suivante :

où m est la moyenne générale. Si l'on a utilisé un plan d'expériences minimal, on obtient alors un modèle passant exactement par les mesures. Autrement, ce n'est pas forcément le cas.

Exemple : pour la catapulte "à 3 facteurs", le modèle obtenu est le suivant :

Si l'étude a été réalisée par le plan complet de l'Exemple 1, les valeurs numériques des coefficients sont donnés dans la dernière ligne du tableau correspondant, et on obtient alors un modèle passant exactement par les mesures (on a identifié 8 coefficients en faisant 8 essais).

Pour les modèles à plus de deux niveaux par facteur, le principe est le même, mais on ne peut naturellement plus se contenter d'une seule valeur Ci ou Cij pour caractériser les effets d'un facteur ou d'une interaction. On obtient donc des expressions plus complexes ; de plus, le modèle ne passera par les mesures que si la dépendance en fonction des facteurs est exactement affine (employer plus de deux niveaux par facteur permet donc de tester la pertinence d'un modèle affine).

Enfin, pour les modèles quadratiques (ou, plus généralement, non affines), le principe est le même, mais l'identification est plus complexe : il faut en effet trouver les coefficients de la "parabole" ou courbe passant par les trois (ou plus) niveaux considérés, ce qui demande quelques calculs supplémentaires. En pratique, des logiciels ou des macros pour tableurs réalisant automatiquement ces calculs sont disponibles dans le commerce.

3.3. Validation du modèle

Enfin, une fois les coefficients identifiés, il est recommandé de s'assurer de la validité du modèle obtenu dans le domaine concerné. Pour ce faire, une technique classique est de vérifier si le modèle passe bien par les mesures en calculant l'écart entre les mesures et les prédictions du modèle, ou résidu. Si ce résidu est trop important, on peut alors envisager d'enrichir ou de corriger le modèle, puis éventuellement de mettre à jour le plan d'expériences et de refaire d'autres essais. La méthode peut ainsi être mise en oeuvre de manière adaptative, c'est-à-dire en améliorant successivement le modèle en fonction des insuffisances rencontrées.

4. Réalisation de simulations

A l'issue du plan d'expériences, on dispose d'un modèle du comportement global du produit, qui peut alors être utilisé pour réaliser des simulations. Ces simulations peuvent servir à valider une solution (c'est-à-dire à prévoir la réponse pour un jeu de facteurs donné, qui n'a pas forcément été testé) ou bien à en concevoir une, c'est-à-dire à trouver un jeu de facteurs répondant à un objectif et des contraintes. C'est à ce dernier cas que nous nous intéressons ici.

Dans les cas les plus simples, l'objectif de la conception est une optimisation de la performance, soit dans l'absolu ("la catapulte doit tirer le plus loin possible"), soit par rapport à une valeur nominale ("la catapulte doit tirer à une distance la plus proche possible de 2 mètres"). Un tel problème d'optimisation peut aisément être résolu à l'aide d'une macro ou d'un logiciel dédié, voire graphiquement dans le cas d'un modèle affine comportant peu de facteurs et d'interactions significatives (un exemple est proposé ici).

Dans d'autres cas, les objectifs sont multiples. Par exemple, de plus en plus de produits sont conçus de sorte à optimiser leur robustesse, c'est-à-dire à minimiser l'influence des variabilités (dues à la fabrication du produit, à son vieillissement, aux changements imprévus de son environnement...) sur leurs performances. Cet objectif peut être partiellement contradictoire par rapport à l'optimisation de la performance nominale "brute" : il s'agit alors d'un problème d'optimisation multi-objectifs qui demande d'effectuer des compromis entre robustesse et performance.

Dans tous les cas, une fois les "bons" niveaux des facteurs identifiés et le produit conçu et fabriqué, le modèle fait généralement l'objet d'une ultime vérification a posteriori dans le cadre du retour d'expérience.

5. Conclusion

Les plans d'expériences offrent un moyen simple et efficace de réduire le coût et d'augmenter la robustesse des études expérimentales effectuées lors de la conception ou de la validation d'un produit industriel. Ils permettent d'utiliser toute la connaissance du produit dont le concepteur peut disposer a priori, offrent un cadre de modélisation rigoureux, et leur mise en oeuvre ne nécessite que des connaissances mathématiques élémentaires. Cette ressource n'offre naturellement qu'un aperçu des possibilités de cette méthode ; nous donnons pour cette raison un certain nombre de références, permettant au lecteur d'approfondir ou de découvrir d'autres points de vue sur le sujet.

6. Références

6.1. Liens

  • Une présentation sous forme de fiches, par un prestataire industriel : ici

  • Un cours relativement complet, à destination des enseignants : ici

  • Un cours très complet, avec développements mathématiques : ici

6.2. Livres

  1. Comprendre et mener des plans d'expériences - Jacques Demonsant - AFNOR - 1996

  2. Pratique industrielle de la méthode Taguchi - Les plans d'expériences - Jacques Alexis - AFNOR - 1995

  3. J. GOUPY, Introduction aux plans d'expériences, seconde édition, Dunod, 2001

  4. M. PILLET, Les plans d'expériences par la méthode Taguchi, Les Editions d'organisation, Paris 1997

  5. J. GOUPY, Plans d'expériences , Techniques de l'ingénieur - PE230

  6. J. GOUPY, Modélisation par les plans d'expériences - Techniques de l'ingénieur, R275

  7. W. FOWLKES et C. CREVELING, L'ingénierie robuste, Dunod, Paris 1998.

  8. P. SCHIMMERLING P, J.-C. SISSON, A. ZAIDI, Pratique des plans d'expériences, Lavoisier, Paris, 1998

  9. TAGUCHI G. et KONISHI S., Orthogonal arrays and linear graphs, American supplier institute, inc, Dearborn, 1987

  10. P. SOUVAY, Les plans d'expériences , Méthode Taguchi, AFNOR, 1994.

  11. La qualité - Démarche, méthodes et outils - Zohra Cherfi - Hermes Sciences, 2002 (ch.4 L'ingénierie robuste p115-154 - Jacques Demonsant)

  12. G.E.P. BOX, W.G. HUNTER, J.S. HUNTER, Statistics for experimenters, WILEY, United States, 1978

  13. G. & M.C SADO, Les plans d'expériences, AFNOR, 2000

  14. Robust engineering - Genichi Taguchi ; Subir Chowdhury; Shin Taguchi - Dunod - 1998