Partage de technologie

Analyse de variance Matlab

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Afin de stabiliser le processus de production et d'obtenir une qualité élevée et un rendement élevé, il est souvent nécessaire d'analyser les facteurs qui affectent la qualité du produit et de découvrir les facteurs qui ont un impact significatif. de nombreuses expériences et analyser et comparer les résultats, à la recherche de modèles. La méthode d'utilisation des statistiques mathématiques pour analyser les résultats des tests et identifier le degré d'influence de chaque facteur sur les résultats est appelée analyse de variance, enregistrée sous le nom d'ANOVA.

Les résultats des tests sont appelés indicateurs, les conditions qui doivent être étudiées et peuvent être contrôlées lors du test sont appelées facteurs ou facteurs, et l'état des facteurs est appelé niveau. Selon le nombre de facteurs, elle peut être divisée en : analyse de variance à un facteur et analyse de variance à deux facteurs.

Table des matières

1. Analyse de variance unidirectionnelle

1.1 Modèle mathématique

1.2 Analyse statistique

1.3 Tableau d'analyse des écarts

1.4 Implémentation de Matlab

(1) Données équilibrées

(2) Données déséquilibrées

1.5 Comparaisons multiples

2. Analyse de variance à deux facteurs

2.1 Modèle mathématique

2.2 Analyse de variance à deux facteurs sans effets d'interaction

​Modifier 2.3 ANOVA bidirectionnelle sur les effets d'interaction

2.4 Implémentation de Matlab


1. Analyse de variance unidirectionnelle

Considérez uniquement l'impact d'un facteur A sur l'indice préoccupant, prenez plusieurs niveaux de A et effectuez plusieurs expériences à chaque niveau. Au cours de l'expérience, les autres facteurs qui affectent l'indice à l'exception de A restent inchangés (seuls des facteurs aléatoires existent), notre. La tâche consiste à déduire des résultats expérimentaux si le facteur A a un impact significatif sur l'indice, c'est-à-dire s'il existe une différence significative dans l'indice lorsque A prend différents niveaux. A prend l'indicateur à un certain niveau comme variable aléatoire. Juger s'il existe une différence significative dans l'indicateur lorsque A prend différents niveaux équivaut à tester si les moyennes de plusieurs populations sont égales.

1.1 Modèle mathématique

1.2 Analyse statistique

À partir de l'additivité de la distribution du chi carré :

1.3 Tableau d'analyse des écarts

Le niveau de signification généralement utilisé dans l'analyse de la variance est le suivant :α = 0.01, rejeter H0, en disant que l'influence du facteur A (ou la différence entre chaque niveau de A) est très significative ;α = 0.01, ne rejetez pas H0, mais prenezα = 0.05 , rejetons H0, et disons que l'influence du facteur A est significative ;α = 0.05 , H0 n’est pas rejeté et le facteur A n’a pas d’impact significatif.

1.4 Implémentation de Matlab

La commande pour l'analyse unidirectionnelle de la variance dans la boîte à outils statistiques Matlab est un ovale . Si le nombre de données dans chaque groupe est égal, on parle de données équilibrées. Si le nombre de données dans chaque groupe n’est pas égal, on parle de données déséquilibrées.

(1) Données équilibrées

L'utilisation pour gérer des données équilibrées est : p=anovale(x)

valeur de retour pest une probabilité, quand p > αaccepter quand H0 , x est une matrice de données de m×r, et chaque colonne de x est un niveau de données (la capacité d'échantillonnage à chaque niveau est ni = m). De plus, un tableau de variance et un Box plot sont générés.

Exemple:

  1. x=[256 254 250 248 236
  2. 242 330 277 280 252
  3. 280 290 230 305 220
  4. 298 295 302 289 252];
  5. p=anova1(x)

On constate que p = 0,1109 >α = 0,05, donc l'hypothèse nulle ne peut pas être rejetée et H0 est acceptée, c'est-à-dire qu'il n'y a pas de différence significative dans la productivité des cinq travailleurs.

Le tableau de variance correspond aux colonnes 1 à 4 du tableau d'analyse de variance à un facteur ci-dessus. F = 2,262 est le quantile 1− p de la distribution F(4,15). On peut vérifier que fcdf(2,262,4, 15)=0,8891=1 -p.

Le Box Plot reflète les caractéristiques de 5 données de productivité des travailleurs.

(2) Données déséquilibrées

L'utilisation pour la gestion des données déséquilibrées est : p=anova1(x,groupe)

x est un vecteur, et les données du 1er groupe au rème groupe sont classées dans l'ordre ; le groupe est un vecteur de même longueur que x, marquant le groupe de données dans x.

Exemple:

  1. clc,clear;
  2. x=[1620 1580 1460 1500
  3. 1670 1600 1540 1550
  4. 1700 1640 1620 1610
  5. 1750 1720 1680 1800];
  6. x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
  7. g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
  8. p=anova1(x,g)

Obtenu : p=0,0331<0,05, il y a donc une différence significative dans la durée de vie des ampoules fabriquées par plusieurs procédés.

 

1.5 Comparaisons multiples

Dans le problème de la durée de vie des ampoules, afin de déterminer quels processus présentent des différences significatives dans la durée de vie des ampoules, nous calculons d'abord la moyenne de chaque ensemble de données :

Bien que A1 ait la valeur moyenne la plus élevée, plusieurs comparaisons sont nécessaires pour déterminer si elle est significativement différente des autres. Généralement, les comparaisons multiples nécessitent une comparaison par paires de toutes les r populations pour analyser les différences entre elles. Le nombre de comparaisons peut être réduit en fonction des circonstances spécifiques du problème.

  1. clc,clear;
  2. x=[1620 1580 1460 1500
  3. 1670 1600 1540 1550
  4. 1700 1640 1620 1610
  5. 1750 1720 1680 1800];
  6. x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
  7. g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
  8. [p,t,st]=anova1(x,g)
  9. [c,m,h,nms] = multcompare(st);
  10. [nms num2cell(m)]

2. Analyse de variance à deux facteurs

Si vous souhaitez considérer l'impact de deux facteurs A et B sur l'indice, divisez A et B en plusieurs niveaux, effectuez plusieurs tests pour chaque combinaison de niveaux, effectuez une analyse de variance sur les données obtenues et testez si les deux facteurs ont un impact significatif. impact sur l'indice, ou il est nécessaire de tester davantage si les deux facteurs ont un effet interactif significatif sur l'indicateur.

2.1 Modèle mathématique

2.2 Analyse de variance à deux facteurs sans effets d'interaction

S'il peut être déterminé à l'avance qu'il n'y a pas d'interaction entre les deux facteurs sur la base de l'expérience ou d'une sorte d'analyse, chaque série d'expériences n'a pas besoin d'être répétée, et le

t = 1, le processus est grandement simplifié.

 

Tableau ANOVA à deux facteurs sans effets d'interaction :

2.3 Analyse de variance à deux facteurs sur les effets d'interaction

Tableau ANOVA à deux facteurs sur les effets d'interaction :

2.4 Implémentation de Matlab

Utilisez anova2 dans la boîte à outils statistiques pour effectuer une analyse de variance à deux facteurs.

La commande est :p=anova2(x,répétitions)

Parmi eux, les données dans différentes colonnes de x représentent les changements d'un seul facteur, et les données dans différentes lignes représentent les changements d'un autre facteur. Si chaque paire ligne-colonne ("unité") a plus d'une valeur d'observation, le paramètre reps est utilisé pour indiquer les différentes étiquettes des multiples valeurs d'observation pour chaque "unité", c'est-à-dire que reps donne le nombre d'expériences répétées t.

  1. x=[58.2 56.2 65.3
  2. 49.1 54.1 51.6
  3. 60.1 70.9 39.2
  4. 75.8 58.2 48.7];
  5. [p,t,st]=anova2(x)

Le p=0,4491 0,7387 obtenu montre que les différences entre les différents carburants et les différents propulseurs n'ont pas d'impact significatif sur la portée de la fusée.

  1. clc,clear
  2. x0=[58.2,52.6 56.2,41.2 65.3,60.8
  3. 49.1,42.8 54.1,50.5 51.6,48.4
  4. 60.1,58.3 70.9,73.2 39.2,40.7
  5. 75.8,71.5 58.2,51.0 48.7,41.4];
  6. x1=x0(:,1:2:5);x2=x0(:,2:2:6);
  7. for i=1:4
  8. x(2*i-1,:)=x1(i,:);
  9. x(2*i,:)=x2(i,:);
  10. end
  11. [p,t,st]=anova2(x,2)

On constate que p=0,0035 0,026 0,0001, tous inférieurs à 0,05, donc l'hypothèse d'égalité des moyennes peut être rejetée. C’est-à-dire qu’il existe des différences significatives dans les gammes de carburants (facteur A) et de propulseurs (facteur B), et l’interaction est également significative.