Compartir tecnología

Análisis de varianza de Matlab.

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Para estabilizar el proceso de producción y lograr alta calidad y alto rendimiento, es necesario analizar los factores que afectan la calidad del producto y descubrir aquellos factores que tienen un impacto significativo. Además de estudiar el mecanismo, a menudo es necesario realizar una investigación. muchos experimentos y analizar y comparar los resultados, buscando patrones. El método de utilizar estadística matemática para analizar los resultados de las pruebas e identificar el grado de influencia de cada factor en los resultados se llama Análisis de Varianza y se registra como ANOVA.

Los resultados de la prueba se denominan indicadores, las condiciones que deben investigarse y pueden controlarse en la prueba se denominan factores o factores, y el estado de los factores se denomina nivel. Según el número de factores, se puede dividir en: análisis de varianza unifactorial y análisis de varianza bifactorial.

Tabla de contenido

1. Análisis de varianza unidireccional

1.1 modelo matemático

1.2 Análisis estadístico

1.3 Tabla de análisis de varianza

1.4 Implementación de Matlab

(1) Datos balanceados

(2) Datos desequilibrados

1.5 Comparaciones múltiples

2. Análisis de varianza de dos factores

2.1 modelo matemático

2.2 Análisis de varianza de dos factores sin efectos de interacción

Editar 2.3 ANOVA bidireccional sobre efectos de interacción

2.4 Implementación de Matlab


1. Análisis de varianza unidireccional

Considere solo el impacto de un factor A en el índice de preocupación, tome varios niveles de A y realice varios experimentos en cada nivel. Durante el experimento, otros factores que afectan el índice, excepto A, permanecen sin cambios (solo existen factores aleatorios), nuestro. La tarea es inferir de los resultados experimentales si el factor A tiene un impacto significativo en el índice, es decir, si hay una diferencia significativa en el índice cuando A toma diferentes niveles. A toma el indicador en un cierto nivel como una variable aleatoria. Juzgar si hay una diferencia significativa en el indicador cuando A toma diferentes niveles equivale a probar si las medias de varias poblaciones son iguales.

1.1 modelo matemático

1.2 Análisis estadístico

De la aditividad de la distribución chi-cuadrado:

1.3 Tabla de análisis de varianza

El nivel de significancia generalmente utilizado en el análisis de varianza es: tomarα = 0.01, rechaza H0, diciendo que la influencia del factor A (o la diferencia entre cada nivel de A) es muy significativa;α = 0.01, no rechace H0, pero tomeα = 0.05 , rechace H0 y diga que la influencia del factor A es significativa;α = 0.05 , H0 no se rechaza y se dice que el factor A no tiene un impacto significativo.

1.4 Implementación de Matlab

El comando para el análisis de varianza unidireccional en la caja de herramientas estadísticas de Matlab es un óvalo . Si el número de datos en cada grupo es igual, se llama datos balanceados. Si la cantidad de datos en cada grupo no es igual, se denominan datos desequilibrados.

(1) Datos balanceados

El uso para manejar datos balanceados es: p=anoval(x)

valor de retorno pages una probabilidad, cuando p > αaceptar cuando H0 , x es una matriz de datos de m×r, y cada columna de x es un nivel de datos (la capacidad de muestra en cada nivel es ni = m). Además, se generan una tabla de varianza y un diagrama de caja.

Ejemplo:

  1. x=[256 254 250 248 236
  2. 242 330 277 280 252
  3. 280 290 230 305 220
  4. 298 295 302 289 252];
  5. p=anova1(x)

Se encuentra que p = 0.1109 >α = 0.05, por lo que no se puede rechazar la hipótesis nula y se acepta H0, es decir, no existe diferencia significativa en la productividad de los cinco trabajadores.

La tabla de varianza corresponde a las columnas 1 a 4 de la tabla de análisis de varianza de un factor anterior. F = 2.262 es el cuantil 1− p de la distribución F(4,15). Se puede verificar que fcdf(2.262,4, 15)=0,8891=1-p.

El diagrama de caja refleja las características de cinco datos de productividad de los trabajadores.

(2) Datos desequilibrados

El uso para manejar datos no balanceados es: p=anova1(x,grupo)

x es un vector, y los datos del primer grupo al r-ésimo grupo están ordenados. El grupo es un vector con la misma longitud que x, marcando el grupo de datos en x;

Ejemplo:

  1. clc,clear;
  2. x=[1620 1580 1460 1500
  3. 1670 1600 1540 1550
  4. 1700 1640 1620 1610
  5. 1750 1720 1680 1800];
  6. x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
  7. g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
  8. p=anova1(x,g)

Obtenido: p=0.0331<0.05, por lo que existe una diferencia significativa en la vida de los focos fabricados por varios procesos.

 

1.5 Comparaciones múltiples

En el problema de la vida útil de las bombillas, para determinar qué procesos tienen diferencias significativas en la vida útil de las bombillas, primero calculamos la media de cada conjunto de datos:

Aunque A1 tiene el valor medio más grande, se necesitan múltiples comparaciones para determinar si es significativamente diferente de los demás. Generalmente, las comparaciones múltiples requieren una comparación por pares de todas las r poblaciones para analizar las diferencias entre ellas. El número de comparaciones se puede reducir dependiendo de las circunstancias específicas del problema.

  1. clc,clear;
  2. x=[1620 1580 1460 1500
  3. 1670 1600 1540 1550
  4. 1700 1640 1620 1610
  5. 1750 1720 1680 1800];
  6. x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
  7. g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
  8. [p,t,st]=anova1(x,g)
  9. [c,m,h,nms] = multcompare(st);
  10. [nms num2cell(m)]

2. Análisis de varianza de dos factores

Si desea considerar el impacto de dos factores A y B en el índice, divida A y B en varios niveles, realice varias pruebas para cada combinación de niveles, realice análisis de varianza de los datos obtenidos y pruebe si los dos factores tienen un impacto significativo. impacto en el índice, o es necesario probar más a fondo si los dos factores tienen un efecto interactivo significativo en el indicador.

2.1 modelo matemático

2.2 Análisis de varianza de dos factores sin efectos de interacción

Si se puede determinar de antemano que no existe interacción entre los dos factores basándose en la experiencia o algún tipo de análisis, no es necesario repetir cada conjunto de experimentos y el

t = 1, el proceso se simplifica enormemente.

 

Tabla ANOVA de dos factores sin efectos de interacción:

2.3 Análisis de varianza de dos factores sobre los efectos de interacción

Tabla ANOVA de dos factores sobre efectos de interacción:

2.4 Implementación de Matlab

Utilice anova2 en la caja de herramientas estadísticas para realizar un análisis de varianza de dos factores.

El comando es:p=anova2(x,repeticiones)

Entre ellos, los datos en diferentes columnas de x representan los cambios de un solo factor y los datos en diferentes filas representan los cambios de otro factor. Si cada par fila-columna ("unidad") tiene más de un valor de observación, el parámetro reps se utiliza para indicar las diferentes etiquetas de los múltiples valores de observación para cada "unidad", es decir, reps da el número de experimentos repetidos t.

  1. x=[58.2 56.2 65.3
  2. 49.1 54.1 51.6
  3. 60.1 70.9 39.2
  4. 75.8 58.2 48.7];
  5. [p,t,st]=anova2(x)

El p=0,4491 0,7387 obtenido muestra que las diferencias entre varios combustibles y varios propulsores no tienen un impacto significativo en el alcance del cohete.

  1. clc,clear
  2. x0=[58.2,52.6 56.2,41.2 65.3,60.8
  3. 49.1,42.8 54.1,50.5 51.6,48.4
  4. 60.1,58.3 70.9,73.2 39.2,40.7
  5. 75.8,71.5 58.2,51.0 48.7,41.4];
  6. x1=x0(:,1:2:5);x2=x0(:,2:2:6);
  7. for i=1:4
  8. x(2*i-1,:)=x1(i,:);
  9. x(2*i,:)=x2(i,:);
  10. end
  11. [p,t,st]=anova2(x,2)

Se encuentra que p=0.0035 0.026 0.0001, todos menores a 0.05, por lo que se puede rechazar la hipótesis de igualdad de medias. Es decir, existen diferencias significativas en los rangos de diferentes combustibles (factor A) y diferentes propulsores (factor B), y la interacción también es significativa.