Compartilhamento de tecnologia

Análise de variância Matlab

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Para estabilizar o processo de produção e alcançar alta qualidade e alto rendimento, é necessário analisar os fatores que afetam a qualidade do produto e descobrir os fatores que têm um impacto significativo. Além de estudar o mecanismo, muitas vezes é necessário realizar. muitos experimentos e analisar e comparar os resultados, procurando regras. O método de utilização da estatística matemática para analisar os resultados dos testes e identificar o grau de influência de cada fator nos resultados é denominado Análise de Variância, registrada como ANOVA.

Os resultados do teste são chamados de indicadores, as condições que precisam ser investigadas e podem ser controladas no teste são chamadas de fatores ou fatores, e o estado dos fatores é chamado de nível. De acordo com o número de fatores, pode ser dividido em: análise de variância unifatorial e análise de variância bifatorial.

Índice

1. Análise de variância unidirecional

1.1 Modelo matemático

1.2 Análise estatística

1.3 Tabela de análise de variância

1.4 Implementação Matlab

(1) Dados balanceados

(2) Dados desequilibrados

1.5 Comparações múltiplas

2. Análise de variância de dois fatores

2.1 Modelo matemático

2.2 Análise de variância de dois fatores sem efeitos de interação

Editar 2.3 ANOVA bidirecional sobre efeitos de interação

2.4 Implementação Matlab


1. Análise de variância unidirecional

Considere apenas o impacto de um fator A no índice de preocupação, tome vários níveis de A e conduza vários experimentos em cada nível. Durante o experimento, outros fatores que afetam o índice, exceto A, permanecem inalterados (existem apenas fatores aleatórios). A tarefa é inferir a partir dos resultados experimentais se o fator A tem um impacto significativo no índice, ou seja, se existe uma diferença significativa no índice quando A assume níveis diferentes. A considera o indicador em um determinado nível como uma variável aleatória. Julgar se há uma diferença significativa no indicador quando A assume níveis diferentes equivale a testar se as médias de várias populações são iguais.

1.1 Modelo matemático

1.2 Análise estatística

Da aditividade da distribuição qui-quadrado:

1.3 Tabela de análise de variância

O nível de significância geralmente usado na análise de variância é:α = 0.01, rejeite H0, dizendo que a influência do fator A (ou a diferença entre cada nível de A) é muito significativa;α = 0.01, não rejeite H0, mas tomeα = 0.05 , rejeite H0 e diga que a influência do fator A é significativa;α = 0.05 , H0 não é rejeitada e diz-se que o fator A não tem impacto significativo.

1.4 Implementação Matlab

O comando para análise de variância unidirecional na caixa de ferramentas estatísticas do Matlab é um oval . Se o número de dados em cada grupo for igual, são chamados de dados balanceados. Se o número de dados em cada grupo não for igual, são chamados de dados não balanceados.

(1) Dados balanceados

O uso para lidar com dados balanceados é: p=anoval(x)

valor de retorno pé uma probabilidade, quando p > αaceitar quando H0 , x é uma matriz de dados de m×r, e cada coluna de x é um nível de dados (a capacidade da amostra em cada nível é ni = m). Além disso, uma tabela de variância e um gráfico de caixa são gerados.

Exemplo:

  1. x=[256 254 250 248 236
  2. 242 330 277 280 252
  3. 280 290 230 305 220
  4. 298 295 302 289 252];
  5. p=anova1(x)

Verifica-se que p = 0,1109 >α = 0,05, portanto a hipótese nula não pode ser rejeitada e H0 é aceita, ou seja, não há diferença significativa na produtividade dos 5 trabalhadores.

A tabela de variância corresponde às colunas 1 ~ 4 da tabela de análise de variância unifatorial acima. F = 2,262 é o quantil 1− p da distribuição F(4,15). 15)=0,8891=1 -p.

O gráfico Box reflete as características de 5 dados de produtividade do trabalhador.

(2) Dados desequilibrados

O uso para lidar com dados não balanceados é: p=anova1(x,grupo)

x é um vetor, e os dados do 1º grupo ao r-ésimo grupo são organizados em ordem. grupo é um vetor com o mesmo comprimento de x, marcando o grupo de dados em x;

Exemplo:

  1. clc,clear;
  2. x=[1620 1580 1460 1500
  3. 1670 1600 1540 1550
  4. 1700 1640 1620 1610
  5. 1750 1720 1680 1800];
  6. x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
  7. g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
  8. p=anova1(x,g)

Obteve-se: p=0,0331<0,05, portanto há uma diferença significativa na vida útil de lâmpadas fabricadas por diversos processos.

 

1.5 Comparações múltiplas

No problema da vida útil das lâmpadas, para determinar quais processos apresentam diferenças significativas na vida útil das lâmpadas, primeiro calculamos a média de cada conjunto de dados:

Embora A1 tenha o maior valor médio, são necessárias múltiplas comparações para determinar se ele é significativamente diferente dos demais. Geralmente, comparações múltiplas requerem comparação aos pares de todas as r populações para analisar as diferenças entre elas. O número de comparações pode ser reduzido dependendo das circunstâncias específicas do problema.

  1. clc,clear;
  2. x=[1620 1580 1460 1500
  3. 1670 1600 1540 1550
  4. 1700 1640 1620 1610
  5. 1750 1720 1680 1800];
  6. x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
  7. g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
  8. [p,t,st]=anova1(x,g)
  9. [c,m,h,nms] = multcompare(st);
  10. [nms num2cell(m)]

2. Análise de variância de dois fatores

Se você quiser considerar o impacto de dois fatores A e B no índice, divida A e B em vários níveis, realize vários testes para cada combinação de níveis, conduza análises de variância nos dados obtidos e teste se os dois fatores têm um impacto significativo. impacto no índice, ou é necessário testar ainda mais se os dois fatores têm um efeito interativo significativo no indicador.

2.1 Modelo matemático

2.2 Análise de variância de dois fatores sem efeitos de interação

Se puder ser determinado antecipadamente que não há interação entre os dois fatores com base na experiência ou em algum tipo de análise, cada conjunto de experimentos não precisará ser repetido, e o

t = 1, o processo é bastante simplificado.

 

Tabela ANOVA de dois fatores sem efeitos de interação:

2.3 Análise de variância de dois fatores sobre efeitos de interação

Tabela ANOVA de dois fatores sobre efeitos de interação:

2.4 Implementação Matlab

Use anova2 na caixa de ferramentas estatísticas para realizar análises de variância de dois fatores.

O comando é:p=anova2(x,repetições)

Entre eles, os dados em diferentes colunas de x representam as alterações de um único fator, e os dados em diferentes linhas representam as alterações de outro fator. Se cada par linha-coluna ("unidade") tiver mais de um valor de observação, o parâmetro reps é usado para indicar os diferentes rótulos dos múltiplos valores de observação para cada "unidade", ou seja, reps dá o número de experimentos repetidos t.

  1. x=[58.2 56.2 65.3
  2. 49.1 54.1 51.6
  3. 60.1 70.9 39.2
  4. 75.8 58.2 48.7];
  5. [p,t,st]=anova2(x)

O p = 0,4491 0,7387 obtido mostra que as diferenças entre os vários combustíveis e os vários propulsores não têm impacto significativo no alcance do foguete.

  1. clc,clear
  2. x0=[58.2,52.6 56.2,41.2 65.3,60.8
  3. 49.1,42.8 54.1,50.5 51.6,48.4
  4. 60.1,58.3 70.9,73.2 39.2,40.7
  5. 75.8,71.5 58.2,51.0 48.7,41.4];
  6. x1=x0(:,1:2:5);x2=x0(:,2:2:6);
  7. for i=1:4
  8. x(2*i-1,:)=x1(i,:);
  9. x(2*i,:)=x2(i,:);
  10. end
  11. [p,t,st]=anova2(x,2)

Verifica-se que p=0,0035 0,026 0,0001, todos menores que 0,05, portanto a hipótese de médias iguais pode ser rejeitada. Ou seja, existem diferenças significativas nas gamas de diferentes combustíveis (fator A) e diferentes propulsores (fator B), e a interação também é significativa.