기술나눔

Matlab 분산 분석

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

생산 공정을 안정화하고 고품질, 고수율을 달성하기 위해서는 제품 품질에 영향을 미치는 요소를 분석하고, 중요한 영향을 미치는 요소를 찾아내는 것이 필요한 경우가 많습니다. 많은 실험을 하고 결과를 분석하고 비교하여 패턴을 찾습니다. 수학적 통계를 이용하여 테스트 결과를 분석하고, 각 요소가 결과에 미치는 영향 정도를 파악하는 방법을 분산분석(Analog of Variance)이라고 하며, ANOVA로 기록합니다.

테스트 결과를 지표라고 하고, 테스트에서 조사해야 하고 제어할 수 있는 조건을 요인 또는 요인이라고 하며, 요인의 상태를 수준이라고 합니다. 요인의 수에 따라 단일요인 분산분석과 2요인 분산분석으로 나눌 수 있습니다.

목차

1. 일원 분산 분석

1.1 수학적 모델

1.2 통계분석

1.3 분산분석표

1.4 Matlab 구현

(1) 균형 잡힌 데이터

(2) 불균형 데이터

1.5 다중 비교

2. 분산의 2요인 분석

2.1 수학적 모델

2.2 상호작용 효과가 없는 분산의 2요인 분석

2.3 상호작용 효과에 대한 양방향 ANOVA 편집

2.4 Matlab 구현


1. 일원 분산 분석

하나의 요인 A가 관심 지수에 미치는 영향만 고려하고 A의 여러 수준을 취하여 각 수준에서 여러 실험을 수행합니다. 실험 중에 A를 제외한 지수에 영향을 미치는 다른 요인은 변경되지 않습니다(임의의 요인만 존재함). 과제는 실험 결과에서 요인 A가 지수에 유의미한 영향을 미치는지, 즉 A가 다른 수준을 취할 때 지수에 유의한 차이가 있는지 여부를 추론하는 것입니다. A가 특정 수준의 지표를 무작위 변수로 사용하는 경우 A가 서로 다른 수준을 취할 때 지표에 유의미한 차이가 있는지 판단하는 것은 여러 모집단의 평균이 동일한지 여부를 테스트하는 것과 같습니다.

1.1 수학적 모델

1.2 통계분석

카이제곱 분포의 가산성에서:

1.3 분산분석표

분산 분석에 일반적으로 사용되는 유의 수준은 다음과 같습니다.α = 0.01, 요인 A의 영향(또는 A의 각 수준 간의 차이)이 매우 중요하다고 말하면서 H0를 거부합니다.α = 0.01, H0를 거부하지 말고 취하십시오.α = 0.05 , H0를 기각하고 요인 A의 영향이 중요하다고 말합니다.α = 0.05 , H0는 기각되지 않으며 요인 A는 큰 영향을 미치지 않는다고 합니다.

1.4 Matlab 구현

Matlab 통계 도구 상자의 일원 분산 분석 명령은 다음과 같습니다. 무변형 . 각 그룹의 데이터 수가 동일한 경우 이를 균형 잡힌 데이터라고 합니다. 각 그룹의 데이터 수가 동일하지 않은 경우 이를 불균형 데이터라고 합니다.

(1) 균형 잡힌 데이터

균형 잡힌 데이터를 처리하는 방법은 다음과 같습니다. p = 비반전(x)

반환 값는 확률이다. p > α언제 받아들이세요 H0 , x는 m×r의 데이터 행렬이고, x의 각 열은 데이터의 레벨(각 레벨의 샘플 용량은 ni = m)입니다. 또한 분산 테이블과 상자 그림이 출력됩니다.

예:

  1. x=[256 254 250 248 236
  2. 242 330 277 280 252
  3. 280 290 230 305 220
  4. 298 295 302 289 252];
  5. p=anova1(x)

p = 0.1109 > α = 0.05로 귀무가설을 기각할 수 없고 H0를 채택하는 것으로 나타났다. 즉, 근로자 5명의 생산성에는 유의한 차이가 없는 것으로 나타났다.

분산표는 위의 일요인 분산표의 1~4열에 해당하며, F = 2.262는 F(4,15) 분포의 1−p 분위수임을 확인할 수 있습니다. fcdf(2.262,4, 15)=0.8891=1 -p.

Box Plot은 5명의 근로자 생산성 데이터의 특성을 반영합니다.

(2) 불균형 데이터

불균형 데이터를 처리하는 용도는 다음과 같습니다. p = anova1(x,그룹)

x는 벡터이고, 첫 번째 그룹부터 r번째 그룹까지의 데이터가 순서대로 배열되어 있으며, 그룹은 x와 동일한 길이의 벡터로 x에 있는 데이터의 그룹을 표시합니다.

예:

  1. clc,clear;
  2. x=[1620 1580 1460 1500
  3. 1670 1600 1540 1550
  4. 1700 1640 1620 1610
  5. 1750 1720 1680 1800];
  6. x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
  7. g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
  8. p=anova1(x,g)

구해진 값은 p=0.0331<0.05로, 여러 공정에 의해 만들어진 전구의 수명에는 상당한 차이가 있음을 의미한다.

 

1.5 다중 비교

전구 수명 문제에서는 전구 수명에 큰 차이가 있는 프로세스를 확인하기 위해 먼저 각 데이터 세트의 평균을 계산합니다.

A1의 평균값이 가장 크지만 다른 항목과 크게 다른지 확인하려면 다중 비교가 필요합니다. 일반적으로 다중 비교에서는 모집단 간의 차이를 분석하기 위해 모든 r개 모집단의 쌍별 비교가 필요합니다. 문제의 특정 상황에 따라 비교 횟수가 줄어들 수 있습니다.

  1. clc,clear;
  2. x=[1620 1580 1460 1500
  3. 1670 1600 1540 1550
  4. 1700 1640 1620 1610
  5. 1750 1720 1680 1800];
  6. x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
  7. g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
  8. [p,t,st]=anova1(x,g)
  9. [c,m,h,nms] = multcompare(st);
  10. [nms num2cell(m)]

2. 분산의 2요인 분석

두 팩터 A와 B가 지수에 미치는 영향을 고려하려면 A와 B를 여러 수준으로 나누고 각 수준 조합에 대해 여러 테스트를 수행하고 얻은 데이터에 대한 분산 분석을 수행하여 두 팩터가 유의미한지 테스트합니다. 또는 두 요소가 지표에 상당한 상호 작용 효과를 갖는지 여부를 추가로 테스트할 필요가 있습니다.

2.1 수학적 모델

2.2 상호작용 효과가 없는 분산의 2요인 분석

경험이나 어떤 종류의 분석을 통해 두 요인 사이에 상호 작용이 없다고 미리 판단할 수 있다면 각 실험 세트를 반복할 필요는 없으며,

t = 1이면 프로세스가 크게 단순화됩니다.

 

교호작용 효과가 없는 2요인 분산분석표:

2.3 상호작용 효과에 대한 분산의 2요인 분석

상호작용 효과에 대한 2요인 분산분석표:

2.4 Matlab 구현

통계 도구 상자에서 anova2를 사용하여 분산의 2요인 분석을 수행합니다.

명령은 다음과 같습니다:p = anova2(x, 반복)

그 중 x의 서로 다른 열에 있는 데이터는 단일 요인의 변화를 나타내고, 서로 다른 행의 데이터는 다른 요인의 변화를 나타냅니다. 각 행-열 쌍("단위")에 둘 이상의 관측 값이 있는 경우 매개변수 res는 각 "단위"에 대한 여러 관측 값의 서로 다른 레이블을 나타내는 데 사용됩니다. 즉, reps는 숫자를 제공합니다. 반복된 실험의 t.

  1. x=[58.2 56.2 65.3
  2. 49.1 54.1 51.6
  3. 60.1 70.9 39.2
  4. 75.8 58.2 48.7];
  5. [p,t,st]=anova2(x)

획득된 p=0.4491 0.7387은 다양한 연료와 다양한 추진기 간의 차이가 로켓 범위에 큰 영향을 미치지 않음을 보여줍니다.

  1. clc,clear
  2. x0=[58.2,52.6 56.2,41.2 65.3,60.8
  3. 49.1,42.8 54.1,50.5 51.6,48.4
  4. 60.1,58.3 70.9,73.2 39.2,40.7
  5. 75.8,71.5 58.2,51.0 48.7,41.4];
  6. x1=x0(:,1:2:5);x2=x0(:,2:2:6);
  7. for i=1:4
  8. x(2*i-1,:)=x1(i,:);
  9. x(2*i,:)=x2(i,:);
  10. end
  11. [p,t,st]=anova2(x,2)

p=0.0035 0.026 0.0001로 모두 0.05보다 작은 것으로 나타나 평균균등가설은 기각될 수 있다. 즉, 다양한 연료(인자 A)와 다양한 추진기(인자 B)의 범위에 상당한 차이가 있으며 상호 작용도 중요합니다.