моя контактная информация
Почтамезофия@protonmail.com
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Чтобы стабилизировать производственный процесс и добиться высокого качества и высокого выхода продукции, необходимо проанализировать факторы, влияющие на качество продукции, и выяснить те факторы, которые оказывают существенное влияние. много экспериментировать и анализировать и сравнивать результаты, ища правила. Метод использования математической статистики для анализа результатов испытаний и определения степени влияния каждого фактора на результаты называется дисперсионным анализом, записываемым как ANOVA.
Результаты теста называются показателями, условия, которые необходимо исследовать и можно контролировать в тесте, — факторами или факторами, а состояние факторов — уровнем. По количеству факторов его можно разделить на: однофакторный дисперсионный анализ и двухфакторный дисперсионный анализ.
Оглавление
1. Односторонний дисперсионный анализ
1.3 Таблица дисперсионного анализа
2. Двухфакторный дисперсионный анализ
2.2 Двухфакторный дисперсионный анализ без эффектов взаимодействия
Редактировать 2.3 Двусторонний дисперсионный анализ эффектов взаимодействия
Рассмотрим только влияние одного фактора А на индекс беспокойства, возьмем несколько уровней А и проведем несколько экспериментов на каждом уровне. В ходе эксперимента остальные факторы, влияющие на индекс, кроме А, остаются неизменными (существуют только случайные факторы), наши. Задача состоит в том, чтобы по результатам эксперимента сделать вывод о том, оказывает ли фактор А существенное влияние на индекс, то есть существует ли значительная разница в индексе при принятии А разных уровней. А принимает показатель на определенном уровне как случайную величину. Оценка того, существует ли значительная разница в показателе, когда А принимает разные уровни, эквивалентна проверке того, равны ли средние значения нескольких совокупностей.
Из аддитивности распределения хи-квадрат:
Уровень значимости, обычно используемый в дисперсионном анализе, следующий:α = 0.01, отвергаем H0, говоря, что влияние фактора A (или разница между каждым уровнем A) очень значительна;α = 0.01, не отвергайте H0, а возьмитеα = 0.05 , отбросим H0 и скажем, что влияние фактора A существенно;α = 0.05 , H0 не отвергается, и говорят, что фактор A не оказывает существенного влияния.
Команда одностороннего дисперсионного анализа в статистическом наборе инструментов Matlab: анальный . Если количество данных в каждой группе одинаково, это называется сбалансированными данными. Если количество данных в каждой группе не одинаково, это называется несбалансированными данными.
Использование для обработки сбалансированных данных: p=анальный(x)
возвращаемое значение пэто вероятность, когда р > αпринять, когда Н0 , x — матрица данных размера m×r, а каждый столбец x — это уровень данных (емкость выборки на каждом уровне равна ni = m). Кроме того, выводятся таблица отклонений и коробчатая диаграмма.
Пример:
- x=[256 254 250 248 236
- 242 330 277 280 252
- 280 290 230 305 220
- 298 295 302 289 252];
- p=anova1(x)
Установлено, что p = 0,1109 >α = 0,05, поэтому нулевую гипотезу нельзя отвергнуть и принять H0, то есть существенной разницы в производительности 5 рабочих нет.
Таблица дисперсии соответствует столбцам с 1 по 4 однофакторного анализа таблицы дисперсии, приведенной выше. F = 2,262 — это 1-p-квантиль распределения F(4,15). Можно проверить, что fcdf(2,262,4, 15)=0,8891=1 -п.
Ящик-диаграмма отражает характеристики пяти данных о производительности труда.
Использование для обработки несбалансированных данных: p=анова1(x,группа)
x — вектор, а данные от 1-й группы до r-й группы расположены по порядку. Группа представляет собой вектор той же длины, что и x, обозначающий группу данных в x;
Пример:
- clc,clear;
- x=[1620 1580 1460 1500
- 1670 1600 1540 1550
- 1700 1640 1620 1610
- 1750 1720 1680 1800];
- x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
- g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
- p=anova1(x,g)
Получено: p=0,0331<0,05, следовательно, существует значительная разница в сроке службы лампочек, обусловленная несколькими процессами.
В задаче о сроке службы лампочек, чтобы определить, какие процессы имеют существенные различия в сроке службы лампочек, мы сначала вычисляем среднее значение каждого набора данных:
Хотя A1 имеет самое большое среднее значение, необходимо несколько сравнений, чтобы определить, значительно ли оно отличается от других. Как правило, множественные сравнения требуют попарного сравнения всех r популяций для анализа различий между ними. Количество сравнений может быть уменьшено в зависимости от конкретных обстоятельств задачи.
- clc,clear;
- x=[1620 1580 1460 1500
- 1670 1600 1540 1550
- 1700 1640 1620 1610
- 1750 1720 1680 1800];
- x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
- g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
- [p,t,st]=anova1(x,g)
- [c,m,h,nms] = multcompare(st);
- [nms num2cell(m)]
Если вы хотите рассмотреть влияние двух факторов A и B на индекс, разделите A и B на несколько уровней, проведите несколько тестов для каждой комбинации уровней, проведите дисперсионный анализ полученных данных и проверьте, имеют ли эти два фактора существенную значимость. влияние на индекс, или необходимо дополнительно проверить, оказывают ли эти два фактора существенное интерактивное влияние на показатель.
Если на основании опыта или какого-либо анализа можно заранее определить, что между двумя факторами нет взаимодействия, нет необходимости повторять каждую серию экспериментов.
t = 1, процесс существенно упрощается.
Таблица двухфакторного дисперсионного анализа без эффектов взаимодействия:
Таблица двухфакторного дисперсионного анализа по эффектам взаимодействия:
Используйте anova2 в наборе статистических инструментов для выполнения двухфакторного дисперсионного анализа.
Команда:p=anova2(x,повторения)
Среди них данные в разных столбцах x представляют изменения одного фактора, а данные в разных строках представляют изменения другого фактора. Если каждая пара строка-столбец («единица измерения») имеет более одного значения наблюдения, параметр повторы используется для указания различных меток нескольких значений наблюдения для каждой «единицы», то есть повторы дают число повторных экспериментов т. н.
- x=[58.2 56.2 65.3
- 49.1 54.1 51.6
- 60.1 70.9 39.2
- 75.8 58.2 48.7];
- [p,t,st]=anova2(x)
Полученное значение p=0,4491-0,7387 показывает, что различия между различными видами топлива и различными двигателями не оказывают существенного влияния на дальность полета ракеты.
- clc,clear
- x0=[58.2,52.6 56.2,41.2 65.3,60.8
- 49.1,42.8 54.1,50.5 51.6,48.4
- 60.1,58.3 70.9,73.2 39.2,40.7
- 75.8,71.5 58.2,51.0 48.7,41.4];
- x1=x0(:,1:2:5);x2=x0(:,2:2:6);
- for i=1:4
- x(2*i-1,:)=x1(i,:);
- x(2*i,:)=x2(i,:);
- end
- [p,t,st]=anova2(x,2)
Установлено, что p=0,0035 0,026 0,0001, все меньше 0,05, поэтому гипотезу о равных средних можно отклонить. То есть существуют существенные различия в дальности действия разных видов топлива (фактор А) и разных двигателей (фактор В), и взаимодействие также существенно.