Ukkaskadgel.ru

Документооборот онлайн
217 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Однофакторный дисперсионный анализ в Excel

Однофакторный дисперсионный анализ в MS Excel

Для рассмотрения однофакторного дисперсионного анализа в MS Excel решим следующий пример.

Пример 3.2.В таблице 3 приведены данные по объемам работ, выполненных на посадке декоративных кустарников за смену для четырех бригад.

Номер бригадыОбъем выполненной работыГрупповое среднееВыборочная смещенная дисперсия
140, 144, 142, 145142,753,688
150, 149, 152, 152150,751,688
148, 149, 146, 147147,501,25
150, 155, 154, 152152,753,688

Проверить гипотезу дисперсионного анализа H0 о равенстве средних: m1 = m2 = m3 = m4.

Решение. Для проверки гипотезы H0 вычислим суммы Q1 и Q2 .

Общее выборочное среднее равно

Вычислим статистику Фишера:

По таблицам распределения Фишера для a = 0,05 и степеней свободы k1 =3, k2 = 12 найдем критическое значение Fкр =3,49. Так как F> Fкр, то гипотезу H0 отклоняем, т.е. считаем, что объем ежедневной выработки зависит от работающей бригады. Оценим степень этой зависимости с помощью коэффициента детерминации. Для этого вычислим Q :

Контроль: Q = Q1+Q2 = 228,688 + 41,25 = 269,9 – верно!

По формуле (48) получим: , это означает, что 84,7% общей вариации (изменчивости) ежесменного объема выработки связано с работающей бригадой.

В MS Excel для проведения однофакторного дисперсионного анализа использует­ся процедура Однофакторный дисперсионный анализ.

Для проведения дисперсионного анализа необходимо:

•ввести данные в таблицу, так чтобы в каждом столбце оказались данные, соот­ветствующие одному значению исследуемого фактора, а столбцы располагались в порядке возрастания (убывания) величины исследуемого фактора,

•выполнить команду Сервис > Анализ данных;

•в появившемся диалоговом окне Анализ данныхв списке Инструментыанализа выбрать процедуру Однофакторный дисперсионный анализ, указав курсором мыши и щелкнув левой кнопкой мыши. Затем нажать кнопку ОК;

•в появившемся диалоговом окне задать Входной интервал, то есть ввести ссылку на диапазон анализируемых данных, содержащий все столбцы данных. Для этого следует навести указатель мыши на верхнюю левую ячейку диапазона данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней правой ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши;

•в разделе Группировка переключатель установить в положение по столбцам;

•указать Выходной диапазон, то есть ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить переключатель в положение Выходной интервал (навести указатель мыши и щелкнуть левой кноп­кой), далее навести указатель мыши на правое поле ввода Выходной интервал и щелкнуть левой кнопкой мыши, затем указатель мыши навести на левую верх­нюю ячейку выходного диапазона и щелкнуть левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведе­но сообщение в случае возможного наложения выходного диапазона на исход­ные данные.

•нажать кнопку ОК.

Результаты анализа. Выходной диапазон будет включать в себя результаты дис­персионного анализа: средние, дисперсии, критерий Фишера и другие показатели.

Однофакторный дисперсионный анализ
ИТОГИ
ГруппыСчетСуммаСреднееДисперсия
Строка 1142,754,916667
Строка 2150,752,25
Строка 3147,51,666667
Строка 4152,754,916667
Дисперсионный анализ
Источник вариацииSSdfMSFP-ЗначениеF критическое
Между группами228,687576,2291722,175763,48104E-053,490294821
Внутри групп41,253,4375
Итого269,9375

Как видно из таблицы, общая сумма квадратов SS (Q) = 269,938 разбита на компоненты: Q1= 228,688, обусловленную различием средних значений между группами и Q2= 41,25, обусловленную внутригрупповой изменчивостью

где Q— общая сумма квадратов отклонений наблюдений от общего среднего, Q1— сумма квадратов отклонений выборочных средних от общего среднего, Q2— сумма квадратов отклонений наблюдений от групповых средних.

Заметим, что MS в этой таблице есть средний квадрат, равный SS, деленная на число степеней свободы (df).

MS1 = Q1/ df1 = 228,688 / 3 = 76,229

Читать еще:  Нумерация приказов в кадровом делопроизводстве

MS2 = Q2/ df2 = 41,25 / 12 = 3,438

F = MS1 / MS2 = 76,229 / 3,438 = 22,176

Внутригрупповая изменчивость (SS) обычно называется остаточной компонентой или дисперсией ошибки. Это означает, что обычно при проведении эксперимента она не может быть предсказана или объяснена. С другой стороны, SS эффект (или компоненту дисперсии между группами) можно объяснить различием между средними значениями в группах. Иными словами, принадлежность к некоторой группе объясняет межгрупповую изменчивость, т.к. нам известно, что эти группы обладают разными средними значениями.
Интерпретация результатов. Влияние исследуемого фактора определяется по величине значимости критерия Фишера, которая находится в таблице Дисперси­онный анализ на пересечении строки Между группами и столбца Р-Значение. В случаях, когда Р-Значение

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого.

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ — конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой.

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰).

Однофакторный дисперсионный анализ в Excel

Однофакторный дисперсионный анализ изучает влияния одного фактора на анализируемый признак.

В таблицы приведены статистические данные по количеству изготовленных деталей на заводе каждым мастером в течение каждой недели.

Необходимо выяснить зависимость количества изготовленных деталей от производительности мастера. Уровень значимости равен α=0.05.

№ п/пНомер неделиКоличество изготовленных деталей
Первым мастеромВторым мастеромТретьим мастеромЧетвертым мастеромПятым мастером
1.Первая неделя260253258257251
2.Вторая неделя257255255252250
3.Третья неделя259250254253255
4.Четвёртая неделя254254260257251

Переходим на вкладку Данные -> Анализ данных. Выбираем однофакторный дисперсионный анализ и жмём Ок.

Появляется окно, здесь во входном интервале выбираем диапазон данный в нашей таблицы в нашем случае это диапазон ячеек $C$3:$G$6, альфа ставим 0,05 (обычно в Excel данная величина стоит по умолчанию) и в выходном интервале указываем произвольную ячейку на листе Excel, где желаете, чтобы отобразился результат, далее Ок.

В результате получим решение в виде таблицы.

Однофакторный дисперсионный анализ
ИТОГИ
ГруппыСчетСуммаСреднееДисперсия
Столбец 141030257,57
Столбец 2410122534,666666667
Столбец 341027256,757,583333333
Столбец 441019254,756,916666667
Столбец 541007251,754,916666667
Дисперсионный анализ
Источник вариацииSSdfMSFP-ЗначениеF критическое
Между группами 94,5423,6253,8002680970,025089214 3,055568276
Внутри групп93,25156,21666667
Итого 187,7519

Из таблицы значения F-критерия равно Fнабл=3.8, а Fкрит=3, правосторонний интервал (3; +∞) Fнабл>Fкрит, отсюда следует, что Fнабл лежит в этом интервале, следовательно, нулевую гипотезу H0 о равенстве групповых матожиданий — отвергаем, следовательно фактор — количества изготовленных деталей зависит от признака — производительности мастера.

Найдём выборочный коэффициент детерминации:

Этот показатель говорит о том, что около половины еженедельного количества изготовленных деталей мастерами связано с номером недели.

Насколько публикация полезна?

Нажмите на звезду, чтобы оценить!

Средняя оценка 4.3 / 5. Количество оценок: 6

Вычисления в MS Excel. Тема 2. Однофакторный дисперсионный анализ

Тема 2. Однофакторный дисперсионный анализ

Вариант 1. Однофакторный дисперсионный анализ

Задание: при уровне значимости 0,05, установить значимость влияния фактора А методом однофакторного дисперсионного анализа. Дать интерпретацию фактору и его уровню, а также результирующему показателю в терминах экономических величин.

Уровни фактора АНомер испытания 1 2 3 4
а1 а2 а3 а412 17 13 11 14 13 14 12 10 11 14 13 13 9 8 9
Читать еще:  Зачем России 33 миллиона бюджетников и чиновников?

Вариант 2. Однофакторный дисперсионный анализ

Задание: при уровне значимости 0,05, установить значимость влияния фактора А методом однофакторного дисперсионного анализа. Дать интерпретацию фактору и его уровню, а также результирующему показателю в терминах экономических величин.

Уровни фактора АНомер испытания 1 2 3 4
а1 а2 а3100 101 126 128 92 102 104 115 74 87 88 93

Вариант 10. Однофакторный дисперсионный анализ

Задание: при уровне значимости 0,05, установить значимость влияния фактора А методом однофакторного дисперсионного анализа. Дать интерпретацию фактору и его уровню, а также результирующему показателю в терминах экономических величин.

Уровни фактора АНомер испытания 1 2 3 4
а1 а2 а3 а48 8 11 9 12 11 7 6 14 13 12 9 10 15 8 7

Вариант 11. Однофакторный дисперсионный анализ

Задание: при уровне значимости 0,05, установить значимость влияния фактора А методом однофакторного дисперсионного анализа. Дать интерпретацию фактору и его уровню, а также результирующему показателю в терминах экономических величин.

Уровни фактора АНомер испытания 1 2 3 4
а1 а2 а3 а418 18 22 29 32 31 37 36 44 43 52 49 50 55 60 57

Вариант 14. Однофакторный дисперсионный анализ

Задание: при уровне значимости 0,05, установить значимость влияния фактора А методом однофакторного дисперсионного анализа. Дать интерпретацию фактору и его уровню, а также результирующему показателю в терминах экономических величин.

Уровни фактора АНомер испытания 1 2 3 4
а1 а2 а3 а412 14 15 11 15 17 20 22 20 16 19 23 33 29 24 27

Вычисления в MS Excel

Пример. Известны итоговые результаты в баллах 20 студентов по дисциплине «Теория вероятностей и математическая статистика». Требуется установить, влияет ли базовое (среднее) образование на успеваемость студента.

Уровни фактора А – базовое (среднее) образование студентаНомер испытания
Гимназия или лицей
Школа с углубленным изучением предметов
Обычная школа
Техникум

Решение. Заносим исходные данные в MS Excel, как в таблице.

Рис. 2.4. Выбор однофакторного дисперсионного анализа

Рис. 2.5. Ввод данных для расчета однофакторного дисперсионного анализа

После проделанных расчетов можно выполнить проверку результата с помощью пакета анализа (пункт меню «Данные», затем выбираем «пакет анализа») (рис. 2.4.).

При введении данных в раздел пакет анализа «однофакторный дисперсионный анализ» необходимо обратить внимание на расположение исходных данных в строках или столбцах (рис. 2.5). Для расчетов входной интервал выделяем вместе с названиями уровней фактора, не забывая при этом поставить отметку в графе «метки в первом столбце». Когда все данные правильно введены, нажимаем кнопку «ОК» и переходим на тот лист, на который будут выведены результаты расчетов (рис. 2.6).

По рис. 2.6. видно, что все результаты, сделанные вручную, совпадают с результатами, рассчитанными автоматически. Таким образом, они верны.

Рис. 2.6. Результаты расчетов значений критерия Фишера с помощью пакета анализа

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.)

Факторный и дисперсионный анализ в Excel с автоматизацией подсчетов

Чтобы проанализировать изменчивость признака под воздействием контролируемых переменных, применяется дисперсионный метод.

Для изучения связи между значениями – факторный метод. Рассмотрим подробнее аналитические инструменты: факторный, дисперсионный и двухфакторный дисперсионный метод оценки изменчивости.

Дисперсионный анализ в Excel

Условно цель дисперсионного метода можно сформулировать так: вычленить из общей вариативности параметра 3 частные вариативности:

  • 1 – определенную действием каждого из изучаемых значений;
  • 2 – продиктованную взаимосвязью между исследуемыми значениями;
  • 3 – случайную, продиктованную всеми неучтенными обстоятельствами.

В программе Microsoft Excel дисперсионный анализ можно выполнить с помощью инструмента «Анализ данных» (вкладка «Данные» — «Анализ»). Это надстройка табличного процессора. Если надстройка недоступна, нужно открыть «Параметры Excel» и включить настройку для анализа.

Читать еще:  Можно ли госпитализировать в психиатрический стационар без согласия

Работа начинается с оформления таблицы. Правила:

  1. В каждом столбце должны быть значения одного исследуемого фактора.
  2. Столбцы расположить по возрастанию/убыванию величины исследуемого параметра.

Рассмотрим дисперсионный анализ в Excel на примере.

Психолог фирмы проанализировал с помощью специальной методики стратегии поведения сотрудников в конфликтной ситуации. Предполагается, что на поведение влияет уровень образования (1 – среднее, 2 – среднее специальное, 3 – высшее).

Внесем данные в таблицу Excel:

  1. Открываем диалоговое окно нашего аналитического инструмента. В раскрывшемся списке выбираем «Однофакторный дисперсионный анализ» и нажимаем ОК.
  2. В поле «Входной интервал» ввести ссылку на диапазон ячеек, содержащихся во всех столбцах таблицы.
  3. «Группирование» назначить по столбцам.
  4. «Параметры вывода» — новый рабочий лист. Если нужно указать выходной диапазон на имеющемся листе, то переключатель ставим в положение «Выходной интервал» и ссылаемся на левую верхнюю ячейку диапазона для выводимых данных. Размеры определятся автоматически.
  5. Результаты анализа выводятся на отдельный лист (в нашем примере).

Значимый параметр залит желтым цветом. Так как Р-Значение между группами больше 1, критерий Фишера нельзя считать значимым. Следовательно, поведение в конфликтной ситуации не зависит от уровня образования.

Факторный анализ в Excel: пример

Факторным называют многомерный анализ взаимосвязей между значениями переменных. С помощью данного метода можно решить важнейшие задачи:

  • всесторонне описать измеряемый объект (причем емко, компактно);
  • выявить скрытые переменные значения, определяющие наличие линейных статистических корреляций;
  • классифицировать переменные (определить взаимосвязи между ними);
  • сократить число необходимых переменных.

Рассмотрим на примере проведение факторного анализа. Допустим, нам известны продажи каких-либо товаров за последние 4 месяца. Необходимо проанализировать, какие наименования пользуются спросом, а какие нет.

  1. Посмотрим, за счет, каких наименований произошел основной рост по итогам второго месяца. Если продажи какого-то товара выросли, положительная дельта – в столбец «Рост». Отрицательная – «Снижение». Формула в Excel для «роста»: =ЕСЛИ((C2-B2)>0;C2-B2;0), где С2-В2 – разница между 2 и 1 месяцем. Формула для «снижения»: =ЕСЛИ(J3=0;B2-C2;0), где J3 – ссылка на ячейку слева («Рост»). Во втором столбце – сумма предыдущего значения и предыдущего роста за вычетом текущего снижения.
  2. Рассчитаем процент роста по каждому наименованию товара. Формула: =ЕСЛИ(J3/$I$11=0;-K3/$I$11;J3/$I$11). Где J3/$I$11 – отношение «роста» к итогу за 2 месяц, ;-K3/$I$11 – отношение «снижения» к итогу за 2 месяц.
  3. Выделяем область данных для построения диаграммы. Переходим на вкладку «Вставка» — «Гистограмма».
  4. Поработаем с подписями и цветами. Уберем накопительный итог через «Формат ряда данных» — «Заливка» («Нет заливки»). С помощью данного инструментария меняем цвет для «снижения» и «роста».

Теперь наглядно видно, продажи какого товара дают основной рост.

Двухфакторный дисперсионный анализ в Excel

Показывает, как влияет два фактора на изменение значения случайной величины. Рассмотрим двухфакторный дисперсионный анализ в Excel на примере.

Задача. Группе мужчин и женщин предъявляли звук разной громкости: 1 – 10 дБ, 2 – 30 дБ, 3 – 50 дБ. Время ответа фиксировали в миллисекундах. Необходимо определить, влияет ли пол на реакцию; влияет ли громкость на реакцию.

  1. Переходим на вкладку «Данные» — «Анализ данных» Выбираем из списка «Двухфакторный дисперсионный анализ без повторений».
  2. Заполняем поля. В диапазон должны войти только числовые значения.
  3. Результат анализа выводится на новый лист (как было задано).

Та как F-статистики (столбец «F») для фактора «Пол» больше критического уровня F-распределения (столбец «F-критическое»), данный фактор имеет влияние на анализируемый параметр (время реакции на звук).

0 0 голоса
Рейтинг статьи
Ссылка на основную публикацию
ВсеИнструменты