6.3.4. Статистический анализ результатов эксперимента

Статистическая обработка результатов эксперимента

6.3.4. Статистический анализ результатов эксперимента

В этом разделе приведены часто используемые термины, необходимые для понимания изложенного материала.

Числовые характеристики выборки – обобщенные показатели, позволяющие:

  • дать количественную оценку эмпирическим распределениям;
  • сравнивать выборки между собой.

Статистической гипотезой (гипотезой) называется утверждение относительно истинных значений параметров исследуемой генеральной совокупности.

Нулевая гипотеза (Но) – предположение о том, что между параметрами генеральных совокупностей  разница равна нулю и различия между ними носят не систематический, а случайный характер.

Альтернативная гипотеза (Н1) – гипотеза, противоположная нулевой.

Уровень значимости  —  вероятность отклонения  нулевой гипотезы, когда она верна или другими словами вероятность ошибки.

Критерий — метод проверки статистических гипотез.

Критерий хи-квадрат, критерий лямбда Колмогорова–Смирнова – критерии согласия, часто используемые для проверки гипотезы о нормальности распределения.

t – критерий Стьюдента – критерий, позволяющий оценить, насколько статистически существенно различаются средние арифметические двух выборок.

F – критерий Фишера – метод, позволяющий проверить гипотезу, что две независимые выборки получены из генеральных совокупностей X и Y  с одинаковыми дисперсиями sx2 и sY2 .

Критерий Манна-Уитни — непарамтерический критерий проверки статистических гипотез.  Применяется для независимых выборок.

О методах математической статистики и ее практическом применении можно прочесть в книге «Компьютерная обработка данных экспериментальных исследований»

Критерий Вилкоксона – непараметрический критерий проверки статистических гипотез. Применяется для связанных выборок.

Корреляционный анализ – метод статистической обработки результатов, сущность которого состоит в определении степени взаимосвязи между двумя случайными величинами X  и Y.

Лекция 2.  Числовые  характеристики выборки

В своей статье, опубликованной в 1989 году В.М. Зациорский указал, какие числовые характеристики должны быть представлены в публикации, чтобы она имела научную ценность.

Он писал, что исследователь  “…должен назвать: 1) среднюю величину (или другой так называемый показатель положения); 2) среднее квадратическое отклонение (или другой показатель рассеяния) и 3) число испытуемых.

Без них его публикация научной ценности иметь не будет “с. 52.

После проведения эксперимента исследователь получает определенные результаты. Чтобы его результаты можно было сравнить с данными других исследователей, необходимо рассчитать числовые характеристики выборки. Наибольшее практическое значение имеют  характеристики  положения, рассеивания и асимметрии (табл.1).

Таблица 1 — Название и обозначение числовых характеристик выборки

Характеристики
ПоложенияВариативностиФормы распределения
Среднее арифметическое (М)Размах вариации (R)Коэффициент асимметрии (As)
Мода (Мо)Дисперсия (S2)Коэффициент эксцесса (Ex)
Медиана (Ме)Стандартное отклонение (S)

Характеристики  положения

Среднее арифметическое  (М) – одна из основных характеристик выборки.  Этот показатель характеризуется тем, что сумма отклонений от него выборочных значений (с учетом знака) равна нулю.

где: n  – объем выборки, xi   – варианты выборки.

Среднее арифметическое, вычисленное  на основе выборочных данных, как правило, не совпадает с генеральным средним.  Чтобы оценить, насколько выборочное среднее арифметическое отличается от генерального среднего, вычисляется ошибка среднего арифметического или ошибка репрезентативности (m).

где: S — стандартное отклонение (см. далее).

В научных публикациях очень часто окончательный результат приводится в следующем виде:  М±m.  В качестве примера приведем фрагмент таблицы из публикации Г.Г.Лапшиной (табл. 2).

Таблица 2 — Антропометрический  и функциональный статусы студенток, n= 83 (по: Г.Г.Лапшиной, 1989)

ПоказателиМ±ms
Длина тела, см163,7±0,95,8
Масса тела, кг60,8±1,27,5

Медианой (Me) – называется такое значение признака, когда одна половина значений экспериментальных данных меньше ее, а вторая половина — больше.

Мода (Мо) – представляет собой значение признака, встречающееся в выборке наиболее часто.

Характеристики вариативности

Средние значения не дают полной информации о варьирующем признаке, поэтому наряду со средними значениями вычисляют характеристики вариации.-

Размах вариации (R) вычисляется как разность между максимальным и минимальным значением признака: R= Xmax-Xmin.

Информативность этого показателя невелика, так как распределения результатов могут иметь одинаковый размах варьирования, а их форма будет очень отличаться.

Дисперсия (S2) – средний квадрат отклонений значений признака от среднего арифметического  (4):

Наиболее часто в публикациях приводится не дисперсия, а стандартное отклонение (S). Этот показатель также называется среднеквадратическим отклонением или СКО (5):

Во многих публикациях этот показатель обозначается s, однако мы рекомендуем применять обозначения, используемые в книге В.С. Иванова (1990): S – выборочное стандартное отклонение, сигма – стандартное отклонение генеральной совокупности. В качестве примера приведем фрагмент таблицы из статьи Л.Н. Жданова (1996).

Таблица 3 — Зависимость возраста достижения лучшего результата и количество необходимого для этого времени от возраста начала спортивной специализации у конькобежцев, дистанция 500 м, 225 спортсменов (по: Л.Н.Жданову, 1996).

Возраст начала спортивной специализации, летСпортивная квалификацияМальчики, юноши
Возраст лучшего результатаКоличество лет с начала специализации
МS
10МC20,00,510,0
КМС17,60,57,6
I,II15,00,35,0

Коэффициент  вариации (V%). Чтобы сопоставить вариативность  признаков, измеренных в различных единицах, используется относительный показатель (6), которы йназывается коэффициентов вариации.

Коэффициент вариации используют для оценки однородности выборки. Если V < 10% – выборка однородна, то есть, получена из одной генеральной совокупности. Очень часто в публикациях приводят  четыре  показателя: объем выборки, среднее арифметическое, стандартное отклонение и коэффициент вариации (К.А.Ежевская, 1995).

Характеристики  асимметрии

Коэффициент асимметрии (As) характеризует “скошен­ность“ эмпирического распределения.

Коэффициент эксцесса (Ex) определяет характер эмпирического распределения: остро- или плосковершинный.

Лекция 3. Закон нормального распределения

Корректное  использование критериев проверки статистических  гипотез предполагает знание  закона распределения. Так, например, использование t – критерия  Стьюдента и  F-критерия Фишера требует нормального распределения экспериментальных данных. К сожалению, многие исследователи это не учитывают.

Большинство экспериментальных распределений, полученных при исследованиях в области физической культуры и спорта может быть описано с помощью нормального  распределения. График плотности вероятности  нормального распределения имеет следующий вид (рис. 1).

Рис. 1

На рис. 1 представлено распределение роста женщин с параметрами:  мю (генеральное среднее) – 170 см, s = 5 см.

Нормальное распределение обладает следующими свойствами:

1. Нормальная кривая имеет колокообразную форму, симметричную относительно  x =  мю.

2. Точки перегиба отстоят от мю  на  ± сигма .

3. Нормальное распределение полностью определяется двумя параметрами: мю и сигма.

4. Медиана и мода  совпадают и равны  мю.

5. В интервал  мю ± сигма     попадают  68 %  всех результатов.

    В интервал  мю ± 2 сигмы  попадают  95%   всех  результатов.

    В интервал  мю ± 3 сигмы  попадают  99 %  всех результатов.

Чтобы проверить, соответствует ли распределение нормальному закону, существует много методов. Можно использовать свойства нормального распределения  (равенство среднего, моды и медианы). Однако более точные результаты дают критерии согласия. В зависимости от объема выборки (n) следует использовать различные критерии:

если объем выборки небольшой (n = 10) – критерий Шапиро – Уилки;

если  объем выборки более 40 — критерий хи-квадрат и критерий Колмогорова-Смирнова;

Лекция 4. Проверка статистических гипотез

          Рассчитав числовые характеристики выборки, экспериментатор получает возможность сравнивать свои результаты с данными других исследователей или сравнить результаты, показанные контрольной и экспериментальной группой.

Иногда задача работы состоит в том, чтобы сравнить результат, показанный группой спортсменов до и после эксперимента.  В этом случае, чтобы дать ответ, существуют ли достоверные различия в результатах, нужно проверить статистические гипотезы, использовав для этого специальные методы —  критерии значимости.

Таким образом, критерий значимости — это метод проверки статистической гипотезы.

          При использовании критериев значимости выдвигается нулевая гипотеза(Ho) — предположение о том, что  в параметрах генеральных совокупностей из которых получены данные, представленные в выборках, разница равна нулю и различия между ними носят не систематический, а случайный характер. Противоположная гипотеза называется альтернативной (Н1).

Для проверки статистических гипотез применяются параметрические и непараметрические критерии. Параметрические критерии включают в формулу расчета параметры распределения, в нашем случае нормального.

поэтому первым условием использования параметрических критериев является нормальное распределение результатов исследования. Вторым условием применения параметрических критериев является статистическая шкала, в которой представлены данные.

Такими шкалами являются интервальная шкала и шкала отношений (данные, представлены в этих шкалах измеряются в кг, м, с и т.д).

  Непараметрические критерии (или ранговые критерии) построены по другому принципу и не требуют нормального распределения экспериментальных результатов. Кроме того, эти критерии можно применять к данным, представленным в порядковой шкале (баллы).

Параметрические критерии

К параметрическим критериям относят: критерий Стьюдента для независимых выборок и критерий Стьюдента для связанных выборок.

t–критерий Стьюдента для независимых выборок

Условия применения: обе выборки независимы и получены из генеральных совокупностей X и Y, имеющих нормальное распределение с параметрами μx , μy , σx  σy .

Гипотеза: Ho: μx= μy  (предполагается равенство средних арифметических генеральных совокупностей).

 Альтернатива: H1: μx ≠ μy или H1  μx >μy  или H1: μx 0 или H1: md < 0.

Значение t – критерия Стьюдента   определяется по формуле (10):

где: `d – среднее арифметическое разностей, Sd`    стандартное отклонение.

Непараметрические критерии

Применение параметрических критериев (t – критерия Стьюдента) связано с целым рядом допущений.

Например, сравнивая выборочные средние значения с помощью t – критерия Стьюдента, принимались следующие предположения: обе выборки являются случайными, то есть каждая из них получена в результате независимых измерений, обе выборки получены из генеральных совокупностей, имеющих нормальное распределение, дисперсии генеральных совокупностей равны между собой. На практике эти предположения строго никогда не выполняются, поэтому применение параметрических критериев всегда связано с опасностью ошибочных выводов, возникающих из-за нарушения принятых допущений. В последнее время в математической статистике интенсивно разрабатываются непараметрические методы, которые строятся так, чтобы их применение зависело от возможно меньшего числа допущений.

Параметрические критерии применимы только для сравнения выборочных данных, представляющих собой результаты измерений, выраженных в единицах метрических шкал (метры, килограммы, секунды и т.д.).

Но в спортивных исследованиях часто приходится иметь дело с данными, выраженными в шкалах порядка, например, произвольная нумерация игроков в команде, места, занятые спортсменами в соревнованиях и т.д.

Такие данные нельзя сравнивать с помощью параметрических критериев, а непараметрические критерии могут быть успешно применены  и к данным этого типа.

Сравнение  двух независимых выборок (критерий Манна-Уитни для независимых выборок)

 Условие применения. Применение критерия Вилкоксона основано на единственном предположении: выборки получены из однотипных непрерывных распределений. При этом вид распределения генеральных совокупностей никак не оговаривается.

Гипотеза: Ho: Mex = Mey (предполагается равенство медиан двух генеральных совокупностей).

Альтернатива: H1: Mex ¹ Mey  или H1: Mex  > Mey или H1: Mex  < Mey (в зависимости от того, что требуется доказать: простое различие медиан или то, что результаты в экспериментальной группе больше чем в контрольной).

Сравнение двух связанных выборок (критерий Вилкоксона для связанных выборок)

Гипотеза: Ho: Med = 0

Альтернатива: H1: Med ¹ 0  или H1: Med  > 0  или H1: Med  0,05). Если вычисленное по выборке значение критерия превышает критические значения при   a=0,05; a=0,01 или a=0,001, то различия считаются статистически значимыми. Это  записывается следующим образом: p

Источник: https://allasamsonova.ru/ngu-im-p-f-lesgafta/studenty/kodjei/lekcii-kodei/

Методы вторичной статистической обработки результатов эксперимента (окончание)

6.3.4. Статистический анализ результатов эксперимента

Статистический анализ экспериментальных данных и способы наглядного представления результатов

Большинство показателей, которые получают в психологопедагогических исследованиях, относятся к порядковым, а не к интервальным шкалам (например, оценки типа «да», «нет», «скорее нет, чем да» и другие, которые можно переводить в баллы), поэтому коэффициент линейной корреляции к ним неприменим. В этом случае обращаются к использованию коэффициента ранговой корреляции, формула которого следующая:

П р и м е р. Допустим, что педагога-экспериментатора интересует, влияет ли интерес учащихся к учебному предмету на их успеваемость.

Предположим, что с помощью некоторой психодиагностической методики удалось измерить величину интереса к учению и выразить его для десяти учащихся в следующих цифрах: 5,6,7,8,2,4,8,7,2,9.

Допустим также, что при помощи другой методики были определены средние оценки этих же учащихся по данному предмету, оказавшиеся соответственно равными: 3,2; 4,0; 4,1; 4,2; 2,5; 5,0; 3,0; 4,8; 4,6; 2,4.

Упорядочим оба ряда оценок по величине цифр и припишем каждому из учащихся по два ранга; один из них указывает на то, какое место среди остальных данных ученик занимает по успеваемости, а другой — на то, какое место среди них же он занимает по интересу к учебному предмету.

Ниже приведены ряды цифр, два из которых (первый и третий) представляют исходные данные, а два других (второй и четвертый) — соответствующие ранги3:

    3 Если исходные данные, которые ранжируются, одинаковы, то и их ранги также будут одинаковыми. Они получаются путем суммирования и деления пополам тех рангов, которые соответствуют этим данным.

Определив сумму квадратов различий в рангах и подставив нужное значение в числитель формулы, получаем, что коэффициент ранговой корреляции равен 0,97, т.е. достаточно высок, что и говорит о том, что между интересом к учебному предмету и успеваемостью учащихся действительно существует статистически достоверная зависимость.

Однако по абсолютным значениям коэффициентов корреляции не всегда можно делать однозначные выводы о том, являются ли они значимыми, т.е. достоверно свидетельствуют о существовании зависимости между сравниваемыми переменными.

Может случиться так, что коэффициент корреляции, равный 0,50, не будет достоверным, а коэффициент корреляции, составивший 0,30, — достоверным.

Многое в решении этого вопроса зависит от того, сколько показателей было в коррелируемых друг с другом рядах признаков: чем больше таких показателей, тем меньшим по величине может быть статистически достоверный коэффициент корреляции.

В табл. 35 представлены критические значения коэффициентов корреляции для различных степеней свободы. (В данном случае степенью свободы будет число, равное n — 2, где n — количество данных в коррелируемых рядах.) Заметим, что значимость коэффициента корреляции зависит и от заданного уровня значимости или принятой вероятности допустимой ошибки в расчетах.

Если, к примеру, коррелируется друг с другом два ряда цифр по 10 единиц в каждом и получен коэффициент корреляции между ними, равный 0,65, то он будет значимым на уровне 0,95 (он больше критического табличного значения, составляющего 0,6319 для вероятности допустимой ошибки 0,05, и меньше критического значения 0,7646 для вероятности допустимой ошибки 0,01).

Метод множественных корреляций в отличие от метода парных корреляций позволяет выявить общую структуру корреляционных зависимостей, существующих внутри многомерного экспериментального материала, включающего более двух переменных, и представить эти корреляционные зависимости в виде некоторой системы.

Один из наиболее распространенных вариантов этого метода — факторный анализ — позволяет определить совокупность внутренних взаимосвязей, возможных причинно-следственных связей, существующих в экспериментальном материале. В результате факторного анализа обнаруживаются так называемые факторы — причины, объясняющие множество частных (парных) корреляционных зависимостей.

Фактор — математико-статистическое понятие.

Будучи переведенным на язык психологии (эта процедура называется содержательной или психологической интерпретацией факторов), он становится психологическим понятием.

Например, в известном 16-факторном личностном тесте Р. Кеттела, который подробно рассматривался в первой части книги, каждый фактор взаимно однозначно связан с определенными чертами личности человека.

С помощью выявленных факторов объясняют взаимозависимость психологических явлений. Поясним сказанное на примере. Допустим, что в некотором психологопедагогическом эксперименте изучалось взаимовлияние таких переменных, как характер, способности, потребности и успеваемость учащихся.

Предположим далее, что, оценив каждую из этих переменных у достаточно представительной выборки испытуемых и подсчитав коэффициенты парных корреляций между всевозможными парами данных переменных, мы получили следующую матрицу интеркорреляций (в ней справа и сверху цифрами обозначены в перечисленном выше порядке изученные в эксперименте переменные, а внутри самого квадрата показаны их корреляции друг с другом; поскольку всевозможных пар в данном случае меньше, чем клеток в матрице, то заполнена только верхняя часть матрицы, расположенная выше ее главной диагонали).

Анализ корреляционной матрицы показывает, что переменная 1 (характер)значимо коррелирует с переменными 2 и 3 (способности и потребности).

Переменная 2 (способности) достоверно коррелирует с переменной 3 (потребности), а переменная 3 (потребности) — с переменной 4 (успеваемость).

Фактически из шести имеющихся в матрице коэффициентов корреляции четыре являются достаточно высокими и, если предположить, что они определялись на совокупности испытуемых, превышающей 10 человек, — значимыми.

Зададим некоторое правило умножения столбцов цифр на строки матрицы: каждая цифра столбца последовательно умножается на каждую цифру строки и результаты парных произведений записываются в строку аналогичной матрицы. Пример: если по этому правилу умножить друг на друга три цифры столбца и строки, представленные в левой части матричного равенства, то получим матрицу, находящуюся в правой части этого же равенства:

Задача факторного анализа по отношению к только что рассмотренной является как бы противоположной.

Она сводится к тому, чтобы по уже имеющейся матрице парных корреляций, аналогичной представленной в правой части показанного выше матричного равенства, отыскать одинаковые по включенным в них цифрам столбец и строку, умножение которых друг на друга по заданному правилу порождает корреляционную матрицу. Иллюстрация:

Здесь x1 х2 х3 и х4 — искомые числа. Для их точного и быстрого определения существуют специальные математические процедуры и программы для ЭВМ.

Допустим, что мы уже нашли эти цифры: х1 = 0,45, х2 = 0,36 х3 = 1,12, х4 = 0,67. Совокупность найденных цифр и называется фактором, а сами эти цифры — факторными весами или нагрузками.

Эти цифры соответствуют тем психологическим переменным, между которыми вычислялись парные корреляции. х1 — характер, х2 — способности, х3 — потребности, х4 — успеваемость.

Поскольку наблюдаемые в эксперименте корреляции между переменными можно рассматривать как следствие влияния на них общих причин — факторов, а факторы интерпретируются в психологических терминах, мы можем теперь от факторов перейти к содержательной психологической интерпретации обнаруженных статистических закономерностей.

Фактор содержит в себе ту же самую информацию, что и вся корреляционная матрица, а факторные нагрузки соответствуют коэффициентам корреляции. В нашем примере х3 (потребности) имеет наибольшую факторную нагрузку (1,12), а х, (способности) — наименьшую (0,36).

Следовательно, наиболее значимой причиной, влияющей на все остальные психологические переменные, в нашем случае являются потребности, а наименее значимой — способности. Из корреляционной матрицы видно, что связи переменной х3 со всеми остальными являются наиболее сильными (от 0,40 до 0,75), а корреляции переменной x2 — самыми слабыми (от 0,16 до 0,40).

Чаще всего в итоге факторного анализа определяется не один, а несколько факторов, по-разному объясняющих матрицу интеркорреляций переменных. В таком случае факторы делят на генеральные, общие и единичные.

Генеральными называются факторы, все факторные нагрузки которых значительно отличаются от нуля (нуль нагрузки свидетельствует о том, что данная переменная никак не связана с остальными и не оказывает на них никакого влияния в жизни). Общие — это факторы, у которых часть факторных нагрузок отлична от нуля.

Единичные — это факторы, в которых существенно отличается от нуля только одна из нагрузок. На рис. 75 схематически представлена структура факторного отображения переменных в факторах различной степени общности.

>

Источник: http://xn--24-6kct3an.xn--p1ai/%D0%9F%D1%81%D0%B8%D1%85%D0%BE%D0%B4%D0%B8%D0%B0%D0%B3%D0%BD%D0%BE%D1%81%D1%82%D0%B8%D0%BA%D0%B0_%D0%9D%D0%B5%D0%BC%D0%BE%D0%B2/59.2.html

6.3.3. Определение коэффициентов уравнения регрессии

6.3.4. Статистический анализ результатов эксперимента

6. МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТОВ. ЛОГИЧЕСКИЕ ОСНОВЫ

тельность реализации экспериментов. Рандомизация дает возможность свести эффект некоторого случайного фактора к случайной погрешности. Это позволяет в определенной степени исключить предвзятость и субъективизм исследователя.

Воспользуемся свойствами ПФЭ для определения коэффициентов уравнения регрессии методом наименьших квадратов y) = b0 + b1x1 + b2x 2 .

Φ = ∑n (y j − y) j )2 → min;

j=1

bi

∂ Φ

= 2 ∑n (y

− b

− b X

− b

X

)X

= 0;

(6.14)

∂ b1

j=1

j

0

1

1j

2

2 j

1j

n

X

− b

n

− b

n

2

− b

n

X

= 0.

∑y

j

1j

0

∑X

1j

∑X

1j

2

∑X

1j

2 j

j=1

j=1

1

j=1

j=1

Воспользуемся свойствами ПФЭ:

-(симметричности) b0 ∑X1j = 0;

-(нормирования) b1∑X1j2 = nb1;

-(ортогональности) b2∑X1jX2j =0;

n

n

n

∑y jX1j

∑y jX2 j

∑y jX0 j

b

=

j=1

; b

2

=

j=1

; b

0

=

j=1

.

(6.15)

1

n

n

n

Следовательно, любые коэффициенты уравнения регрессии определяются скалярным произведением столбца y на соответствующий столбец X.

Можно показать, что аналогичным образом определяются коэффициен-

ты, если в уравнении регрессии (6.6) учитываются линейные взаимодействия (двойные, тройные):

6. МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТОВ. ЛОГИЧЕСКИЕ ОСНОВЫ

∑n

y j(X1X2 )j

∑n

y j(X1X2X3 )j

b

=

j=1

; b

=

j=1

и т.д.

(6.16)

12

n

123

n

Следует обратить особое внимание на то, что все линейные коэффициенты независимы, так как в формулы для их расчета (6.15), (6.16) входят свои одноименные переменные.

Поэтому каждый коэффициент характеризует роль соответствующей переменной в процессе или силу влияния факторов. Чем больше численная величина коэффициента, тем большее влияние оказывает этот фактор.

Если коэффициент имеет знак плюс, то с увеличением значения фактора отклик увеличивается, а если минус – уменьшается.

В результате определения уравнения регрессии может получиться так, что один (или несколько) коэффициентов не очень большие и окажутся незначимыми.

Факторы, имеющие коэффициенты, незначимо отличающиеся от нуля, могут быть выведены из состава уравнения, так как их влияние на параметры отклика будет отнесено к ошибке эксперимента.

Учитывая ортогональность плана, оставшиеся коэффициенты уравнения регрессии можно не пересчитывать. При отсутствии ортогональности плана эксперимента все коэффициенты необходимо пересчитывать заново.

6.3.4. Статистический анализ результатов эксперимента

Планирование эксперимента исходит из статистического характера зависимостей, поэтому полученные уравнения подвергаются тщательному статистическому анализу с целью извлечь из результатов эксперимента максимум

информации и убедиться в достоверности полученной зависимости и ее точно-

сти. Процедура проверки значимости коэффициентов уравнения регрессии и его адекватности принципиально не отличается от описания, данного в параграфах 4.5.1 и 4.5.2, поэтому остановимся только на отдельных моментах. Как уже отмечалось ранее, каждый эксперимент несет в себе какую-то погрешность, для повышения надежности результатов производятся для каждой стро-

ки таблицы планирования повторения опытов m* раз.

Построчные (выборочные) дисперсии подсчитываются по формуле

168

6. МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТОВ. ЛОГИЧЕСКИЕ ОСНОВЫ

∑m* (y j i −

)2

S 2j =

y j

,

(6.17)

i=1

m * −1

m*

∑y j i

где

=

i=1

– средний отклик по m* опытам в точке с номером j.

y j

m *

Дисперсия воспроизводимости отклика

2

есть среднеарифметиче-

Sвосп

ское дисперсий всех n различных вариантов опытов:

n

n

m*

∑S 2j

∑∑(y j i −

)2

y j

Sвосп2 =

j=1

=

j=1

i=1

.

(6.18)

n

n (m * −1)

Прежде чем производить объединение дисперсий, следует убедиться в их однородности. Проверка производится с помощью критерия Фишера или Кохрена (см. гл. 3).

Для оценки значимости коэффициентов прежде всего находят дисперсию коэффициентов регрессии. Учитывая свойства 1-3 плана, представленного в табл. 6.3, из выражений (4.27) и (4.

27а) при одинаковом дублировании опытов по точкам с числом повторных опытов m* получим

2

2

S

=

Sвосп

,

(6.19)

b

m * n

а при отсутствии дублирования будем иметь

2

2

S

=

Sвосп

.

(6.19а)

b

n

Следовательно, все коэффициенты уравнения регрессии ПФЭ имеют одинаковую точность (дисперсию). В этом заключается принципиальное отли-

чие коэффициентов уравнения регрессии, полученных по плану табл.6.3, от ко-

эффициентов уравнений, полученных пассивным экспериментом (см. параграф 4.5.2). Планы, по результатам которых коэффициенты уравнения регрессии оп-

ределяются с одинаковой дисперсией, называются ротатабельными. В связи с

этим план, представленный в табл.6.3, является не только ортогональным, но

ротатабельным. В дальнейшем проверка значимости каждого коэффициента производится с использованием t-критерия Стьюдента (см. гл.4). Статистически

6. МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТОВ. ЛОГИЧЕСКИЕ ОСНОВЫ

незначимые коэффициенты исключаются из уравнения, а остальные коэффициенты при этом не пересчитываются. После этого уравнение регрессии составляется в виде уравнения связи выходного параметра y и переменных Xi, включающего только значимые коэффициенты.

После вычисления коэффициентов уравнения следует прежде всего проверить его пригодность или адекватность. Для этого достаточно оценить отклонение выходной величины y) , предсказанной уравнением регрессии, от резуль-

татов эксперимента y в различных точках.

Рассеяние результатов эксперимента относительно уравнения регрессии, аппроксимирующего искомую зависимость, можно, как уже было показано ранее, охарактеризовать с помощью дисперсии адекватности, оценка которой, справедливая при одинаковом числе дублирующих опытов, находится по фор-

муле

m * ∑n (y j − y) j )2

S ад2 =

j =1

.

(6.20)

n − l

Здесь n – число опытов (вариантов); l=k+1, где k – число членов в уравнении регрессии.

Проверка адекватности состоит в выяснении соотношения между дис-

персией адекватности Sад2 и дисперсией воспроизводимости S 2восп и проводит-

ся с помощью F-критерия Фишера, который в данном случае рассчитывается как

S 2

F = 2ад . (6.21)

Sвосп

Если вычисленное значение критерия меньше теоретического Fα;m1;m2 для соответствующих степеней свободы m1=n-l, m2=n(m*-1), при заданном уровне значимости α, то описание свойств объекта уравнением регрессии признается адекватным объекту. Адекватность модели может быть достигнута уменьшением интервала варьирования факторов, а если это не дает результата, то переходом к плану второго порядка.

Источник: https://studfile.net/preview/6463456/page:23/

Uchebnik-free
Добавить комментарий