для какого типа шкал может рассчитываться t стьюдента
Библиотека постов MEDSTATISTIC об анализе медицинских данных
Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic
Критерии и методы
t-КРИТЕРИЙ СТЬЮДЕНТА ДЛЯ НЕЗАВИСИМЫХ СОВОКУПНОСТЕЙ
– общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.
Уильям Госсет
1. История разработки t-критерия
Данный критерий был разработан Уильямом Сили Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны, статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
2. Для чего используется t-критерий Стьюдента?
t-критерий Стьюдента используется для определения статистической значимости различий средних величин. Может применяться как в случаях сравнения независимых выборок (например, группы больных сахарным диабетом и группы здоровых), так и при сравнении связанных совокупностей (например, средняя частота пульса у одних и тех же пациентов до и после приема антиаритмического препарата). В последнем случае рассчитывается парный t-критерий Стьюдента
3. В каких случаях можно использовать t-критерий Стьюдента?
Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение. Также имеет значение равенство дисперсий (распределения) сравниваемых групп (гомоскедастичность). При неравных дисперсиях применяется t-критерий в модификации Уэлча (Welch’s t).
При отсутствии нормального распределения сравниваемых выборок вместо t-критерия Стьюдента используются аналогичные методы непараметрической статистики, среди которых наиболее известными является U-критерий Манна — Уитни.
4. Как рассчитать t-критерий Стьюдента?
Для сравнения средних величин t-критерий Стьюдента рассчитывается по следующей формуле:
5. Как интерпретировать значение t-критерия Стьюдента?
Полученное значение t-критерия Стьюдента необходимо правильно интерпретировать. Для этого нам необходимо знать количество исследуемых в каждой группе (n1 и n2). Находим число степеней свободы f по следующей формуле:
После этого определяем критическое значение t-критерия Стьюдента для требуемого уровня значимости (например, p=0,05) и при данном числе степеней свободы f по таблице (см. ниже).
Сравниваем критическое и рассчитанное значения критерия:
6. Пример расчета t-критерия Стьюдента
Решение: Для оценки значимости различий используем t-критерий Стьюдента, рассчитываемый как разность средних значений, поделенная на сумму квадратов ошибок:
Библиотека постов MEDSTATISTIC об анализе медицинских данных
Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic
Критерии и методы
ПАРНЫЙ t-КРИТЕРИЙ СТЬЮДЕНТА
– одна из модификаций метода Стьюдента, используемая для определения статистической значимости различий парных (повторных) измерений.
Уильям Госсет
1. История разработки t-критерия
t-критерий был разработан Уильямом Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны, статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
2. Для чего используется парный t-критерий Стьюдента?
3. В каких случаях можно использовать парный t-критерий Стьюдента?
Основным условием является зависимость выборок, то есть сравниваемые значения должны быть получены при повторных измерениях одного параметра у одних и тех же пациентов.
Как и в случае сравнения независимых выборок, для применения парного t-критерия необходимо, чтобы исходные данные имели нормальное распределение. При несоблюдении этого условия для сравнения выборочных средних должны использоваться методы непараметрической статистики, такие как G-критерий знаков или Т-критерий Вилкоксона.
Парный t-критерий может использоваться только при сравнении двухвыборок. Если необходимо сравнить три и более повторных измерений, следует использовать однофакторный дисперсионный анализ (ANOVA) для повторных измерений.
4. Как рассчитать парный t-критерий Стьюдента?
Парный t-критерий Стьюдента рассчитывается по следующей формуле:
5. Как интерпретировать значение t-критерия Стьюдента?
Интерпретация полученного значения парного t-критерия Стьюдента не отличается от оценки t-критерия для несвязанных совокупностей. Прежде всего, необходимо найти число степеней свободы f по следующей формуле:
После этого определяем критическое значение t-критерия Стьюдента для требуемого уровня значимости (например, p
3. Найдем среднее квадратическое отклонение разностей от средней по формуле:
4. Рассчитаем парный t-критерий Стьюдента:
Основные статистические критерии. t-критерий Стьюдента
В целях проведения качественного исследования и получения достоверных результатов для дальнейшего анализа и принятия окончательного решения используют различные способы, методы и инструменты. Порой бывает неважно, в какой научной области или отрасли действует автор. Важно лишь грамотно подобрать и использовать необходимые критерии. Одними из таких универсальных параметров являются так называемые статистические критерии, среди которых особое внимание следует уделить t-критерию Стьюдента.
В целях проведения качественного исследования и получения достоверных результатов для дальнейшего анализа и принятия окончательного решения используют различные способы, методы и инструменты. Порой бывает неважно, в какой научной области или отрасли действует автор. Важно лишь грамотно подобрать и использовать необходимые критерии. Одними из таких универсальных параметров являются так называемые статистические критерии, среди которых особое внимание следует уделить t-критерию Стьюдента.
Что это такое?
Этапы проведения исследования
t-критерий Стьюдента – это статистический метод исследования, позволяющий производить сравнение параметров из двух разных выборок, областей. По результатам такого анализа исследователь может делать вывод о сходстве или различии анализируемых объектов. Данный метод успешно используется как в повседневной жизни, так и в различных областях науки (психология, математика, экономика и пр.) и отраслях.
t-критерий Стьюдента чаще всего используется в целях установления взаимосвязи между элементами разных групп. Например, исследователь может анализировать поведение и состояние пациентов с хроническим заболеванием (например, сахарный диабет второго типа) и здоровых людей или имеющих сахарный диабет первого типа и пр.
Нужна помощь преподавателя?
Мы всегда рады Вам помочь!
Этапы применения t-критерия Стьюдента
При использовании t-критерия Стьюдента важно, чтобы объекты исследования или анализируемые выборки были распределены равномерно и имели хотя бы минимальное взаимодействие: относились к одной и той же среде, выполняли одно и то же задание и пр. Данное правило называется принципом нормального распределения, когда изучаемые явления/процессы:
t-критерий Стьюдента лучше всего использовать в случаях, когда известны средние значения выборки. Например, эксперт намерен проанализировать средний возраст жителей Сибири и средний возраст россиян по стране. При использовании указанной статистической методики он сможет проверить гипотезу: продолжительность жизни в Сибири дольше, чем в среднем по стране. Для этого достаточно сравнить средние показатели по указанному региону и России. Если отклонений в возрасте не будет, то гипотеза считается верной. Если же будет выявлено некое различие, то важно рассчитать это отклонение.
Схема применения t-критерия Стьюдента выглядит следующим образом:
Чаще всего сравнивают средние показатели конкретного явления, процесса и пр. Для расчета этого критерия можно воспользоваться следующей формулой:
Как используется t-критерий Стьюдента в разных областях науки?
t-критерий Стьюдента – универсальное средство для анализа ситуации, позволяющее установить наличие связей между разными группами элементов. В частности, он успешно применяется в психологии и медицине при проведении различных экспериментов и наблюдений. Исследователи могут сравнивать две группы людей с одним и тем же заболеванием на разных стадиях. Например, первая группа – лица с первичным инсультом, вторая группа – лица со вторичным (неоднократным) инсультом. Гипотеза может быть любой: продолжительность жизни и после первичного инсульта выше чем после вторичного или физическая активность лиц с первичным заболеванием лучше, чем со вторичным и пр.
Применение t-критерия Стьюдента в различных науках
Также t-критерий Стьюдента часто используется в экономике, когда требуется апробировать полученные исследователем результаты. Например, он может сравнивать показатели разных лет, выявлять их динамику и прогнозировать дальнейшее развитие событий (этих же показателей). Здесь автор эксперимента выдвигает гипотезу: анализируемые показатели увеличатся или наоборот уменьшатся.
Ярким примером применения t-критерия Стьюдента является следующая ситуация:
Решение ситуации с помощью t-критерия Стьюдента
Трудности с учебой?
Помощь в написании студенческих и
аспирантских работ!
6.1 Параметрические критерии
В группу параметрических критериев методов математической статистики входят методы для вычисления описательных статистик, построения графиков на нормальность распределения, проверка гипотез о принадлежности двух выборок одной совокупности. Эти методы основываются на предположении о том, что распределение выборок подчиняется нормальному (гауссовому) закону распределения. Среди параметрических критериев статистики нами будут рассмотрены критерий Стьюдента и Фишера.
6.1.1 Методы проверки выборки на нормальность
Чтобы определить, имеем ли мы дело с нормальным распределением, можно применять следующие методы:
1) в пределах осей можно нарисовать полигон частоты (эмпирическую функцию распределения) и кривую нормального распределения на основе данных исследования. Исследуя формы кривой нормального распределения и графика эмпирической функции распределения, можно выяснить те параметры, которыми последняя кривая отличается от первой;
2) вычисляется среднее, медиана и мода и на основе этого определяется отклонение от нормального распределения. Если мода, медиана и среднее арифметическое друг от друга значительно не отличаются, мы имеем дело с нормальным распределением. Если медиана значительно отличается от среднего, то мы имеем дело с асимметричной выборкой.
3) эксцесс кривой распределения должен быть равен 0. Кривые с положительным эксцессом значительно вертикальнее кривой нормального распределения. Кривые с отрицательным эксцессом являются более покатистыми по сравнению с кривой нормального распределения;
4) после определения среднего значения распределения частоты и стандартного oтклонения находят следующие четыре интервала распределения сравнивают их с действительными данными ряда:
а) — к интервалу должно относиться около 25% частоты совокупности,
б) — к интервалу должно относиться около 50% частоты совокупности,
в) — к интервалу должно относиться около 75% частоты совокупности,
г) — к интервалу должно относиться около 100% частоты совокупности.
6.1.2 Критерий Стьюдента ( t-критерий)
Критерий позволяет найти вероятность того, что оба средних значения в выборке относятся к одной и той же совокупности. Данный критерий наиболее часто используется для проверки гипотезы: «Средние двух выборок относятся к одной и той же совокупности».
При использовании критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная группа и экспериментальная (опытная) группа, количество испытуемых в группах может быть различно.
Во втором случае, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних, используется так называемый парный t-критерий. Выборки при этом называют зависимыми, связанными.
Статистика критерия для случая несвязанных, независимых выборок равна:
(1)
где ,
— средние арифметические в экспериментальной и контрольной группах,
— стандартная ошибка разности средних арифметических. Находится из формулы:
, (2)
где n 1 и n 2 соответственно величины первой и второй выборки.
Если n 1= n 2, то стандартная ошибка разности средних арифметических будет считаться по формуле:
(3)
где n величина выборки.
Подсчет числа степеней свободы осуществляется по формуле:
Далее необходимо сравнить полученное значение t эмп с теоретическим значением t—распределения Стьюдента (см. приложение к учебникам статистики). Если t эмп t крит, то гипотеза H 0 принимается, в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза.
Таблица 1. Результаты эксперимента
Первая группа (экспериментальная) N 1=11 человек
Вторая группа (контрольная)
12 14 13 16 11 9 13 15 15 18 14
13 9 11 10 7 6 8 10 11
Общее количество членов выборки: n 1=11, n 2=9.
Расчет средних арифметических: Хср=13,636; Y ср=9,444
Стандартное отклонение: s x=2,460; s y =2,186
По формуле (2) рассчитываем стандартную ошибку разности арифметических средних:
Считаем статистику критерия:
Сравниваем полученное в эксперименте значение t с табличным значением с учетом степеней свободы, равных по формуле (4) числу испытуемых минус два (18).
Табличное значение tкрит равняется 2,1 при допущении возможности риска сделать ошибочное суждение в пяти случаях из ста (уровень значимости=5 % или 0,05).
Если полученное в эксперименте эмпирическое значение t превышает табличное, то есть основания принять альтернативную гипотезу (H1) о том, что учащиеся экспериментальной группы показывают в среднем более высокий уровень знаний. В эксперименте t=3,981, табличное t=2,10, 3,981>2,10, откуда следует вывод о преимуществе экспериментального обучения.
Здесь могут возникнуть такие вопросы:
1. Что если полученное в опыте значение t окажется меньше табличного? Тогда надо принять нулевую гипотезу.
2. Доказано ли преимущество экспериментального метода? Не столько доказано, сколько показано, потому что с самого начала допускается риск ошибиться в пяти случаях из ста (р=0,05). Наш эксперимент мог быть одним из этих пяти случаев. Но 95% возможных случаев говорит в пользу альтернативной гипотезы, а это достаточно убедительный аргумент в статистическом доказательстве.
3. Что если в контрольной группе результаты окажутся выше, чем в экспериментальной? Поменяем, например, местами, сделав средней арифметической экспериментальной группы, a
— контрольной:
Отсюда следует вывод, что новый метод пока не проявил себя с хорошей стороны по разным, возможно, причинам. Поскольку абсолютное значение 3,9811>2,1, принимается вторая альтернативная гипотеза (Н2) о преимуществе традиционного метода.
В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента.
Вычисление значения t осуществляется по формуле:
(5)
Sd вычисляется по следующей формуле:
(6)
Если t эмп t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.
Пример 2. Изучался уровень ориентации учащихся на художественно-эстетические ценности. С целью активизации формирования этой ориентации в экспериментальной группе проводились беседы, выставки детских рисунков, были организованы посещения музеев и картинных галерей, проведены встречи с музыкантами, художниками и др. Закономерно встает вопрос: какова эффективность проведенной работы? С целью проверки эффективности этой работы до начала эксперимента и после давался тест. Из методических соображений в таблице 2 приводятся результаты небольшого числа испытуемых. [2]
Таблица 2. Результаты эксперимента
до начала эксперимента (Х)
Вначале произведем расчет по формуле:
Затем применим формулу (6), получим:
И, наконец, следует применить формулу (5). Получим:
Число степеней свободы: k =10-1=9 и по таблице Приложения 1 находим tкрит =2.262, экспериментальное t=6,678, откуда следует возможность принятия альтернативной гипотезы (H1) о достоверных различиях средних арифметических, т. е. делается вывод об эффективности экспериментального воздействия.
6.1.3 F — критерий Фишера
Критерий Фишера позволяет сравнивать величины выборочных дисперсий двух независимых выборок. Для вычисления Fэмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая – в знаменателе. Формула вычисления критерия Фишера такова:
(8)
где — дисперсии первой и второй выборки соответственно.
Так как, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значение Fэмп всегда будет больше или равно единице.
Число степеней свободы определяется также просто:
В Приложении 1 критические значения критерия Фишера находятся по величинам k 1 (верхняя строчка таблицы) и k 2 (левый столбец таблицы).
Если t эмп> t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.
Пример 3. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. [3] Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос — есть ли различия в степени однородности показателей умственного развития между классами.
Решение. Для критерия Фишера необходимо сравнить дисперсии тестовых оценок в обоих классах. Результаты тестирования представлены в таблице:
Рассчитав дисперсии для переменных X и Y, получаем:
Тогда по формуле (8) для расчета по F критерию Фишера находим:
6.2 Непараметрические критерии
Сравнивая на глазок (по процентным соотношениям) результаты до и после какого-либо воздействия, исследователь приходит к заключению, что если наблюдаются различия, то имеет место различие в сравниваемых выборках. Подобный подход категорически неприемлем, так как для процентов нельзя определить уровень достоверности в различиях. Проценты, взятые сами по себе, не дают возможности делать статистически достоверные выводы. Чтобы доказать эффективность какого-либо воздействия, необходимо выявить статистически значимую тенденцию в смещении (сдвиге) показателей. Для решения подобных задач исследователь может использовать ряд критериев различия. Ниже будет рассмотрены непараметрические критерии: критерий знаков и критерий хи-квадрат.
6.2.1 Критерий знаков ( G-критерий)
Критерий предназначен для сравнения состояния некоторого свойства у членов двух зависимых выборок на основе измерений, сделанных по шкале не ниже ранговой.
Нулевая гипотеза формулируются следующим образом: в состоянии изучаемого свойства нет значимых различий при первичном и вторичном измерениях. Альтернативная гипотеза: законы распределения величин X и У различны, т. е. состояния изучаемого свойства существенно различны в одной и той же совокупности при первичном и вторичном измерениях этого свойства.
Статистика критерия (Т) определяется следующим образом:
Пример 4. Учащиеся выполняли контрольную работу, направленную на проверку усвоения некоторого понятия. Пятнадцати учащимся затем предложили электронное пособие, составленное с целью формирования данного понятия у учащихся с низким уровнем обучаемости. После изучения пособия учащиеся снова выполняли ту же контрольного работу, которая оценивалась по пятибалльной системе.
Результаты двукратного выполнения работы представляют измерения по шкале порядка (пятибалльная шкала). В этих условиях возможно применение знакового критерия для выявления тенденции изменения состояния знаний учащихся после изучения пособия, так как выполняются все допущения этого критерия.
Результаты двукратного выполнения работы (в баллах) 15 учащимися запишем в форме таблицы (см. табл. 1). [4]
Для какого типа шкал может рассчитываться t стьюдента
Критерий t Стьюдента направлен на оценку различий величин средних и двух выборок X и Y, которые распределены по нормальному закону. Одним из главных достоинств критерия является широта его применения. Он может быть использован для сопоставления средних у связных и несвязных выборок, причем выборки могут быть не равны по величине.
Рассмотрим сначала равночисленные выборки. В этом случае n1 = n2 = n, тогда выражение (9.2) будет вычисляться следующим образом:
В обоих случаях подсчет числа степеней свободы осуществляется по формуле:
где n1 и n2 соответственно величины первой и второй выборки.
Пример : Психолог измерял время сложной сенсомоторной реакции выбора
(в мс) в контрольной и экспериментальной группах. В экспериментальную группу (X) входили 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающихся спортом. Психолог проверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем эта же величина у людей, не занимающихся спортом.
Результаты эксперимента представим в виде табл. 9, в которой произведем ряд необходимых расчетов:
№ | Группы | Отклонение от среднего | Квадраты отклонения | |||
X | Y | |||||
1 | 504 | 580 | — 22 | — 58 | 484 | 3368 |
2 | 560 | 692 | 34 | 54 | 1156 | 2916 |
3 | 420 | 700 | — 106 | 62 | 11236 | 3844 |
4 | 600 | 621 | 74 | — 17 | 5476 | 289 |
5 | 580 | 640 | 54 | — 2 | 2916 | 4 |
6 | 530 | 561 | 4 | — 77 | 16 | 5929 |
7 | 490 | 680 | — 36 | 42 | 1296 | 1764 |
8 | 580 | 630 | 54 | — 8 | 2916 | 64 |
9 | 470 | — | — 56 | — | 3136 | — |
Сумма | 4734 | 5104 | 0 | 0 | 28632 | 18174 |
Среднее | 526 | 638 |
Разница по абсолютной величине между средними
Подсчет выражения дает:
Число степеней свободы = 9 + 8-2= 15. По табл. 17 приложения 6 для данного числа степеней свободы находим :
Строим «ось значимости»:
Таким образом, обнаруженные психологом различия между экспериментальной и контрольной группами значимы более чем на 0,]% уровне, или, иначе говоря, средняя скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше, чем в группе людей, активно не занимающихся спортом.
Вычисления значений осуществляется по формуле:
В свою очередь вычисляется по следующей формуле:
Пример: Психолог предположил, что в результате научения время решения эквивалентных задач «игры в 5» (т. е. имеющих один и тот же алгоритм решения) будет значимо уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задач. Решение задачи представим в виде табл. 10.
№ испытуемых | 1 задача | 2 задача | ||
1 | 4,0 | 3,0 | 1,0 | 1,0 |
2 | 3,5 | 3,0 | 0,5 | 0,25 |
3 | 4,1 | 3,8 | 0,3 | 0,09 |
4 | 5,5 | 2,1 | 3,4 | 11,56 |
5 | 4,6 | 4,9 | -0,3 | 0,09 |
6 | 6,0 | 5,3 | 0,7 | 0,49 |
7 | 5,1 | 3,1 | 2,0 | 4,00 |
8 | 4,3 | 2,7 | 1,6 | 2,56 |
Суммы | 37,1 | 27,9 | 9,2 | 20,04 |
Вначале произведем расчет по формуле:
Затем применим формулу:
И, наконец, следует применить формулу. Получим:
Строим «ось значимости»:
Измерение может быть проведено в шкале интервалов и отношений.
Сравниваемые выборки должны быть распределены по нормальному закону.