Автоматический подсчет манна уитни. U – критерий Манна – Уитни

Настоящий статистический метод был предложен Фрэнком Вилкоксоном (см. фото) в 1945 году. Однако в 1947 году метод был улучшен и расширен Х. Б. Манном и Д. Р. Уитни, посему U-критерий чаще называют их именами.

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 ,n 2 ≥3 или n 1 =2, n 2 ≥5, и является более мощным, чем критерий Розенбаума.

Описание U-критерия Манна-Уитни

Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам (Гублер Е. В., 1978; Рунион Р., 1982; Захаров В. П., 1985; McCall R., 1970; Krauth J., 1988).

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок (Welkowitz J. et al., 1982).

Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.

Гипотезы U - критерия Манна-Уитни

H 0 : Уровень признака в группе 2 не ниже уровня признака в группе 1.
H 1 : Уровень признака в группе 2 ниже уровня признака в группе 1.

Ограничения U-критерия Манна-Уитни

1. В каждой выборке должно быть не менее 3 наблюдений: n 1 ,n 2 ≥ З; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n 1 , n 2 ≤ 60.

Автоматический расчет U-критерия Манна-Уитни

Шаг 1

Введите в первую колонку («Выборка 1») данные первой выборки, а во вторую колонку («Выборка 2») данные второй выборки. Данные вводятся по одному числу на строку; без пробелов, пропусков и т.д. Вводятся только цифры. Дробные числа вводятся со знаком «.» (точка). После заполнения колонок нажмите на кнопку «Шаг 2», чтобы произвести автоматический расчет U-критерия Манна-Уитни.

Критерий U Манна - Уитни

Назначение критерия. Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда п 1, п 2 > 3 или п Л = 2, п 2 > 5, и является более мощным, чем критерий Q Розенбаума.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок. Эмпирическое значение критерия и отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше t/ 3Mn , тем более вероятно, что различия достоверны.

Гипотезы.

Уровень невербального интеллекта в группе студентов физиков выше, чем в группе студентов-психологов.

Графическое представление критерия U. Па рис. 7.25 представлены три из множества возможных вариантов соотношения двух рядов значений.

В варианте (а) второй ряд ниже первого, и ряды почти не перекрещиваются. Область наложения (S j) слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что различия между ними достоверны. Точно определить это мы сможем с помощью критерия U.

В варианте (б) второй ряд тоже ниже первого, но и область перекрещивающихся значений у двух рядов достаточно обширна (5 2). Она может еще не достигать критической величины, когда различия придется признать несущественными. Но так ли это, можно определить только путем точного подсчета критерия U.

В варианте (в) второй ряд ниже первого, но область наложения настолько обширна (5 3), что различия между рядами скрадываются.

Рис. 7.25.

в двух выборках

Примечание. Перекрытием (5 t , S 2 , *$з) обозначены зоны возможного наложения. Ограничения критерия U.

  • 1. В каждой выборке должно быть не менее трех наблюдений: n v п 2 > 3; допускается, чтобы в одной выборке было два наблюдения, но тогда во второй их должно быть не менее 5.
  • 2. В каждой выборке должно быть не более 60 наблюдений; п л, п 2 щ, п 2 > 20 ранжирование становится достаточно трудоемким.

Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального интеллекта. С помощью критерия Q Розенбаума было с высоким уровнем значимости определено, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот результат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в таблице.

2 ниже уровня признака в выборке 1 на достоверно значимом уровне. Чем меньше значения U, тем достоверность различий выше.

Теперь проделаем всю эту работу на материале нашего примера. В результате работы по 1-6 шагам алгоритма построим таблицу (табл. 7.4).

Таблица 7.4

Подсчет ранговых сумм по выборкам студентов физического и психологического факультетов

Студенты-физики (п = 14)

Студенты-психологи (п= 12)

Показатель невербального интеллекта

Средние 107,2

Общая сумма рангов: 165 + 186 = 351. Расчетная сумма по формуле (5.1) такова:

Равенство реальной и расчетной сумм соблюдено. Мы видим, что по уровню невербального интеллекта более «высоким» рядом окалывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186. Теперь мы готовы сформулировать статистические гипотезы:

Я 0: группа студентов-психологов не превосходит группу студентов- физиков по уровню невербального интеллекта;

Я,: группа студентов-психологов превосходит группу студентов-физи- ков по уровню невербального интеллекта.

В соответствии со следующим шагом алгоритма определяем эмпирическую величину U :

Поскольку в нашем случае п л * п 2 , подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу (7.4) соответствующее ей п х.:

По приложению 8 определяем критические значения для п л = 14, п 2 = 12:

Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если {/ эмп U Kp 0 05 (при ^эмп = 60, и шп > U Kf) о,05).

Следовательно, Н 0 принимается следующей: группа студентов-психологов не превосходит группы студентов-физиков по уровню невербального интеллекта.

Обратим внимание на то, что для данного случая Q-критерий Розенбаума неприменим, так как размах вариативности в группе физиков шире, чем в группе психологов: и самое высокое, и самое низкое значения невербального интеллекта приходятся на группу физиков (см. табл. 7.4).

Критерий в математической статистике - это строгое правило, в соответствии с которым гипотеза с определённым уровнем значимости принимается или отвергается. Чтобы построить его, необходимо найти определенную функцию. Она должна зависеть от конечных результатов эксперимента, то есть от эмпирически найденных значений. Именно эта функция будет являться инструментом оценки расхождения между выборками.

Статистически значимая величина. Общие сведения

Статистическая значимость - это величина, вероятность случайного возникновения которой очень мала. Незначительны также и более крайние ее показатели. Разницу называют статистически значимой в том случае, если существуют данные, вероятность появления которых незначительна, если утверждать, что эти расхождения не существуют. Но это не значит вовсе, что эта разница обязательно должна быть велика и значима.

Уровень статистической достоверности теста

Под данным термином следует понимать вероятность отклонения нулевой гипотезы в случае её истинности. Это также называется ошибкой первого рода или ложноположительным решением. В большинстве случаев процесс опирается на p-величину ("пи-величина"). Это накопленная вероятность при наблюдении за уровнем статистического критерия. Он, в свою очередь, насчитывается по выборке во время принятия нулевой гипотезы. Предположение будет отвергнуто, если эта p-величина будет меньше заявленного аналитиком уровня. От этого показателя зависит напрямую значимость тестовой величины: чем она меньше, тем, соответственно, и больше оснований отвергнуть гипотезу.

Уровень значимости, как правило, обозначается буквой б (альфа). Популярные показатели среди специалистов: 0,1%, 1%, 5% и 10%. Если, скажем, говорится, что шансы на совпадения равны 1 к 1000, то определённо речь идёт об уровне 0,1% статистической значимости случайной величины. Различные по значению б-уровни имеют свои плюсы и минусы. Если показатель меньше, то больше вероятность, что альтернативная гипотеза значимая. Хотя при этом возможен риск, что ложное нулевое предположение не будет отвергнуто. Можно сделать вывод, что выбор оптимального б-уровня зависит от баланса "значимость-мощность" или, соответственно, от компромисса вероятностей ложноположительного и ложноотрицательного решений. Синонимом "статистической значимости" в отечественной литературе является термин "достоверность".

Определение нулевой гипотезы

В математической статистике проверяемое на согласованность с уже имеющимися в запасе эмпирическими данными. В большинстве случаев в качестве нулевой гипотезы берётся гипотеза о том, что корреляция между исследуемыми переменными отсутствует или что в изучаемых распределениях нет различий однородности. При стандартных исследованиях математик пытается опровергнуть нулевую гипотезу, то есть доказать, что она не согласована с экспериментально полученными данными. Причем должно иметь место и альтернативное предположение, которое принимается вместо нулевого.

Ключевое определение

Критерий U (Манна-Уитни) в позволяет оценивать различия двух выборок. Они могут быть даны по уровню некоего признака, который измерен количественно. Этот метод идеален для оценки различий малых выборок. Этот простой критерий был предложен Фрэнком Уилкоксоном в 1945 году. А уже в 1947 году метод был пересмотрен и дополнен учёными Х. Б. Манном и Д. Р. Уитни, именами которых он и именуется по сей день. Критерий Манна-Уитни в психологии, математике, статистике и во многих других науках является одним из основополагающих элементов математического обоснования результатов теоретических исследований.

Описание

Критерий Манна-Уитни - относительно простой метод без параметров. Его мощность значительна. Она существенно выше, чем мощность Q-критерия Розенбаума. Метод оценивает, насколько мала область перекрёстных значений между выборками, а именно между ранжированными рядами значений первой и второй подборки. Чем значение критерия меньше, тем больше вероятность, что расхождения значений параметра достоверны. Чтобы корректно применить критерий U (Манна-Уитни), не стоит забывать о некоторых ограничениях. В каждой выборке должно быть как минимум 3 значения признака. Возможна ситуация, когда в одном случае значений два, но во втором обязательно тогда их должно быть хотя бы пять. В исследуемых выборках должно быть минимальное количество совпадающих показателей. Все числа должны быть разными в идеальном случае.

Использование

Как правильно использовать критерий Манна-Уитни? Таблица, которая составлена по данному методу, содержит определенные критические значения. Для начала нужно создать единый ряд из обеих сопоставленных выборок, который затем ранжируется. То есть элементы выстраиваются по степени нарастания признака, и меньший ранг присваивается меньшему значению. В итоге получим такое общее число рангов:

N = N1 + N2,

где величины N1 и N2 - количество единиц, содержащихся в первой и второй выборках соответственно. Далее единый ранжированный ряд значений делится на две категории. Единицы, соответственно, из первой и второй выборок. Теперь считается по очереди сумма рангов значений в первом и во втором рядах. Определяется большая из них (Tx), которая соответствует выборке с nx единицами. Чтобы использовать метод Уилкоксона далее, вычисляется его значение по следующей методике. Необходимо по таблице для выбранного уровня значимости выяснить критическое значение этого критерия для конкретно взятых N1 и N2.

Получившийся показатель может быть меньше или равен значению из таблицы. В этом случае констатируется значительное различие уровней признака в исследуемых выборках. Если полученное значение больше табличного, тогда нулевая гипотеза принимается. Когда производится расчет критерия Манна-Уитни, следует заметить, что если нулевая гипотеза справедлива, критерий будет иметь а также дисперсию. Отметим, что при достаточно больших объёмах данных выборок метод считается практически нормально распределенным. Достоверность различий тем выше, чем меньшее значение принимает критерий Манна-Уитни.

U-критерий является ранговым , поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Другие названия: критерий Манна-Уитни-Уилкоксона (Mann-Whitney-Wilcoxon, MWW), критерий суммы рангов Уилкоксона (Wilcoxon rank-sum test) или критерий Уилкоксона-Манна-Уитни (Wilcoxon-Mann-Whitney test, WMW).

Примеры задач

Пример 1. Первая выборка - это пациенты, которых лечили препаратом А. Вторая выборка - пациенты, которых лечили препаратом Б. Значения в выборках - это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.

Пример 2. Первая выборка - это поля, обработанные агротехническим методом А. Вторая выборка - поля, обработанные агротехническим методом Б. Значения в выборках - это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.

Пример 3. Первая выборка - это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка - дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках - это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.

Описание критерия

Заданы две выборки .

Дополнительные предположения:

Иногда ошибочно считают, что U-критерий проверяет нулевую гипотезу равенства медиан в двух выборках. Существуют распределения, для которых гипотеза верна, но их медианы различны.

U-критерий можно применять для проверки гипотезы сдвига в качестве альтернативной , где - некоторая константа, отличная от нуля. При этой альтернативе U-критерий является состоятельным . Его целесообразно применять, если одним и тем же прибором проводятся две серии измерений двух значений некоторой физической величины. При этом функция распределения описывает погрешности измерения одного значения, а - другого. Однако во многих приложениях (в частности, эконометрических) нет особых оснований предполагать, что распределение второй выборки лишь сдвигается, но не меняется каким-либо иным образом.

U-критерий является непараметрическим аналогом критерия Стьюдента . Если выборки нормальные , то для проверки гипотезы сдвига предпочтительно применить более мощный критерий Стьюдента.

История

Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном. В 1947 году он был существенно переработан и расширен Манном и Уитни, по именам которых сегодня обычно и называется.

Литература

  1. Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947, №18. - Pp. 50-60.
  2. Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. 1945. - Pp. 80–83.
  3. Орлов А. И. Эконометрика. - М.: Экзамен, 2003. - 576 с. (§4.5 Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона?)
  4. Кобзарь А. И. Прикладная математическая статистика. - М.: Физматлит, 2006. - 816 с.

​ U-критерий Манна-Уитни – непараметрический статистический критерий, используемый для сравнения двух независимых выборок по уровню какого-либо признака, измеренного количественно. Метод основан на определении того, достаточно ли мала зона перекрещивающихся значений между двумя вариационными рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.

1. История разработки U-критерия

Данный метод выявления различий между выборками был предложен в 1945 году американским химиком и статистиком Фрэнком Уилкоксоном .
В 1947 году он был существенно переработан и расширен математиками Х.Б. Манном (H.B. Mann) и Д.Р. Уитни (D.R. Whitney), по именам которых сегодня обычно и называется.

2. Для чего используется U-критерий Манна-Уитни?

U-критерий Манна-Уитни используется для оценки различий между двумя независимыми выборками по уровню какого-либо количественного признака.

3. В каких случаях можно использовать U-критерий Манна-Уитни?

U-критерий Манна-Уитни является непараметрическим критерием, поэтому, в отличие от t-критерия Стьюдента , не требует наличия нормального распределения сравниваемых совокупностей.

U-критерий подходит для сравнения малых выборок: в каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было 2 значения, но во второй тогда должно быть не менее пяти.

Условием для применения U-критерия Манна-Уитни является отсутствие в сравниваемых группах совпадающих значений признака (все числа – разные) или очень малое число таких совпадений.

Аналогом U-критерия Манна-Уитни для сравнения более двух групп является Критерий Краскела-Уоллиса .

4. Как рассчитать U-критерий Манна-Уитни?

Сначала из обеих сравниваемых выборок составляется единый ранжированный ряд , путем расставления единиц наблюдения по степени возрастания признака и присвоения меньшему значению меньшего ранга. В случае равных значений признака у нескольких единиц каждой из них присваивается среднее арифметическое последовательных значений рангов.

Например, две единицы, занимающие в едином ранжированном ряду 2 и 3 место (ранг), имеют одинаковые значения. Следовательно, каждой из них присваивается ранг равный (3 + 2) / 2 = 2,5.

В составленном едином ранжированном ряду общее количество рангов получится равным:

N = n 1 + n 2

где n 1 - количество элементов в первой выборке, а n 2 - количество элементов во второй выборке.

Далее вновь разделяем единый ранжированный ряд на два, состоящие соответственно из единиц первой и второй выборок, запоминая при этом значения рангов для каждой единицы. Подсчитываем отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно - на долю элементов второй выборки. Определяем большую из двух ранговых сумм (T x ) соответствующую выборке с n x элементами.

Наконец, находим значение U-критерия Манна-Уитни по формуле:

5. Как интерпретировать значение U-критерия Манна-Уитни?

Полученное значение U-критерия сравниваем по таблице для избранного уровня статистической значимости (p=0.05 или p=0.01 ) с критическим значением U при заданной численности сопоставляемых выборок:

  • Если полученное значение U меньше табличного или равно ему, то признается статистическая значимость различий между уровнями признака в рассматриваемых выборках (принимается альтернативная гипотеза). Достоверность различий тем выше, чем меньше значение U.
  • Если же полученное значение U больше табличного, принимается нулевая гипотеза.