Построение доверительного интервала для математического ожидания генеральной совокупности. Доверительный интервал для дисперсии нормального распределения

Пусть случайная величина распределена по нормальному закону, для которого дисперсия D неизвестна. Делается выборка объема n . Из нее определяется исправленная выборочная дисперсия s 2 . Случайная величина

распределена по закону 2 c n -1 степенями свободы. По заданной надежности можно найти сколько угодно границ 1 2 и 2 2 интервалов, таких, что

Найдем 1 2 и 2 2 из следующих условий:

P(2 1 2) = (1 -)/ 2(**)

P(2 2 2) = (1 -)/ 2(***)

Очевидно, что при выполнении двух последних условий справедливо равенство (*).

В таблицах для случайной величины 2 обычно дается решение уравнения

Из такой таблицы по заданной величине q и по числу степеней свободы n - 1 можно определить значение q 2 . Таким образом, сразу находится значение 2 2 в формуле (***).

Для определения 1 2 преобразуем (**):

P(2 1 2) = 1 - (1 -)/ 2 = (1 +)/ 2

Полученное равенство позволяет определить по таблице значение 1 2 .

Теперь, когда найдены значения 1 2 и 2 2 , представим равенство (*) в виде

Последнее равенство перепишем в такой форме, чтобы были определены границы доверительного интервала для неизвестной величины D:

Отсюда легко получить формулу, по которой находится доверительный интервал для стандартного отклонения:

Задача. Будем считать, что шум в кабинах вертолетов одного и того же типа при работающих в определенном режиме двигателях -- случайная величина, распределенная по нормальному закону. Было случайным образом выбрано 20 вертолетов, и произведены замеры уровня шума (в децибелах) в каждом из них. Исправленная выборочная дисперсия измерений оказалась равной 22,5. Найти доверительный интервал, накрывающий неизвестное стандартное отклонение величины шума в кабинах вертолетов данного типа с надежностью 98%.

Решение. По числу степеней свободы, равному 19, и по вероятности (1 - 0,98)/2 = 0,01 находим из таблицы распределения 2 величину 2 2 = 36,2. Аналогичным образом при вероятности (1 + 0,98)/2 = 0,99 получаем 1 2 = 7,63. Используя формулу (****), получаем искомый доверительный интервал: (3,44; 7,49).

В статистике существует два вида оценок: точечные и интервальные. Точечная оценка представляет собой отдельную выборочную статистику, которая используется для оценки параметра генеральной совокупности. Например, выборочное среднее - это точечная оценка математического ожидания генеральной совокупности, а выборочная дисперсия S 2 - точечная оценка дисперсии генеральной совокупности σ 2 . было показано, что выборочное среднее является несмещенной оценкой математического ожидания генеральной совокупности. Выборочное среднее называется несмещенным, поскольку среднее значение всех выборочных средних (при одном и том же объеме выборки n ) равно математическому ожиданию генеральной совокупности.

Для того чтобы выборочная дисперсия S 2 стала несмещенной оценкой дисперсии генеральной совокупности σ 2 , знаменатель выборочной дисперсии следует положить равным n – 1 , а не n . Иначе говоря, дисперсия генеральной совокупности является средним значением всевозможных выборочных дисперсий.

При оценке параметров генеральной совокупности следует иметь в виду, что выборочные статистики, такие как , зависят от конкретных выборок. Чтобы учесть этот факт, для получения интервальной оценки математического ожидания генеральной совокупности анализируют распределение выборочных средних (подробнее см. ). Построенный интервал характеризуется определенным доверительным уровнем, который представляет собой вероятность того, что истинный параметр генеральной совокупности оценен правильно. Аналогичные доверительные интервалы можно применять для оценки доли признака р и основной распределенной массы генеральной совокупности.

Скачать заметку в формате или , примеры в формате

Построение доверительного интервала для математического ожидания генеральной совокупности при известном стандартном отклонении

Построение доверительного интервала для доли признака в генеральной совокупности

В этом разделе понятие доверительного интервала распространяется на категорийные данные. Это позволяет оценить долю признака в генеральной совокупности р с помощью выборочной доли р S = Х/ n . Как указывалось , если величины n р и n (1 – р) превышают число 5, биномиальное распределение можно аппроксимировать нормальным. Следовательно, для оценки доли признака в генеральной совокупности р можно построить интервал, доверительный уровень которого равен (1 – α)х100% .


где p S - выборочная доля признака, равная Х/ n , т.е. количеству успехов, деленному на объем выборки, р - доля признака в генеральной совокупности, Z - критическое значение стандартизованного нормального распределения, n - объем выборки.

Пример 3. Предположим, что из информационной системы извлечена выборка, состоящая из 100 накладных, заполненных в течение последнего месяца. Допустим, что 10 из этих накладных составлены с ошибками. Таким образом, р = 10/100 = 0,1. Доверительному уровню 95% соответствует критическое значение Z = 1,96.

Таким образом, вероятность того, что от 4,12% до 15,88% накладных содержат ошибки, равна 95%.

Для заданного объема выборки доверительный интервал, содержащий долю признака в генеральной совокупности, кажется более широким, чем для непрерывной случайной величины. Это объясняется тем, что измерения непрерывной случайной величины содержат больше информации, чем измерения категорийных данных. Иначе говоря, категорийные данные, принимающие лишь два значения, содержат недостаточно информации для оценки параметров их распределения.

В ычисление оценок, извлеченных из конечной генеральной совокупности

Оценка математического ожидания. Поправочный коэффициент для конечной генеральной совокупности (fpc ) использовался для уменьшения стандартной ошибки в раз. При вычислении доверительных интервалов для оценок параметров генеральной совокупности поправочный коэффициент применяется в ситуациях, когда выборки извлекаются без возвращения. Таким образом, доверительный интервал для математического ожидания, имеющий доверительный уровень, равный (1 – α)х100% , вычисляется по формуле:

Пример 4. Чтобы проиллюстрировать применение поправочного коэффициента для конечной генеральной совокупности, вернемся к задаче о вычислении доверительного интервала для средней суммы накладных, рассмотренной выше в примере 3. Предположим, что за месяц в компании выписываются 5000 накладных, причем =110,27долл., S = 28,95 долл., N = 5000, n = 100, α = 0,05, t 99 = 1,9842. По формуле (6) получаем:

Оценка доли признака. При выборе без возвращения доверительный интервал для доли признака, имеющий доверительный уровень, равный (1 – α)х100% , вычисляется по формуле:

Доверительные интервалы и этические проблемы

При выборочном исследовании генеральной совокупности и формулировании статистических выводов часто возникают этические проблемы. Основная из них - как согласуются доверительные интервалы и точечные оценки выборочных статистик. Публикация точечных оценок без указания соответствующих доверительных интервалов (как правило, имеющих 95%-ный доверительный уровень) и объема выборки, на основе которых они получены, может породить недоразумения. Это может создать у пользователя впечатление, что точечная оценка - именно то, что ему необходимо, чтобы предсказать свойства всей генеральной совокупности. Таким образом, необходимо понимать, что в любых исследованиях во главу угла должны быть поставлены не точечные, а интервальные оценки. Кроме того, особое внимание следует уделять правильному выбору объемов выборки.

Чаще всего объектами статистических манипуляций становятся результаты социологических опросов населения по тем или иным политическим проблемам. При этом результаты опроса выносят на первые страницы газет, а ошибку выборочного исследования и методологию статистического анализа печатают где-нибудь в середине. Чтобы доказать обоснованность полученных точечных оценок, необходимо указывать объем выборки, на основе которой они получены, границы доверительного интервала и его уровень значимости.

Следующая заметка

Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 448–462

Центральная предельная теорема утверждает, что при достаточно большом объеме выборок выборочное распределение средних можно аппроксимировать нормальным распределением. Это свойство не зависит от вида распределения генеральной совокупности.

Построение доверительного интервала для дисперсии нормально распределенной генеральной совокупности основывается на том, что случайная величина:

имеет c 2 -распределение Пирсона c n=n –1 степенями свободы. Зададим доверительную вероятность g и определим числа и из условия

Числа и , удовлетворяющие этому условию, можно выбрать бесчисленным числом способов. Один из способов состоит в следующем

и .

Значения чисел и определяются из таблиц для распределения Пирсона. После этого образуем неравенство

В результате получаем следующую интервальную оценку дисперсии генеральной совокупности:

. (3.25)

Иногда это выражение записывают в виде

, (3.26)

, (3.27)

где для коэффициентов и составляют специальные таблицы.

Пример 3.10. На фабрике работает автоматическая линия по фасовке растворимого кофе в жестяные 100-граммовые банки. Если средняя масса наполняемых банок отличается от точной, то линии налаживается для подгонки средней массы в рабочем режиме. Если дисперсия массы превышает заданное значение, то линия должна быть остановлена на ремонт и переналадку. Время от времени производится отбор банок с кофе для проверки средней массы и ее колеблемости. Предположим, что с линии в случайном порядке производится отбор банок с кофе и оценка дисперсии s 2 =18,540. Постройте 95%-й доверительный интервал для генеральной дисперсии s 2 .

Решение. Предполагая, что генеральная совокупность имеет нормальное распределение, воспользуемся формулой (3.26). По условию задачи уровень значимости a=0,05 и a/2=0,025. По таблицам для c 2 -распределение Пирсона с n=n –1=29 степенями свободы находим

и .

Тогда доверительный интервал для s 2 можно записать в виде

,

.

Для средне квадратичного отклонения ответ будет иметь вид

. â

Проверка статистических гипотез

Основные понятия

Большинство эконометрических моделей требует многократного улучшения и уточнения. Для этого необходимо проведение соответствующих расчетов, связанных с установлением выполнимости или невыполнимости тех или иных предпосылок, анализом качества найденных оценок, достоверностью полученных выводов. Поэтому знание основных принципов проверки гипотез является обязательным в эконометрике.



Во многих случаях необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид, то выдвигают гипотезу: генеральная совокупность распределена по этому закону. Например, можно выдвинуть предположение, что доход населения, ежедневное количество покупателей в магазине, размер выпускаемых деталей имеют нормальный закон распределения.

Возможен случай, когда закон распределения известен, а его параметры нет. Если есть основания предположить, что неизвестный параметр q равен ожидаемому числу q 0 , то выдвигают гипотезу: q=q 0 . Например, можно выдвинуть предположение о величине среднего дохода населения, среднего ожидаемого дохода по акциям, о разбросе в доходах и т.д.

Под статистической гипотезой H понимают любое предположение о генеральной совокупности (случайной величине), проверяемое по выборке. Это может быть предположение о виде распределения генеральной совокупности, о равенстве двух выборочных дисперсий, о независимости выборок, об однородности выборок, т.е. что закон распределения не меняется от выборки к выборке и др.

Гипотеза называется простой , если она однозначно определяет какое-либо распределение или какой-либо параметр; в противном случае гипотеза называется сложной . Например, простой гипотезой является предположение о том, что случайная величина X распределена по стандартному нормальному закону N (0;1); если же высказывается предположение, что случайная величина X имеет нормальной распределение N (m ;1), где a £m £b , то это сложная гипотеза.

Проверяемая гипотеза называется основной или нулевой гипотезой и обозначается символом H 0 . Наряду с основной гипотезой рассматривают и противоречащую ей гипотезу, которую обычно называют конкурирующей или альтернативной гипотезой и обозначают символом H 1 . Если основная гипотеза будет отвергнута, то имеет место альтернативная гипотеза. Например, если проверяется гипотеза о равенства параметра q некоторому заданному значению q 0 , т.е. H 0:q=q 0 , то в качестве альтернативной гипотезы можно рассмотреть одну из следующих гипотез: H 1:q>q 0 , H 2:qH 3:q¹q 0 , H 4:q=q 1 . Выбор альтернативной гипотезы определяется конкретной формулировкой задачи.

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверка осуществляется статистическими методами, то в связи с этим с определенной долей вероятности может быть принято неправильное решение. Здесь могут быть допущены ошибки двух видов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода обозначают буквой a, т.е.

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают буквой b, т.е.

Последствия указанных ошибок неравнозначны. Первая приводит к более осторожному, консервативному решению, вторая – к неоправданному риску. Что лучше или хуже – зависит от конкретной постановки задачи и содержания нулевой гипотезы. Например, если H 0 состоит в признании продукции предприятия качественной и допущена ошибка первого рода, то будет забракована годная продукция. Допустив ошибку второго рода, мы отправим потребителю брак. Очевидно, последствия этой ошибки более серьезны с точки зрения имиджа фирмы и ее долгосрочных перспектив.

Исключить ошибки первого и второго рода невозможно в силу ограниченности выборки. Поэтому стремятся минимизировать потери от этих ошибок. Отметим, что одновременное уменьшение вероятностей данных ошибок невозможно, т.к. задачи их уменьшения являются конкурирующими. И снижение вероятности допустить одну из них влечет за собой увеличение вероятности допустить другую. В большинстве случаев единственный способ уменьшения обеих вероятностей состоит в увеличении объема выборки.

Правило, в соответствие с которым принимается или отклоняется основная гипотеза, называется статистическим критерием . Для этого подбирается такая случайная величина K, распределение которой точно или приближенно, известно и которая служит мерой расхождения между опытными и гипотетическими значениями.

Для проверки гипотезы по данным выборки вычисляют выборочное (или наблюдаемое ) значение критерия K набл . Затем, в соответствии с распределением выбранного критерия, строится критическая область K крит . Это такая совокупность значений критерия, при которых нулевую гипотезу отвергают. Оставшуюся часть возможных значений называют областью принятия гипотезы . Если ориентироваться на критическую область, то можно совершить ошибку
1-го рода, вероятность которой задана заранее и равна a, называемой уровнем значимости гипотезы. Отсюда вытекает следующее требование к критической области K крит :

.



Уровень значимости a определяет "размер" критической области K крит . Однако ее положение на множестве значений критерия зависит от вида альтернативной гипотезы. Например, если проверяется нулевая гипотеза H 0:q=q 0 , а альтернативная гипотеза имеет вид H 1:q>q 0 , то критическая область будет состоять из интервала (K 2 , +¥), где точка K 2 определяется из условия P (K>K 2)=a (правосторонняя критическая область H 2:qP (Kлевосторонняя критическая область ). Если альтернативная гипотеза имеет вид H 3:q¹q 0 , то критическая область будет состоять из двух интервалов (–¥;K 1) и (K 2 , +¥), где точки K 1 и K 2 определяются из условий: P (K>K 2)=a/2 и P (Kдвухсторонняя критическая область ).

Основной принцип проверки статистических гипотез можно сформулировать следующим образом. Если K набл попадает в критическую область, то гипотеза H 0 отвергается и принимается гипотеза H 1 . Однако поступая таким образом, следует понимать, что здесь можно допустить ошибку 1-го рода с вероятностью a. Если K набл попадает в область принятия гипотезы – то нет оснований, чтобы отвергать нулевую гипотезу H 0 . Но это вовсе не означает, что H 0 является единственно подходящей гипотезой: просто расхождения между выборочными данными и гипотезой H 0 невелико; однако таким же свойством могут обладать и другие гипотезы.

Мощностью критерия называется вероятность того, что нулевая гипотеза будет отвергнута, если верна альтернативная гипотеза; т.е. мощность критерия равна 1–b, где b – вероятность совершить ошибку 2-го рода. Пусть для проверки гипотезы принят определенный уровень значимости a и выборка имеет фиксированный объем. Поскольку в выборе критической области есть определенный произвол, то ее целесообразно строить так, чтобы мощность критерия была максимальной или чтобы вероятность ошибки 2-го рода была минимальной.

Критерии, используемые для проверки гипотез о параметрах распределения, называются критериями значимости . В частности, построение критической области аналогично построению доверительного интервала. Критерии, используемые для проверки согласия между выборочным распределением и гипотетическим теоретическим распределением, называются критериями согласия .

Доверительный интервал – предельные значения статистической величины, которая с заданной доверительной вероятностью γ будет находится в этом интервале при выборке большего объема. Обозначается как P(θ - ε . На практике выбирают доверительную вероятность γ из достаточно близких к единице значений γ = 0.9 , γ = 0.95 , γ = 0.99 .

Назначение сервиса . С помощью этого сервиса определяются:

  • доверительный интервал для генерального среднего, доверительный интервал для дисперсии;
  • доверительный интервал для среднего квадратического отклонения, доверительный интервал для генеральной доли;
Полученное решение сохраняется в файле Word (см. пример). Ниже представлена видеоинструкция, как заполнять исходные данные.

Пример №1 . В колхозе из общего стада в 1000 голов овец выборочной контрольной стрижке подверглись 100 овец. В результате был установлен средний настриг шерсти 4,2 кг на одну овцу. Определить с вероятностью 0,99 среднюю квадратическую ошибку выборки при определении среднего настрига шерсти на одну овцу и пределы, в которых заключена величина настрига, если дисперсия равна 2,5 . Выборка бесповторная.
Пример №2 . Из партии импортируемой продукции на посту Московской Северной таможни было взято в порядке случайной повторной выборки 20 проб продукта «А». В результате проверки установлена средняя влажность продукта «А» в выборке, которая оказалась равной 6 % при среднем квадратическом отклонении 1 %.
Определите с вероятностью 0,683 пределы средней влажности продукта во всей партии импортируемой продукции.
Пример №3 . Опрос 36 студентов показал, что среднее количество учебников, прочитанных ими за учебный год, оказалось равным 6. Считая, что количество учебников, прочитанных студентом за семестр, имеет нормальный закон распределения со средним квадратическим отклонением, равным 6, найти: А) с надежностью 0,99 интервальную оценку для математического ожидания этой случайной величины; Б) с какой вероятностью можно утверждать, что среднее количество учебников, прочитанных студентом за семестр, вычисленное по данной выборке, отклонится от математического ожидания по абсолютной величине не больше, чем на 2.

Классификация доверительных интервалов

По виду оцениваемого параметра:

По типу выборки:

  1. Доверительный интервал для бесконечной выборки;
  2. Доверительный интервал для конечной выборки;
Выборка называется повторной , если отобранный объект перед выбором следующего возвращается в генеральную совокупность. Выборка называется бесповторной , если отобранный объект в генеральную совокупность не возвращается. На практике обычно имеют дело с бесповторными выборками.

Расчет средней ошибки выборки при случайном отборе

Расхождение между значениями показателей, полученных по выборке, и соответствующими параметрами генеральной совокупности называется ошибкой репрезентативности .
Обозначения основных параметров генеральной и выборочной совокупности.
Формулы средней ошибки выборки
повторный отбор бесповторный отбор
для средней для доли для средней для доли
Соотношение между пределом ошибки выборки (Δ), гарантируемым с некоторой вероятностью Р(t), и средней ошибкой выборки имеет вид: или Δ = t·μ, где t – коэффициент доверия, определяемый в зависимости от уровня вероятности Р(t) по таблице интегральной функции Лапласа.

Формулы расчета численности выборки при собственно-случайном способе отбора

Чтобы найти границы доверительного интервала для среднего значения генеральной совокупности необходимо выполнить следующие действия:

1) по полученной выборке объема n вычислить среднее арифметическое и стандартную ошибку среднего арифметическогопо формуле:

;

2) задать доверительную вероятность 1 – α , исходя из цели исследования;

3) по таблице t -распределения Стьюдента (Приложение 4) найти граничное значение t α в зависимости от уровня значимости α и числа степеней свободы k = n – 1;

4) найти границы доверительного интервала по формуле:

.

Примечание: В практике научных исследований, когда закон распределения малой выборочной совокупности (n < 30) неизвестен или отличен от нормального, пользуются вышеприведенной формулой для приближенной оценки доверительных интервалов.

Доверительный интервал при n ≥ 30 находится по следующей формуле:

,

где u  – процентные точки нормированного нормального распределения, которые находятся по таблице 5.1.

8. Порядок работы на V этапе

1. Проверить на нормальность распределения малую (n < 30) выборку, составленную из разностей парных значений результатов измерений исходного показателя скоростных качеств у «спортсменов» (эти результаты обозначены индексом В) и показателя, достигнутого после двухмесячных тренировок (эти результаты обозначены индексом Г).

2. Выбрать критерий и оценить эффективность метода тренировки, используемого для ускоренного развития скоростных качеств у «спортсменов».

Отчет о работе на V этапе игры (образец)

Тема: Оценка эффективности методики тренировки.

Цели:

    Ознакомиться с особенностями нормального закона распределения результатов тестирования.

    Приобрести навыки по проверке выборочного распределения на нормальность.

    Приобрести навыки оценки эффективности методики тренировки.

    Научиться рассчитывать и строить доверительные интервалы для генеральных средних арифметических малых выборок.

Вопросы:

    Сущность метода оценки эффективности методики тренировки.

    Нормальный закон распределения. Сущность, значение.

    Основные свойства кривой нормального распределения.

    Правило трех сигм и его практическое применение.

    Оценка нормальности распределения малой выборки.

    Какие критерии и в каких случаях используются для сравнения средних попарно зависимых выборок?

    Что характеризует доверительный интервал? Методика его определения.

Вариант 1: критерий параметрический

Примечание: В качестве примера возьмем приведенные в таблице 5.2 результаты измерения показателя скоростных качеств у спортсменов до начала тренировок (они обозначены индексом В, были получены в результате измерений на I этапе деловой игры) и после двух месяцев тренировок (они обозначены индексом Г).

От выборок В и Г перейдем к выборке, составленной из разностей парных значений d i = N i Г N i В и определим квадраты этих разностей. Данные занесем в расчетную таблицу 5.2.

Таблица 5.2 – Расчет квадратов парных разностей значений d i 2

N i В , уд

N i Г , уд

d i = N i Г N i В , уд

d i 2 , уд 2

Пользуясь таблицей 5.2, найдем среднее арифметическое парных разностей:

уд.

Далее рассчитаем сумму квадратов отклонений d i от по формуле:

Определим дисперсию для выборки d i :

уд. 2

Выдвигаем гипотезы:

– нулевую – H 0: о том, что генеральная совокупность парных разностей d i имеет нормальное распределение;

– конкурирующую – H 1: о том, что распределение генеральной совокупности парных разностей d i отлично от нормального.

Проверку проводим на уровне значимости = 0,05.

Для этого составим расчетную таблицу 5.3.

Таблица 5.3 – Данные расчета критерия Шапиро и Уилка W набл для выборки, составленной из разностей парных значений d i

d i , уд

d n - k + 1 -d k = k

a nk

k ×a nk

17 – (–2) = 19

Порядок заполнения таблицы 5.3:

    В первый столбец записываем номера по порядку.

    Во второй – разности парных значений d i в неубывающем порядке.

    В третий – номера по порядку k парных разностей. Так как в нашем случае n = 10, то k изменяется от 1 до n /2 = 5.

4. В четвертый – разности k , которые находим таким образом:

– из самого большого значения d 10 вычтем самое малое d 1 k = 1,

– из d 9 вычтем d 2 и полученное значение запишем в строке для k = 2 и т.д.

    В пятый – записываем значения коэффициентов a nk , взятые из таблицы, используемой в статистике для расчета критерия Шапиро и Уилка (W ) проверки нормальности распределения (Приложение 2) для n = 10.

    В шестой – произведение k ×a nk и находим сумму этих произведений:

.

Наблюдаемое значение критерия W набл находим по формуле:

.

Проверим правильность выполнения расчетов критерия Шапиро и Уилка (W набл ) его расчетом на компьютере по программе «Статистика».

Расчет критерия Шапиро и Уилка (W набл ) на компьютере позволил установить, что:

.

Далее по таблице критических значений критерия Шапиро и Уилка (Приложение 3) ищем W крит для n = 10. Находим, что W крит = 0,842. Сравним величины W крит и W набл .

Делаем вывод : так как W набл (0,874) > W крит (0,842), должна быть принята нулевая гипотеза о нормальном распределении генеральной совокупности d i . Следовательно, для оценки эффективности применявшейся методики развития скоростных качеств следует использовать параметрический t -критерий Стьюдента.