Проверка статистических гипотез
Math Task сайт репетиторов

Проверка статистических гипотез

 
  line    
line
 
         
  Главная > Учебные материалы > Математика:  Проверка статистических гипотез  
  line  
 
  • Репетитор по математике - Васильев Алексей Александрович Math Task Репетитор: Васильев Алексей Александрович

    Math Task Предметы: математика, физика, информатика, экономика.

           Стоимость: 2000 руб / 90 мин.
  • Репетитор по математике - Крюков Илья Хассанович Math Task Репетитор: Крюков Илья Хассанович

    Math Task Предметы: математика, экономика, бухгалтерский учет.

           Стоимость: 1600 руб / 60 мин.
  • Репетитор по математике - Скрипаленко Михаил Михайлович Math Task Репетитор: Скрипаленко Михаил Михайлович

    Math Task Предметы: математика (ЕГЭ), английский язык (GMAT, GRE (general), GRE subject test in maths, IELTS, TOEFL, BEC).

           Стоимость: 1200 руб / 60 мин.
  • Репетитор по русскому языку - Матвеева Милада Андреевна Math Task Репетитор: Матвеева Милада Андреевна

    Math Task Предметы: русский язык, литература (ЕГЭ, ГИА).

           Стоимость: 1200 руб / 60 мин.
  • Репетитор по физике - Тверской Василий Борисович Math Task Репетитор: Тверской Василий Борисович

    Math Task Предметы: математика, физика.

           Стоимость: 3500 руб / 90 мин.
  • Репетитор по английскому языку - Поздняков Андрей Александрович Math Task Репетитор: Поздняков Андрей Александрович

    Math Task Предметы: английский язык, (ЕГЭ). Подготовка к TOEFL и IELTS.

           Стоимость: 2000 руб / 60 мин.
  • Репетитор по бухучету - Ершикова Марина Львовна Math Task Репетитор: Ершикова Марина Львовна

    Math Task Предметы: бухгалтерский учет (кроме банковского), налогообложение, аудит.

           Стоимость: 1500 руб / 60 мин.
 
 

1.Статистическая гипотеза.
2.Проверка гипотез о равенстве числовых характеристик.

 

 
     
  24 25 26 27 28 29 30 31 32  
     
  line  

1.Статистическая гипотеза.

 
 

   В теории вероятностей проверка статистических гипотез используется для оценки эффективности нового метода ведения деятельности, метода выполнения какой-либо работы, использования новых видов ресурсов или применения новой технологии и т.д. Статистической гипотезой называется предположение о числовом значении параметра или о виде неизвестного закона распределения статистических данных. Для того, что бы обосновать применение новой технологии или использование новых видов ресурсов, необходимо рассчитать параметры статистики, используя числовые характеристики генеральной и выборочной совокупности. Затем сделать вывод о том, что выдвигаемая изначально гипотеза не противоречит (или противоречит) имеющимся наблюдениям, путем сравнения полученных результатов с критическими. Проверка статистической гипотезы делится на два этапа.

 
 

   На первом этапе выдвигается гипотеза, например, об эффективности новой технологии Н0. Затем по выборочной совокупности рассчитывается значение параметра θв и сверяется с критическим значением θкр, которое рассчитывается на основе точного или приближенного значения. Если гипотеза Н0 верна, то θв < θкр и вероятность Р (θв > θкр) = α мала. Согласно принципу практической уверенности данное событие можно считать практически невозможным. (В основе принципа практической уверенности лежит такой факт, что если вероятность события А мала, то при однократном испытании его можно считать практически невозможным.) Если θв > θкр, то гипотеза Н0 отвергается.

  Статистическая гипотеза  
 

   При проверке статистической гипотезы Н0 можно допустить ошибку 1-го или 2-го рода.

Гипотеза Н0

1. Верна      - отвергается (ошибка 1-го рода)
2. Неверна  - принимается (ошибка 2-го рода)

   Вероятность допустить ошибку 1-го рода называется уровнем значимости критерия. Вероятность не допустить ошибку 2-го рода называется мощностью критерия.

 

 
 

   При проверке гипотизы Н0 необходимо правильно выбрать критическую область. Критической областью может быть:
θ кр 1 - область положительных отклонений,
θ кр 2 - область отрицательных отклонений,
θ кр 3, θ кр 4- область больших и малых по абсолютной величине отклонений. (Рис.1)


   Предположим, что мы выбрали проверяемую гипотезу Н0 θ1 = θ0. Конкурирующая гипотеза пусть будет Н1 θ1 > θ0. Тогда критической областью при заданном уровне значимости будет интервал θ > θкр1. Если θ < θ кр1, то гипотеза Н0 принимается. Если θ > θ кр1, т.е. попадает в критическую область, то гипотеза Н0 отвергается. При увеличении θ кр1 вероятность допустить ошибку 1-го рода уменьшается, но увеличивается вероятность допущения ошибки 2-го рода.

   В геометрическом смысле вероятность ошибки 1-го рода представляет собой площадь фигуры под функцией на интервале θ > θкр1. А вероятность ошибки 2-го рода представляет собой площадь фгуры на интервале θ < θкр1. В итоге эти две вероятности обратно пропорциональны. Т.е. чем больше вероятность допущения ошибки 1-го рода, тем меньше вероятность допущения ошибки 2-го рода и наоборот. Одновременно уменьшить вероятности обоих ошибок невозможно. Отсюда следует, что при проверке статистической гипотезы критическую область необходимо выбирать такой, что бы мощность критерия (не допустить ошибку 2-го рода) была максимальной.

  Проверка статистической гипотезы. Критическая область
Рис.1
 
 

   Конкурирующую гипотезу Н1 выбирают одну из следующих возможных вариантов:

а < a0 - левосторонняя критическая область
а > a0 - правосторонняя критическая область
а ≠ a0 - двусторонняя критическая область

Для определения границ критических областей используются следующие соотношения:

 
  Соотношения для определения границ критических областей  
 

   Необходимо добавить, что в случае принятия гипотезы Н0, в действительности не означает, что расчетное значение параметра по выборочной совокупности θn равно истинному значению. Это, всего лишь, говорит о правдоподобии параметра θn, который рассчитан на основе данных, полученных по выборочной совокупности. При расчете параметра θn предполагается, что закон распределения генеральной совокупности известен. Критерии, которые используются при проверке таких гипотез, называются параметрическими. Если же закон распределения генеральной совокупности не известен, то критерии называются непараметрическими. Исходя из смысла статистическая гипотеза может выдвигаться о числовом значении параметра, о законе распределения генеральной совокупности, о равенстве числовых характеристик генеральной совокупности или о принадлежности выборок к одной и той же генеральной совокупности.

 

 

2.Проверка гипотез о равенстве числовых характеристик

 
 

   Числовые характеристики описывают свойства совокупности данных. Например средняя арифметическая описывает среднее значение некоторого числа экспериментов. При расчете числовых характеристик в разных сериях эспериментов можно получить разное их значение. При этом необходимо определить: эти различия являются существенными для этих совокупностей или нет.

   Допустим есть две совокупности N1, N2, которые имеют среднии арифметические хср1, хср2 и дисперсии σ21, σ22. Проверим гипотезу Н0 о равенстве генеральных средних. Если объем выборки достаточно большой, то выборочные средние имеют приблизительно нормальный закон распределения. Из двух совокупностей взяты два независимых объема выборки n1, n2 и рассчитаны выборочные среднии арифметические и дисперсии.

 
 

   Критерий, по которому оценивается справедливость гипотезы рассчитывается по следующей формуле:

Формула рассчета критерия справедливости гипотезы

где

   хв1, хв2 - выборочные средние
   σ21, σ22 - генеральные дисперсии
   n1, n2 - объемы выборок
   α - уровень значимости

  Выбор критической области, по которому оценивается справедливость гипотезы
Рис.2
 
 

   Затем сравнивается полученное значение статистики t с критическим tкр. Если | t | > t кр., то на заданном уровне значимости гипотеза Н0 отвергается. Если | t | < tкр., то делается вывод о том, что выдвигаемая гипотеза Н0 не противоречит данным наблюдений. (рис.2)

 
 

Пример.

     
 

   Для повышения скорости обработки данных для операционистов было внедрено новое программное обеспечение. Для проверки его эффективности отобрали две группы операционистов численностью n1 = 65 и n2 = 70 человек. В группе, где применялось новое программное обеспечение среднее количество обработанных документов составило хср1 = 190, где старое программное обеспечение - хср2 = 182. Известно, что дисперсии выработки для групп составляют: σ21 = 120 и σ22 = 110. На уровне значимости α = 0,02 выяснить эффективно ли новое программное обеспечение?

 
 

Решение. Проверяемая гипотеза Н0: хср1 = хср2 означает равенство среднего числа обработанных документов операционистов двух групп. Конкурирующая гипотеза Н1: хср1 > хср2. Рассчитаем значение статистики t критерий:

Значение статистики t критерия

  Критическое значение статистики t критерия
Рис.3
 
 

   Т.к значение t критерия больше критического 4,3274 > 2,06 кр.(рис.3), то можно сделать вывод об эффективности нового программного обеспечения, т.е гипотеза Н0 о равенстве среднего количества обработанных документов двух групп отвергается на 2-х процентном уровне значимости.

 
         
  line  
     
  24 25 26 27 28 29 30 31 32  
     
line
    Комментарий:  
         
  Регистрация  
   Для написания комментария необходимо зарегистрироваться!    
         
        Забыли пароль?
      Email:
      Пароль:
       
         
         
         
line
 
line line
Math Task - сайт репетиторов Яндекс.Метрика Рейтинг@Mail.ru