Тест хипотезе за поређење два удела

У овом чланку ћемо проћи кроз кораке неопходне за извођење хипотеза тестили тест значаја за разлику од два удела становништва. То нам омогућава да упоредимо две непознате пропорције и закључимо ако нису једнаке једнакој или ако је једна већа од друге.

Преглед и позадина теста хипотезе

Пре него што пређемо на специфичности нашег теста хипотеза, погледаћемо оквир тестова хипотеза. У тесту на значај покушавамо да покажемо да изјава која говори о вредности становништва параметар (или понекад природа саме популације) је вероватно тачна.

Ми прикупљамо доказе за ову изјаву спроводећи статистички узорак. Из овог узорка израчунавамо статистику. Вредност ове статистике је оно што користимо за утврђивање истинитости оригиналне изјаве. Овај процес садржи несигурност, међутим ми смо у стању да га квантификујемо

Целокупни поступак теста хипотеза дат је у доњој листи:

  1. Уверите се да су испуњени услови неопходни за наш тест.
  2. Јасно наведите то нулта и алтернативна хипотеза. Алтернативна хипотеза може укључивати једнострани или двострани тест. Такође би требало да одредимо ниво значаја који ће бити означен грчким словом алфа.
    instagram viewer
  3. Израчунајте тест статистике. Врста статистике коју користимо зависи од одређеног теста који проводимо. Прорачун се ослања на наш статистички узорак.
  4. Израчунајте п-вредност. Статистика теста може се превести у п-вредност. П-вредност је вероватноћа да случајност произведе вредност наше тестне статистике под претпоставком да је нулта хипотеза тачна. Опште правило је да што је мања п-вредност, то је већи доказ против нулте хипотезе.
  5. Извући закључак. На крају користимо вредност алфа која је већ одабрана као вредност прага. Правило одлуке је да ако је п-вредност мања или једнака алфа, тада одбацујемо нулту хипотезу. Иначе ми не одбије нулта хипотеза.

Сада када смо видели оквир за тест хипотезе, видећемо специфичности теста хипотезе за разлику две пропорције становништва.

Услови

Тест хипотезе за разлику од две пропорције становништва захтева да су испуњени следећи услови:

  • Имамо две једноставни случајни узорци од велике популације. Овде "велика" значи да је популација најмање 20 пута већа од величине узорка. Величине узорка ће бити означене са н1 и н2.
  • Појединци у нашим узорцима изабрани су независно један од другог. Сама популација такође мора бити независна.
  • У оба наша узорка постоји најмање 10 успеха и 10 неуспеха.

Све док су ови услови задовољени, можемо наставити са тестом хипотеза.

Нулта и алтернативна хипотеза

Сада морамо размотрити хипотезе за наш тест важности. Нулта хипотеза је наша изјава без учинка. У овом посебном типу хипотеза наша нулта хипотеза је да нема разлике између две пропорције популације. То можемо написати као Х0: п1 = п2.

Алтернативна хипотеза је једна од три могућности, зависно од специфичности онога за шта тестирамо:

  • Ха: п1 је већи од п2. Ово је једнострани или једнострани тест.
  • Ха: п1 је мање од п2. Ово је такође једнострани тест.
  • Ха: п1 није једнак п2. Ово је дворезни или двострани тест.

Као и увек, да бисмо били опрезни, требало би да користимо двострану алтернативну хипотезу ако немамо правац пре него што добијемо наш узорак. Разлог за то је то што је нулану хипотезу теже одбити двостраним тестом.

Три хипотезе могу се преписати наводећи како п1 - п2 се односи на вредност нула. Да будемо прецизнији, нулта хипотеза би постала Х0:п1 - п2 = 0. Потенцијалне алтернативне хипотезе написале би се као:

  • Ха: п1 - п2 > 0 је еквивалентно изјави "п1 је већи од п2."
  • Ха: п1 - п2 <0 је еквивалент изјава "п1 је мање од п2."
  • Ха: п1 - п2 = 0 је еквивалентно изјави „п1 није једнак п2."

Ова еквивалентна формулација нам заправо показује мало више онога што се дешава иза кулиса. Оно што радимо у овом тесту хипотезе је окретање два параметра п1 и п2 у јединствени параметар п1 - п2. Затим тестирамо овај нови параметар на вредности нула.

Статистика теста

Формула за тест тест је дата на горњој слици. Следи објашњење сваког од термина:

  • Узорак из прве популације има величину н1. Број успеха овог узорка (што се директно не види у горњој формули) је к1.
  • Узорак из друге популације има величину н2. Број успеха овог узорка је к2.
  • Пропорције узорка су п1-Шта = к1 / н1 и стр2-хат = к2 / н2 .
  • Затим комбинујемо или објединимо успехе из оба ова узорка и добијемо: п-капа = (к1 + к2) / (н1 + н2).

Као и увек, будите пажљиви са редоследом операција приликом рачунања. Све што се налази испод радикала мора бити израчунато пре него што узмете квадратни корен.

П-вредност

Следећи корак је израчунавање п-вредности која одговара нашој тестној статистици. Ми користимо стандардну нормалну дистрибуцију за нашу статистику и консултујемо таблицу вредности или користимо статистички софтвер.

Детаљи нашег израчунавања п-вредности зависе од алтернативне хипотезе коју користимо:

  • За Ха: п1 - п2 > 0, израчунавамо удио нормалне расподјеле који је већи од З.
  • За Ха: п1 - п2 <0, израчунавамо удио нормалне расподјеле који је мањи од З.
  • За Ха: п1 - п2 = 0, израчунавамо удио нормалне дистрибуције који је већи од |З|, апсолутна вредност З. Након овога, да бисмо узели у обзир чињеницу да имамо тест са двоструким репом, удвостручујемо пропорцију.

Правило одлуке

Сада доносимо одлуку о томе да ли ћемо одбацити ништавну хипотезу (и тиме прихватити алтернативу) или нећемо одбацити ништавну хипотезу. Ову одлуку доносимо упоређујући нашу п-вредност са нивоом алфа значајности.

  • Ако је п-вредност мања или једнака алфа, тада одбацујемо нулту хипотезу. То значи да имамо статистички значајан резултат и да ћемо прихватити алтернативну хипотезу.
  • Ако је п-вредност већа од алфа, тада не успевамо да одбацимо ништавну хипотезу. То не доказује да је нулта хипотеза тачна. Уместо тога, значи да нисмо добили довољно уверљиве доказе да одбацимо ништавну хипотезу.

Посебна напомена

Тхе интервал поузданости за разлику од две пропорције становништва не обједињује успехе, док тест хипотезе. Разлог за то је што наша ништавна хипотеза претпоставља то п1 - п2 = 0. Интервал поверења то не претпоставља. Неки статистичари не обједињују успехе овог теста хипотеза, и уместо тога користе мало модификовану верзију горњег статистичког теста.