Много пута када проучавамо групу заиста упоређујемо две популације. Зависно од параметар ове групе која нас занима и услови са којима имамо посла је на располагању неколико техника. Статистички закључак поступци који се тичу поређења две популације обично се не могу применити на три или више популација. Да бисмо проучавали више од две популације одједном, потребне су нам различите врсте статистичких алата. Анализа варијансеили АНОВА, је техника из статистичких интерференција која нам омогућава да се бавимо са неколико популација.
Поређење средстава
Да бисмо видели који проблеми настају и зашто нам треба АНОВА, размотрићемо пример. Претпоставимо да покушавамо да утврдимо да ли је значити утези зелених, црвених, плавих и наранџастих М&М бомбона разликују се један од другог. Навешћемо средње тежине за сваку од ових популација, μ1, μ2, μ3 μ4 и респективно Можда користимо одговарајуће хипотеза тест неколико пута и тест Ц (4,2), или шест различитих нулта хипотеза:
- Х0: μ1 = μ2 да се провери да ли је средња тежина популације црвених бомбона другачија од средње тежине популације плавих бомбона.
- Х0: μ2 = μ3 да се провери да ли је средња тежина популације плавих бомбона другачија од средње тежине популације зелених бомбона.
- Х0: μ3 = μ4 да се провери да ли је средња тежина популације зелених бомбона другачија од средње тежине популације наранџастих бомбона.
- Х0: μ4 = μ1 да се провери да ли је средња тежина популације наранџастих бомбона другачија од средње тежине популације црвених бомбона.
- Х0: μ1 = μ3 да се провери да ли је средња тежина популације црвених бомбона другачија од средње тежине популације зелених бомбона.
- Х0: μ2 = μ4 да се провери да ли је средња тежина популације плавих бомбона другачија од средње тежине популације наранџастих бомбона.
Постоји много проблема са оваквом анализом. Имаћемо шест п-вредности. Иако можемо да тестирамо сваког од 95% ниво самопоуздања, наше поверење у свеукупни процес је мање од овога, јер се вероватноће множе: .95 к .95 к .95 к .95 к .95 к .95 је приближно .74, или ниво поверења од 74%. Тако је вероватноћа грешке типа И порасла.
На фундаменталнијем нивоу, ова четири параметра не можемо упоређивати као целину, упоређујући их два истодобно. Средства црвене и плаве боје и боје могу бити значајна, при чему је средња тежина црвене боје релативно већа од средње тежине плаве боје. Међутим, ако узмемо у обзир тежину свих четири врсте слаткиша, можда нема значајне разлике.
Анализа варијансе
Да бисмо се позабавили ситуацијама у којима треба да направимо више поређења, користимо АНОВА. Овај тест омогућава нам да размотримо параметре неколико популација одједном, а да не улазимо у неке проблеме са којима се сусрећемо спровођење тестова хипотеза на два параметра истовремено.
Да бисмо спровели АНОВА са горњим примером М&М, тестирали бисмо нулту хипотезу Х0:μ1 = μ2 = μ3= μ4. Ово наводи да нема разлике између средњих тежина црвених, плавих и зелених М&М. Алтернативна хипотеза је да постоји нека разлика између средњих тежина црвених, плавих, зелених и наранџастих боја. Ова хипотеза је заиста комбинација неколико изјава Ха:
- Средња тежина популације црвених бомбона није једнака средњој тежини популације плавих бомбона, ИЛИ
- Средња тежина популације плавих бомбона није једнака средњој тежини популације зелених бомбона, ИЛИ
- Средња тежина популације зелених бомбона није једнака средњој тежини популације наранџастих бомбона, ИЛИ
- Средња тежина популације зелених бомбона није једнака средњој тежини популације црвених бомбона, ИЛИ
- Средња тежина популације плавих бомбона није једнака средњој тежини популације наранџастих бомбона, ИЛИ
- Средња тежина популације плавих бомбона није једнака средњој тежини популације црвених бомбона.
У овом конкретном случају, да бисмо добили своју п-вредност, користили бисмо а расподела познат као Ф-дистрибуција. Прорачуни који укључују АНОВА Ф тест могу се обавити ручно, али се обично рачунају са статистичким софтвером.
Вишеструка поређења
Оно што раздваја АНОВА од осталих статистичких техника је да се користи за вишеструко упоређивање. То је уобичајено у читавој статистици, јер често имамо поређење више од две групе. Типично општи тест сугерише да постоји нека врста разлике између параметара које проучавамо. Затим пратимо овај тест са неком другом анализом да бисмо одлучили који се параметар разликује.