Понекад је у статистици корисно видети разрађене примере проблема. Ови примери нам могу помоћи у проналажењу сличних проблема. У овом чланку ћемо проћи кроз поступак вођења инференцијалне статистике за резултат који се односи на два средства становништва. Не само да ћемо видети како да поступимо хипотеза тест о разлици два средства становништва, такође ћемо конструисати а интервал поверења за ову разлику. Методе које користимо понекад се називају два узорка т теста и интервал узорка два узорка т.
Изјава о проблему
Претпоставимо да желимо да тестирамо математичку способност школске деце. Једно питање које бисмо могли имати је да ли нивои вишег разреда имају веће средње резултате теста.
Једноставни случајни узорак од 27 трећих разреда има математички тест, њихови одговори су оцењени, а резултати имају просечну оцену од 75 бодова са стандардна девијација узорка од 3 поена.
Једноставни случајни узорак од 20 петих разреда даје се исти тест из математике и њихови одговори се дају. Средња оцена за пете разреде је 84 поена са стандардним одступањем узорка од 5 бодова.
С обзиром на овај сценарио постављамо следећа питања:
- Да ли нам огледни подаци пружају доказ да средња оцена тестова популације свих петих греда прелази средњу оцену тестова популације свих трећих греда?
- Колики је интервал поузданости од 95% за разлику у средњим резултатима тестова између популације трећих и петог разреда?
Услови и поступак
Морамо одабрати који поступак да користимо. При томе морамо бити сигурни и проверити да ли су испуњени услови за овај поступак. Од нас се тражи да упоредимо два средства за популацију. Једна збирка метода која се може користити за то је она за т-поступке са два узорка.
Да бисмо користили ове т-процедуре за два узорка, морамо да будемо сигурни да следећи услови важе:
- Имамо два једноставна случајна узорка из две интересантне популације.
- Наши једноставни случајни узорци не чине више од 5% популације.
- Два узорка су међусобно неовисна и не постоји подударање између субјеката.
- Променљива је нормално дистрибуирана.
- Обе популације и стандардна девијација су непознате за обе популације.
Видимо да је већина ових услова испуњена. Речено нам је да имамо једноставне случајне узорке. Популација коју проучавамо је велика пошто у овим разредима има милион ученика.
Услов који не можемо аутоматски претпоставити је да се резултати тестова нормално расподељују. Будући да имамо довољно велику величину узорка, због робусности наших т-процедура нам није нужно да се променљива нормално дистрибуира.
Пошто су услови задовољени, вршимо неколико прелиминарних калкулација.
Стандардна грешка
Стандардна грешка је процена стандардног одступања. За ову статистику додајемо варијансу узорка узорака и затим узмемо квадратни корен. То даје формулу:
(с1 2 / н1 + с22 / н2)1/2
Употребом горњих вредности видимо да је вредност стандардне грешке
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
Степени слободе
Конзервативну апроксимацију можемо искористити за своју степени слободе. Ово може потценити број степени слободе, али то је много лакше израчунати него користити Велцхову формулу. Користимо мању од две величине узорка, а затим одузмемо један од овог броја.
За наш пример, мањи од два узорка је 20. То значи да је број степени слободе 20 - 1 = 19.
Тест хипотезе
Желимо да тестирамо хипотезу да ученици петих разреда имају средњу оцену теста која је већа од средње оцене ученика трећег разреда. Нека је μ1 бити средњи резултат популације свих петих разреда. Слично томе, пустимо μ2 бити средњи резултат популације свих трећих разреда.
Хипотезе су следеће:
- Х0: μ1 - μ2 = 0
- Ха: μ1 - μ2 > 0
Статистика теста је разлика између узорка, која се затим дели стандардном грешком. Будући да користимо узорке стандардних девијација за процену стандардног одступања популације, тестна статистика из т-дистрибуције.
Вредност тестне статистике је (84 - 75) /1.2583. То износи отприлике 7.15.
Сада одређујемо која је п вредност за овај тест хипотезе. Гледамо вредност тестне статистике и где се она налази на т-дистрибуцији са 19 степени слободе. За ову дистрибуцију имамо 4,2 к 10-7 као наша п-вредност. (Један од начина да се то утврди је коришћење Т.ДИСТ.РТ функције у Екцелу.)
Пошто имамо тако малу п-вредност, одбацујемо ништавну хипотезу. Закључак је да је средњи резултат теста за пете разреде виши од средњег теста за треће разреде.
Интервал поверења
Пошто смо утврдили да постоји разлика између средњих резултата, сада одређујемо интервал поузданости за разлику између ова два средства. Већ имамо много онога што нам треба. Интервал поузданости за разлику мора да има и процену и грешку.
Процена разлике двема средствима је једноставно израчунати. Једноставно проналазимо разлику узорака. Ова разлика у узорку значи процену разлике становништва у популацији.
За наше податке, разлика у средствима узорка је 84 - 75 = 9.
Границу грешке је мало теже израчунати. За то морамо одговарајућу статистику помножити са стандардном грешком. Статистику која нам је потребна пронађемо консултацијама са таблицом или статистичким софтвером.
Опет користећи конзервативну апроксимацију, имамо 19 степени слободе. За интервал повећања од 95% видимо да т* = 2.09. Могли бисмо искористити Т.ИНВ функционише у Екце-уЈа израчунавам ову вредност.
Сада све саставимо и видимо да је наша грешка 2.09 к 1.2583, што је отприлике 2.63. Интервал поузданости је 9 ± 2,63. Интервал износи од 6,37 до 11,63 бода на тесту који су изабрали пети и трећи разред.