Интервали поверења кључни су део инференцијалне статистике. Можемо користити неке вероватноће и информације из расподела за процену популационог параметра уз коришћење узорка. Изјава а интервал поверења ради на такав начин да је лако погрешно схватити. Погледаћемо исправну интерпретацију интервала поверења и истражићемо четири грешке које су направљене у овој области статистике.
Шта је интервал поверења?
Интервал поузданости може се изразити било у распону вредности или у следећем облику:
Процените ± Маргина грешке
Интервал поверења обично се наводи са нивоом поверења.Заједнички нивои поверења су 90%, 95% и 99%.
Погледаћемо пример где желимо да употријебимо узорак за закључивање средње вриједности становништва. Претпоставимо да то резултира интервалом поузданости од 25 до 30. Ако кажемо да смо 95% сигурни да је непозната популација значити је садржан у овом интервалу, тада стварно кажемо да смо интервал пронашли користећи методу која је у 95% времена успешна да даје исправне резултате. Дугорочно, наша метода ће бити неуспешна 5% времена. Другим речима, нећемо успети да забележимо стварну популацију значи само једно од сваких 20 пута.
Грешка бр. 1
Сада ћемо погледати низ различитих грешака које се могу учинити када се баве интервалима поверења. Једна погрешна изјава која се често даје о интервалу поверења на нивоу поверења од 95% је да постоји 95% шансе да интервал поверења садржи истинску средину становништва.
Разлог да је то грешка заправо је прилично суптилан. Кључна идеја која се односи на интервал поузданости је да искоришћена вероватноћа улази у слику метода која се користи у одређивању интервала поузданости је да се односи на методу која је користи.
Грешка бр. 2
Друга грешка је тумачење интервала поузданости од 95% тако да 95% свих вредности података у популацији спада у тај интервал. Опет, 95% говори са методом теста.
Да видимо зашто је горња изјава нетачна, могли бисмо да сматрамо нормалну популацију са стандардна девијација од 1 и средње од 5. Узорак који је имао две тачке података, од којих свака има вредности 6, има просечну вредност узорка од 6. Интервал поузданости за 95% за становништво износио би 4,6 до 7,4. Ово се очигледно не преклапа са 95% нормална расподела, тако да неће садржати 95% становништва.
Грешка бр. 3
Трећа грешка је рећи да интервал поверења од 95% подразумева да 95% свих могућих средстава за узорак спада у распон интервала. Преиспитајте пример из последњег одељка. Сваки узорак величине две, који се састојао од само вредности испод 4,6, имао би средњу вредност мању од 4,6. Стога би та средства узорка била изван овог одређеног интервала поверења. Узорци који одговарају овом опису чине више од 5% укупне количине. Дакле, грешка је рећи да овај интервал поверења обухвата 95% свих узорака.
Грешка бр. 4
Четврта грешка у раду са интервалима поверења је мислити да су они једини извор грешке. Иако постоји разлика у грешци која је повезана са интервалом поузданости, постоје и друга места на која грешке могу прећи у статистичку анализу. Неколико примера ове врсте грешака могло би да буде од погрешног дизајна експеримента, пристраности узорковања или немогућности добијања података из одређене групе становништва.