Интервали поверења може се користити за процену неколико популација параметри. Једна врста параметра која се може проценити коришћењем инференцијалне статистике проценат становништва. На пример, можда ћемо желети да знамо колики је проценат америчке популације која подржава одређени закон. За ову врсту питања морамо пронаћи интервал поверења.
У овом чланку ћемо видети како да конструишемо интервал поверења за удео становништва и испитаћемо неке теорије које стоје иза тога.
Општи оквир
Започињемо посматрањем велике слике пре него што нађемо у специфичностима. Тип интервала поверења који ћемо размотрити има следећи облик:
Процените +/- маргину грешке
То значи да морамо да утврдимо два броја. Ове вредности су процена за жељени параметар, уз маргину грешке.
Услови
Пре спровођења било ког статистичког теста или поступка, важно је да се уверите да су испуњени сви услови. За интервал поверења за удео становништва, морамо да се уверимо да следеће:
- Имамо једноставан случајни узорак величине н од велике популације
- Наши појединци су изабрани независно једни од других.
- У нашем узорку има најмање 15 успеха и 15 неуспеха.
Ако задња ставка није задовољена, можда ће бити могуће мало прилагодити узорак и користити а плус четири интервала поверења. У даљем тексту, претпоставит ћемо да су сви горе наведени услови испуњени.
Узорак и удио становништва
Почињемо са проценом удела у нашем становништву. Баш као што користимо узорак средње вредности за процену просечне популације, тако користимо и узорак пропорције да проценимо удео становништва. Проценат становништва је непознат параметар. Узорак узорака је статистика. Ову статистику проналазимо бројењем броја успеха у нашем узорку, а затим дељењем са укупним бројем појединаца у узорку.
Проценат становништва означен је са п и само по себи објашњава. Забиљежавање пропорције узорка је мало више укључено. Означавамо узорак пропорције као п, а овај симбол читамо као „п-хат“ јер изгледа као слово п са шеширом на врху.
Ово постаје први део нашег интервала поверења. Процена п је п.
Узорковање дистрибуције узорака
Да бисмо одредили формулу грешке грешке, морамо да размислимо о подјела узорковања од п. Морат ћемо знати средњу вриједност, стандардну девијацију и одређену дистрибуцију с којом радимо.
Дистрибуција узорковања п је биномна дистрибуција са вероватноћом успеха п и н суђења. Ова врста случајне променљиве има средњу вредност п и стандардна девијација (п(1 - п)/н)0.5. Постоје два проблема са тим.
Први проблем је што биномна дистрибуција може бити веома шкакљива за рад. Присуство фабричара може довести до врло великог броја. Овде нам услови помажу. Све док су наши услови испуњени, можемо проценити биномну дистрибуцију са стандардном нормалном дистрибуцијом.
Други проблем је што стандардна девијација п употребе п у својој дефиницији. Непознати параметар популације процјењује се кориштењем истог параметра као граница погрешке. Ово кружно образложење је проблем који треба да се реши.
Излаз из ове загонетке је заменити стандардно одступање са његовом стандардном грешком. Стандардне грешке се заснивају на статистици, а не на параметрима. За процену стандардног одступања користи се стандардна грешка. Оно што ову стратегију чини корисном је то што више не требамо знати вриједност параметра п.
Формула
Да бисмо користили стандардну грешку, заменимо непознати параметар п са статистичким п. Резултат је следећа формула интервала поверења за удео становништва:
п +/- з * (п (1 - п) /н)0.5.
Овде је вредност з * одређује наш ниво поверења Ц. Тачно за стандардну нормалну дистрибуцију Ц процента стандардне нормалне расподјеле је између -з * и з *. Уобичајене вредности за з * укључују 1.645 за 90% поузданости и 1.96 за 95% поузданост.
Пример
Погледајмо како ова метода делује на примеру. Претпоставимо да желимо са 95% поузданости знати проценат бирачког тела у жупанији која себе идентификује као демократског. Проводимо једноставан случајни узорак од 100 људи у овој жупанији и откривамо да се њих 64 идентификује као демократа.
Видимо да су сви услови испуњени. Процена нашег броја становника је 64/100 = 0,64. Ово је вредност пропорције узорка п и она је центар нашег интервала поверења.
Грешка грешке састоји се од два дела. Прво је з*. Као што смо рекли, за 95% поузданост, вредност з* = 1.96.
Други део грешке дат је формулом (п (1 - п) /н)0.5. Поставили смо п = 0,64 и израчунали = стандардна грешка бити (0,64 (0,36) / 100)0.5 = 0.048.
Помножимо та два броја заједно и добијемо грешку од 0.09408. Крајњи резултат је:
0.64 +/- 0.09408,
или то можемо преписати као 54.592% до 73.408%. Стога смо 95% сигурни да је прави удио демократа у популацији негдје у границама ових постотака. То значи да ће наша техника и формула дугорочно заузети део популације у 95% времена.
Сродне идеје
Постоји низ идеја и тема који су повезани са овом врстом интервала поверења. На пример, могли бисмо да извршимо тест хипотезе који се односи на вредност удела становништва. Такође бисмо могли да упоредимо две пропорције из две различите популације.