Пример интервала поверења за варијанту

Варијанса становништва показује како се шири скуп података. Нажалост, обично је немогуће тачно знати шта је овај параметар популације. Да надокнадимо наш недостатак знања, користимо тему из инференцијалне статистике под називом интервали поверења. Видећемо пример како израчунати интервал поузданости за варирање становништва.

Интервал формула

Формула за (1 - α) интервал поузданости о варијанци популације. Даје се следећим низом неједнакости:

[ (н - 1)с2] / Б < σ2 < [ (н - 1)с2] / А.

Ево н је величина узорка, с2 је варијанца узорка. Број А је тачка хи-квадратне дистрибуције са н -1 степен слободе на коме је тачно α / 2 подручја испод кривуље лево од А. На сличан начин је и број Б је тачка исте хи-квадратне дистрибуције са тачно α / 2 подручја испод кривуље десно од Б.

Прелиминариес

Започињемо са скупом података са 10 вриједности. Овај скуп података добијен је једноставним случајним узорком:

97, 75, 124, 106, 120, 131, 94, 97,96, 102

Потребна би била нека истраживачка анализа података која би показала да нема одраслих особа. Конструкцијом а

instagram viewer
парцела стабљике и лишћа видимо да су ови подаци вероватно из дистрибуције која је отприлике нормално дистрибуирана. То значи да можемо наставити са проналажењем интервала поузданости од 95% за варирање становништва.

Варијанта узорка

Морамо проценити одступање популације са варијансом узорка, означеном са с2. Дакле, почињемо израчунавањем ове статистике. У суштини ми просечимо збир квадратних одступања од средње. Међутим, уместо да делимо ову суму са н то поделимо по н - 1.

Откривамо да је просечна вредност узорка 104,2. Користећи ово, имамо зброј квадратних одступања од средње вредности коју даје:

(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6

Поделимо ову суму са 10 - 1 = 9 да бисмо добили варијансу узорка од 277.

Цхи-Скуаре Дистрибуција

Сада се окрећемо нашој дистрибуцији хи-квадрата. Пошто имамо 10 вредности података, имамо и 9 степени слободе. Будући да желимо средњих 95% наше дистрибуције, потребно нам је 2,5% у сваком од два репа. Конзултирамо таблицу или софтвер са хи-квадратом и видимо да вредности табеле 2.7004 и 19.023 обухватају 95% површине дистрибуције. Ови бројеви су А и Б, редом.

Сада имамо све што нам је потребно и спремни смо да саставимо свој интервал поверења. Формула за леву крајњу тачку је [(н - 1)с2] / Б. То значи да је наша лева крајња тачка:

(9 к 277) / 19.023 = 133

Права крајња тачка пронађена је заменом Б са А:

(9 к 277) /2.7004 = 923

И тако смо 95% сигурни да одступање популације лежи између 133 и 923.

Стандардно одступање становништва

Наравно, пошто је стандардно одступање квадратни корен варијанције, ова метода би се могла користити за конструкцију интервала поузданости за стандардно одступање популације. Све што би требало да урадимо је да узмемо квадратне корене крајњих тачака. Резултат би био интервал поузданости од 95% стандардна девијација.