Степени слободе за независност у двосмерној табели

click fraud protection

Број степени слободе за независност две категоријске променљиве дат је једноставна формула: (р - 1)(ц - 1). Ево р је број редова и ц је број ступаца у двосмерни сто вредности категоријске променљиве. Прочитајте да бисте сазнали више о овој теми и да бисте схватили зашто ова формула даје тачан број.

Позадина

Један корак у процесу многих тестови хипотеза је одређивање броја степена слободе. Овај број је важан јер за дистрибуције вероватноће које укључују породицу дистрибуција, као што је хи-квадратна дистрибуција, број степени слобода означава тачну расподелу из породице коју бисмо требали користити у нашој хипотези тест.

Степени слободе представљају број слободних избора које можемо донети у датој ситуацији. Један од тестова хипотезе који захтева да утврдимо степен слободе је хи-квадрат тест независности за две категоријске променљиве.

Тестови за независност и двосмерни столови

Тест хи-квадрата за независност тражи од нас да конструишемо двосмерну табелу, такође познату и као табела непредвиђених догађаја. Ова врста стола има

instagram viewer
р редови и ц колона, представљајући р нивои једне категоријске променљиве и ц нивои друге категоријске променљиве. Дакле, ако не рачунамо ред и ступац у које биљежимо збројеве, има их укупно рц ћелије у двосмерној табели.

Хи-квадрат тест независности омогућава нам тестирање хипотезе да је категоричан променљиве су независне једна од друге. Као што смо горе споменули, р редови и ц колумне у табели дају нам (р - 1)(ц - 1) степени слободе. Али можда није одмах јасно зашто је точан број степени слободе.

Број степени слободе

Да видим зашто (р - 1)(ц - 1) је тачан број, детаљније ћемо испитати ову ситуацију. Претпоставимо да знамо граничне укупне вредности за сваки од нивоа наших категоријских варијабли. Другим речима, знамо за сваки ред и укупно за сваки ступац. За први ред постоје ц колона у нашој табели, тако да их има ц ћелије. Једном када знамо вредности свих ћелија осим једне, а пошто знамо укупан број свих ћелија, проблем алгебре је да се одреди вредност преостале ћелије. Да испуњавамо ове ћелије наше табеле, могли бисмо ући ц - 1 слободно, али тада се преостала ћелија одређује према укупном реду. Тако постоје ц - 1 степен слободе за први ред.

Тако настављамо на следећи ред, а опет их има ц - 1 степен слободе. Овај процес се наставља све док не дођемо до предзадњег реда. Сваки од редова, осим последњег, даје свој допринос ц - 1 степен слободе. До тренутка када имамо све, осим задњег реда, па зато што знамо суму ступаца можемо одредити све уносе завршног реда. Ово нам даје р - 1 редова са ц - 1 степен слободе у сваком од њих, за укупно (р - 1)(ц - 1) степени слободе.

Пример

То видимо на следећем примеру. Претпоставимо да имамо двосмерну табелу са две категоричке променљиве. Једна варијабла има три нивоа, а друга два. Надаље, претпоставимо да знамо укупне вриједности редака и ступаца за ову таблицу:

Ниво А Ниво Б Укупно
Ниво 1 100
Ниво 2 200
Ниво 3 300
Укупно 200 400 600

Формула предвиђа да постоје (3-1) (2-1) = 2 степена слободе. То видимо на следећи начин. Претпоставимо да у горњу леву ћелију попунимо са бројем 80. Ово ће аутоматски одредити цео први ред уноса:

Ниво А Ниво Б Укупно
Ниво 1 80 20 100
Ниво 2 200
Ниво 3 300
Укупно 200 400 600

Сада ако знамо да је први унос у другом реду 50, тада се попуњава остатак табеле, јер знамо укупан број сваког реда и ступца:

Ниво А Ниво Б Укупно
Ниво 1 80 20 100
Ниво 2 50 150 200
Ниво 3 70 230 300
Укупно 200 400 600

Табела је у потпуности попуњена, али имали смо само два слободна избора. Једном када су ове вредности биле познате, остатак табеле је у потпуности одређен.

Иако обично не требамо знати зашто постоји толико много слобода, добро је знати да ми заправо само примјењујемо концепт степена слободе на нову ситуацију.

instagram story viewer