Број степени слободе за независност две категоријске променљиве дат је једноставна формула: (р - 1)(ц - 1). Ево р је број редова и ц је број ступаца у двосмерни сто вредности категоријске променљиве. Прочитајте да бисте сазнали више о овој теми и да бисте схватили зашто ова формула даје тачан број.
Позадина
Један корак у процесу многих тестови хипотеза је одређивање броја степена слободе. Овај број је важан јер за дистрибуције вероватноће које укључују породицу дистрибуција, као што је хи-квадратна дистрибуција, број степени слобода означава тачну расподелу из породице коју бисмо требали користити у нашој хипотези тест.
Степени слободе представљају број слободних избора које можемо донети у датој ситуацији. Један од тестова хипотезе који захтева да утврдимо степен слободе је хи-квадрат тест независности за две категоријске променљиве.
Тестови за независност и двосмерни столови
Тест хи-квадрата за независност тражи од нас да конструишемо двосмерну табелу, такође познату и као табела непредвиђених догађаја. Ова врста стола има
р редови и ц колона, представљајући р нивои једне категоријске променљиве и ц нивои друге категоријске променљиве. Дакле, ако не рачунамо ред и ступац у које биљежимо збројеве, има их укупно рц ћелије у двосмерној табели.Хи-квадрат тест независности омогућава нам тестирање хипотезе да је категоричан променљиве су независне једна од друге. Као што смо горе споменули, р редови и ц колумне у табели дају нам (р - 1)(ц - 1) степени слободе. Али можда није одмах јасно зашто је точан број степени слободе.
Број степени слободе
Да видим зашто (р - 1)(ц - 1) је тачан број, детаљније ћемо испитати ову ситуацију. Претпоставимо да знамо граничне укупне вредности за сваки од нивоа наших категоријских варијабли. Другим речима, знамо за сваки ред и укупно за сваки ступац. За први ред постоје ц колона у нашој табели, тако да их има ц ћелије. Једном када знамо вредности свих ћелија осим једне, а пошто знамо укупан број свих ћелија, проблем алгебре је да се одреди вредност преостале ћелије. Да испуњавамо ове ћелије наше табеле, могли бисмо ући ц - 1 слободно, али тада се преостала ћелија одређује према укупном реду. Тако постоје ц - 1 степен слободе за први ред.
Тако настављамо на следећи ред, а опет их има ц - 1 степен слободе. Овај процес се наставља све док не дођемо до предзадњег реда. Сваки од редова, осим последњег, даје свој допринос ц - 1 степен слободе. До тренутка када имамо све, осим задњег реда, па зато што знамо суму ступаца можемо одредити све уносе завршног реда. Ово нам даје р - 1 редова са ц - 1 степен слободе у сваком од њих, за укупно (р - 1)(ц - 1) степени слободе.
Пример
То видимо на следећем примеру. Претпоставимо да имамо двосмерну табелу са две категоричке променљиве. Једна варијабла има три нивоа, а друга два. Надаље, претпоставимо да знамо укупне вриједности редака и ступаца за ову таблицу:
Ниво А | Ниво Б | Укупно | |
Ниво 1 | 100 | ||
Ниво 2 | 200 | ||
Ниво 3 | 300 | ||
Укупно | 200 | 400 | 600 |
Формула предвиђа да постоје (3-1) (2-1) = 2 степена слободе. То видимо на следећи начин. Претпоставимо да у горњу леву ћелију попунимо са бројем 80. Ово ће аутоматски одредити цео први ред уноса:
Ниво А | Ниво Б | Укупно | |
Ниво 1 | 80 | 20 | 100 |
Ниво 2 | 200 | ||
Ниво 3 | 300 | ||
Укупно | 200 | 400 | 600 |
Сада ако знамо да је први унос у другом реду 50, тада се попуњава остатак табеле, јер знамо укупан број сваког реда и ступца:
Ниво А | Ниво Б | Укупно | |
Ниво 1 | 80 | 20 | 100 |
Ниво 2 | 50 | 150 | 200 |
Ниво 3 | 70 | 230 | 300 |
Укупно | 200 | 400 | 600 |
Табела је у потпуности попуњена, али имали смо само два слободна избора. Једном када су ове вредности биле познате, остатак табеле је у потпуности одређен.
Иако обично не требамо знати зашто постоји толико много слобода, добро је знати да ми заправо само примјењујемо концепт степена слободе на нову ситуацију.