Једно питање које је увек важно поставити статистика је, „Да ли је посматрани резултат последица само случајности, или је то статистички значајна? " Једна класа тестови хипотеза, названи тестовима пермутације, омогућују нам да тестирамо ово питање. Преглед и кораци таквог теста су:
- Подузеће смо поделили у контролну и експерименталну групу. Нулта хипотеза је да нема разлике између ове две групе.
- Примените третман на експерименталну групу.
- Измерите одговор на третман
- Размотрите сваку могућу конфигурацију експерименталне групе и посматрани одговор.
- Израчунајте п-вредност засновану на нашем посматраном одговору у односу на све потенцијалне експерименталне групе.
Ово је обрис пермутације. У складу са овом обрисом, потрошићемо време разматрајући добро израђен пример таквог пермутацијског теста.
Пример
Претпоставимо да проучавамо мишеве. Нарочито нас занима колико брзо мишеви завршавају лавиринт какав никад раније нису срели. Желимо да пружимо доказе у корист експерименталног лечења. Циљ је показати да ће мишеви из групе за третирање лавиринт ријешити брже од необрађених мишева.
Започињемо с нашим предметима: шест мишева. Ради практичности, на мишеве ће се позивати слова А, Б, Ц, Д, Е, Ф. Три од ових мишева треба да буду насумично одабрана за експериментални третман, а остала три су постављена у контролну групу у којој испитаници добијају плацебо.
Следеће ћемо насумично бирати редослед којим су мишеви одабрани како би изводили лавиринт. Биљежи се вријеме проведено у завршетку лавиринта за све мишеве, а биће израчуната средња вриједност сваке групе.
Претпоставимо да наш случајни избор има мишеве А, Ц и Е у експерименталној групи, а остали мишеви у плацебо Контролна група. Након примене третмана, насумично бирамо редослед како би мишеви прошли кроз лавиринт.
Времена извођења за сваки од мишева су:
- Миш А трчи трку за 10 секунди
- Миш Б трчи у 12 секунди
- Миш Ц трчи трку за 9 секунди
- Миш Д трчи у 11 секунди
- Миш Е претрчава трку за 11 секунди
- Миш Ф трчи трку за 13 секунди.
Просечно време за комплетирање лавиринта за мишеве у експерименталној групи је 10 секунди. Просечно време за завршетак лавиринта за оне из контролне групе је 12 секунди.
Могли бисмо поставити неколико питања. Да ли је третман заиста разлог бржег просечног времена? Или смо само имали среће у избору контролне и експерименталне групе? Третман можда није имао ефекта и насумично смо бирали спорије мишеве који су примали плацебо и брже мишеве који су примили третман. Пермутацијски тест ће вам помоћи да одговорите на ова питања.
Хипотезе
Хипотезе за наш пермутацијски тест су:
- Тхе нулта хипотеза је изјава без ефекта. За овај специфични тест, имамо Х0: Не постоји разлика између група лечења. Средње време за извођење лавиринта за све мишеве без третмана исто је као и средње време за све мишеве који су третирани.
- Алтернативна хипотеза је оно што ми покушавамо да утврдимо у прилог. У овом случају имали бисмо Ха: Средње време за све мишеве са третманом биће брже од просечног времена за све мишеве без третмана.
Пермутације
Има шест мишева, а у експерименталној групи постоје три места. То значи да је број могућих експерименталних група дан бројем комбинација Ц (6,3) = 6! / (3! 3!) = 20. Преостали појединци били би део контролне групе. Дакле, постоји 20 различитих начина да насумично бирамо појединце у наше две групе.
Додељивање А, Ц и Е експерименталној групи извршено је насумично. Пошто постоји 20 таквих конфигурација, специфична са А, Ц и Е у експерименталној групи има вероватноћу да ће се појавити 1/20 = 5%.
Морамо утврдити свих 20 конфигурација експерименталне групе појединаца у нашој студији.
- Експериментална група: А Б Ц и контролна група: Д Е Ф
- Експериментална група: А Б Д и контролна група: Ц Е Ф
- Експериментална група: А Б Е и контролна група: Ц Д Ф
- Експериментална група: А Б Ф и контролна група: Ц Д Е
- Експериментална група: А Ц Д и контролна група: Б Е Ф
- Експериментална група: А Ц Е и контролна група: Б Д Ф
- Експериментална група: А Ц Ф и контролна група: Б Д Е
- Експериментална група: А Д Е и контролна група: Б Ц Ф
- Експериментална група: А Д Ф и контролна група: Б Ц Е
- Експериментална група: А Е Ф и контролна група: Б Ц Д
- Експериментална група: Б Ц Д и контролна група: А Е Ф
- Експериментална група: Б Ц Е и контролна група: А Д Ф
- Експериментална група: Б Ц Ф и контролна група: А Д Е
- Експериментална група: Б Д Е и контролна група: А Ц Ф
- Експериментална група: Б Д Ф и Контролна група: А Ц Е
- Експериментална група: Б Е Ф и Контролна група: А Ц Д
- Експериментална група: Ц Д Е и контролна група: А Б Ф
- Експериментална група: Ц Д Ф и контролна група: А Б Е
- Експериментална група: Ц Е Ф и Контролна група: А Б Д
- Експериментална група: Д Е Ф и Контролна група: А Б Ц
Затим размотримо сваку конфигурацију експерименталне и контролне групе. Израчунавамо средњу вредност за сваку од 20 пермутација у горњем списку. На пример, за прве, А, Б и Ц имају времена од 10, 12 и 9, респективно. Средња вриједност ова три броја је 10,3333. Такође у овој првој пермутацији, Д, Е и Ф имају времена по 11, 11 и 13, респективно. То има у просеку 11.6666.
Након израчуна значи за сваку групу, израчунавамо разлику између ових средстава. Свако од следећег одговара разлици између експерименталних и контролних група које су горе наведене.
- Плацебо - третман = 1.333333333 секунди
- Плацебо - Третман = 0 секунди
- Плацебо - Третман = 0 секунди
- Плацебо - третман = -1.333333333 секунди
- Плацебо - Третман = 2 секунде
- Плацебо - Третман = 2 секунде
- Плацебо - третман = 0.666666667 секунди
- Плацебо - третман = 0.666666667 секунди
- Плацебо - третман = -0.666666667 секунди
- Плацебо - третман = -0.666666667 секунди
- Плацебо - третман = 0.666666667 секунди
- Плацебо - третман = 0.666666667 секунди
- Плацебо - третман = -0.666666667 секунди
- Плацебо - третман = -0.666666667 секунди
- Плацебо - Третман = -2 секунде
- Плацебо - Третман = -2 секунде
- Плацебо - третман = 1.333333333 секунди
- Плацебо - Третман = 0 секунди
- Плацебо - Третман = 0 секунди
- Плацебо - третман = -1.333333333 секунди
П-вредност
Сада рангирамо разлике између средстава из сваке групе које смо горе приметили. Такође табелирамо проценат наших 20 различитих конфигурација које су представљене са сваком разликом у средствима. На пример, четири од 20 особа нису имале разлике између средстава контролне и лечне групе. Ово чини 20% од 20 горе наведених конфигурација.
- -2 за 10%
- -1,33 за 10%
- -0.667 за 20%
- 0 за 20%
- 0.667 за 20%
- 1,33 за 10%
- 2 за 10%.
Овде упоређујемо овај попис са нашим посматраним резултатом. Наш случајни избор мишева за лечење и контролне групе резултирао је просечном разликом од 2 секунде. Такође видимо да та разлика одговара 10% свих могућих узорака. Резултат тога је да за ову студију имамо: п-вредност од 10%.