Пробни тест за случајне секвенце

С обзиром на слијед података, једно питање које бисмо се могли запитати је да ли је редослијед случајних појава или подаци нису случајни. Тешко је препознати случајност, јер је врло тешко једноставно погледати податке и утврдити да ли су они произведени случајно или не. Једна метода која се може користити како би се утврдило да ли је редослед заиста настао случајно, назива се тестом трчања.

Тест трчања је тест значаја или хипотеза тест. Поступак овог теста заснован је на покретању или низу података који имају одређену особину. Да бисмо разумели како функционира тест трчања, прво морамо испитати концепт трчања.

Секвенце података

Започет ћемо прегледом примера трчања. Размотримо следећи низ случајних цифара:

6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5

Један од начина за класификацију ових цифара је њихова подела у две категорије, било парне (укључујући цифре 0, 2, 4, 6 и 8) или непарне (укључујући цифре 1, 3, 5, 7 и 9). Гледаћемо редослед случајних цифара и означаваћемо парне бројеве као Е, а непарне бројеве као О:

instagram viewer

Е Е О Е Е О О Е Е Е Е Е Е О Е Е О О

Трчања је лакше уочити ако ово напишемо тако да су сви Ос заједно и сви Ес заједно:

ЕЕ О ЕЕ ОО Е ЕЕЕЕЕ О ЕЕ ОО

Бројимо бројеве парних или непарних бројева и видимо да постоји укупно десет покрета за податке. Четири вожње имају дужину један, пет имају дужину две, а једна дужину пет

Услови

Са било којим тест значаја, важно је знати који су услови неопходни за провођење теста. За тест покуса, моћи ћемо да класификујемо сваку вредност података из узорка у једну од две категорије. Рачунат ћемо укупан број издања у односу на број броја вриједности података који спадају у сваку категорију.

Тест ће бити а двострани тест. Разлог за то је што премало трчања значи да вјероватно нема довољно варијација и броја покретања који би се догодили случајним процесом. Превише извођења ће резултирати када се процес пречесто измени међу категоријама да би се случајно описао.

Хипотезе и П-вредности

Сваки тест значаја има: нулта и алтернативна хипотеза. За тест трчања, нулта хипотеза је да је низ случајни низ. Алтернативна хипотеза је да низ узоркованих података није случајни.

Статистички софтвер може израчунати п-вредност што одговара одређеној статистици теста. Постоје и табеле које на одређени број дају критичне бројеве ниво значаја за укупан број трчања.

Изводи тест тест

Проширићемо следећи пример да видимо како функционише тест трчања. Претпоставимо да се од задатка од ученика тражи да 16 пута баци новчић и примети редослед глава и репова који су се појавили. Ако завршимо са овим скупом података:

Х Т Х Х Х Т Т Х Т Т Х Т Х Т Х Х

Можемо се запитати да ли је ученик заиста урадио домаћи задатак или је преварио и написао низ Х и Т који изгледају насумично? Испитивање трчања може нам помоћи. Претпоставке су испуњене за тест трчања јер се подаци могу сврстати у двије групе, било као глава или реп. Настављамо рачунајући број трчања. Груписање, видимо следеће:

Х Т ХХХ ТТ Х ТТ Х Т Х Т ХХ

За наше податке постоји десет покрета, са седам репова су девет глава.

Нулта хипотеза је да су подаци насумични. Алтернатива је да није случајна. За ниво значајности алфа једнак 0,05, констатујући одговарајућу табелу, видимо да одбацујемо нулту хипотезу када је број трчања мањи од 4 или већи од 16. Пошто у нашим подацима постоји десет вожњи, ми не одбије нулта хипотеза Х₀.

Нормална апроксимација

Тест трчања је користан алат за утврђивање да ли је редослед вероватно случајни или не. За велики скуп података понекад је могуће користити нормалну апроксимацију. Ова нормална апроксимација захтева да користимо број елемената у свакој категорији и затим израчунамо средњу и стандардну девијацију одговарајућег нормална расподела.