Имате пуно питања која треба поставити ако гледате расипач. Једно од најчешћих је питати се колико добро равна линија приближава податке. Да бисте одговорили на то, постоји описна статистика која се назива коефицијент корелације. Видећемо како да израчунамо ову статистику.
Коефицијент корелације
Тхе коефицијент корелације, означено са р, говори нам колико су подаци блиски дијаграм расејања падати дуж равне линије. Што је ближе томе апсолутна вредност од р је једно, боље је да су подаци описани линеарном једначином. Ако р = 1 или р = -1 тада је скуп података савршено поравнат. Скупови података са вредностима од р близу нуле показују мало-не равноправан однос.
Због дугих израчуна, најбоље је израчунати р употребом калкулатора или статистичког софтвера. Међутим, увек је вредно покушати знати шта ваш калкулатор ради приликом рачунања. Следи поступак израчунавања коефицијента корелације углавном ручно, помоћу калкулатора који се користи за рутинске аритметичке кораке.
Кораци за израчунавање р
Почећемо тако што ћемо навести кораке за израчунавање коефицијента корелације. Подаци са којима радимо јесу упарени подаци, од којих ће сваки пар бити означен са (Иксја, ија).
- Почињемо са неколико прелиминарних израчуна. Количине из ових израчуна користиће се у наредним корацима нашег израчуна р:
- Израчунајте к, значити свих првих координата података Иксја.
- Израчунајте ы, средњу вредност свих других координата података
- ија.
- Израчунајте с Икс узорак стандардна девијација свих првих координата података Иксја.
- Израчунајте с и стандардно одступање узорка свих других координата података ија.
- Користите формулу (зИкс)ја = (Иксја - Икс) / с Икс и израчунати стандардизовану вредност за сваку Иксја.
- Користите формулу (зи)ја = (ија – ȳ) / с и и израчунати стандардизовану вредност за сваку ија.
- Помножите одговарајуће стандардизоване вредности: (зИкс)ја(зи)ја
- Додајте производе из последњег корака заједно.
- Поделите суму из претходног корака са н - 1, где н је укупни број бодова у нашем скупу упарених података. Резултат свега тога је коефицијент корелације р.
Овај поступак није тежак и сваки је корак прилично рутински, али прикупљање свих ових корака је прилично укључено. Прорачун стандардног одступања је довољно досадан сам по себи. Али израчунавање коефицијента корелације укључује не само две стандардне девијације, већ и мноштво других операција.
Пример
Да бисте тачно видели како вредност р добијемо погледамо пример. Опет, важно је напоменути да бисмо за практичне апликације желели да користимо наш калкулатор или статистички софтвер за прорачун р за нас.
Почињемо са списком упарених података: (1, 1), (2, 3), (4, 5), (5,7). Злато Икс вредности, средња вредност 1, 2, 4 и 5 је к = 3. Такође имамо да је ы = 4. Стандардна девијација
Икс вредности су сИкс = 1,83 и си = 2.58. У табели испод приказани су други прорачуни потребни за р. Збир производа у десној колони је 2.969848. Пошто постоје укупно четири тачке и 4 - 1 = 3, зброј производа делимо са 3. Ово нам даје коефицијент корелације од р = 2.969848/3 = 0.989949.
Табела за пример израчуна коефицијента корелације
Икс | и | зИкс | зи | зИксзи |
---|---|---|---|---|
1 | 1 | -1.09544503 | -1.161894958 | 1.272792057 |
2 | 3 | -0.547722515 | -0.387298319 | 0.212132009 |
4 | 5 | 0.547722515 | 0.387298319 | 0.212132009 |
5 | 7 | 1.09544503 | 1.161894958 | 1.272792057 |