Много пута у студији статистика важно је успоставити везу између различитих тема. Видећемо пример тога у којем је нагиб регресијске линије директно повезан са коефицијент корелације. Будући да оба концепта укључују равне линије, природно је поставити питање: "Колики су коефицијент корелације и најмање квадратна линија повезан?"
Прво ћемо погледати неке позадине које се тичу ове обе теме.
Детаљи у вези корелације
Важно је запамтити детаље који се односе на коефицијент корелације, који је означен са р. Ова статистика се користи када смо упалили квантитативни подаци. Са расипане струје упарени подаци, можемо потражити трендове у укупној дистрибуцији података. Неки упарени подаци показују линеарни или праволинијски образац. Али у пракси подаци никада не падају тачно равно.
Неколико људи гледа исто дијаграм расејања упарених података не би се сложило у томе колико је близу приказивању укупног линеарног тренда. Напокон, наши критеријуми за то могу бити помало субјективни. Опсег који користимо такође може утицати на нашу перцепцију података. Из тих разлога и више, потребна нам је нека врста објективне мере да би рекли колико су наши упарени подаци линеарни. Коефицијент корелације то постиже за нас.
Неколико основних чињеница о томе р укључују:
- Вредност р се креће између било којег стварног броја од -1 до 1.
- Вредности р близу 0 имплицира да постоји мало или не постоји линеарни однос између података.
- Вредности р близу 1 значи да постоји позитиван линеарни однос између података. То значи да као Икс повећава то и такође се повећава.
- Вредности р близу -1 имплицира да постоји негативан линеарни однос између података. То значи да као Икс повећава то и опада.
Нагиб најмање линије квадрата
Последње две ставке на горњој листи усмеравају нас према нагибу линије најмањег квадрата који најбоље одговара. Подсјетимо да је нагиб линије мјерење колико јединица иде горе или доље за сваку јединицу коју помјерамо удесно. Понекад се то наводи као успон линије подељене са трком или промена и вредности подељене променом у Икс вредности.
Генерално, равне линије имају нагибе који су позитивни, негативни или нула. Ако бисмо прегледали наше регресијске линије најмање квадрата и упоредили одговарајуће вредности р, приметили бисмо да сваки пут када наши подаци имају негативни коефицијент корелације, нагиб регресијске линије је негативан. Слично томе, за сваки пут када имамо коефицијент позитивне корелације, нагиб регресијске линије је позитиван.
Из овог запажања би требало бити видљиво да дефинитивно постоји веза између знака коефицијента корелације и нагиба линије најмањег квадрата. Остаје само да објаснимо зашто је то тачно.
Формула за нагиб
Разлог за везу између вредности р а нагиб линије најмање квадрата има везе са формулом која нам даје нагиб ове линије. За упарене податке (к, и) означавамо стандардна девијација од Икс дата би сИкс и стандардно одступање од и дата би си.
Формула за нагиб а линија регресије је:
- а = р (с)и/ сИкс)
Израчунавање стандардне девијације укључује узимање позитивног квадратног корена ненегативног броја. Као резултат, оба стандардна одступања у формули за нагиб морају бити ненегативна. Ако претпоставимо да постоји нека варијација у нашим подацима, моћи ћемо занемарити могућност да било које од ових стандардних девијација буде нула. Стога ће коефицијент корелације бити исти као и нагиб регресијске линије.