Распршивач је врста графа која се користи за представљање упарени подаци. Објашњавајућа варијабла је приказана дуж водоравне осе, а варијабла одговора је гравирана дуж вертикалне осе. Један од разлога за употребу ове врсте графикона је тражење односа између променљивих.
Најосновнији образац који треба тражити у скупу упарених података јесте правац. Кроз било које две тачке можемо повући равну линију. Ако у нашем расипавању постоје више од две тачке, већину времена више нећемо моћи да повучемо линију која пролази кроз сваку тачку. Уместо тога, повући ћемо линију која пролази кроз средину тачака и приказати укупни линеарни тренд података.
Док гледамо тачке на нашем графикону и желимо повући црту кроз те тачке, поставља се питање. Коју линију треба да нацртамо? Постоји бесконачан број линија које се могу нацртати. Употребом само наших очију јасно је да би свака особа која гледа ракету могла произвести нешто другачију линију. Ова нејасноћа је проблем. Желимо да имамо добро дефинисан начин да сви добију исту линију. Циљ је математички прецизан опис које линије треба цртати. Најмање квадрата
регресијска линија је једна таква линија кроз наше тачке података.Најмањих квадрата
Назив линије најмањег квадрата објашњава шта она ради. Започињемо са збирком тачака са координатама које даје (Иксја, ија). Било која равна линија проћи ће између ових тачака и ићи ће изнад или испод сваке од њих. Можемо израчунати удаљености од ових тачака до црте одабиром вредности Икс а затим одузимање посматрано и координата која одговара овоме Икс од и координата наше линије.
Различите линије кроз исти скуп тачака дале би различит скуп удаљености. Желимо да та удаљеност буде што мања колико их можемо направити. Али постоји проблем. Будући да наше удаљености могу бити или позитивне или негативне, зброј свих тих удаљености ће се отказати. Збир удаљености ће увек бити једнак нули.
Решење овог проблема је елиминисање свих негативних бројева поређењем растојања између тачака и линија. Ово даје колекцију ненегативних бројева. Циљ који смо пронашли најприкладнију линију је исти као што је зброј тих квадратних растојања што је могуће мањи. Овде нам долази помоћ. Процес диференцијације у рачуници омогућава минимизирање сума квадратних растојања од дате линије. Ово објашњава фразу „најмање квадрата“ у нашем имену за ову линију.
Линија најбољег фитања
Будући да линија најмањег квадрата минимизира квадратне удаљености између линије и наших тачака, ову линију можемо сматрати оном која најбоље одговара нашим подацима. Због тога је линија најмање квадрата такође позната као линија најбољег уклапања. Од свих могућих црта које се могу нацртати, линија најмањег квадрата најближа је скупу података у целини. То може значити да ће наша линија пропустити било коју тачку у нашем скупу података.
Карактеристике линије најмање квадрата
Постоји неколико значајки које поседује свака најмање квадратна линија. Прва ставка интереса односи се на нагиб наше линије. Нагиб има везу са коефицијент корелације наших података. У ствари, нагиб линије је једнак р (с)и/ сИкс). Ево с Икс означава стандардно одступање од Икс координате и с и стандардна девијација и координате наших података. Знак коефицијента корелације директно је повезан са знаком нагиба наше најмање квадратне линије.
Још једна карактеристика линије најмање квадрата односи се на тачку кроз коју пролази. Док и пресретање најмање квадратичне линије са статистичког становишта можда није занимљиво, постоји једна тачка. Свака најмања линија квадрата пролази кроз средњу тачку података. Ова средња тачка има Икс координата која је та значити од Икс вредности а и координата која је средња вредност и вредности.