Како проценити стандардна одступања (СД)

click fraud protection

Стандардна девијација и опсег су обе мере за ширење скупа података. Сваки број нам на свој начин говори колико су подаци распоређени, јер су обоје мерило варијације. Иако не постоји експлицитна веза између опсег и стандардна девијација, има правило то може бити корисно за повезивање ове две статистике. Тај се однос понекад назива и правило распона стандардне девијације.

Правило распона говори нам да је стандардна девијација узорка приближно једнака једној четвртини распона података. Другим речимас = (Максимум - минимум) / 4. Ово је врло једноставна формула за употребу и треба је користити само као врло грубу процена стандардног одступања.

Пример

Да бисмо видели пример рада правила распона, погледаћемо следећи пример. Претпоставимо да кренемо са вредностима података 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Ове вредности имају а значити од 17 и стандардна девијација од око 4.1. Ако уместо тога прво израчунамо распон наших података као 25 - 12 = 13, а затим тај број поделимо са четири, оцењујемо стандардну девијацију као 13/4 = 3,25. Овај број је релативно близу правој стандардној девијацији и добар је за грубу процену.

instagram viewer

Зашто то ради?

Може се чинити као да је правило распона помало чудно. Зашто то ради? Не изгледа ли потпуно произвољно само поделити распон на четири? Зашто не бисмо поделили други број? Заправо се дешава неко математичко оправдање иза кулиса.

Подсетите се својстава крива звона и вероватноће из а стандардна нормална дистрибуција. Једна карактеристика има везе са количином података која спада у одређени број стандардних одступања:

  • Отприлике 68% података налази се унутар једне стандардне девијације (веће или ниже) од средње вредности.
  • Отприлике 95% података налази се унутар два стандардна одступања (веће или ниже) од средње вриједности.
  • Отприлике 99% је унутар три стандардна одступања (већа или нижа) од средње вриједности.

Број који ћемо користити има везе са 95%. Можемо рећи да 95% наших двеју стандардних девијација испод средње вредности до две стандардне девијације изнад средње вредности имамо 95% наших података. Тако би се готово сва наша нормална дистрибуција протезала на линијском сегменту који је дугачак укупно четири стандардна одступања.

Нису сви подаци нормално дистрибуирани и у облику криве звона. Али већина података се довољно добро понаша да одлазак два стандардна одступања од средње вредности обухвата скоро све податке. Процењујемо и кажемо да су четири стандардна одступања приближно величине распона, па је распон подељен са четири груба апроксимација стандардног одступања.

Користи се за правило распона

Правило распона је корисно у бројним подешавањима. Прво, врло је брза процена стандардног одступања. Стандардно одступање захтева да прво пронађемо средину, а затим одузмемо ову средину из сваке тачке података, квадрата разлике, збројите их, поделите за један мањи од броја података, а затим (коначно) узмите квадрат корен. С друге стране, правило распона захтева само једно одузимање и једну поделу.

Остала места на којима је правило распона корисно су када имамо непотпуне информације. Формуле попут оне за одређивање величине узорка захтевају три информације: жељену Маргина грешке, тхе ниво самопоуздања и стандардну девијацију становништва коју истражујемо. Много је пута немогуће знати шта је становништво стандардна девијација је. Помоћу правила распона можемо процијенити ову статистику, а затим знати колико бисмо требали направити наш узорак.

instagram story viewer