Разумевање квантитета: дефиниције и употребе

Резиме статистике као што је средња, први квартил и трећи квартил су мерења положаја. То је зато што ови бројеви показују где лежи одређени удео дистрибуције података. На пример, медијан је средњи положај података у истраживању. Половина података има вредности мање од медијане. Слично томе, 25% података има вредности мање од првог квартила и 75% података има вредности мање од трећег квартила.

Овај концепт се може генерализовати. Један од начина да се то постигне је разматрање Процентитили. Деведесети процентил означава тачку у којој 90% процента података има вредности мање од овог броја. Опћенитије, птх перцентил је број н за које п% података је мање од н.

Континуиране случајне променљиве

Иако су статистички подаци о редоследу средњег, првог и трећег квартила обично уведени у а подешавањем са дискретним скупом података, ове статистике се такође могу дефинисати за континуирани случајни случај променљива. Пошто радимо са континуираном дистрибуцијом, користимо интеграл. Тхе птх перцентил је број н тако да:

instagram viewer

-₶нф ( Икс ) дк = п/100.

Ево ф ( Икс ) је функција густине вероватноће. На тај начин можемо добити било који постотак који желимо за а непрекидно дистрибуција.

Квантали

Даљња генерализација је приметити да наша статистика наруџби дели поделу с којом радимо. Медијана дели податке који су постављени на пола, а средњи, односно 50. процентуални део континуиране дистрибуције, дели дистрибуцију на пола у односу на површину. Први квартил, средња вредност и трећи квартил поделимо наше податке у четири дела са истим бројем у сваком. Горњи интеграл можемо користити да добијемо 25., 50. и 75. постотил и поделимо континуирану расподелу на четири дела једнаке површине.

Можемо генерализовати овај поступак. Питање с којим можемо започети даје се природни број н, како можемо поделити дистрибуцију променљиве на н комади једнако величине? То директно говори о идеји квантала.

Тхе н квантали за скуп података налазе се приближно тако што се подаци рангирају по редослиједу и затим се подели рангирање н - 1 једнако распоређена тачка на интервалу.

Ако имамо функцију густоће вероватноће за континуирану случајну променљиву, користимо горњи интеграл да пронађемо квантале. За н квантали, желимо:

  • Први који имају 1 /н области дистрибуције лево од ње.
  • Други који има 2 /н области дистрибуције лево од ње.
  • Тхе ртх то хаве р/н области дистрибуције лево од ње.
  • Последња која има (н - 1)/н области дистрибуције лево од ње.

То видимо за било који природни број н, тхе н квантали одговарају 100р/нтх постотцила, где р може бити било који природни број од 1 до н - 1.

Уобичајени квантитали

Одређене врсте квантила користе се довољно често да имају одређена имена. Испод је листа ових:

  • 2 квантил се назива медијан
  • 3 квантила се називају терцили
  • Четири квантита називамо квартилима
  • Пет квантила назива се квинтилима
  • Шест квантила назива се секстили
  • 7 квантила називамо септили
  • 8 квантила назива се октилима
  • 10 квантила назива се децилима
  • 12 квантила назива се дуодециле
  • 20 квантила назива се вигинтилима
  • 100 квантила назива се постотилима
  • 1000 квантила назива се пермиллес

Наравно, и други квантали постоје изван оних на горњој листи. Много пута се користи одређени квантил величине величине узорка из континуираног дистрибуција.

Употреба квантала

Осим што одређују положај скупа података, квантали су корисни и на друге начине. Претпоставимо да имамо једноставан случајни узорак из неке популације, а дистрибуција популације је непозната. Да бисмо помогли да се утврди да ли је модел, попут нормалне дистрибуције или Веибуллове дистрибуције, добро прилагођен за популацију из које смо узели узорке, можемо погледати квантале наших података и модел.

Упоређивањем квантала из наших података узорака с квантилима одређеног расподела, резултат је прикупљање упарених података. Ове податке цртамо у расипној плочи, познатој као квантно-квантитативна заплет или к-к заплет. Ако је резултирајући расипање приближно линеарно, онда је модел добро уклопљен за наше податке.

instagram story viewer