Чебишева неједнакост у вероватноћи

Чебишева неједнакост каже да је најмање 1-1 /К2 подаци из узорка морају бити унутар К стандардна одступања од средње вредности (овде К да ли је било који позитиван стварни број већи од једног).

Било који скуп података који се обично дистрибуира или је у облику а крива звона, има неколико функција. Један од њих бави се ширењем података у односу на број стандардних одступања од средње вредности. У нормалној дистрибуцији знамо да је 68% података једно стандардно одступање од средњег, а 95% два стандардна одступања од средње вриједности, а приближно 99% је унутар три стандардна одступања од средње вриједности.

Али ако се скуп података не дистрибуира у облику кривуље звона, другачија количина може бити унутар једног стандардног одступања. Чебишева неједнакост пружа начин да се зна у који део података спада К стандардна одступања од средње вредности за било који скупа података

Чињенице о неједнакости

Наведену неједнакост такође можемо навести замењујући изразом „подаци из узорка“ са расподела. То је зато што је Чебишева неједнакост резултат вероватноће, која се затим може применити на статистику.

instagram viewer

Важно је напоменути да је та неједнакост резултат који је математички доказан. Није попут емпиријски однос између средње и режима или правило који повезује опсег и стандардно одступање.

Илустрација неједнакости

Да бисмо илустровали неједнакост, размотрићемо неколико вредности К:

  • За К = 2 имамо 1 - 1 /К2 = 1 - 1/4 = 3/4 = 75%. Дакле, неједнакост Чебишева каже да најмање 75% вредности података било које дистрибуције мора бити у оквиру две стандардне девијације од средње вредности.
  • За К = 3 имамо 1 - 1 /К2 = 1 - 1/9 = 8/9 = 89%. Дакле, неједнакост Чебишева каже да најмање 89% вредности података било које дистрибуције мора бити у оквиру три стандардна одступања од средње вредности.
  • За К = 4 имамо 1 - 1 /К2 = 1 - 1/16 = 15/16 = 93.75%. Дакле, неједнакост Чебишева каже да најмање 93,75% вредности података било које дистрибуције мора бити у оквиру две стандардне девијације од средње вредности.

Пример

Претпоставимо да смо узорковали тежине паса у локалном прихватилишту за животиње и открили да наш узорак има просечну вредност од 20 килограма са стандардним одступањем од 3 килограма. Употребом Чебишеве неједнакости знамо да најмање 75% паса које смо узорковали има тежину која је два стандардна одступања од средње вредности. Два пута већа од стандардне девијације даје нам 2 к 3 = 6. Одузмите и додајте то од просека 20. Ово нам говори да 75% паса има тежину од 14 до 26 килограма.

Употреба неједнакости

Ако знамо више о дистрибуцији са којом радимо, обично можемо гарантовати да је више података одређени број стандардних одступања далеко од средње вредности. На пример, ако знамо да имамо нормалну дистрибуцију, тада је 95% података две стандардне девијације од средње вредности. Чебишева неједнакост каже да у овој ситуацији то знамо барем 75% података представља два стандардна одступања од средње вредности. Као што видимо у овом случају, то би могло бити и пуно више од ових 75%.

Вредност неједнакости је у томе што нам пружа „лошији случај“ сценарија у којем једино о нашим узорцима (или дистрибуцији вероватноће) знамо просечност и стандардна девијација. Кад не знамо ништа више о нашим подацима, Чебишева неједнакост пружа додатни увид у то колико је шири скуп података.

Историја неједнакости

Неједнакост је добила име по руском математичару Пафнутију Чебишеву, који је први показао неједнакост без доказа 1874. године. Десет година касније, неједнакост је доказала Маркова у свом докторском делу. дисертација. Због разлика у начину представљања руске абецеде на енглеском језику, Цхебисхев је такође написан као Тцхебисхефф.

instagram story viewer