Како пронаћи унутрашњу и вањску ограду

Једна карактеристика скупа података која је важна за утврђивање је да ли садржи неке издатке. У нашем серији података интуитивно се сматра да се за оутлиерс-ове вредности значајно разликују од већине осталих података. Наравно, ово разумевање одметника је двосмислено. Да бисмо га сматрали вансеријом, колико вредност треба да одступа од осталих података? Да ли оно што један истраживач назива вансеријом који се подудара са другим? Да бисмо обезбедили неку доследност и квантитативну меру за одређивање одлива, користимо унутрашњу и спољну ограду.

Да бисмо пронашли унутрашњу и спољну ограду низа података, прво нам треба неколико других дескриптивна статистика. Почећемо од израчунавања квартила. То ће довести до интерквартилног распона. Коначно, помоћу ових израчунавања иза нас, моћи ћемо да утврдимо унутрашњу и спољну ограду.

Квартили

Тхе први и трећи квартил су део сажетак пет бројева било којег скупа квантитативних података. Започињемо проналажењем средње или тачке средине након што су све вредности наведене у растућем редоследу. Вриједности мање од медијане које одговарају отприлике половини података. Налазимо средину ове половине података, и ово је први квартил.

instagram viewer

На сличан начин сада сматрамо горњу половину скупа података. Ако пронађемо средњу вредност за ову половину података, имамо трећи квартил. Ови квартили су добили своје име по томе што су поделили скуп података у четири једнака дела или четвртине. Другим речима, отприлике 25% свих вредности података су мање од првог квартила. На сличан начин отприлике 75% вредности података је мање од трећег квартила.

Интеркуартиле опсег

Следеће треба да пронађемо интеркуартиле опсег (ИКР). То је лакше израчунати него први квартил к1 и трећи квартил к3. Све што треба да урадимо је да схватимо разлику између ова два квартила. То нам даје формулу:

ИКР = К3 - К1

ИКР нам говори колико је раширена средина половине нашег скупа података.

Пронађите унутрашње ограде

Сада можемо пронаћи унутрашње ограде. Почињемо са ИКР и множимо овај број на 1,5. Затим одузимамо овај број од првог квартила. Овом броју додамо и трећи квартил. Ова два броја чине нашу унутрашњу ограду.

Пронађите спољне ограде

За вањске ограде започињемо с ИКР и овај број множимо с 3. Затим одузимамо овај број од првог квартила и додамо га у трећи квартил. Ова два броја су наше спољне ограде.

Откривање Оутлиерс-а

Откривање одметници сада постаје једнако лако као и одређивање где се вредности података налазе у односу на наше унутрашње и спољашње ограде. Ако је појединачна вредност података екстремнија од било које од наших спољних ограда, онда је то вањска страна и понекад је називају јаком руком. Ако се наша вредност налази између одговарајуће унутрашње и спољне ограде, тада је та вредност сумњиви вањски или благи облик. Видећемо како то функционише са доњим примером.

Пример

Претпоставимо да смо израчунали први и трећи квартил наших података и пронашли ове вредности на 50 и 60, респективно. Интерквартилни распон ИКР = 60 - 50 = 10. Затим видимо да је 1,5 к ИКР = 15. То значи да су унутрашње ограде на 50 - 15 = 35 и 60 + 15 = 75. То је 1,5 к ИКР мање од првог квартила и више од трећег квартила.

Сада израчунавамо 3 к ИКР и видимо да је то 3 к 10 = 30. Вањске ограде су 3 к ИКР екстремније у односу на први и трећи квартил. То значи да су вањске ограде 50 - 30 = 20 и 60 + 30 = 90.

Све вредности података које су мање од 20 или веће од 90, сматрају се оутлиерима. Било какве вредности података између 29 и 35 или између 75 и 90 сумњају се да су одметници.

instagram story viewer