Данас је поноћно приказивање најновијег хит филма. Људи су постројени испред позоришта и чекају да уђу. Претпоставимо да од вас тражи да пронађете средиште линије. Како бисте то урадили?
Постоји неколико различитих начина решавање овог проблема. На крају бисте морали да схватите колико је људи у реду, и онда да узмете половину тог броја. Ако је укупан број паран, онда би средиште линије било између две особе. Ако је укупан број непаран, у центру би била једна особа.
Можете питати: „Какве везе има проналазак средишта линије статистика? "Ова идеја проналаска центра је управо оно што се користи приликом израчунавања медијане низа података.
Шта је медијан?
Медијана је један од три основна начина за проналажење просека статистички подаци. Теже је израчунати од режима, али није толико напорно као израчунавање средње вредности. То је центар на исти начин као и проналазак средишта линије људи. Након пописа података у узлазном редослиједу, медијан је вриједност података с истим бројем вриједности података изнад и испод ње.
Први случај: Непарни број вредности
Једанаест батерија је тестирано да се види колико дуго трају. Њихов животни век у сатима даје се 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. Који је средњи животни век? Пошто постоји непаран број вредности података, то одговара линији са непарним бројем људи. Средина ће бити средња вредност.
Постоји једанаест вриједности података, тако да је шеста у центру. Стога је медијан трајања батерије шеста вредност на овој листи, односно 105 сати. Имајте на уму да је медијан једна од вредности података.
Случај други: Парни број вредности
Двадесет мачака су извагане. Њихове тежине у килограмима дају се 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Која је средња мачја тежина? С обзиром да постоји парни број вредности података, то одговара линији са уједначеним бројем људи. Средина је између две средње вредности.
У овом случају центар се налази између десете и једанаесте вредности података. Да бисмо пронашли средњу вредност, израчунали смо средњу вредност ове две вредности и добили (7 + 8) / 2 = 7.5. Овде медијан није једна од вредности података.
Има ли других случајева?
Једине две могућности су да имају паран или непаран број вредности података. Дакле, горња два примера су једини могући начини израчунавања медијане. Или ће медијан бити средња вредност, или ће медијана бити средња вредност средње две средње вредности. Типично су скупови података много већи од оних које смо погледали горе, али поступак проналаска медијане је исти као у ова два примера.
Ефекат одметника
Средња вредност и модус су веома осетљиви на особе које троше. То значи да ће присуство вансеријске драматично утицати на обе мере центра. Једна предност медијана је да на њега не утиче толико странац.
Да бисте то видели, размотрите скупове података 3, 4, 5, 5, 6. Средња вредност је (3 + 4 + 5 + 5 + 6) / 5 = 4,6, а средња вредност је 5. Сада задржите исти скуп података, али додајте вредност 100: 3, 4, 5, 5, 6, 100. Јасно да је 100 извансеријски, јер је много већи од свих осталих вредности. Средња вриједност новог сета је сада (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20,5. Међутим средња вредност новог сета је 5. иако
Примена медијане
Због онога што смо видели горе, медијан је преферирана мера просека када подаци садрже одметнике. Када се извештавају о примањима, типичан приступ је пријављивање средњег дохотка. То је учињено зато што средњи доходак искривљује мали број људи с врло високим примањима (помислите Билл Гатес и Опрах).