Термин крива звона користи се за описивање математичког концепта званог нормална дистрибуција, који се понекад назива и Гауссова дистрибуција. "Крива звона" односи се на облик звона који се ствара када се црта црта користећи тачке података за ставку која испуњава критеријуме нормалне дистрибуције.
У кривини звона, центар садржи највећи број вредности и, према томе, то је највиша тачка на луку линије. Ова тачка се односи на значити, али једноставним речима, то је највећи број појава елемента (у статистичким речима, моду).
Нормална расподела
Важна ствар коју треба имати на уму нормална расподела је да је кривуља концентрисана у центру и опада са обе стране. Ово је значајно по томе што подаци имају мању тенденцију стварања необично екстремних вредности, званих оутлиерс, у поређењу с другим дистрибуцијама. Такође, крива звона означава да су подаци симетрични. То значи да можете створити разумна очекивања у погледу могућности да исход буде унутар опсег лево или десно од центра, након што измерите количину одступања која се садржи у подацима. То се мери у смислу стандардна одступања.
Граф криве звона зависи од два фактора: средње и стандардне девијације. Средња вредност идентификује положај средишта, а стандардна девијација одређује висину и ширину звона. На пример, велико стандардно одступање ствара звоно кратко и широко, док мало стандардно одступање ствара високу и уску кривуљу.
Вероватноћа криве звона и стандардно одступање
Да бисте разумели факторе вероватноће нормалне дистрибуције, морате да разумете следећа правила:
- Укупна површина испод кривуље једнака је 1 (100%)
- Око 68% површине испод кривуље спада у једно стандардно одступање.
- Око 95% површине испод кривуље спада у две стандардне девијације.
- Око 99,7% површине испод кривуље спада у три стандардна одступања.
Ставке 2, 3 и 4 горе понекад се називају емпиријским правилом или правилом 68–95–99.7. Једном када утврдите да се подаци нормално дистрибуирају (звоно закривљено) и израчунати средњу и стандардна девијација, можете да одредите вероватноћа да ће једна тачка података пасти у оквиру датог распона могућности.
Пример криве звона
Добар пример кривуље звона или нормалне дистрибуције је колут две коцкице. Расподјела се концентрише око броја седам и вјероватност опада како се удаљавате од центра.
Ево процента шанси различитих исхода када баците две коцкице.
- Два: (1/36) 2.78%
- Три: (2/36) 5.56%
- Четири: (3/36) 8.33%
- Пет: (4/36) 11.11%
- Шест: (5/36) 13.89%
- Седам: (6/36) 16,67% = највјероватнији исход
- Осам: (5/36) 13.89%
- Девет: (4/36) 11.11%
- Десет: (3/36) 8.33%
- Једанаест: (2/36) 5.56%
- Дванаест: (1/36) 2.78%
Нормалне расподјеле имају мноштво погодних својстава, па у многим случајевима, посебно у стање и астрономија, случајне варијације са непознатим расподелбама се често претпостављају као нормалне да би се омогућиле калкулације вероватноће. Иако ово може бити опасна претпоставка, често је добра апроксимација због изненађујућег резултата познатог као централна гранична теорема.
Ова теорема каже да се средња било којег скупа варијанти са било којом дистрибуцијом која има ограничену средњу вредност и варијанцу има тенденцију да се јавља у нормалној дистрибуцији. Многе уобичајене особине, као што су тестови или висина, следе приближно нормалне расподјеле, с неколико чланова на високим и доњим крајевима и много у средини.
Када не би требало да користите кривуљу звона
Постоје неке врсте података које не слиједе нормалан образац дистрибуције. Ове скупове података не треба присиљавати да покушају да ставе кривуљу звона. Класичан пример су оцене ученика, које често имају два начина. Остале врсте података које не слиједе кривуљу укључују приходе, раст становништва и механичке кварове.