Колико калорија је свако од нас појео за доручак? Колико далеко су сви путовали данас од куће? Колико је велико место које зовемо дом? Колико других људи то зове дом? Да би се схватиле све ове информације, потребни су одређени алати и начини размишљања. Математичка наука звана статистика је оно што нам помаже да се носимо са овим информацијама преоптерећеним.
Статистика је проучавање нумеричких информација, које се зову подаци. Статистичари прикупљају, организују и анализирају податке. Сваки део овог процеса је такође детаљно прегледан. Технике статистике примењују се на мноштво других подручја знања. Испод је увод у неке од главних тема у статистици.
Становништво и узорци
Једна од понављајућих тема статистике је да смо у стању рећи нешто о великој групи заснованој на проучавању релативно малог дела те групе. Група у целини позната је као популација. Део групе коју проучавамо је узорак.
Као пример тога, претпоставимо да смо желели да знамо просечну висину људи који живе у Сједињеним Државама. Могли бисмо покушати да измеримо преко 300 милиона људи, али то би било неизводљиво. Било би логистичка ноћна мора да мерења спроведе на такав начин да нико није промашен и да се нико не броји два пута.
Због немогуће природе мерења свих у Сједињеним Државама, уместо тога можемо користити статистику. Уместо да пронађемо висине свих у популацији, узимамо један статистички узорак од неколико хиљада. Ако смо правилно испитали популацију, просечна висина узорка ће бити врло близу просечне висине популације.
Добивање података
Да бисмо извукли добре закључке, потребни су нам добри подаци с којима ћемо сарађивати. Начин на који узоркујемо популацију ради добијања ових података увек треба пажљиво проверити. Који узорак користимо зависи од тога које питање постављамо популацији. Уобичајени узорци су:
- Симпле Рандом
- Стратифицирана
- Цлустеред
Једнако је важно знати како се врши мерење узорка. Да се вратимо на горњи пример, како постижемо висине оних у нашем узорку?
- Да ли људима допуштамо да сами кажу своју висину путем упитника?
- Да ли неколико истраживача широм земље мери различите људе и пријављује њихове резултате?
- Да ли један истраживач мери све у узорку истом траком?
Сваки од ових начина прибављања података има своје предности и недостатке. Свако ко користи податке из ове студије желео би да зна како су добијени.
Организовање података
Понекад постоји мноштво података и у свим детаљима се буквално можемо изгубити. Тешко је видети шуму за дрвеће. Због тога је важно да подаци буду добро организовани. Пажљива организација и графички прикази података нам помажу да уочимо обрасце и трендове пре него што заиста урадимо било какве прорачуне.
Пошто начин на који графички представљамо наше податке зависи од низа фактора. Уобичајени графикони су:
- Пите графикони или кругови
- Бар или парето графови
- Сцаттерплотс
- Временске завере
- Плодови стабљике и лишћа
- Графови кутија и вискија
Поред ових добро познатих графова, постоје и други који се користе у специјализованим ситуацијама.
Дескриптивна статистика
Један од начина анализе података назива се описна статистика. Овде је циљ израчунати количине које описују наше податке. Бројеви названи средња, средња вредност и начин рада користе се за означавање просек или центар података. Опсег и стандардна девијација се користе за одређивање раширености података. Сложеније технике, као што су корелација и регресија описује податке који су упарени.
Инференцијалне статистике
Када почнемо са узорком, а затим покушамо да закључимо о становништву, ми то користимо инференцијалне статистике. У раду са овом облашћу статистике тема је хипотеза тестирање настаје. Овде видимо научну природу предмета статистике, јер излажемо хипотезу, а затим је употребљавамо статистичким алатима помоћу нашег узорка како бисмо утврдили вероватноћу да морамо да одбацимо хипотезу или не. Ово објашњење је само гребање површине овог врло корисног дела статистике.
Примене статистике
Није претјеривање рећи да се статистички алати користе у готово свим областима научног истраживања. Ево неколико области које се у великој мери ослањају на статистику:
- Психологија
- Економија
- Медицина
- Оглашавање
- Демографија
Основе статистике
Иако неки мисле статистику као грану математике, боље је размишљати о њој као о дисциплини која је основана на математици. Конкретно, статистика је грађена из математичке области познате као вероватноћа. Вероватноћа нам омогућава начин да одредимо колико је вероватно да се неки догађај догоди. То нам такође даје начин да разговарамо о случајности. Ово је кључно за статистику, јер типични узорак треба насумично одабрати из популације.
Вероватноћу су први пут проучавали 1700-их математичари, као што су Пасцал и Фермат. 1700-те су такође означиле почетак статистике. Статистика је наставила да расте из својих вероватних корена и заиста се повукла у 1800-има. Данас је теоријски обим и даље увећан у ономе што се назива математичким статистикама.