Поље статистике је подељено у две главне поделе: дескриптивне и инференцијалне. Сваки од ових сегмената је важан, нуди различите технике којима се постижу различити циљеви. Дескриптивна статистика описује шта се дешава у а Популација или скупа података. Насупрот томе, референтна статистика омогућава научницима да узимају налазе из узорка и генералишу их на већој популацији. Две врсте статистика имају неке значајне разлике.
Дескриптивна статистика
Дескриптивна статистика је врста статистике која вероватно пада на памет већини људи кад чују реч "статистика". У овој грани статистике циљ је описати. Нумеричке мере се користе да би се рекло о карактеристикама скупа података. Постоји неколико ставки које припадају овом делу статистике, као што су:
- Тхе просекили мера центра скупа података, који се састоји од средњег, средњег, режима или средњег опсега
- Ширење скупа података, који се може мерити са домет или стандардна девијација
- Општи опис података као што су сажетак пет бројева
- Мерења као што су скевнесс и куртоза
- Истраживање односа и корелација између упарених података
- Приказ статистичких резултата у графички форма
Ове мере су важне и корисне јер омогућавају научницима да виде обрасце међу подацима и на тај начин имају смисла у тим подацима. Описна статистика може се користити само за описивање популације или скупа података који се проучавају: Резултати се не могу генерализирати на било коју другу групу или популацију.
Врсте описне статистике
Постоје две врсте описних статистика које друштвени научници користе:
Мере централне тенденције ухватити општа кретања у подацима и израчунати се и изразити као средња, средња и модусна. Средство каже научницима математички просек свих података, као што је просечна старост у првом браку; средња вредност представља средину дистрибуције података, као што је старост која се налази у средини распона старости у којима се људи први пут венчају; и начин је можда најчешћа доб у којој се људи први пут венчају.
Мјере ширења описују како се подаци дистрибуирају и односе једни са другима, укључујући:
- Распон, читав опсег вредности присутних у скупу података
- Дистрибуција фреквенције, која дефинира колико пута се одређена вриједност појављује унутар скупа података
- Квартили, подгрупе које се формирају унутар скупа података када су све вриједности подијељене у четири једнака дијела широм распона
- Средња апсолутна девијација, просек колико свака вредност одступа од средње вредности
- Променљив, што илуструје колико ширења постоји у подацима
- Стандардна девијација, која илуструје ширење података у односу на средњу вредност
Мере ширења често су визуелно представљене у табелама, пита и графиконима и хистограмима како би се помогло разумевању трендова у подацима.
Инференцијалне статистике
Инференцијална статистика се производи путем сложених математичких израчуна који омогућавају научницима да закључују трендове о већој популацији на основу испитивања узорка узетог из ње. Научници користе инференцијалну статистику да би испитали однос између променљивих унутар узорка а затим направити генерализације или предвиђања о томе како ће се те променљиве односити на већу Популација.
Обично је немогуће испитати сваког члана популације појединачно. Научници тако бирају репрезентативну подгрупу популације, која се назива статистички узорак, а из ове анализе они су у стању да кажу нешто о популацији из које је узорак дошао. Постоје две главне поделе инференцијалне статистике:
- Интервал поузданости даје распон вриједности за непознати параметар популације мјерењем статистичког узорка. То се изражава интервалом и степеном поузданости да је параметар унутар интервала.
- Тестови од значаја или хипотеза тестирање где научници износе тврдњу о популацији анализирајући статистички узорак. У дизајну, постоји одређена неизвесност у овом процесу. То се може изразити на нивоу значајности.
Технике које друштвени научници користе да би испитали однос између променљивих и на тај начин створили инференцијалну статистику, укључују линеарне регресијске анализе, логистичке регресијске анализе, АНОВА, корелацијске анализе, моделирање структуралних једначинаи анализа преживљавања. Приликом спровођења истраживања користећи инференцијалну статистику, научници спроводе тест важности како би утврдили да ли могу генерализовати своје резултате на већој популацији. Уобичајени тестови значаја укључују: хи-квадрат и т-тест. Они научницима говоре вероватноћу да су резултати њихове анализе узорка репрезентативни за целу популацију.
Дескриптивно вс. Инференцијалне статистике
Иако је дескриптивна статистика корисна за учење ствари као што су ширење и центар података, ништа у описној статистици не може се користити за генерализирање. У описној статистици, мерења као што су средња и стандардна девијација су наведена као тачни бројеви.
Иако инференцијална статистика користи сличне прорачуне - као што су средња и стандардна девијација - фокус је различит за инференцијалну статистику. Инференцијална статистика започиње узорком, а затим се генерализира на популацију. Овај податак о популацији није наведен као број. Уместо тога, научници те параметре изражавају као распон потенцијалних бројева, заједно са степеном поузданости.