Како се користи кластер анализа у истраживањима друштвених наука

Кластер анализа је статистичка техника која се користи да се утврди како се разне јединице - попут људи, група или друштава - могу групирати због карактеристика које имају заједничке. Такође познато као групирање, то је истраживачко средство за анализу података које има за циљ да разврста различите предмете у групе на такав начин да када припадају истој групи имају максималан степен удруживања, а када не припадају истој групи, степен њихове асоцијације је минимално. За разлику од неких других статистичке технике, структурама које су откривене кластер анализом није потребно објашњење или интерпретација - она ​​открива структуру у подацима без објашњења зашто постоје.

Шта је кластерирање?

Кластерирање постоји у готово сваком аспекту нашег свакодневног живота. Узмимо, на пример, предмете у трговини. На истој или оближњој локацији увек се приказују различите врсте предмета - месо, поврће, сода, житарице, производи од папира итд. Истраживачи често желе да учине исто са подацима и групишу објекте или предмете у кластере који имају смисла.

instagram viewer

Да узмемо пример из друштвених наука, рецимо да гледамо земље и желимо да их групишемо у кластере на основу карактеристика као што су подела рада, војници, технологија или образовано становништво. Открили бисмо да Велика Британија, Јапан, Француска, Немачка и Сједињене Државе имају сличне карактеристике и да би биле повезане у групу. Уганда, Никарагва и Пакистан такође би били сврстани у различит скуп зато што имају различит скуп карактеристика, укључујући низак ниво богатства, једноставније поделе рада, релативно нестабилне и недемократске политичке институције и ниску технолошку развој.

Кластерска анализа се обично користи у истраживачкој фази истраживања када је истраживач нема унапријед замишљене хипотезе. Обично није једина употребљена статистичка метода, већ се ради у раним фазама пројекта како би се лакше водили остатак анализе. Из тог разлога, испитивање значајности обично није ни релевантно нити је примерено.

Постоји неколико различитих врста анализа кластера. Два најчешће кориштена су кластерисање К-средстава и хијерархијско групирање.

К-значи кластерирање

К-значи кластерирање посматра опажања у подацима као објекте који имају локације и удаљености једни од других (имајте на уму да растојања која се користе у кластерирању често не представљају просторне удаљености). Објекте дели на К међусобно искључиве кластере тако да објекти унутар сваког кластера јесу као што ближе једни другима и у исто време, што даље од објеката у другим кластерима. Сваки кластер је онда окарактерисан са својим средња или средња тачка.

Хијерархијско кластерирање

Хијерархијско кластерирање је начин да се истовремено истраже груписање података на различитим скали и удаљеностима. То се постиже тако што ствара стабло кластера са различитим нивоима. За разлику од К-значи кластерирања, дрво није један скуп кластера. Уместо тога, дрво је хијерархија на више нивоа где се кластери на једном нивоу спајају као кластери на следећем вишем нивоу. Алгоритам који се користи започиње са сваким случајем или променљивом у засебном кластеру, а затим комбинује кластере све док не остане само један. То омогућава истраживачу да одлучи који ниво кластера је најприкладнији за његово истраживање.

Извођење кластер анализе

Већина софтверски програми за статистику може да врши кластер анализу. У СПСС изаберите анализирати из менија, затим класификовати и анализа кластера. У САС-у проц цлустер функција се може користити.

Ажурирано од Др Ницки Лиса Цоле