Razlika između analize klastera i faktora

Klaster analiza i faktorska analiza dvije su statističke metode analize podataka. Ova se dva oblika analize u velikoj mjeri koriste u prirodnim znanostima i znanostima o ponašanju. I klaster analiza i faktorska analiza omogućuju korisniku grupiranje dijelova podataka u "klastere" ili na "čimbenike", ovisno o vrsti analize. Neki istraživači koji su novi u metodama klaster i faktorske analize mogu smatrati da su ove dvije vrste analiza u cjelini slične. Iako se klaster analiza i faktorska analiza čine sličnima na površini, razlikuju se na mnogo načina, uključujući i svoje ukupne ciljeve i primjene.

Cilj

Klaster analiza i faktorska analiza imaju različite ciljeve. Uobičajeni cilj faktorske analize je objasniti korelaciju u skupu podataka i povezati varijable međusobno, dok je cilj klaster analize rješavanje heterogenosti u svakom skupu podataka. U duhu je klasterska analiza oblik kategorizacije, dok je faktorska analiza oblik pojednostavljenja.

Složenost

Složenost je jedno pitanje oko toga koja se faktorska analiza i klaster analiza razlikuju: veličina podataka različito utječe na svaku analizu. Kako skup podataka raste, analiza klastera postaje računski nerazrješiva. To je točno jer je broj podatkovnih točaka u klaster analizi izravno povezan s brojem mogućih rješenja klastera. Na primjer, broj načina za dijeljenje dvadeset objekata u 4 klastera jednake veličine je preko 488 milijuna. To onemogućuje izravne računske metode, uključujući kategoriju metoda kojoj pripada faktorska analiza.

instagram story viewer

Riješenje

Iako su rješenja i za faktorsku analizu i za klaster analizu donekle subjektivna, faktorska analiza omogućuje istraživaču da to učini dati "najbolje" rješenje, u smislu da istraživač može optimizirati određeni aspekt rješenja (ortogonalnost, jednostavnost interpretacije itd.) na). To nije slučaj s klaster analizom, jer su svi algoritmi koji bi mogli dati najbolje rješenje za klaster analizu računski neučinkoviti. Stoga istraživači koji koriste klaster analizu ne mogu jamčiti optimalno rješenje.

Prijave

Faktorska analiza i klaster analiza razlikuju se u načinu na koji se primjenjuju na stvarne podatke. Budući da faktorska analiza može smanjiti nezgrapan skup varijabli na mnogo manji skup čimbenika, prikladna je za pojednostavljivanje složenih modela. Faktorska analiza također ima potvrdnu uporabu, u kojoj istraživač može razviti niz hipoteza o tome kako su varijable u podacima povezane. Tada istraživač može pokrenuti faktorsku analizu na skupu podataka kako bi potvrdio ili opovrgnuo ove hipoteze. Klaster analiza je, s druge strane, prikladna za razvrstavanje objekata prema određenim kriterijima. Na primjer, istraživač može izmjeriti određene aspekte skupine novootkrivenih biljaka i svrstati ih u kategorije vrsta primjenom klaster analize.

Teachs.ru
  • Udio
instagram viewer