...">
瀏覽量:170次
SPSS中怎么進行快速聚類分析?許多用戶在使用spss數(shù)據(jù)分析軟件的時候都會遇到一些問題,最近就有不少小伙伴在詢問spss怎么快速聚類分析,下面小編就為大家講解一下吧!
操作方法:
一、方法概述
聚類分析是將研究對象按照一定的標準進行分類的方法,分類結(jié)果是每一組的對象都具有較高的相似度,組間的對象具有較大的差異。
這類分析方法多用于對于數(shù)據(jù)樣本沒有特定的分類依據(jù)的情況,IBM SPSS Statistics 會通過對數(shù)據(jù)的觀察為用戶做出較為完善的分類。
圖1:功能位置快速聚類是聚類分析的一種,使用到的功能在"分析"——"分類"中的"K-均值聚類"。
二、案例分享
1、樣本數(shù)據(jù)
圖2:樣本數(shù)據(jù)我們這里選擇的數(shù)據(jù)樣本是一部分學(xué)生的各科期末成績,使用快速聚類方法可以分析各個學(xué)生成績分布的差異和共性。
2、變量設(shè)置
圖3:變量設(shè)置我們將學(xué)生的所有單科成績作為分析變量,移入到"變量"窗口中,將學(xué)生的編號變量移入到下側(cè)的"個案標記依據(jù)"窗口。
聚類數(shù)設(shè)置的是分類的數(shù)目,這個需要根據(jù)數(shù)據(jù)樣本的特點來設(shè)置,我們這里設(shè)置為4類。
聚類方法有兩類,即迭代和分類,前者較為復(fù)雜,會在分析過程中不斷移動凝聚點,后者則始終使用初始凝聚點,我們選擇兩類都有的第一種分析方法。
3、聚類中心
圖4:聚類中心用戶可以選擇從外部文件或數(shù)據(jù)文件中寫入或讀取聚類中心,本案例中我們不使用這個功能。
4、迭代設(shè)置
圖5:迭代設(shè)置我們可以設(shè)置迭代的終止條件,即到達設(shè)定的最大值后將停止迭代分析,輸出聚類分析結(jié)果。
收斂性標準設(shè)置的是凝聚點改變的最大距離小于初始凝聚點的比例,小于設(shè)定值時,也會停止迭代,輸出結(jié)果。
使用運行均值表示每次觀測后都重新計算凝聚點,這些設(shè)置保持默認即可。
5、保存
圖6:保存新變量這是用來設(shè)置保存形式的,勾選"聚類成員"將保存SPSS的分類結(jié)果,勾選"與聚類中心的距離"將保存觀測值和所屬類別的歐氏距離,我們不做設(shè)置。
6、選項
圖7:選項設(shè)置這個對話框設(shè)置的是輸出的統(tǒng)計量和個案缺失處理方法,勾選"初始聚類中心"和"每個個案的聚類信息"。
7、結(jié)果輸出
圖8:聚類結(jié)果在輸出日志中可以看到,這些學(xué)生根據(jù)他們的單科成績被分成了四類,SPSS輸出了多個表格,包括初始聚類中心、迭代歷史記錄、聚類成員、最終聚類中心、最終聚類中心之間的距離和每個聚類中的個案數(shù)目,完整詳細,可信度較高。
[聲明]本網(wǎng)轉(zhuǎn)載網(wǎng)絡(luò)媒體稿件是為了傳播更多的信息,此類稿件不代表本網(wǎng)觀點,本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。故此,如果您發(fā)現(xiàn)本網(wǎng)站的內(nèi)容侵犯了您的版權(quán),請您的相關(guān)內(nèi)容發(fā)至此郵箱【779898168@qq.com】,我們在確認后,會立即刪除,保證您的版權(quán)。
官網(wǎng)優(yōu)化
整站優(yōu)化
渠道代理
400-655-5776