...">
瀏覽量:138次
"分箱法"相信學過統(tǒng)計學的小伙伴們都不會陌生,它的主要作用就在于對噪音數(shù)據(jù)進行剔除,同時將連續(xù)型數(shù)據(jù)進行離散處理。在模型分析開始前,我們經(jīng)常需要使用到分箱法來處理和清洗數(shù)據(jù)。下面小編就帶著大家一起學習一下吧!
操作方法:
圖1是我們準備要分箱的數(shù)據(jù),我們將對年齡列進行分箱,按照每10歲為一個標準進行分箱。
圖1:要分箱的數(shù)據(jù)點擊"轉換"中的"可視分箱",進入分箱設置界面。
圖2:可視分箱將"年齡"拉入到"要分箱的變量"中,然后點擊"繼續(xù)"。
圖3:拉入要分箱的變量在圖4所示界面,我們可以看到要掃描的個案數(shù)共34個,其中最大的變量值為67,最小為22,也就是說要分箱的數(shù)據(jù)年齡段在22到67歲之間。
我們在"分箱化變量"中,填入"年齡段",作為一個之后新生成的變量,隨后點擊"生成分割點"按鈕。
圖4:分箱化變量按照我們的分箱目的,我們要每隔10歲分組一次,最小的年齡為22歲,則我們需要在第一個分割點位置填寫"20",然后在寬度填寫"10",此時點擊鍵盤Tap鍵,SPSS會自動生成分割點數(shù)的值為"5",如圖5所示。
這樣子SPSS會自動幫我們將20到30、30到40、40到50、50到60、60到70的年齡段進行分組,一共5組。
圖5:生成分割點點擊"應用"按鈕后,回到"可視分箱"界面中,我們可以在圖6紅框位置看到后續(xù)的分箱值,標簽欄默認是空值,我們可以進行自定義填寫,如設置20的分箱標簽為2。
圖6:設置自定義標簽最后點擊"確定"按鈕,開始進行數(shù)據(jù)分箱,分箱后的新數(shù)據(jù)結果如圖7所示,生成了新的"年齡段"列,數(shù)據(jù)也非常正確地進行了分箱,如年齡為27的那行數(shù)據(jù),被正確地設置到了標簽為2的分箱中。
圖7:分箱結果以上就是使用IBM SPSS Statistic對演示數(shù)據(jù)中的年齡指標,按照每隔10歲的標準,進行分箱的全部教程,上述演示的是等距分箱,小伙伴也可以自己動手在IBM SPSS Statistic中嘗試一下不等距分箱哦。
[聲明]本網(wǎng)轉載網(wǎng)絡媒體稿件是為了傳播更多的信息,此類稿件不代表本網(wǎng)觀點,本網(wǎng)不承擔此類稿件侵權行為的連帶責任。故此,如果您發(fā)現(xiàn)本網(wǎng)站的內(nèi)容侵犯了您的版權,請您的相關內(nèi)容發(fā)至此郵箱【779898168@qq.com】,我們在確認后,會立即刪除,保證您的版權。
官網(wǎng)優(yōu)化
整站優(yōu)化
渠道代理
400-655-5776