WPS专家网

如何利用SPSS中的分盒函数将连续数据离散化?

发表于:2022-08-17 作者:WPS专家网编辑
编辑最后更新 2022年08月17日,"盒子法"相信是学过统计学的小伙伴所熟悉的。其主要功能是消除噪声数据,离散处理连续数据。在模型分析开始之前,我们经常需要使用box方法来处理和清理数据。下面小编就带大家一起学习!操作方法:图1显示了我

"盒子法"相信是学过统计学的小伙伴所熟悉的。其主要功能是消除噪声数据,离散处理连续数据。在模型分析开始之前,我们经常需要使用box方法来处理和清理数据。下面小编就带大家一起学习!

操作方法:

图1显示了我们将要装箱的数据。我们会按照每10岁的标准,把年龄一栏框起来。

图1:点击"转换"中的"可视化分箱",进入分箱设置界面。

图2:视觉宁滨将"年龄"拉进"要入库的变量",然后点击"继续"。

图3:拉入要入库的变量在图4所示的界面中,我们可以看到有34个要扫描的案例,其中最大变量值为67,最小值为22,也就是说,要入库的数据的年龄在22岁到67岁之间。

我们在"宁滨变量"中填写"年龄组"作为新生成的变量,然后点击"生成分割点"按钮。

图4:根据我们对宁滨变量的目的,需要每10岁分组一次,最小的年龄是22岁,所以需要在第一个分界点填写"20",然后在宽度处填写"10"。这时,点击键盘的Tap键,SPSS会自动生成分界点的值为"5",如图5所示。

这样,SPSS会自动帮助我们将20到30岁、30到40岁、40到50岁、50到60岁、60到70岁的年龄组分为5组。

图5:点击"应用"生成分割点,然后返回"可视化分箱"界面。我们可以在图6中的红色框中看到后续的框间距值。标签栏默认为空,我们可以通过定义来填写,比如将盒子分隔标签设置为20:2。

图6:设置自定义标签。最后,点击"确定"按钮开始数据宁滨。宁滨之后的新数据结果如图7所示,并生成了一个新的"年龄组"列。数据的入库也非常正确。例如,年龄为27岁的数据行在标签为2的宁滨中设置正确。

图7:以上结果是用IBM SPSS Statistics将演示数据中的年龄指标按照每10岁的标准分为所有教程。以上演示是等距除法,小伙伴可以自己在IBM SPSS Statistics中尝试不等除法。

0