SPSS在1968年创立时,是社会科学的统计软件包的缩写,但这种数据分析技术后来也被许多其他领域广泛采用。
SPSS可以提供一些强大而令人兴奋的数据操作选项,但仅当您将调查设置为利用这些功能时才。对于那些寻求更高级了解他们的调查结果来获得更高级的洞察力,SPS可能是一个很棒的工具。
我在SPSS工作了很多年,在创建一个与SPSS兼容的调查时,我看到了几乎所有可能的错误。我的希望是,您将能够避开这些太常见的问题与这个基本指南的调查变量和SPSS。
这里我将介绍SPSS语法的一些核心用法,包括:
- 重命名变量
- 添加和更改变量标签
- 添加、更改和更新Value标签
- 创建和操纵变量
奠定基础:SPSS中的调查变量和值
调查变量是您在SPSS数据文件中给各个字段(如响应)的名称。例如,如果您要求人们选择他们喜欢的电影(选择所有适用的电影),您可能会提供这样的列表:
布奇·卡西迪和圣丹斯小子
时尚女魔头
《塔拉迪加之夜》
你只能活两次
怪物史莱克
大多数调查工具会生成相应的变量名:
q6a_butch_cassidy_and_the_sundance_kid.
Q6b_The_Devil_Wears_Prada
Q6c_Talladega_Nights
Q6d_You_Only_Live_Twice
Q6e_Shrek
要在SPSS中进行报告和分析更容易您可以调整这些响应的变量名称,以如下:
Q6_BUTCH
Q6_PRADA
Q6_NIGHTS
Q6_LIVE
Q6_SHREK
变量恰好是 - 基于SPSS分析需求可以调整的变量数据点。一般来说,他们不用于报告。当您尝试运行分析时,它们就是您将看到的。可变标签是该报告中实际显示的内容。
另一方面,调查值是单独的数据。在这个例子中,数据集中可能会有一个0或1来表示应答者是否选择了它。值标签为0的值通常被标记为“未选中”,而值为1的值被标记为“选中”。值标签几乎可以处理任何Unicode符号,因此它们更加灵活,可以帮助您的报表看起来更好。
当您在SPSS中打开数据文件并检查数据时,您正在查看变量(考虑列)和值(每个列中的单元格)。
您可能已经习惯手动单击数据视图并更改变量名或更新标签。不幸的是,在SPSS世界的调查研究中,我们经常重新导出我们的数据,然后不得不手动更新数据文件,以我们喜欢。
使用下面列出的语法,您可以只进行一次更改,然后将更改重新应用到新导出的数据文件中。
现在我们已经掌握了正确的术语,让我们进入如何配置您的调查变量,以便您的SPSS分析可以提供您所需要的所有信息。
(你也可以看到一个详细的演练为什么在这个视频中学习SPSS语法很重要.)
重命名SPSS变量
SPSS变量遵循一个非常特殊的命名约定。第一个字符必须是以下字符之一:@,#,或$。下面的字符几乎可以是字母、数字、非标点字符和句号的任何组合。
出于超出本帖子范围的原因,我可以给您的最佳建议是用一封信启动你的变量。
记住,变量名不能以数字开头!
我看到人们在变量名中使用的最常见的字符(所有这些都是不允许的)是:
, - !" $ % &() *…"/:;?[\] ^ | + < = >©®™
下面的命令是你用来重命名一个变量的语法:fake_var1.
重命名变量(fake_var1 = new_var1)。
要一次重命名多个变量,你可以使用下面的语法:
重命名变量(Fake_Var1 =New_Var1)(Fake_Var2=New_Var2)。
在运行命令后,重命名变量将立即生效。
(有一些程序没有,但现在不要担心。)
在SPSS中添加或更改变量标签
现在我们已经介绍了变量命名约定,了解如何向现有变量标签添加更多信息(或完全更改)也很重要。
添加或更改变量的标签很简单。
以下是您用来将标签添加(或更改)标签到上面使用的假_var1的语法:
变量标签fake_var1“我的假变量”。
如果您希望一次添加或更改多个变量,只需将它们添加到以下行中(但不要这样做,包括main命令)。下面是一个例子:
变量标签fake_var1“我的假变量”
Fake_Var2“我的第二个假变量”
在SPSS中添加或更改值标签
记住,变量标签和值标签之间有一个重要的区别。可以将变量标签视为所问的总体问题,而值标签则是答案。
对于这个例子,让我们假设你有一个名为Age_Group的变量,在你的调查中,你有以下选项:
<18
18-26
27-50
51 +
要添加或更改值标签,您将使用以下语法:
值标签age_group 1“<18”2“2”18-26“3”27-50“4”51+“。
如果你只想更新一个值(而不是覆盖所有其他值),你可以使用下面的语法:
添加价值标签age_group 1“青少年 - ugh!”。
在上面的场景中,可能不值得“更新”单个值而不是重新连接它们;然而,当你有数十个(或数百个)价值标签时,这就非常方便了。
在SPSS中创建和操作变量
分析师可以添加价值的最佳方式之一是通过查找审查数据的新方法。有许多方法可以更改允许进一步的数据,更具体地分析的数据。
以下是一些我经常使用我们讨论过的技巧的常见方法:
- 创建汇总其他变量(Average, Sum等)
- 从良好分组的分类变量创建间隔变量
- 从分类变量创建双峰变量
- 重新组合分类变量以增加子组的大小
- 重新组合几个变量
- 数学上转换变量(对数,平方,平方根等)
- 将特定值设置为missing,这样就不会在分析中使用它们
- 用有效值替换缺失的值
我总是发现例子更容易理解,所以现在让我们来看看一个例子。
深入了解汽水购买行为
让我们说你是苏打公司,并试图了解购买前的有多少品牌客户,通常称为“考虑集”。
对于苏打水,考虑集可能像这样:
当你考虑下次购买汽水时,你会考虑下列哪个品牌?(选择所有适用的选项)
- 可口可乐
- 健怡可乐
- 百事可乐
- 百事可乐
- 胡椒博士
- 雪碧
- 私酿的威士忌酒
- 其他 ________________
典型报告提供受访者选择的每种选择的百分比。
虽然这很有趣,但它也有助于理解有关客户购买模式的其他基本统计数据。
一个简单的选择是设置一个“sum”变量,将每个被调查者选择的苏打水总数相加。在这种情况下,最小值是零(除非你需要答案),最大值是8。
竞争数据通过SPSS调查变量
审查总和变量的平均值,中位数和模式将为消费者的态度和行为提供有用的见解。
例如,如果选择的苏打水的平均数量为1.2,那将意味着消费者不会经常从他们的首选品牌中偏离。另一方面,如果选择的苏打水的平均数量为6.5,市场似乎似乎更分散和竞争。
在上面的例子中,假设数据被编码为0=未选中和1=选中,并且变量是顺序的,代码可以像这样简单:
compute consd_set_sum = sum(可焦炭到其他)。
执行。
计算过程不是“热的”,这意味着在您使用“Execute”命令跟踪它之前,它实际上不会做任何事情。
这看起来很奇怪,但在处理大型数据集时,在每次使用“Compute”命令时不读取和写入数据集是非常有用的。
上面的代码将创建一个“sum”变量,该变量将所选苏打水的总数相加。如果有人选择百事可乐,健怡百事可乐和激浪,变量中就会有值3。
通过SPSS变量标签提高清晰度
在创建sum变量之后,您应该添加一个比前面提到的统计数据更好的标签。
下面是语法(加上最小值、最大值和标准偏差):
变量标号
频率变量= consid_set_sum / stats = stddev min max均值中值模式。
SPSS语法和开放式问题
另一个巨大使用语法是帮助代码开放式问题,这难以分析。
在上面的示例中,选择“其他________”的受访者可能已在选项中编写。让我们说你看到了很多人在答案中写道,“先生PIBB。“
以下语法是创建变量的重要方法,该变量将允许您量化有多少受访者在其中写入。在第二行之下是查找“PIBB”的响应者,而在它将所有受访者值设置为零:
计算Mr_Pibb = 0。If INDEX(Upcase(Other_Write_In),Upcase("PIBB"))>0 Mr_Pibb= 1。
执行。
运行以上代码后,如果单词“PIBB”出现在Other_Write_In变量的任何位置,则在Mr_Pibb
多变的。
上面的代码看起来很奇怪,但这是因为它有案例不敏感。
这意味着在检查之前,你没有把变量全部用大写字母输入。而且,即使您输入“pibb”来查找文本,它仍然会找到“pibb”,因为命令告诉SPSS在搜索之前查找“pibb”的大写版本。
顺便提一下,如果您确实想要大写其他_WRITE_IN变量,则以下是语法:
计算oother_write_in = Upcase(tooth_write_in)。
可执行程序。
为了补充这一点,你可以用小写表示变量:
计算oother_write_in = lowcase(tooth_write_in)。
可执行程序。
SPSS语法:值得麻烦
一开始可能很难,但是设置语法可以让您在更短的时间内更深入地了解调查数据。如果你有兴趣了解更多,你可以复习这个帖子,它演示了使用GUI接口时获得从SPS生成的语法的三种方法。
你对SPSS有什么迫切的问题吗?在评论中给我们一个提示,Joe可能会在以后的文章中回答他们!
生物:
Joe Glines是联合创始人the-Automator这是一家专门从事自动化报告和日常任务的小公司。他是SPSS和市场研究方面的专家,并将定期将他的专业知识带到Alchemer博客。