1. 变量(variable)
基本类型有分类变量(categorical variable)和数值变量(metric variable)。分类变量根据取值是否有序可分为无序分类变量和有序分类变量两种。无序分类变量取值的各类别间是不可以排序的。比如,“上市公司所属的行业”这一变量取值为“制造业”“金融业”“旅游业”等,这些取值之间不存在顺序关系。有序分类变量也称顺序变量,其取值的各类别间可以排序。比如,“对商品的评价”这一变量的取值为“很好“好”“一般”“差”“很差”,这5个值之间是有序的。
数值变量是取值为数字的变量,也称为定量变量(quantitative variable)。例如,“企业销售额”“某只股票的收盘价”“生活费支出”“投掷一枚色子出现的点数”等变量的取值可以用数字来表示,都属于数值变量。数值变量根据其取值的不同,可以分为离散变量(discrete variable)和连续变量(continuous variable)。离散变量是只能取有限个值的变量;连续变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的。
“value”(值)就是“variable”(变量)的特征;
“variable”(变量)是“value”(值)所描述的对象。
名义变量(Nominal variable):这类变量的value都是一些没办法排序也没办法定量的东西,比如 “性别”, “宗教”,“民族“,”专业“, “出生地”,“国籍“。这类变量的value一般都不是数字,如果是数字,那也不代表着什么数字本身的含义。比如“篮球运动员号”这个变量,虽然有的球员是“29”号,有的是“40”号,这只是为了区分开彼此的“ID” 而已,它不代表29号球员就比40号小或者能力差,也没什么其他的含义。 有序变量(Ordinal variable):这类变量的value可以按照一定逻辑进行排序,从低往高排,或者从高往低排。比如 “一道题困难的程度”(变量值 =不困难,还行,挺困难),“你对某陈述句的同意程度”(变量值=非常不同意,不同意,中立,同意,非常同意), “学生的年级”(变量值=一年级,二年级,三年级)-------这些变量的value内容就更丰富了,你看,对于一个normal variable来说,你只能知道它的变量值是什么,不能知道变量值之间的任何关系;而对于ordinal variable来说,你已经可以知道它的各个value之间的高低排序了。
定类变量(nominally scaled variable):利用无权重或无数值的符号以识别变量的不同水平。例如,研究者经常想要考察在一些变量(如收入)上是否存在男女差异。大多数计算机软件处理统计数据时都要求这种性别变量用数字赋值以代表分组。例如,男性用“0”表示,女性用“1”表示。此时,取值1并不意味着比取值0具有更高评价。0和1只不过是指代各组的名称或标签而已。 定序变量(ordinal variable):取值含有权重。我若想知道美国十大富豪令最富有的人取1,第二富的人取2,依此类推,直到取10。这一赋值系统告诉我,这10个最富有的美国人各自相对于其他人的排位如何(例如,比尔·盖茨是1;奥普拉·温弗瑞是8,等等),但没有提供关于取值间距离的信息。于是,我知道首富比次富更富有,但不知道前者的财富比后者多1美元还是多10亿美元。 定距型变量(Interval variable ):这类变量的value不仅可以排序,而且每个value之间的数值差(interval) 还是有意义的。比如“华氏度”(Fehrenheit)这个变量,(变量值=1度,2度,3度….) 1度与3度之间差了两度,与2度与4度 之间差的温度相同。---反过来看ordinal variable就不具有这个能力了,你说不出“非常不同意”与“不同意”之间的差距是多少,也无法说出这个差距和“同意”与“非常同意”之间的差距是不是一般大,你只能说明他们两个之间在程度上的排序谁强谁弱。再比如说 “几点钟”这个变量也是interval的(value =1pm, 2pm, 3pm…),1点和2点之间的差距是有意义的,就是一个小时,这跟2点和3点,3点和4 点之间差的一小时是一样的。 定比型变量(Ratio variable):拥有最高级别的可定量化能力,可以做的分析种类最多,它的value不仅兼具以上三种变量的全部功能,而且它的“零点”是真的有意义的,是指真的为0。生活里好多这种变量,比如,“年龄”,“学生数量”,“工资”-----0年就是0岁,0个学生就是没有学生,0元就是没有工资----这些都有实际意义。再看上面的interval variable----0华氏度,不代表没有温度,只是说温度是0这个刻度;而“零点钟”也不代表没有时间,只是代表当时时间的标度是0这个时刻。
对于nominal variable: 它们的变量值只能用“相等”或“不等”来表示;
对于ordinal variable: 它们的变量值之间可以用“大于”或“小于”的关系来表示;
对于Interval variable: 它们的变量值之间可以“加减”;
对于ratio variable: 它们的变量值之间可以“乘除”。
2. 连续变量
定义:指变量的所有可能取值是连续的量变而不是跳跃式的质变。例:被试的年龄。
定义:指变量的取值只能是间断的取值而非连续的量变,也称间断变量。例:种族、性别。
我们可以把实验中的变量分为两类,一类是实验条件(即自变量),另一类是在这些实验条件下产生的结果(即因变量)。在实验条件中,一类是对因变量不产生影响的实验条件,称为无关变量(irrelevant variable);另一类是对因变量产生影响的实验条件,称为相关变量(relevant variable)。
无关变量因为不产生影响所以无关,这里指的无关是没有相关关系或因果关系。但是无关变量有可能是本质上真的就是无关的无关变量,也可能是研究者一开始猜测认为无关但没有发现其本质是有关的相关变量,这是后来在经过实验研究的过程中证明其有关的,但研究者又不用以研究,此时称为额外变量,实验者要再去控制住其对因变量的影响,这时称为控制变量。
定义:指由自变量的变化而引起行为上的变化,是研究者力图测量、记录的行为指标。
定义:在实验中,被试对自变量操作的反应指标,即实验者观察和记录的随自变量变化而变化的被试行为。
定义:在实验中由操纵自变量而引起的被试的某种特定反应称为因变量。
定义:会受到自变量影响的变量,也就是研究者想要预测的结果变量。
定义:除了实验规定的自变量外,一切能够影响实验结果的变量。
定义:非研究变量因与某特定研究目标无关。
额外变量(extraneous variable)是指在实验过程中除自变量以外任何能对因变量产生影响的变量。在任何时候,被试的行为反应都会受到来自内外环境因素的影响
控制变量(controlled variable,CV)与实验目的无关,但又对被试的反应有一定影响,需要在研究过程中加以控制的变量。
通常包括两大类:一类是与实验目的无关的、相对恒定的客观条件对实验结果产生的影响,这种影响通常是在一个恒定的水平上下波动,我们将这种额外变量称为系统的额外变量。系统的额外变量对实验结果会产生系统误差(Systematic Error),如实验仪器本身的性能对实验结果产生的影响,再如不能够消除的、被控制在恒定水平的额外变量对实验结果产生的相对稳定的影响,这种影响对所有的被试都是一致的,仪器的性能和精确性越好,产生的系统误差也就越小。另一类是随机的、偶然的出现的、不可预期的与实验目的无关的,但又对实验结果有一定影响的因素,这些因素称为随机的额外变量,随机变量引起的误差称为随机误差(Stochastic Error)。
6.相关变量(relevant variable)
心理学实验涉及的自变量很多,大致可分为:作业变量、环境变量、被试变量、暂时的被试变量。
8. 环境变量
9. 被试变量 也称机体变量
定义:可能影响对某种刺激反应的被试的特性因素称为被试变量。
定义:指在外界条件一致的情况下,被试间不同程度的持续性特征。
例:被试的性别、年龄、健康状况、智力、受教育水平、人格特征、动机、态度、内驱力。
10. 暂时的被试变量
例:利用半视野速示技术,让被试用左眼或右眼来辨认其中的刺激,用单眼辨认刺激,与日常行为也是不同的。
无关变量是以研究者是否将其作为研究目的说法,如果它对因变量产生影响但它不是研究者关心的有时也称无关变量,这里指的无关是研究者认为和研究目的无关,在这个角度中,就算这个无关变量对因变量产生影响了,本质上是两者是相关的,但认为这个变量与本次研究目的无关,这时也称其为无关变量。
实验的“人为性”很突出,这不仅体现在对自变量的操纵上,还体现在对无关因素的控制上。无关变量,也称于扰变量,指在实验中除自变量之外所有可能对被试行为发生影响的变量。无关变量有不同的来源。有些无关变量来自被试方面,如年龄、性别、文化、身体状况,以及他们的情绪、动机、兴趣、态度、习惯,等等;有些来自客观环境方面,如实验场所的噪声、照明、温度等;还有的来自主试方面,主试的态度、语言的准确性、操作是否熟练等;还有的来自时间方面,如自然成熟、练习、疲劳。无关变量在实验中需要严格控制,如果对这些变量缺乏控制,会直接影响实验结果,降低实验效度。
在实验研究中常称的被试变量、机体变量就是主体变量。
根据是否可直接对变量进行测量,可将变量分为直接测量变量和间接测量变量
15. 间接测量变量:
从变量是否可由研究者主动加以操作角度划分,可分为操作性变量和非操作性变量
根据变量是否成为一特定研究所要操作的对象,可分为研究变量和非研究变量
19. 非研究变量:
定义:指位于两个变量之间的、被用于解释两个变量之间关系的变量,起中介作用。
作用:了解在自变量对因变量影响之中,会不会因为自变量透过某个特定的中介变量而影响因变量。 在于能否正确解释研究变量之间的关系。
例:奖励方式(自变量)会引起学习成绩(因变量)的变化,可能存在的中介变量是学习动机,即外在奖励增强了学习动机,从而提高学习成绩。上司的归因研究:下属的表现——上司对下属表现的归因——上司对下属表现的反应,其中的“上司对下属表现的归因”为中介变量。
中介的两种类型
中介效应的检验和估计方法
一般说来,简单的分析该变量是否是中介变量可以用线性回归:
首先假定自变量与因变量之间有较高的相关,当在它们之间加入中介变量时,如果自变量与因变量的相关或回归系数明显降低(降低到0就是完全中介作用)就可以认为中介效应明显,即中介变量能有效解释自变量与因变量的关系。
依次检验回归系数 a、b(完全中介效应还要检验 c′)的显著性。 检验经过中介变量的路径上的回归系数的乘积 ab 是否显著。 检验 c’与 c 的差异是否显著。
但要更严谨的话,就要采用结构方程,一般分为三步:
首先分别检验每一个变量(包括自变量和第三变量)的主效应是否显著; 第二步是将自变量放入回归方程中,检验自变量的效应; 第三步,将第三变量也移入回归方程中,检验自变量的效应,若自变量的效应与之前相比大大减少甚至变为零,那么该变量的确就起到了中介的作用。
X→Y:自变量X对因变量Y有影响且显著相关。 X→Z:自变量X对中介变量Z有影响且显著相关。 Z→Y:中介变量Z对因变量Y有影响且显著相关。
21. 调节(干扰)变量(Moderator , Mo)
作用:了解自变量对因变量的影响在不同的情况下有何不同。在于能否真实地揭示变量之间在不同层次、水平上的关系。调节变量所要解释的是自变量在何种条件下会影响因变量,也就是说,当自变量与因变量的相关大小或正负方向受到其他因素影响时,这个“其他因素”就是该自变量与因变量之间的调节变量,调节变量影响自变量和因变量之间关系的方向(正或负)和强弱。
例:在不同智力组的儿童中,学习努力程度与学习成绩的相关程度是不同的,智力水平对于上述两个变量的关系来说就是一个调节变量。
调节模型:
一般不要求自变量X与调节变量M之间必须存在相关。 如果自变量X是一个实验操纵变量,一般情况下,自变量X和调节变量M之间应该是相互独立的。
对模型中调节效应的分析主要是估计和检验c。如果c显著(即H0:c=0的假设被拒绝) ,说明M的调节效应显著。c代表了X与M的交互效应,所以这里的调节效应就是交互效应。这样,调节效应与交互效应从统计分析的角度看可以说是一样的。
然而,调节效应和交互效应这两个概念不完全一样。在交互效应分析中,两个自变量的地位可以是对称的,其中任何一个都可以解释为调节变量;也可以是不对称的,只要其中有一个起到了调节变量的作用,交互效应就存在。这一点从有关讨论交互效应的专著中可以看出(例如,显变量之间的交互效应,潜变量之间的交互效应)。但在调节效应中,哪个是自变量,哪个是调节变量,是很明确的,在一个确定的模型中两者不能互换。
调节变量(M) | 自变量(X) | |
类别 | 连续 | |
类别 | ||
连续 | 自变量使用伪变量,并将调节变量中心化。做层次回归: 1.做Y对X和M的回归,得测定系数。 2.做Y对X、M和XM的回归得R2²,若R2²显著高于R1²,则调节效应显著。或者,作XM的回归系数检验,若显着,则调节效应显著。 |
调节效应分析和交互效应分析大同小异。这里分两大类进行讨论。一类是所涉及的变量(因变量、自变量和调节变量)都是可以直接观测的显变量(observable variable) ,另一类是所涉及的变量中至少有一个是潜变量(latent variable) 。
显变量的调节效应分析方法。调节效应分析方法根据自变量和调节变量的测量级别而定。变量可分为两类, 一类是类别变量(categorical variable) ,包括定类和定序变量,另一类是连续变量(continuous variable) ,包括定距和定比变量。定序变量的取值比较多且间隔比较均匀时,也可以近似作为连续变量处理。表1分类列出了显变量调节效应分析方法。
当自变量和调节变量都是类别变量时做方差分析。当自变量和调节变量都是连续变量时,用带有乘积项的回归模型,做层次回归分析: (1)做Y对X和M 的回归,得测定系数R21。(2)做Y对X、M 和XM 的回归得R22 ,若R22 显著高于R21 ,则调节效应显著;或者,做XM 的偏回归系数检验,若显著,则调节效应显著。
当调节变量是类别变量、自变量是连续变量时,做分组回归分析。但当自变量是类别变量、调节变量是连续变量时,不能做分组回归,而是将自变量重新编码成为伪变量( dummy variable) ,用带有乘积项的回归模型,做层次回归分析。
Babbie, E. R. (2013). The basics of social research. Cengage Learning.
Schwester, R. W. (Ed.). (2015). Teaching research methods in public administration. IGI Global. James L R,Brett JM, Mediators, moderators and tests formedialion. Joumal of Applied Psychology,1984,69(2):307 ~321 Baron R M,KenyDA.The moderator-mediater variabledistinetion in social psychological research : Coneeptual, strategie ,and statistical considerations. Joural of Personality and SoeialPsyehology,1986,51(6):1173~1182 《统计学(第八版)》贾俊平,何晓群,金勇进,中国人民大学出版社 2000年9月第1版 《白话统计学(第3版)》蒂莫西·C·厄丹(Timothy C. Urdan) 中国人民大学出版社2013年12月第1版 《实验心理学》白学军 中国人民大学出版社 2017年7月第2版 《实验心理学》郭秀艳 人民教育出版社 2019年7月第2版 《实验心理学》张学民、舒华 2011年10月第3版 《心理与教育研究方法》董奇 北京师范大学出版社 2019年7月第2版 《心理学研究方法》辛自强 北京师范大学出版社 2017年10月第2版 温忠麟,叶宝娟.中介效应分析:方法和模型发展[J].心理科学进展, 2014, 22(005):731-745.DOI:10.3724/SP.J.1042.2014.00731. 卢谢峰,韩立敏.中介变量、调节变量与协变量——概念、统计检验及其比较[J].心理科学, 2007, 30(4):3.DOI:10.3969/j.issn.1671-6981.2007.04.040. 温忠麟,侯杰泰,张雷.调节效应与中介效应的比较和应用[J].心理学报, 2005(2).