变量 Variable

文摘   2024-10-08 23:43   泰国  

1. 变量(variable)

定义:指在数量上或质量上可变的事物的属性。变量可分为量的变量(连续变量)和质的变量(非连续变量)
定义:说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化。

  基本类型有分类变量(categorical variable)数值变量(metric variable)分类变量根据取值是否有序可分为无序分类变量和有序分类变量两种。无序分类变量取值的各类别间是不可以排序的。比如,“上市公司所属的行业”这一变量取值为“制造业”“金融业”“旅游业”等,这些取值之间不存在顺序关系。有序分类变量也称顺序变量,其取值的各类别间可以排序。比如,“对商品的评价”这一变量的取值为“很好“好”“一般”“差”“很差”,这5个值之间是有序的。

  数值变量是取值为数字的变量,也称为定量变量(quantitative variable)。例如,“企业销售额”“某只股票的收盘价”“生活费支出”“投掷一枚色子出现的点数”等变量的取值可以用数字来表示,都属于数值变量。数值变量根据其取值的不同,可以分为离散变量(discrete variable)连续变量(continuous variable)。离散变量是只能取有限个值的变量;连续变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的。

  • “value”(值)就是“variable”(变量)的特征;

  • “variable”(变量)是“value”(值)所描述的对象。

  • 名义变量(Nominal variable):这类变量的value都是一些没办法排序也没办法定量的东西,比如 “性别”, “宗教”,“民族“,”专业“, “出生地”,“国籍“。这类变量的value一般都不是数字,如果是数字,那也不代表着什么数字本身的含义。比如“篮球运动员号”这个变量,虽然有的球员是“29”号,有的是“40”号,这只是为了区分开彼此的“ID” 而已,它不代表29号球员就比40号小或者能力差,也没什么其他的含义。
  • 有序变量(Ordinal variable):这类变量的value可以按照一定逻辑进行排序,从低往高排,或者从高往低排。比如 “一道题困难的程度”(变量值 =不困难,还行,挺困难),“你对某陈述句的同意程度”(变量值=非常不同意,不同意,中立,同意,非常同意), “学生的年级”(变量值=一年级,二年级,三年级)-------这些变量的value内容就更丰富了,你看,对于一个normal variable来说,你只能知道它的变量值是什么,不能知道变量值之间的任何关系;而对于ordinal variable来说,你已经可以知道它的各个value之间的高低排序了。
变量的四种测量尺度
  • 定类变量(nominally scaled variable):利用无权重或无数值的符号以识别变量的不同水平。例如,研究者经常想要考察在一些变量(如收入)上是否存在男女差异。大多数计算机软件处理统计数据时都要求这种性别变量用数字赋值以代表分组。例如,男性用“0”表示,女性用“1”表示。此时,取值1并不意味着比取值0具有更高评价。0和1只不过是指代各组的名称或标签而已。
  • 定序变量(ordinal variable):取值含有权重。我若想知道美国十大富豪令最富有的人取1,第二富的人取2,依此类推,直到取10。这一赋值系统告诉我,这10个最富有的美国人各自相对于其他人的排位如何(例如,比尔·盖茨是1;奥普拉·温弗瑞是8,等等),但没有提供关于取值间距离的信息。于是,我知道首富比次富更富有,但不知道前者的财富比后者多1美元还是多10亿美元。
  • 定距型变量(Interval variable ):这类变量的value不仅可以排序,而且每个value之间的数值差(interval) 还是有意义的。比如“华氏度”(Fehrenheit)这个变量,(变量值=1度,2度,3度….) 1度与3度之间差了两度,与2度与4度 之间差的温度相同。---反过来看ordinal variable就不具有这个能力了,你说不出“非常不同意”与“不同意”之间的差距是多少,也无法说出这个差距和“同意”与“非常同意”之间的差距是不是一般大,你只能说明他们两个之间在程度上的排序谁强谁弱。再比如说 “几点钟”这个变量也是interval的(value =1pm, 2pm, 3pm…),1点和2点之间的差距是有意义的,就是一个小时,这跟2点和3点,3点和4 点之间差的一小时是一样的。
  • 定比型变量(Ratio variable):拥有最高级别的可定量化能力,可以做的分析种类最多,它的value不仅兼具以上三种变量的全部功能,而且它的“零点”是真的有意义的,是指真的为0。生活里好多这种变量,比如,“年龄”,“学生数量”,“工资”-----0年就是0岁,0个学生就是没有学生,0元就是没有工资----这些都有实际意义。再看上面的interval variable----0华氏度,不代表没有温度,只是说温度是0这个刻度;而“零点钟”也不代表没有时间,只是代表当时时间的标度是0这个时刻。
如何区分四种变量的一个方法:
  • 对于nominal variable: 它们的变量值只能用“相等”或“不等”来表示;

  • 对于ordinal variable: 它们的变量值之间可以用“大于”或“小于”的关系来表示;

  • 对于Interval variable: 它们的变量值之间可以“加减”;

  • 对于ratio variable: 它们的变量值之间可以“乘除”。

2. 连续变量

定义:指变量的所有可能取值是连续的量变而不是跳跃式的质变。例:被试的年龄。

3. 非连续变量

定义:指变量的取值只能是间断的取值而非连续的量变,也称间断变量。例:种族、性别。

  我们可以把实验中的变量分为两类,一类是实验条件(即自变量),另一类是在这些实验条件下产生的结果(即因变量)。在实验条件中,一类是对因变量不产生影响的实验条件,称为无关变量(irrelevant variable);另一类是对因变量产生影响的实验条件,称为相关变量(relevant variable)

  无关变量因为不产生影响所以无关,这里指的无关是没有相关关系或因果关系。但是无关变量有可能是本质上真的就是无关的无关变量,也可能是研究者一开始猜测认为无关但没有发现其本质是有关的相关变量,这是后来在经过实验研究的过程中证明其有关的,但研究者又不用以研究,此时称为额外变量,实验者要再去控制住其对因变量的影响,这时称为控制变量。

4. 自变量(independent variable IV也称独立变量刺激变量

定义:指在实验中由实验者操作和控制的变量。
定义:指的是由实验者操纵控制、对被试的反应产生影响的变量。
定义:依假设决定因变量取值的变量。由研究者所控制, 但并非总是如此。
定义:在模型中不会受到其他变量所影响的变量,也就是研究者可以操作的变量。

5.因变量(dependent variableDV也称依从变量反应变量

定义:指由自变量的变化而引起行为上的变化,是研究者力图测量、记录的行为指标。

定义:在实验中,被试对自变量操作的反应指标,即实验者观察和记录的随自变量变化而变化的被试行为。

定义:在实验中由操纵自变量而引起的被试的某种特定反应称为因变量。

定义:会受到自变量影响的变量,也就是研究者想要预测的结果变量。

5.无关变量(irrelevant variable)也称额外变量控制变量

定义:除了实验规定的自变量外,一切能够影响实验结果的变量。

定义:非研究变量因与某特定研究目标无关。

额外变量(extraneous variable)是指在实验过程中除自变量以外任何能对因变量产生影响的变量。在任何时候,被试的行为反应都会受到来自内外环境因素的影响

控制变量(controlled variable,CV与实验目的无关,但又对被试的反应有一定影响,需要在研究过程中加以控制的变量。

通常包括两大类:一类是与实验目的无关的、相对恒定的客观条件对实验结果产生的影响,这种影响通常是在一个恒定的水平上下波动,我们将这种额外变量称为系统的额外变量。系统的额外变量对实验结果会产生系统误差(Systematic Error),如实验仪器本身的性能对实验结果产生的影响,再如不能够消除的、被控制在恒定水平的额外变量对实验结果产生的相对稳定的影响,这种影响对所有的被试都是一致的,仪器的性能和精确性越好,产生的系统误差也就越小。另一类是随机的、偶然的出现的、不可预期的与实验目的无关的,但又对实验结果有一定影响的因素,这些因素称为随机的额外变量,随机变量引起的误差称为随机误差(Stochastic Error)

6.相关变量(relevant variable)

定义:指相互之间存在相关关系的变量,变量之间在发展变化的方向和大小存在一定的关系,但不能确定它们之间哪个是因、哪个是果。

心理学实验涉及的自变量很多,大致可分为:作业变量、环境变量、被试变量、暂时的被试变量。

7. 作业变量
定义:指试验中被试的任务,或试验中所呈现的和被试任务有关的某种刺激。
定义:把任务的任何特性作为自变量来操纵,称这种自变量为作业变量。
例:迅速呈现的字母串、记忆词表、错觉图形。

8. 环境变量

定义:指研究者改变实验环境中各种环境因素的任何特性时,改变了的环境特性即为环境自变量。
例:实验室的照明情况、噪声强度。

9. 被试变量  也称机体变量

定义:可能影响对某种刺激反应的被试的特性因素称为被试变量。

定义:指在外界条件一致的情况下,被试间不同程度的持续性特征。

例:被试的性别、年龄、健康状况、智力、受教育水平、人格特征、动机、态度、内驱力。

有些可以被研究者主动加以操纵和改变从而成为真正的自变量,如:内驱力强度可用禁食或禁饮的时间加以操纵。
有些是被试本身固有的属性,只能测量而无法真正操控,如:智力、受教育水平、性别。

10. 暂时的被试变量

定义:指通过主试的言语、态度以及用某些方法使被试的特性、机能状态等方面产生一时的变化,由这种一时的变化作为自变量的被试因素,称为暂时的被试变量。
例:疲劳、焦虑、恐惧、奖励、惩罚、饥饿等。
例:采用双耳分听法,让被试的两只耳同时听到不同的内容。让左右耳同时关注不同的内容,这与其日常生活习惯是不同的。

例:利用半视野速示技术,让被试用左眼或右眼来辨认其中的刺激,用单眼辨认刺激,与日常行为也是不同的。

根据变量是否成为一特定研究所要操作的对象,变量可分为研究变量非研究变量。前者指某特定的研究所要操作的变量;后者指某特定研究所要操作的变量以外的其他变量。研究变量可以是因果变量,也可以是相关变量;可以是主体变量,也可以是主、客体两类变量;可以是操作性变量,也可以是非操作性变量;可以是直接测量变量,也可以是间接测量变量。在实验研究中,如果无关变量对研究结果产生了影响,混淆了实验处理的效果,又被称为混淆变量

无关变量是以研究者是否将其作为研究目的说法,如果它对因变量产生影响但它不是研究者关心的有时也称无关变量,这里指的无关是研究者认为和研究目的无关,在这个角度中,就算这个无关变量对因变量产生影响了,本质上是两者是相关的,但认为这个变量与本次研究目的无关,这时也称其为无关变量。

实验的“人为性”很突出,这不仅体现在对自变量的操纵上,还体现在对无关因素的控制上。无关变量,也称于扰变量,指在实验中除自变量之外所有可能对被试行为发生影响的变量。无关变量有不同的来源。有些无关变量来自被试方面,如年龄、性别、文化、身体状况,以及他们的情绪、动机、兴趣、态度、习惯,等等;有些来自客观环境方面,如实验场所的噪声、照明、温度等;还有的来自主试方面,主试的态度、语言的准确性、操作是否熟练等;还有的来自时间方面,如自然成熟、练习、疲劳。无关变量在实验中需要严格控制,如果对这些变量缺乏控制,会直接影响实验结果,降低实验效度。

主要存在于相关研究中。
11. 因果变量:
定义:指相互之间存在因果关系的变量,其中一个或多个是自变量,另一个或多个是因变量,
自变量、因变量主要存在于实验研究中,在其他各类研究中也可存在。
以研究对象为主体,可将变量分为主体变量与客体变量。
12. 主体变量:
定义:指存在于研究对象主体身上的各种变量。
如:性别、年龄、教育水平、性格、情绪、动机、态度、兴趣等。

在实验研究中常称的被试变量、机体变量就是主体变量。

13. 客体变量
定义:指存在于研究对象以外的各种变量。
如:团体气氛、文化特征(集体主义文化和个体主义文化)、他人行为(积极行为和消极行为)、他人态度等。
在实验研究中主试变量相对于研究对象主体来说是一种客体变量。

根据是否可直接对变量进行测量,可将变量分为直接测量变量和间接测量变量

14. 直接测量变量:
定义:指可直接测量的变量。
如:年龄、身高、体重、学习成绩、教学方法、学习时间、家庭结构等。

15. 间接测量变量:

定义:指不可直接测量的变量,即无法直接观察、测量的内部心理状态特征的变量。
如:动机、智力、态度、友谊、价值观等。

从变量是否可由研究者主动加以操作角度划分,可分为操作性变量和非操作性变量

16. 操作性变量:
定义:指研究者可主动加以操作的变量。
例:刺激呈现时间、教学方法、惩罚方式、学习次数、奖品数量、学习内容等。
17. 非操作性变量:
定义:指在研究前已经存在 或 研究时研究者无法主动加以操作的变量。
例:年龄、生理成熟过程、性别、社会经济地位、家庭结构、父母职业、受教育水平等。

根据变量是否成为一特定研究所要操作的对象,可分为研究变量和非研究变量

18. 研究变量:
定义:指某特定的研究所要操作的变量。
研究变量可以是因果变量、相关变量、主体变量、主客体两类变量、操作性变量、非操作性变量、直接测量变量、间接测量变量。

19. 非研究变量:

定义:指某特定的研究所要操作的变量以外的变量。
非研究变量因与某特定研究目标无关,也称为无关变量。
在无关变量中,对研究结果有影响的变量需要在研究过程中加以控制,这种无关变量也称为控制变量。
在实验研究中,如果无关变量对研究结果产生影响,混淆了实验处理的效果,也称为混淆变量。
e.g.:研究不同动机强度对考试成绩的影响。动机强度是研究变量,是因果变量中的自变量,是主体变量、可操作性变量、间接测量变量。
---------------------
20. 中介变量(Mediator , Me)

定义:指位于两个变量之间的、被用于解释两个变量之间关系的变量,起中介作用。

定义:考虑自变量X对因变量Y的影响,如果X通过影响变量Me而对Y产生影响,则称Me为中介变量,中介变量是自变量X对因变量Y产生影响的实质性的、内在的原因。

作用:了解在自变量对因变量影响之中,会不会因为自变量透过某个特定的中介变量而影响因变量。 在于能否正确解释研究变量之间的关系。

例:奖励方式(自变量)会引起学习成绩(因变量)的变化,可能存在的中介变量是学习动机,即外在奖励增强了学习动机,从而提高学习成绩。上司的归因研究:下属的表现——上司对下属表现的归因——上司对下属表现的反应,其中的“上司对下属表现的归因”为中介变量。

如果一个变量与自变量或因变量相关不大,它不可能成为中介变量,但有可能成为调节变量。理想的调节变量是与自变量和因变量的相关都不大。有的变量,如性别、年龄等,由于不受自变量的影响,自然不能成为中介变量,但许多时候都可以考虑为调节变量。对于给定的自变量和因变量,有的变量做调节变量和中介变量都是合适的,从理论上都可以做出合理的解释。
回归模型路径图:这是自变量X与因变量Y这两个变量之间因果关系的最简单模型。由X指向Y的箭头是X能预测Y,这条路径的系数用c表示,它是自变量X对因变量Y的总效应,e1表示Y中没有被它与X之间关系所解释的部分,即回归残差。

中介模型路径图:自变量X影响中介变量M,而M又影响因变量Y,有一个潜在的中介关系X->M->Y。从X到Y还有一条不经过中介变量M的路径,就是X对Y的直接效应,以下是几个系数的含义,注意直接效应c'与总效应c的区别。
a:自变量X对中介变量M的影响。
b:是控制了自变量X后,中介变量M对因变量Y的影响。
c’:X对Y的直接效应。
ab:表示中介效应。
c 是X对Y的总效应,ab是经过中介变量M的中介效应(mediating effect),c′是直接效应。当只有一个中介变量时‚效应之间的关系可以表示为:c=c′+ab。

中介的两种类型

完全中介:在检验中介效应时,假定自变量X与因变量Y之间有较高的相关,当在他们之间加入中介变量M时,如果自变量X与因变量Y的相关或回归系数明显降低,当降低到0时称为完全中介。
部分中介作用:X影响Y时,一部分是直接影响,一部分是通过中介变量M去影响的,从另一个角度说,x对y的关系本来就显著了(本来就有影响),引进了m之后,整体而言,比一开始x与y的联系更强。
使用回归方法检验中介作用

中介效应的检验和估计方法

一般说来,简单的分析该变量是否是中介变量可以用线性回归:

  • 首先假定自变量与因变量之间有较高的相关,当在它们之间加入中介变量时,如果自变量与因变量的相关或回归系数明显降低(降低到0就是完全中介作用)就可以认为中介效应明显,即中介变量能有效解释自变量与因变量的关系。

  • 依次检验回归系数 a、b(完全中介效应还要检验 c′)的显著性。
  • 检验经过中介变量的路径上的回归系数的乘积 ab 是否显著。
  • 检验 c’与 c 的差异是否显著。

但要更严谨的话,就要采用结构方程,一般分为三步:

  • 首先分别检验每一个变量(包括自变量和第三变量)的主效应是否显著;
  • 第二步是将自变量放入回归方程中,检验自变量的效应;
  • 第三步,将第三变量也移入回归方程中,检验自变量的效应,若自变量的效应与之前相比大大减少甚至变为零,那么该变量的确就起到了中介的作用。
推论要求依次证明:
  • X→Y:自变量X对因变量Y有影响且显著相关。
  • X→Z:自变量X对中介变量Z有影响且显著相关。
  • Z→Y:中介变量Z对因变量Y有影响且显著相关。

21. 调节(干扰)变量(Moderator , Mo)

定义:指其系统变化可以改变其他两个变量之间关系的变量,起调节作用。当变量Mo取不同水平的值时,自变量X对因变量Y的影响程度不同,这时称Mo调节了X与Y之间的关系,变量Mo称为调节变量,X与Y之间关系依赖于Mo的程度。
定义:调节变量又称为干扰变量,是一个外来的变量,而这个外来变量会改变自变量与因变量之间关系的强弱(斜率),则称这个外来变量为调节变量,而调节变量可以是类别变量(如性别、受教育程度等等),也可以是连续变量(如年龄、薪资等等)。
定义:如果变量Y与变量X的关系是变量Mo的函数,称M为调节变量。就是说,Y与X的关系受到第三个变量Mo的影响,这种有调节变量的模型一般地可以用图1示意。调节变量可以是定性的(性别、种族、学校类型等),也可以是定量的(如年龄、受教育年限、刺激次数等),它影响因变量和自变量之间关系的方向(正或负)和强弱。

作用:了解自变量对因变量的影响在不同的情况下有何不同。在于能否真实地揭示变量之间在不同层次、水平上的关系。调节变量所要解释的是自变量在何种条件下会影响因变量,也就是说,当自变量与因变量的相关大小或正负方向受到其他因素影响时,这个“其他因素”就是该自变量与因变量之间的调节变量,调节变量影响自变量和因变量之间关系的方向(正或负)和强弱。

例:在不同智力组的儿童中,学习努力程度与学习成绩的相关程度是不同的,智力水平对于上述两个变量的关系来说就是一个调节变量。

调节变量可以是定性的(如性别、种族、学校类型等) ,也可以是定量的(如年龄、受教育年限、刺激次数等) ,它影响因变量和自变量之间关系的方向(正或负)和强弱。
在做调节效应分析时,通常要将自变量和调节变量做中心化变换(即变量减去其均值)。最简单常用的调节模型,即假设Y与X 有如下关系:
Y=aX+bM+cXM+e (1)
可以把上式重新写成:Y=bM+(a+cM)X+e
对于固定的M ,这是Y对X 的直线回归。Y与X 的关系由回归系数a + cM 来刻画,它是M的线性函数, c衡量了调节效应的大小。

调节模型:


  • 一般不要求自变量X与调节变量M之间必须存在相关。
  • 如果自变量X是一个实验操纵变量,一般情况下,自变量X和调节变量M之间应该是相互独立的。
调节效应(moderating effect)与交互效应(interactioneffect)

对模型中调节效应的分析主要是估计和检验c。如果c显著(即H0:c=0的假设被拒绝) ,说明M的调节效应显著。c代表了X与M的交互效应,所以这里的调节效应就是交互效应。这样,调节效应与交互效应从统计分析的角度看可以说是一样的。

然而,调节效应和交互效应这两个概念不完全一样。在交互效应分析中,两个自变量的地位可以是对称的,其中任何一个都可以解释为调节变量;也可以是不对称的,只要其中有一个起到了调节变量的作用,交互效应就存在。这一点从有关讨论交互效应的专著中可以看出(例如,显变量之间的交互效应,潜变量之间的交互效应)。但在调节效应中,哪个是自变量,哪个是调节变量,是很明确的,在一个确定的模型中两者不能互换。

表1  显变量的调节效应分析方法

调节变量(M)

自变量(X)

类别

连续

类别

两因素有交互效应的方差分析(AN0VA),交互效应即调节效应。
方法1.分组回归:按M的取值分组,做Y对X的回归。若回归系数的差异显著,则调节效应显著。
方法2.调节变量使用伪变量,并将自变量中心化,做层次回归(同左下)。

连续

自变量使用伪变量,并将调节变量中心化。做层次回归:

1.做Y对X和M的回归,得测定系数。

2.做Y对X、M和XM的回归得R2²,若R2²显著高于R1²,则调节效应显著。或者,作XM的回归系数检验,若显着,则调节效应显著。

将自变量和调节变量中心化,做层次回归(同左)。
除了考虑交互效应项见外,还可以考虑高阶交互效应项(如Mf²,表示非线性调节效应;MX²,表示曲线回归的调节)。

调节效应分析和交互效应分析大同小异。这里分两大类进行讨论。一类是所涉及的变量(因变量、自变量和调节变量)都是可以直接观测的显变量(observable variable) ,另一类是所涉及的变量中至少有一个是潜变量(latent variable) 。

显变量的调节效应分析方法。调节效应分析方法根据自变量和调节变量的测量级别而定。变量可分为两类, 一类是类别变量(categorical variable) ,包括定类和定序变量,另一类是连续变量(continuous variable) ,包括定距和定比变量。定序变量的取值比较多且间隔比较均匀时,也可以近似作为连续变量处理。表1分类列出了显变量调节效应分析方法。

当自变量和调节变量都是类别变量时做方差分析。当自变量和调节变量都是连续变量时,用带有乘积项的回归模型,做层次回归分析: (1)做Y对X和M 的回归,得测定系数R21。(2)做Y对X、M 和XM 的回归得R22 ,若R22 显著高于R21 ,则调节效应显著;或者,做XM 的偏回归系数检验,若显著,则调节效应显著。

当调节变量是类别变量、自变量是连续变量时,做分组回归分析。但当自变量是类别变量、调节变量是连续变量时,不能做分组回归,而是将自变量重新编码成为伪变量( dummy variable) ,用带有乘积项的回归模型,做层次回归分析。

References:
  • Babbie, E. R. (2013). The basics of social research. Cengage Learning.

  • Schwester, R. W. (Ed.). (2015). Teaching research methods in public administration. IGI Global.
  • James L R,Brett JM, Mediators, moderators and tests formedialion. Joumal of Applied Psychology,1984,69(2):307 ~321
  • Baron R M,KenyDA.The moderator-mediater variabledistinetion in social psychological research : Coneeptual, strategie ,and statistical considerations. Joural of Personality and SoeialPsyehology,1986,51(6):1173~1182
  • 《统计学(第八版)》贾俊平,何晓群,金勇进,中国人民大学出版社 2000年9月第1版
  • 《白话统计学(第3版)》蒂莫西·C·厄丹(Timothy C. Urdan) 中国人民大学出版社2013年12月第1版
  • 《实验心理学》白学军 中国人民大学出版社 2017年7月第2版
  • 《实验心理学》郭秀艳 人民教育出版社 2019年7月第2版
  • 《实验心理学》张学民、舒华 2011年10月第3版
  • 《心理与教育研究方法》董奇 北京师范大学出版社 2019年7月第2版
  • 《心理学研究方法》辛自强 北京师范大学出版社 2017年10月第2版
  • 温忠麟,叶宝娟.中介效应分析:方法和模型发展[J].心理科学进展, 2014, 22(005):731-745.DOI:10.3724/SP.J.1042.2014.00731.
  • 卢谢峰,韩立敏.中介变量、调节变量与协变量——概念、统计检验及其比较[J].心理科学, 2007, 30(4):3.DOI:10.3969/j.issn.1671-6981.2007.04.040.
  • 温忠麟,侯杰泰,张雷.调节效应与中介效应的比较和应用[J].心理学报, 2005(2).

菁华的学习笔记
学而时习之,不亦说乎
 最新文章