本期目录
什么是“学习”(learning)?其基本形式是什么?
行为主义和激进行为主义对人类心智的态度如何?
什么是经典条件作用?什么是反射?什么是(无)条件刺激/反应?
经典条件作用的基本过程是什么样的?
CS和UCS之间有哪几种时间模式?
经典条件作用能够发生的条件是什么?
什么是操作性条件作用?什么是强化相倚?什么是(正/负)强化?什么是逃脱/回避条件作用?什么是(阳/阴性)惩罚?
什么是刺激泛化和刺激辨别?
什么是三项相倚?
什么是初级/条件性强化物?
强化程序表有哪些类型?其结果差异如何?
什么是本能漂移?
味觉—厌恶学习表明什么?
哪些行为无法用经典或操作性条件作用解释而要诉诸认知过程?
番外——那个今天在戒毒所偷偷吸食的毒品量比以往在家里还要少的瘾君子为什么却突然暴毙了?
什么是“学习”(learning)?其基本形式是什么?
学习(learning)定义为基于经验而使行为或行为潜能发生相对一致变化的过程(简单思考一下这个词和同被译为学习的study有何区别)。
学习首先是基于经验的过程。学习只有通过经验才能发生。经验包括吸收、评价、转换信息和做出反应来影响环境。学习受记忆影响,而记忆本身是经验的产物。行为或行为潜能发生变化表明无法直接进行观察的学习的发生,并且这种变化必须在不同场合表现出相对一致性,以排除随机扰动的可能。
习惯化和敏感化概括了学习的两种基本形式:前者指当刺激重复呈现时,行为回应会减少;后者指对重复呈现刺激的反应增强而非减弱。二者都符合学习的定义。
(学习似乎就是一种对(可塑造的)因果进行识别和反应的过程)
行为主义和激进行为主义对人类心智的态度如何?
华生开创的行为主义认为人们对感觉、表象和情感的言语报告太主观了,科学无法对这些内部的私人经验的准确性进行检验,我们能观察到的只有人们的外部行为,因此心理学的科学研究应着力于此。他说:“意识状态,如所谓精神现象,是无法被客观证实的,出于这一原因,它永远不会成为科学的数据。”(这很马歇尔、很萨缪尔森、很经济学)
华生是从可证伪性方面对内部状态和心理事件进行批评的,斯金纳则进一步扩展了他的观点,形成了激进行为主义。他认为,所谓的心智不过是外部环境的产物,随后人们又根据这种由外部环境所引致的心智(或意识)去产生相应的行为,那么我们为什么不直接抛掉这个无法观测的、假设出来的中间变量,而直接关注环境对行为的影响呢?行为主义的极端大概完全排除了所谓的自由意志。
什么是经典条件作用?什么是反射?什么是(无)条件刺激/反应?
经典条件作用是一种由一个刺激或事件预示另一个刺激或事件之到来的基本学习方式。有机体学习在两个刺激——一个先前不能诱发反应的刺激和一个天生能诱发反应的刺激之间形成一种联系。
反射(reflex)是一种由与有机体生物学相关的特定刺激自然诱发的现象,例如在某些自然条件下人们分泌唾液、瞳孔收缩、膝盖痉挛或眨眼睛。任何能够不经过学习这一条件便可自然诱发反射性行为的刺激叫无条件刺激(unconditioned stimulus, UCS),由无条件刺激诱发的行为叫无条件反应(unconditioned response, UCR)。另外一些刺激,它们本来是中性的,不会诱发特定的行为,但在它们与无条件刺激相匹配的条件下,产生了诱发特定行为的效力,这样的中性刺激称为条件刺激(conditioned stimulus, CS),匹配后CS所引发的特定行为或反应称为条件反应(conditioned response)。
经典条件作用的基本过程是什么样的?
首先,识别出引发UCR的UCS;然后将CS与UCS相匹配,使UCS诱发反应的同时存在CS的信息;最后将UCS撤掉,由CS直接诱发相应的CR,这样就可以说有机体习得了条件反应。
不过条件反应习得后也不是永久存在的,当CS逐渐和UCS脱钩后,CR会随着时间的推移越来越弱,最终,当单独呈现CR时,不再有相应的反应,此时就发生了消退过程。
不过,间隔一段时间后,即使没有再进行CS和UCS的重新匹配,CS也可能突然单独诱发CR,这种现象称为自发恢复。
当最初的配对重新恢复,进行消退后训练时,CR会迅速变得强大,所耗费的时间要小于初次习得。
CS和UCS之间有哪几种时间模式?
1.延迟条件作用。CS先出现并至少持续到UCS呈现。
2.痕迹条件作用。CS在UCS呈现之前被取消。
3.同时性条件作用。CS和UCS同时呈现。
4.倒摄条件作用。CS出现在UCS之后。
通常,延迟条件作用是最有效的;倒摄条件作用的效果最差,同时性条件作用次之。
经典条件作用能够发生的条件是什么?
简单来说,CS必须提供UCS将要到来的准确信息。首先,它们必须在时间上相对接近,并且要存在可靠的预期,最后,CS要比其他刺激提供额外的信息来预示UCS的出现。
什么是操作性条件作用?什么是强化相倚?什么是(正/负)强化?什么是逃脱/回避条件作用?什么是(阳/阴性)惩罚?
操作性条件作用指通过操纵有机体行为的结果对它们的行为发生影响,它是学习的另一基本方式。(可以简单理解为经典条件作用在结果相同情况下增加条件,以使人建立和习得新条件和结果之间的事前联系;而操作性条件作用在行为相同的情况下操纵结果,以使人习得行为和结果之间的事后联系)
强化相倚指某一行为和它使环境发生变化之间的一致性关系。必须要建立这种强化相倚才能使有机体意识到其行为与结果之间的因果联系(可类比UCS和CS之间的匹配)。
正强化指某一行为是由于令人喜爱的刺激的出现而产生的;负强化指某一行为是由于令人讨厌的刺激的解除而产生的。逃脱条件作用和回避条件作用是负强化的两种情境,前者使有机体在习得某种反应后可以逃离令人讨厌的刺激(事后),后者使有机体在习得某种反应后可以使它们讨厌的刺激免于出现(事前)。强化总是增加某一反应发生的概率。
阳性惩罚指有机体某一行为发生概率的降低是因为给予了令它感到厌恶的刺激;阴性惩罚指有机体某一行为发生概率的降低是因为剥夺了令它感到喜爱的刺激。惩罚总是减少某一反应再次发生的概率。
什么是刺激泛化和刺激辨别?
刺激泛化指与某一特定刺激相类似的刺激同样可以诱发行为或反应的现象。刺激辨别指在这些类似的同样可以诱发行为或反应的刺激族中逐渐辨别出一些特定的刺激,使得只有该种辨别性刺激才能诱发行为或反应。刺激泛化和刺激辨别在两种基本学习方式中均有体现。
什么是三项相倚?
三项相倚指辨别性刺激—行为—结果这一序列,行为主义者相信它能解释人的大多数行为。
什么是初级/条件性强化物?
初级强化物指由生物学因素所决定的人的自然欲求物,例如食物和水。当一些中性刺激和初级强化物联系在一起,这些中性刺激就作为条件性强化物影响行为和反应,它们可能经过多个链条的链接,也可能脱离初级强化物的作用而直接成为欲求对象。
强化程序表有哪些类型?其结果差异如何?
强化程序表代表我们通过什么样的程序来对反应进行强化。
固定比率程序表。强化物在有机体做出一定次数的反应后才出现。
可变比率程序表。强化物随机出现,但强化物之间的平均反应次数恒定。
固定间隔程序表。强化物经过一个固定的时间间隔后,有机体第一次做出某反应时才出现。
可变间隔程序表。强化物随机出现,但强化物之间的平均时间间隔恒定。
研究表明,一般而言,比率表比时间间隔表,可变程序表比固定程序表往往产生更高的反应速率和更强的抗消退能力。
什么是本能漂移?
本能漂移指后天习得的行为会朝着先天的本能行为漂移,任其自然发展可能会导致本能行为最终抑制习得行为,有些行为由于和本能相冲突甚至直接无法养成。
味觉—厌恶学习表明什么?
对于老鼠而言,它们只要建立了某种气味与自己身体生病的一次联系就足以永久保持对这种气味的避免,而如果与生病的联系是由噪音或灯光所预示的,那么这种联系会难建立并且脆弱得多。这表明一些条件的作用不仅依赖刺激与行为间的关系,而且依赖于遗传预先安排有机体将以何种方式对待环境刺激——生物可能在遗传因素中就已经对感觉线索的类型最有可能提示奖赏或危险的那些信号进行了编码。
哪些行为无法用经典或操作性条件作用解释而要诉诸认知过程?
即使只经历过一次路线演练,动物也会形成认知地图,为随后在路线发生改变时选择最优路线作准备,而非一有改变就不停试错。
概念性行为使动物对环境的结构进行概括化,形成分类,这也无法仅仅用简单的对具体个别事物的反应来解释。
人和其他动物可以通过观察进行学习,即使他们本身没有真正受到刺激,他们也可以从对他人受到刺激后结果的观察中习得相应的行为。
这些都要诉诸更加高级的认知过程。
(还有一种情况,即使人们没有亲身经历,也没有眼见他人经历,还是会根据一些被教授的律令来行事,这似乎跟想象有关)
番外
——那个今天在戒毒所偷偷吸食的毒品量比以往在家里还要少的瘾君子为什么却突然暴毙了?
当吸毒时,身体内部往往会做出反应来应对毒品的效应,以使我们重新建立体内的动态平衡,这种药物对抗反应是一种UCS。但如果服用毒品的环境总是一致的,它就会逐渐和UCS建立联系,使得环境本身形成CS,这样,在特定的环境出现时,在还未吸食毒品前,身体就已经开始形成CR,为建立动态平衡作准备,这使得在真正的UCR发生时,身体可以承受的药量可能更大。而如果突然改变了吸食的环境,身体没有预先做出CR,那么在原来情境中可以耐受的剂量在新情境中就成了过量剂量。
因此,这位瘾君子死于吸食环境的改变。(再次远离毒品!)
七日谈读书计划由来自中国人民大学、山东大学、华中农业大学、一桥大学等国内外知名高校的青年朋友组织成立。阅读领域主要为哲学、经济学、政治学、社会学等人文社会科学,也包括国学、历史、艺术、宗教神话等内容。我们的宗旨是“阅读、思考、分享、交流”。欢迎来自各个高校的渴望知识、愿意思考、接受交流、善于坚持的青年朋友加入我们。