行为主义的学习理论

文化 2024-12-07 01:14 北京

读书/笔记/分享

小引：读书觉有启发者，便稍加理董，录存于此。自渡亦渡人，如有帮助，还望帮忙转发，在此谢过。

行为主义的学习理论

由美国心理学家华生所创立的行为主义是20世纪最有影响的心理学流派之一，对西方心理学产生了深远的影响，被称为西方心理学第一势力（first force）。

行为主义最有影响的两位大师——华生和斯金纳都对学习理论作出了巨大贡献，而另外两位杰出人物，美国心理学家桑代克和俄国生理学家巴甫洛夫虽然不属于行为主义学派，后者严格来说并不是一位心理学家，但他们的研究对行为主义学习理论的形成有重要影响。

本节将对以上四位学者关于学习的理论和研究加以介绍。

一、桑代克的联结主义

桑代克（Thorndike,1874—1949）是教育心理学体系和联结主义心理学的创始人，是心理学史上第一个用实验来研究动物心理的人。

受达尔文进化论思想的影响，桑代克认为人和动物的心理具有连续性，在对动物学习的实验研究基础上，提出了联结主义学习论。

为表彰他对教育心理学的卓越贡献，美国心理学会教育心理学分会设立了“桑代克奖”，这个奖项是授予教育心理学家的最高荣誉。

桑代克认为学习是联结的形成和巩固，所谓联结即是刺激与反应之间建立起的稳固的联系。联结的建立是通过尝试错误的方式形成的。

他这种学说来自于他著名的迷箱实验。在这个实验中，桑代克把一只饥饿的猫关进一个有机关的迷箱里，箱外放一条鱼。为了吃到鱼，猫就会乱蹦乱跳，企图逃出迷箱。

在做出许多无效的动作后，猫偶然触动了机关，打开了箱门，跑到外面吃到了鱼。将猫重新放回迷箱，会发现，猫经过几次尝试后，逃出的时间变得越来越短。

也就是说，猫在反复尝试后，逐渐抛弃了不成功的反应，将成功的反应保留了下来。由此桑代克认为动物学习是一个盲目尝试、不断减少错误的过程，即试误的过程。猫通过试误建立起刺激与反应的联结，从而获得正确的解决问题的方式，这个过程是不需要思维和推理的。

桑代克认为，尽管人类的学习更为复杂，也存在其他形式的学习，但人类学习与动物学习具有相似性，其本质也是形成联结。

在动物实验的基础上，桑代克提出了三条学习定律：准备律、效果律和练习律。

1．准备律，学习者是否会对刺激做出反应，取决于他是否做好了准备。例如在迷箱实验中，猫只有在饥饿状态下，才会进行学习活动；如果猫吃饱了，只会蜷缩在那里睡觉，不会有任何试图逃出迷箱的行为。这条定律实际上是说学习需要由动机唤起。

2．效果律，如果一个反应带来的结果是令人满意的，学习就会发生；如果反应的结果是令人烦恼的，学习就不会发生。满意的程度越高，刺激—反应之间的联结就越强。

3．练习律，分为应用律和失用律。应用律指一个已形成的可变联结，若加以应用就会变强；失用律指一个已形成的可变联结，若久不应用，就会变弱。

1930年以后，桑代克对学习定律进行了修改。首先，他抛弃了练习律，他认为练习本身并不是一种很有效的学习方式，例如在一项实验中，让被试闭上眼睛画出长度为2、4、6、8英寸（1英寸=2.54厘米）的线段，虽然重复了上百次，但如果不对他们画线的结果给予反馈的话，被试最后一次画线的成绩同先前的成绩相比并无提高。可见，不知道结果的练习不可能有助于学习。

其次，他修改了效果律，最初他认为奖励和惩罚的效力是相当的，作用的性质是相反的。但后来的研究表明，奖励可以加强联结，但惩罚却不一定减弱联结。

在一项实验中，主试给被试念一些常见的单词，并告诉被试，每个单词都与一个号码相连，要求被试猜测。主试对被试讲出的号码大多不给予反馈，只是偶尔说“对”（奖励）或“不对”（惩罚）。

念完所有单词后，立即进行保持测验，结果发现，没有得到任何反馈的单词号码保持率为10%，得到强化的保持率为20%，受到惩罚的保持率为15%～16%（施良方，1992）。可见，惩罚不但没有令联结减弱，反而令其增强了。

二、巴甫洛夫的经典条件作用

俄国生理学家巴甫洛夫（И.П.Павлов,1849—1936）堪称现代学习心理学之父，他通过对动物条件作用形成过程的研究为学习理论奠定了科学的基础。

巴甫洛夫的经典条件作用实验是把一只狗放在一间黑暗的屋子里，打开灯，30秒后把食物放在狗的嘴里，诱导出分泌唾液的反射。开灯并提供食物，这个程序重复几次后，灯光，这个原本与分泌唾液无关的刺激，也会引起分泌唾液的反应。

巴甫洛夫把食物叫做无条件刺激，而灯光是条件刺激，因食物引起的分泌唾液叫做无条件反射，灯光引起的唾液分泌叫做条件反射，整个过程叫做条件作用。

经过实验研究，巴甫洛夫提出了条件作用的几个原则。

1．条件刺激的呈现应在无条件刺激之前，如先开灯后给食物。巴甫洛夫及其学生发现，如果条件刺激在无条件刺激之后呈现，很难对动物形成条件作用。其他的研究则发现，条件刺激在无条件刺激呈现之前的1.5秒呈现，最易形成条件作用。

2．消退。条件作用的形成并不是一劳永逸的。如果只呈现条件刺激，而不伴随无条件刺激，几次以后，动物将不会再做出条件反应，即反应消退了。

3．自然恢复。已经消退了的条件反应，经过一段时间的休息之后，当条件刺激又重新单独出现时，条件反应也会重新出现，我们就说条件反应在消退后又自然恢复了。

4．刺激的泛化。条件作用的形成往往是针对某一特定刺激的，但是动物有能力对与条件刺激相似的一些刺激做出条件反应。如狗被训练对某一声调的铃声做出条件反应后，它也会对不同声调的铃声做出反应。这种现象叫做泛化。

5．分化。泛化最终让位给分化的过程。如果继续呈现不同音调的铃声而不伴随食物，狗就开始更有选择性地做出反应，只对与最初的条件刺激最相似的刺激做出反应，这叫做刺激的分化。

6．高级条件作用。当条件作用形成后，可单独用条件刺激与另一中性刺激建立起联结。如巴甫洛夫的学生曾用铃声建立起狗的条件作用，然后在铃声出现时伴随着一个黑色的方形，几次以后，黑色的方形独自也可以引起狗分泌唾液。这种情况叫做二级条件作用，巴甫洛夫还发现有时甚至可建立三级条件作用。

三、华生的行为主义

华生（Watson,1878—1958）是行为主义的创始人，他坚持心理学应该成为一门纯粹客观的自然科学，并奉行科学、客观、控制、预测的研究取向。

当他读到巴甫洛夫的研究成果后，认为这正是心理学应该学习的研究范式，经典条件作用的原则不仅适用于动物，人类的大部分行为也服从经典条件作用原理，并应用条件作用的原理对情绪进行了研究。

华生认为婴儿出生时只有三种情绪反应：恐惧、愤怒和爱。引起这些情绪的无条件刺激一般只有一、两种，但是年长的儿童可以对很多的刺激产生这些情感反应，因此对这些刺激所产生的反应一定是习得的。例如，华生认为对婴儿来说只有两种无条件刺激可以引起恐惧，一种是突然的声响，另一种是失去支持物（如从高空落下），但年龄大点儿的儿童对很多事物：陌生人、猫、狗、黑暗等都感到恐惧。对这些事物的恐惧一定是习得的。如一个小孩对蛇的恐惧是因为当他看到蛇时听到了尖叫声，蛇因而成为了一种条件刺激。

华生和雷诺以一个11个月大的小男孩为被试，看能否通过条件作用让他对小白鼠产生恐惧。实验之初，小孩对小白鼠并不害怕，但经过条件作用后，小孩发生了很大变化。

实验过程如下：在小白鼠出现在小孩面前的同时，在小孩的背后用力击打一个物体发出巨响，引起孩子的惊吓反应。反复几次后，当只有小白鼠出现时，小孩也表现出害怕、逃避的反应。几天后，小孩对所有带毛的物体如狗、皮毛大衣等都感到害怕，可见，他的恐惧已经泛化。

华生的研究在实践上的主要应用是发展了一套对恐惧进行去条件作用的方法。这种方法在当代来说即是一种行为矫正或称之为系统脱敏法。

这个研究是针对一个叫皮特的三岁小男孩进行的，他是一个健康活泼的孩子，但对兔子等动物感到害怕。

华生和琼斯为消除其恐惧采用了如下程序：首先，在皮特喝下午茶时，将关在笼子里的兔子放在距离皮特较远且不会对他产生威胁的地方。

第二天，将兔子拿到较近的距离，直到皮特感到一丝不安。

接下来的每一天，兔子都被移近一点儿，但在实验者的关照下，并不会给皮特带来太多的麻烦。终于皮特可以做到一边吃东西一边与兔子一起玩。用同样的方法，琼斯消除了皮特对其他物体的恐惧。

四、斯金纳的操作性条件作用

从学习理论的观点看，经典条件作用似乎只限于对某些反射或先天的反应进行条件作用。对于人们是如何学习复杂的技能及进行主动的学习，经典条件作用很难进行解释，于是心理学家开始研究其他形式的条件作用。

斯金纳（Skinner,1904—1990）就是其中最有影响的一位。同华生一样，他也是一位行为主义心理学家，但他研究的条件作用并不是巴甫洛夫式的。

在斯金纳看来，巴甫洛夫所研究的反应其实是一种应答，是由刺激自动引起的，大多数这样的应答都是简单的反射。

斯金纳感兴趣的是操作性的行为，是对环境的主动操作。个体在环境中可能有多种反应，哪些行为保留下来或更可能再次发生，取决于行为发生之后所得到的强化。

为了研究操作性条件作用，斯金纳发明了一种仪器，叫做“斯金纳箱”。动物在里面可以自由活动，当它无意中压到了杠杆时，会得到食物作为奖励。以后，动物就会更经常地挤压杠杆。反应的比率作为测量学习的指标，当反应受到强化时，它发生的比率也会增加。

斯金纳认为，操作性行为在人类生活中比应答性行为扮演着更为重要的角色。如读书并不是由某一具体刺激引起的，而在于读书曾给我们带来的结果。如果读书得到的是奖励，如好成绩，人们就更可能投入这种行为。因此，行为是由其结果决定的。

操作性行为的保持和去除均与强化有直接关系，因此如何对行为进行强化就显得至关重要。形成操作性条件作用应注意以下原则。

1．强化与消退。

可充当强化的事物有很多，有些强化如食物或去除痛苦叫做一级强化，它们本身就带有强化的属性。有些强化，如成人的微笑、表扬或注意则是条件性强化。它们的效能取决于与一级强化的联结频率。

当行为得不到强化时，就会渐渐消退。如有些孩子的讨厌行为仅仅是为了得到成人的注意，如果对这些行为不予注意，这些不受欢迎的行为就会逐渐消失。

2．及时强化。

对反应及时给予强化，它才会保留下来。这一点对教育孩子有特别重要的意义。对好的行为及时表扬，这种行为再次发生的可能性就高，如果强化延迟了，行为将得不到加强。

3．操作性行为的获得并不是按照“全或无”的法则进行的，通常是逐步学会的。

儿童的行为获得也是如此。当儿童的行为向正确的方向发展时，就给予强化、肯定，并对他提出进一步要求，使其每取得一定的进步都会得到强化，通过这种方式，儿童最终掌握了完全正确的行为。

4．强化的时间安排。

人们的日常行为很少受到连续强化，大多都是间歇强化。如并不是每次看电影都会感到赏心悦目。间歇强化的不同安排会有不同的效果。

一种安排叫做固定间隔式，即每隔一段时间给予一次强化，这种安排下的反应速度是相当低的。另一种安排是固定比率式，即反应每达到一定的次数，即会获得奖励，这种安排能带来较高的反应速度。

但这两种安排在有机体得到强化后都会表现出一个反应安静期，仿佛他们知道距下一次强化还远着呢！这种安静期可以通过不定期强化或不定比率强化得以避免。

前者是将奖励的时间间隔进行灵活变动，后者是将能够得到奖励的反应次数设为可变的。在这两种情况下反应的速度都相当快，之所以能保持反应是因为奖励随时都可能来。

间歇强化形成的行为要比连续强化获得的行为更不易消退。当我们希望教会学生一个好的行为时，最好由连续强化开始，但是要想使行为保持下去，最好使用间歇强化。

5．负强化和惩罚。

前面提到的强化都是正强化，强化意味着提高了反应的速度或可能性。正强化是通过给予一些正面的结果，如食物、表扬、注意等方式加强了行为；负强化是通过去掉某些不好的、不愉快的刺激令反应得到增强。如学生为了避免受到老师的批评而认真学习，老师的批评就是负强化。

负强化与惩罚不同。惩罚不是为了增强而是试图去掉某些行为反应。当发生了某些不好的行为后，给予不愉快的刺激，这就是惩罚。但是惩罚往往不一定有效并会带来一定的负面结果。

首先，惩罚往往是将不良行为压抑下去，但并没有教导出新的行为。儿童并没有因惩罚而学会更有建设性的行为。

其次，惩罚易使人产生怀恨心理，对惩罚者心怀不满，并常常表现出攻击行为。

第三，在成人眼里是惩罚，在儿童眼里可能变成奖励。如儿童做出不良行为，可能就是为了吸引成人的注意，成人加以惩罚，正是对儿童的注意，儿童不但不会改变行为，反而会变本加厉。

第四，惩罚尤其是当众的惩罚，会令儿童失去自尊，心灵受到伤害。

斯金纳的操作条件理论在实践中主要应用于行为矫正和程序教学。在行为矫正方面，对不良行为给予惩罚或不予注意，对好的行为给予奖励，坏的行为就会逐渐消退，而好的行为就会渐渐保留。

程序教学允许学生选择短文，回答问题，然后再按按钮看是否正确。

它遵循几个原则：第一，是小步子原则，行为的获得是循序渐进的；第二，学习者是主动的，这是有机体的自然条件；第三，要及时反馈。

五、条件作用理论对于教育的意义

尽管人们对行为主义的学习理论有诸多批评，但不能不承认，时至今日，强化与惩罚仍是课堂环境中老师用来控制学生行为的重要手段。

作为教师，掌握强化的作用和原则将有助于塑造学生良好的行为习惯和矫正学生的不良行为。

当学生表现出好的行为时要及时给予强化加以肯定，但要注意，强化应以表扬、微笑等精神性奖励为主，少用物质性奖励，以免使学生养成为了获得外在奖赏而学习的习惯，因为心理学的研究表明，外在奖赏可能会降低学生的学习兴趣和内在动机。

注意了解学生行为的真正目的，避免将对学生行为的惩罚变成对其行为的强化，使学生的不良行为得以继续保持。鉴于惩罚的负面作用，要谨慎使用。

有人提出了四种替代惩罚的方法：

第一，改变能引起消极行为的刺激。如两个同桌学生上课总是说话，可将他们分开。

第二，允许不希望的行为继续出现直到行动者满足为止。如一个学生在应该坐着的时候站着，那么让他站着好了，他累的时候自会坐下。

第三，对小的违纪行为不予理会，这样这种行为会因为得不到强化而消除。

第四，只对好的行为给予强化，如当调皮的学生表现出良好行为时予以表扬，这种方式让学生知道什么是正确的行为。

（摘自《教育心理学》）

一键关注‍‍

欢迎关注、转发

转载请注明出处

翟氏日知录

以学心读，以平心取，以公心述。