重点推荐
扫码下载《动物行为实验手册》pdf
自愿的奖励驱动行为并不仅仅是获取奖励的行为,而是通过一系列认知和行为事件逐步形成的,这些事件包括目标参与、行动启动、阻挡干扰等认知和行为组成部分,它们共同并顺序地运作,使动物决定进行操作性反应以获得奖励。然而,促成这些前操作性事件的神经机制大部分仍然是未知的。伏隔核(nucleus accumbens, NAc)长期以来被认为在奖励驱动行为中起着重要作用,特别是在将动机与奖励获取相连接方面。NAc中的主要中间棱柱神经元(medium spiny neurons, MSNs)占比超过90%,可分为多巴胺D1受体表达的MSNs(D1-MSNs)和D2-MSNs,它们在奖励驱动行为中扮演着不同的角色。由于这些细胞类型的差异以及其他异质特征,NAc的MSNs被认为形成了不同的神经元群体,每个群体对奖励驱动行为的特定方面有不同的贡献。使用体内记录技术的啮齿动物研究显示,某些NAc MSNs在奖励投放和消费时表现出增强的活动,而另一些则更倾向于对预测奖励投放的线索作出反应,这表明NAc MSNs在不同的动机反应时间阶段中呈现出群体组织特征。与前操作阶段相关,研究发现,在奖励条件任务之前,某些NAc MSNs的活动水平升高,而对NAc的损伤则会降低老鼠主动响应以获取奖励的可能性。
基于前述发现,匹兹堡大学的Yan Dong团队在Nature Communcations发表论文Temporal dynamics of nucleus accumbens neurons in male mice during reward seeking,探讨了一个重要但尚未深入研究的问题,即在执行自我节奏的蔗糖自我给药任务时,NAc神经元是否会表现出独特的活动模式并影响前操作认知和行为事件。该研究通过GCaMP6m媒介的钙成像技术,发现在已建立的蔗糖自我给药过程中,NAc神经元分为三个时间上不同的活动群体,这些群体在杠杆按压前的约0秒、−2.5秒和−5秒时表现出活动增加。此外,研究还发现在−5秒时对D1神经元的光遗传学抑制或在−2.5秒时对D2神经元的抑制会减少随后的蔗糖杠杆按压,而在其他时间点的抑制则无此效果。这些发现为理解NAc中D1和D2神经元的序列活动变化提供了新视角,揭示了它们如何将奖励动机与行为输出联系起来。
图源 Nature Communcations
首先,为了探讨NAc神经元的时间动态变化,研究人员通过立体定位注射GCaMP6m表达的AAV9到NAc,并在注射部位上方安装GRIN镜头。经过六周的训练,小鼠可以在自我调节的蔗糖自给药任务中自由移动,并通过杠杆按压获得蔗糖溶液。在训练的前20分钟,研究者通过迷你荧光显微镜持续记录GCaMP6m介导的钙信号,并提取单个NAc神经元的钙瞬态。分析结果显示,在杠杆按压前后20秒的时间窗口内,NAc神经元可分为三个时间上不同的活动群体,分别在约−5秒、−2.5秒和0秒时增加活动。通过K-means聚类分析,这三个群体代表了不同的功能组合,分别在不同的时间点与奖励动机行为的认知和行为事件相关。具体而言,−5秒的神经元群体主要由D1神经元组成,而−2.5秒的群体则以D2神经元为主。研究还发现,某些神经元在这三个时间点的活动模式有助于预测后续的杠杆按压行为。
图1 野生型小鼠在蔗糖驱动的操作行为中存在三个神经元集群
研究人员进一步探讨了D1和D2中间棱柱神经元(MSNs)在NAc中对蔗糖自我给药任务的不同贡献。他们在D1-Cre或D2-Cre小鼠的NAc中注射AAV-Flex-GCaMP6m,以分别标记D1或D2神经元。经过六周的训练,研究者监测了这些小鼠在蔗糖自我给药过程中的神经活动。结果显示,在自我给药第11天,D1神经元在杠杆按压前和按压时均表现出显著活动增加,而D2神经元同样在这两个阶段表现出活动提升。进一步分析发现,D1神经元在约−5秒时的活动明显,与D2神经元在−2.5秒时的活动形成对比。K-means聚类分析显示,D1和D2神经元的活动均可分为两个聚类,分别集中在−5秒和−2.5秒,此外两者在0秒时也共同参与。这表明D1和D2神经元在前按压阶段的活动模式存在差异,可能对导致蔗糖的操作性反应的一系列认知行为事件起到不同的作用。整体而言,这些发现强调了D1和D2神经元在奖励驱动行为中的分工与协作。
图2 D1型和D2型神经元对NAc不同簇状结构的贡献存在差异
研究人员通过主成分分析(PCA)和支持向量机(SVM)分类器探讨了D1和D2神经元在杠杆按压前的活动模式是否能够预测按压行为。首先,构建一个基于30秒时间窗口的PCA矩阵,以捕捉与杠杆按压相关的神经活动,结果显示D1和D2神经元的前两主成分(PC)能够解释超过30%的变异。通过分析D1-Cre和D2-Cre小鼠在杠杆按压时的PCA数据,发现D1神经元在约−5秒时和D2神经元在约−2.5秒时显示出明显的活动分离。此外,使用MIND方法进行非线性降维后,支持向量机分类器在这些时间点的预测准确性显著提高。研究还绘制了神经元的动态轨迹,发现D1神经元在约−5秒时的轨迹比随机时间点的轨迹更一致,而D2神经元在约−2.5秒时的轨迹表现出相似的组织结构。这些发现进一步说明D1和D2神经元在杠杆按压前的有序时间动态,可能为未来的行为预测提供了神经基础。
图3 D1型和D2型神经元在小鼠按下杠杆获取蔗糖之前的群体活动
为了探讨前按压神经元集群与小鼠运动之间的关联,研究者利用DeepLabCut跟踪分析了小鼠在杠杆按压试验中的运动。结果显示,D1-Cre和D2-Cre小鼠的头部运动速度在前按压阶段有明显变化,尤其是在约−5秒和−2.5秒时,D1神经元和D2神经元的活动强度与头部运动速度呈正相关。此外,研究还开发了一种基于DLC的算法,能够预测杠杆按压行为,并通过光遗传学方法在特定时间点干预NAc神经元的活动。研究者使用Jaws阻断D1或D2神经元的活动,结果表明,在−5秒时抑制D1神经元会减少后续的杠杆按压,而在−2.5秒时抑制D2神经元则有类似效果。尽管在“开”会话中,未预测到的按压数量与“关”会话相似,表明基本的奖赏动机行为未发生显著变化,但特定时间的干预显著降低了与甜食奖励相关的操作反应。综合而言,这些结果表明D1神经元和D2 神经元在前按压阶段的活动反映了启动与甜食相关的操作反应的不同神经事件步骤。
图4 干扰NAc神经元的按压前时间动态可减少蔗糖驱动的操作反应
在这项研究中,研究人员设计了一个经典的奖励寻求(reward seeking)行为模型以探索小鼠在追求奖励过程中的神经动态变化。实验在一个专门设计的行为箱中进行,箱内配备了杠杆、奖励投放装置,以及能够发出视觉或听觉信号的设备。实验分为两个主要阶段:训练阶段和测试阶段。在训练阶段,小鼠被置于行为箱中,经过多次试验,逐渐掌握杠杆操作与奖励之间的因果关系。随着训练的深入,小鼠的杠杆按压次数逐渐增加,反映出其对奖励的期待和动机。研究人员实时记录小鼠的行为数据,包括杠杆按压频率和获得奖励的次数,以评估学习效果和激励水平。测试阶段则主要是评估小鼠在缺乏奖励情况下的行为变化。研究人员观察小鼠在没有奖励提供的情况下是否仍然频繁按压杠杆,以此判断其对奖励的渴望是否依然强烈。为了深入了解神经基础,研究还结合了光遗传学和钙成像技术,以实时监测NAc神经元的活动。在小鼠按下杠杆或获得奖励的瞬间,神经元活动模式被捕捉和记录。这种综合实验范式使研究人员能够揭示不同神经元在奖励预期和实际获得中的反应差异,进而探索神经动态如何影响动物的奖励寻求行为。
这项研究结论表明,NAc中的D1和D2神经元在小鼠追求奖励的不同阶段扮演着关键角色,其中D1神经元在预期奖励前的活动显著增加,而D2神经元在实际获得奖励时显示出更强的活跃性。这种神经动态的变化揭示了奖励寻求行为中的复杂机制,强调了不同神经元群体在时间上的独特功能。未来的研究中,可进一步探索NAc及其连接的其他脑区如何协同作用,以影响行为选择。此外,结合光遗传学和行为学实验的方法,未来的研究可以更深入地分析神经网络在奖励学习和记忆中的作用,尤其是如何通过特定的神经活动模式来调节奖励相关行为。整体而言,这项研究为开发针对成瘾和其他动机相关障碍的干预策略奠定了基础,具有广泛的应用前景。
https://www.nature.com/articles/s41467-024-53690-8
找实验方法,上脑声常谈
欢迎加入
动物模型构建与行为评估交流群
扫码邀请入群