全文参考《Theoretical Neuroscience: Computational and Mathematical Modeling of Neural Systems》(MIT Press,2005),作者为Peter Dayan和L.F. Abbott
大脑对视觉刺激的编码模式一直是神经科学研究的重点,而考虑到实验的可行性,科学家们需要先对五光十色的大千世界做些简化,简化的近义词是取舍,这意味着,我们只需“在意”那些最能抓取我们眼球的图像。为了分清“抓眼球图像”和“无聊图像”,我们有必要先了解视网膜的基本结构和功能。
图 1 视网膜细胞的基本组成
光线进入人眼后(图1A下方),会首先到达眼底的光感受细胞(rode and core cells),这些细胞能将光影的变化转换成电信号的变化(图1B上方),再将变化的电信号传递到水平细胞(horizontal cell)和双极细胞(bipolar cell),最后再由二者传递到神经节细胞(ganglion cell)。
上文提到的“抓眼球图像”更多地指向那些明暗分明的图像,而“无聊图像”则更多地指代千篇一律,一成不变的图像,双极细胞和水平细胞在区分二者的过程中发挥了重要作用。
先来关注水平细胞,它的作用是侧向抑制。当眼底的一个感光细胞被激发后,该细胞会通过与水平细胞的连接来间接地抑制它周围感光细胞的活动。由此,大面积的光线照射反而会让感光细胞们相互制约,导致最后加总的电位变化微乎其微;相反,那些黑暗中的微小光点能诱发更强烈的视觉输入。
再看双极细胞,它们更像感光细胞和神经节细胞间的“中介”,分为ON型和OFF型:当光线增强(变亮)时,ON型双极细胞会被激活,对光强度的增加做出反应,并将这种光亮信息传递给相应的ON型神经节细胞;相反,当光线减弱(变暗)时,OFF型双极细胞则会被激活,响应光强的减少,并将暗光信息传递给OFF型神经节细胞。
这样一来,ON型和OFF型双极细胞能够分别处理亮度变化的信息,从而使视觉系统更敏锐地感知环境光的动态变化。由此,我们就可以简单地将“抓眼球图像”看作是那些在时间和空间中持续变化的图像。
在二维的横纵坐标基础上(图2A),图像上的每一点还另有一个时间维度(图2B),而除了x,y和t之外的其他特征参数决定了图像的周期和朝向等信息。
视觉刺激的特征参数包括空间频率K(单位为弧度每度)、时间频率ω(单位为弧度每秒)、方向角θ(相对于y轴测量)、空间相位φ(单位为弧度)和对比度幅度A。在任何固定时间点,刺激沿着垂直于θ的方向振荡,波长为2π/K;而在任何固定位置上,刺激随时间振荡,周期为2π/ω。改变φ的值会使光栅在垂直于其方向上移动Δφ/2π个波长,对比度幅度A则控制明暗区域之间的最大差异程度。
本文讨论的所有情况都只针对简单细胞(simple cell)。 在初级视觉皮层中,简单细胞响应特定方向的边缘和条纹,具有清晰的兴奋和抑制反应野[1]。复杂细胞存在于初级和次级视觉皮层(V1、V2、V3)中。与简单细胞相似,复杂细胞对特定方向的边缘和光栅有反应,但具有空间不变性,其感受野无法划分为固定的兴奋和抑制区域。它们在较大的感受野内,对特定方向的光线模式产生反应,而不受刺激位置的影响,有些复杂细胞还对特定方向的运动有最佳反应[2]。
遵循上文思路,我们为视觉刺激曲线“加上”一个D函数,并将D函数当作卷积核,与刺激函数求取卷积,从而得到神经元的(预估)放电函数:
上式中的x和y为图像在二维空间中的位置,t为时间,而t-τ为视觉刺激影响神经元反应的时刻,而更关键的变量是D函数,它描述了视觉刺激和神经元反应间的关系,因此,对D函数的求取就成为了后续计算的核心。
这里,我们借助STA(可参见小邹的另一篇内容:Spike-Triggered Average:在神经元放电之前),来量化视觉刺激和神经元反应间的关系:
而在另一些情况下,时间和空间相互影响,其对应的D函数如下:
模型的输入和输出符合我们的观测,然而,干瘪的方程是否真的帮助我们理解了大脑?匈牙利哲学家乔治·卢卡奇曾这样说道:描述是理解的必要前提,但仅仅描述永远无法实现真正的理解……
参考资料
[1] https://en.wikipedia.org/wiki/Simple_cell#:~:text=A%20simple%20cell%20in%20the,(bars%20of%20particular%20orientations)
[2] https://en.wikipedia.org/wiki/Complex_cell