导读:对大规模多通道神经元的记录数据进行降维有两个核心应用:1)揭示在群体层面神经元之间和大脑各区域之间反应协调的神经机制,这些机制在单个神经元上无法体现;2)理解大脑怎么进行数据的编码和解码的,这对我们研究新的生成式AI算法很有启发性。
本文总结:
高维度神经元信号降维背景:研究神经元群体记录比单独研究每个神经元能获得什么科学见解?
单次试验数据分析有可能捕捉到内部认知的瞬时波动,这个在平均试次会被平均掉。
在可能涉及神经元之间反应协调的神经机制的情况下,群体分析是必要的。这些机制仅存在于群体层面,而不存在于单个神经元层面。
视觉注意力机制:将V4神经元单次数据投影到一维分析视觉注意力。
皮层决策任务轨迹:降维揭示前额叶皮层对运动和颜色刺激任务相关反应的低维运动轨迹。
斑马鱼大脑神经动态种类:降维方法有助于对大量神经数据进行初步的可视化和探索性分析,该方法帮助从超过80,000个神经元找到斑马鱼大脑的4种神经动态。
以下科普内容来自Nature neuroscience文章:
摘要
大多数感觉、认知和运动功能依赖于许多神经元的相互作用。近年来,记录大量神经元活动的技术得到了快速发展并日益广泛应用,无论是按顺序还是同时记录。一个关键问题是,研究神经元群体记录比单独研究每个神经元能获得什么科学见解。在本文中,我们考察了群体研究的三个重要动机:需要统计能力的单次试验假设、群体反应结构的假设以及大数据集的探索性分析。许多最近的研究采用降维技术来分析这些群体并发现单个神经元层面无法察觉的特征。我们描述了常用于群体活动分析的降维方法,并就选择方法和解释输出提供实际建议。本综述旨在帮助实验和计算研究者理解降维在系统神经科学中的作用及其对自己数据的应用。
群体分析的科学动机
记录技术在规模和分辨率上的增长带来了神经活动分析的挑战。考虑一个教学示例,其中来自多个实验条件的多个模拟神经元的动作电位在多次实验试验中被“记录”(图1a)。随着神经元数量、试验次数和条件的增加,从这些脉冲序列中提取有意义的结构变得越来越具有挑战性。尽管如此,这种复杂性也为研究神经元群体提供了巨大的科学机会。
图一: 大规模神经元来自多个实验条件的多个模拟神经元的动作电位在多次实验试验中被记录。
单次试验统计能力
如果神经活动不是外部可测量或可控制变量的直接函数(例如,活动更多是内部处理的反映而不是刺激驱动或可测量的行为),则在名义上相同的试验中,神经反应的时间进程可能会大不相同。特别是在涉及注意、决策等认知要求高的任务中,这种情况尤其明显。在这种情况下,跨试验平均反应可能会掩盖感兴趣的神经时间进程,因此单次试验分析至关重要。通过记录单个神经元的反应,通常难以识别这些内部认知过程的瞬时波动。然而,如果同时记录多个神经元,则可以利用跨神经元的统计能力来提取单个实验试验中的群体活动摘要。这些时间进程然后可以与试验的行为相关联,可能带来关于决策神经基础的新见解。下面,我们将展示降维方法是这种统计分析的自然选择。
群体反应结构
在可能涉及神经元之间反应协调的神经机制的情况下,群体分析是必要的。这些机制仅存在于群体层面,而不存在于单个神经元层面,因此单个神经元的反应可能显得无比混乱,甚至会误导对真实生物机制的搜索。事实上,在较高级别的大脑区域以及接近感觉输入和运动输出的区域中,已经发现了高度异质和复杂的单个神经元反应。在某些情况下,单个神经元的反应可能与外部可测量的感觉输入或运动输出没有明显的瞬时关系。传统上,这种异质性被认为是生物噪声或其他干扰的结果,研究者通常只研究那些在外部可测量量上“有意义”的神经元。然而,这种单神经元复杂性可能是仅存在于群体层面的连贯且可测试的神经机制的体现。
探索性数据分析
共同研究神经元群体有助于数据驱动的假设生成。这与前一个动机有细微但重要的区别。群体反应结构关注的是仅在群体层面上有意义的机制,而探索性数据分析则涉及可视化大量数据,这有助于生成关于单个神经元或群体的假设。当神经元显示异质性反应特性时,同时和一致地解释所有反应可能具有挑战性。考虑整个群体,提供了一种解释所有数据(跨神经元、条件、试验和时间)的方式。这一步骤提供了数据显著特征的初步评估,并可指导后续分析。此外,可视化是对大数据集进行合理性检查的有效方法,有助于快速迭代实验设计。通过提供高维群体活动的低维摘要,降维是一种执行探索性数据分析的自然方法。
降维的直觉
降维通常应用于存在D个测量变量的情况下,但怀疑这些变量根据较少的解释变量K(K < D)共变。降维方法根据每种方法特定的目标发现并提取这些K个解释变量。这些解释变量通常被称为潜在变量,因为它们不是直接观察到的。通常,未被潜在变量捕捉到的数据方差被认为是噪声。在这种情况下,降维与许多统计方法类似:它提供对统计特征的简洁描述,并将数据的某些方面视为噪声。
在神经群体活动的情况下,D通常对应于记录的神经元数量。由于记录的神经元属于一个共同的基础网络,因此记录的神经元的反应可能不是彼此独立的。因此,解释群体活动所需的潜在变量可能比记录的神经元数量少。潜在变量可以被认为是共同输入,或更广泛地说,是未观测到的神经元在与记录神经元同一网络中的集体作用。此外,许多降维方法认为单个神经元发出的动作电位序列可以用一个时间变化的基础放电率来表示,从而以随机方式生成动作电位。这是神经科学中普遍的观点,无论是隐含地(例如,通过跨试验平均脉冲序列来估计时间变化的基础放电率)还是明确地(例如,脉冲序列的统计模型)。前人的研究表明,随机成分往往是泊松式的,我们称之为脉冲变异性。
降维的目标是表征不同神经元的基础放电率如何共变,同时将脉冲变异性视为噪声。因此,每个D个神经元可以被认为提供了对一个共同、共享的神经过程的不同、噪声视图,由K个潜在变量捕获。潜在变量定义了一个K维空间,表示在群体反应中突出的共享活动模式
科学研究中的降维算法举例
建立了降维的直觉后,我们讨论这些方法在神经科学文献中的应用及其揭示的见解,按分析神经群体的三种科学动机进行组织。
案例1:单次试验统计数据降维来帮助判断视觉注意力
越来越多的工作利用跨多个神经元的统计能力来表征单个实验试验中的群体活动。一个突出的例子是视觉注意的研究,尽管实验者尽了最大努力,但视觉注意可能会每时每刻变化。为了研究视觉注意的神经机制,一组研究者在猴子进行变化检测任务期间记录了V4区域的一群神经元的活动。他们然后通过将群体活动投影到一维“注意轴”上建立了单次试验注意测量,这是降维到一条线上。注意轴由每个神经元在每种注意条件下的平均反应定义。值得注意的是,作者发现投影到注意轴上的结果可以在单次试验基础上预测行为表现,这是在单个神经元层面无法看到的。这个发现的关键在于投影,它利用整个记录群体的统计能力来估计单次试验中的潜在注意状态。
图二:利用将2个神经元降维的方法判断视觉注意力。
请注意,上图根据数据确定一个表示注意力方向的向量(在这个例子中是绿色线)。这个向量通常是通过统计方法,比如主成分分析(PCA)或者线性判别分析(LDA),根据神经元反应的变异性或分类性能来确定的。
案例2: 降维揭示决策认知相关群体反应的简单组织原则
降维的另一个重要用途是测试仅在群体层面有意义的科学假设。群体结构假设在多个不同系统中被积极追求,包括前额叶皮层、运动系统和嗅觉系统。跨这些系统的一个共同主题是,虽然单个神经元层面的神经反应可能显得无比复杂,但在群体层面上存在更简单的组织原则。
在前额叶皮层中,一项研究考察了决策任务中相关和不相关的刺激信息的表示,该任务包括屏幕上点的运动和颜色的72种不同实验条件。在这项任务中,作者记录了前额叶皮层中的1000多个神经元,产生了一个无法轻易总结或理解的大量反应数据库,这是单神经元复杂性的一个典型例子。鉴于单个神经元层面缺乏简单解释,他们问道,这些混乱的单神经元反应是否可以理解为群体层面的一个简单动态过程的表现。设计了一种降维方法,以识别解释外部协变量的共享潜在变量。应用这种方法于实验数据,作者发现群体活动与涉及线吸引子的低维动态过程一致,这无法通过单独检查神经元来确定。此外,他们发现群体活动意外地携带了相关和不相关的刺激信息,并且通过沿任务相关方向在群体空间中的读取机制隐式地实现了“门控”。
图三:前额叶皮层决策任务。
在运动系统中,另一组研究者研究了通过记录主要运动皮层中数百个神经元在108种不同实验条件下的准备和执行运动。与前一个示例一样,单个神经元反应的异质性难以解释。通过应用降维,他们发现了群体层面的一个连贯机制:准备活动设置了一个动态过程的初始状态,该过程在运动执行时展开。这种动态结构无法通过单个神经元反应来理解,需要群体分析来揭示这种任务两阶段之间的有规律协调。
图四:运动皮层准备和执行两者任状态的低维轨迹。
嗅觉系统中对不同气味的神经元反应也通过群体反应结构的镜头进行了考虑。在这里,神经元和气味刺激的多样时间进程使得理解这些气味的基本编码变得困难。随着神经元和刺激条件数量的增加,这项任务变得越来越困难。降维已应用于蝗虫触角叶中约100个神经元的活动,并发现群体活动在刺激条件下会形成环路。特别是环路的方向与气味的身份相关,环路的大小与气味浓度相关。
案例3: 降维揭示斑马鱼探索性数据大脑区域神经动态
降维也是对大型神经数据集进行探索性数据分析的有用工具。一个有说服力的例子来自在运动适应期间对幼年斑马鱼整个大脑的光学记录。该设置及类似设置中记录的数据量惊人:每小时记录超过1TB的数据,来自超过80,000个神经元。为了可视化和开始理解这些数据,作者应用降维揭示了四种不同类型的神经动态。他们然后将这一见解与神经结构联系起来,发现每种动态模式对应于不同大脑区域的单个神经元,提出了这些区域的新角色。
图五:斑马鱼应用降维揭示了四种不同类型的神经动态。
即使是记录了更少数量的神经元,也需要方法来简洁地可视化群体活动。降维已用于多个大脑区域的数据可视化和假设生成,包括运动皮层、海马体、前额叶皮层、听觉皮层、嗅觉系统等。